wmjordan / pdfpatcher Goto Github PK
View Code? Open in Web Editor NEWPDF补丁丁——PDF工具箱,可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档,探查文档结构,提取图片、转成图片等等
Home Page: https://pdfpatcher.cnblogs.com/
PDF补丁丁——PDF工具箱,可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档,探查文档结构,提取图片、转成图片等等
Home Page: https://pdfpatcher.cnblogs.com/
不如今后将版本发布在这里,用户既可以通过rss订阅及时获得最新版本,也不必再忍受诚通网盘的龟速下载。
谢谢!
Error Logs:
已启动生成…
1>------ 已启动生成: 项目: PDFPatcher, 配置: Debug x86 ------
1>CSC : error CS7027: 使用来自文件“wmjordan.snk”的公钥对输出签名时出错 -- 未找到文件。
========== 生成: 成功 0 个,失败 1 个,最新 1 个,跳过 0 个 ==========
AboutPage.html中‘’网页界面:ArthurHub’引用连接应更新为:https://github.com/ArthurHub/HTML-Renderer
使用文字识别功能需要安装 Microsoft Office 2003(或2007)的 Document Imaging 组件(MODI)需要依赖微软office组件,近几天关注到基于百度飞桨OCR已经有大佬完成C#封装并可离线部署,期待可以双剑合璧。参考连接:
https://mp.weixin.qq.com/s/U6gLjz1kbnftLWnVbWDkow
https://github.com/sdcb/paddlesharp
单张PDF页面设置成所有pdf都转90度的话可以使用
如果是单独将纵向转换成横向无法成功,具体的设置如下:
纵向.pdf
附件是纵向的pdf 一直我明白该怎么弄 请教下老师 这个该咋设置
功能应该怎样实现
主程序系统调用 jbig2 解码器。
对于编码器,没有改造的需求,为了统一,也可以修改。
参考资料:https://www.cnblogs.com/babycool/p/3570648.html
当前进展
正在进行中,包括以下内容:
没有编译工具,能否同步提供编译好的release文件压缩包?
合并早期pdf文件会出现字体丢失
使用如下附件
2005.zip
使用场景
我习惯连页阅读PDF文件。
有些文件,标题并不是在开头,而是靠近中间,但是标题之上是有信息的。
按照 自动快速生成文档书签 的方法,生成的书签位置即标题位置,不能立刻看到完整页面,得手动往上拉才能看到标题之上的信息。
功能应该怎样实现
自动快速生成文档书签 增加“跳到当前页开头”选项,生成后不管标题在什么位置,点击书签后都导航到当前页开头。
类似软件
无
其它内容
无
使用场景
mac m1 用户请求支持
功能应该怎样实现
保持与win操作一致
类似软件
mac平台下完全没有同类产品可供使用,反倒是win平台下已经有有类似的软件PdgCntEditor.exe了,mac用户只能通过虚拟机访问。
其它内容
与本需求相关的其它内容
年报格式稳定,二三级目录识别相对具有可行性,现在支持一级目录识别,可以支持一下二三级目录识别吗?
目前我本地的 C# 代码格式化配置和此项目的代码不一致,只要一修改和保存,这个文件代码格式就乱了。而我不想调整我本地的配置,一是繁琐,二是有同时维护其他项目的需求。
好在,如果工作区本地有 .editorconfig 文件,那么 Visual Studio 就会优先应用工作区中的格式化配置,覆盖 IDE 自身的配置。
因此特向维护者请求,将您 Visual Studio 的格式化配置导出为 .editorconfig 文件放到本项目的根目录下,提交合并入库。
导出的方法为:进入 Tools -> Text Editor -> C# -> Code Style -> General
, 点击 Generate .editorconfig file from settings
按钮,则版本库根目录下就出现了 .editorconfig 文件,请将其提交并推送入库。
非常感谢!
使用场景
课件中的多个文档,每个文档的标题格式一样,想要快速批量生成书签。
按照 自动快速生成文档书签 的方法,只能一个个文档重复操作。
功能应该怎样实现
自动快速生成文档书签 的批量化:
类似软件
无
其它内容
我不确定是否已经实现了该功能?
如果已经实现的话,请问教程在哪?
如果还没实现的话,这算一个改进需求。
在进行大变更之前,我先创建一个Issue,然后再做PR,以免工作和其他贡献者的产生重复或冲突。也可大家就此进行讨论,达成共识。
近期计划:
远期计划:
请简要描述你遇到的问题
PDFPatcher在打开不正常的PDF文件直接闪退。
重现问题的步骤
步骤如下:
使用如下附件 '...'
test.zip
打开某功能 '....'
无需打开任何功能,只要PDF非法就会出现此问题。
选中哪些选项,点击哪些按钮 '....'
出现的问题
程序闪退
预期的结果或行为
类似于Acrobat Pro,并未闪退,而是弹出警告框,如下图:
相关截图或文件
如果有必要,请附上截图或文件(最好能附上程序的界面截图,以便了解你现在使用的版本和操作选项等)
其它
本问题存在于1.0.0.3802及以下版本。
请简要描述你遇到的问题
将一批文件拖入PDF补丁丁,有时会文件名和文件内容不一致。
如果生成书签并保存,往往会报错。
重现问题的步骤
步骤如下:
预期的结果或行为
1.批量拖入文件名和文件内容一致。
2.生成书签正常。
其它
无
使用场景
现在已经支持提取文档中的图片:https://www.cnblogs.com/pdfpatcher/archive/2012/09/12/2682535.html
但我需要能删除提取出来的图片中的一张或几张。
功能应该怎样实现
如果可以当然希望能做成图形界面,太麻烦的话可以考虑输入序号来指定删除。序号可以通过提取来获取。
类似软件
https://blog.csdn.net/jylonger/article/details/106714154
https://www.e-iceblue.cn/pictures/add-replace-and-delete-image-in-pdf.html
更多的收费的pdf编辑器有这个功能就不多说了。
其它内容
暂无。
请简要描述你遇到的问题
按照 自动快速生成文档书签 的方法。
有些文件,生成书签后保存,会报 ”乱码“(十六进制值 0x..)是无效的字符。
重现问题的步骤
步骤如下:
预期的结果或行为
其它
我遇过好多种空白字符保存的编码问题,不仅仅是上述这种,请考虑兼容其他的类似状况。
使用场景
在电子设计行业,在电路图设计场景,因版本迭代修改,经常需要对比和之前某个版本的原理图的差异,确认修改点是否符合预期。但是原理图设计工具只提供了对比元器件列表的功能,对于元件位置的变动的对比,我们只能将从电路图设计软件中其导出为 PDF 格式,通过 PDF 对比工具对比。因此我们认为 PDF 对比是一大刚需。
功能应该怎样实现
选取两个文档,左右对比,差异部分高亮。类似文本对比工具。
类似软件
https://tech.wmzhe.com/article/2307.html
https://vslavik.github.io/diff-pdf/
https://github.com/witwall/diffpdf
其它内容
无。
使用场景
命令行执行选中已设置好书签的pdf文件,执行拆分(按顶层书签拆分,标题命名)
或者打开选中pdf文件(发现直接显示的是编辑书签界面),编辑好书签保存后,直接点击工作流按钮或者快捷键执行拆分(工作流设置为比如标题命名、顶层书签拆分)
其它内容
一般情况是,打开补丁丁,选择拆分模块后,再从文件夹打开pdf文件,然后设置标题命名,再按书签拆分,由于用AHK、命令行较多,想省去繁琐步骤,直接执行拆分等命令行
类似ShareX的工作流或者快捷键设置,命令行调用
使用场景
在某些有上传大小限制的地方非常实用,本人目前压缩的方式是Adobe Acrobat Pro DC上,但这个软件操作有点复杂,工作限制只能使用win7,无法连接外网,由于电脑性能使用Adobe Acrobat Pro DC会耗时较久。
PDF解密和压缩是经常用到的功能,现在的解决方法是解密一个工具,压缩一个工具,如果能在一个软件上实现会非常方便。
功能应该怎样实现
最好在导出的时候增加压缩文件大小的选项
类似软件
Adobe Acrobat Pro DC
Ref: Github doc
Adding a license to repository
请求添加LICENSE file.
读了.md理解大概会是AGPL3,请求单独添加一个文件, follow github best practice.
老版本的pdf文件内嵌图片通常包含CCITT、JPEG2000等非JPEG格式图片,能不能在合并文件或编辑保存的时候转换为JPEG
t.pdf
大佬,能把开发补丁丁所需的知识储备罗列一下吗?
初学者实在不懂,没搜索到有效的资源。
请简要描述你遇到的问题
按照 自动快速生成文档书签 的方法。
有些文件,无法生成书签,这些文件的文字是可复制的。
重现问题的步骤
步骤如下:
预期的结果或行为
左下角显示识别出"Goals for Today",并且左边的书签栏生成"Goals for Today"。
其它
这些文件的文字是可复制的,为什么不能生成书签?
当Windows文字缩放级别(Scale)非100%时,界面显示异常。缩放级别越大异常越明显。
在 Windows 中右键点击桌面,选择 “显示设置”,在 "缩放和布局" 中将 "更改文本、应用等项目的大小" 中将 100% 修改为更大的值,然后再启动程序,可以复现问题。
缩放级别非 100% 时,可能有部分分辨率下是正常的,比如当缩放级别为 150% 时以下2个分辨率正常:
800x600
1280x720
没有文字覆盖,文字、按钮均能完整显示。
在高分辨率的显示器上,往往会将缩放级别调大,甚至 Windows 会根据分辨率的大小推荐一个比 100% 更大的缩放值,否则 Windows 界面的文字显示过小。
年纪大的用户更喜欢调大文字缩放级别。之所以不是调分辨率,是因为调小分辨率会导致无论图片还是文字全部显示模糊,所以常规方式是调整文字缩放级别。
以下为缩放级别为 125% 时的显示情况。
下图左下角的 "导出信息文件" 的按钮显示为 "导出信息文",末尾少一个字。
下图中的文字排版方向右边的下拉框,预期显示为“自动检测”,实际显示为“动检”,左侧和右侧文字显示不全。
另外,"识别图像文本" 按钮文本显示不全,写入PDF文档 左侧的图标显示靠下,可能是因为和按钮长度不足有关。(和上面的“长按钮文本显示不全”的问题可能同源)
下图中存在多处文字或控件被覆盖的情况。比如灰度、垂直旋转,等。
批量修改文档中工具栏的 “删除文件” 按钮右边出现很长的空白,才到 “刷新文档属性” 按钮的下拉小三角 。
这段空白几乎等于 “刷新文档属性” 按钮的总长度。
最大化窗口不能解决。
预期为,“刷新文档属性” 按钮直接显示在工具栏上,即便不显示,小三角也不应该距离如此远。
某些界面是显示全的,如 "重命名文件" 界面的 “刷新文档属性” 按钮能显示在工具栏上。
表格中的标题很多显示不全,末尾显示为 ...
,需要一个个手动拉长。
预期显示效果:
再举2例:
请简要描述你遇到的问题
默认编译未拷贝FreeImage.dll 顾导出图片时无法加载FreeImage.dll
重现问题的步骤
正常编译后,使用导出显示报错
预期的结果或行为
建议自动拷贝FreeImage.dll 到编译后的bin目录, 方便测试和应用
相关截图或文件
报错文本: 很容易复现的
其它
与本问题相关的信息
再次感谢pdfpathcer和作者 做出像PDF Patcher一样稳定可靠的软件一直是我的梦想, 我正通过源代码尝试学习C# 尤其是多线程编程, PDFPatcher可以在导出等处理PDF过程中不会让winform卡顿 ,这个是在学习如何实现的地方, 如果能用简单几句话说明一下我将不胜感激,不想浪费作者的时间哈...
祝大家快乐幸福!
使用场景
老师发了 A3 幅面的试卷给学生,学生家长希望用 A4 幅面分两页打印试卷
功能应该怎样实现
在拆分文档功能中增加一个对开拆分的功能
感谢您关注 PDF 补丁丁,请在使用软件或源代码前阅读说明和授权协议。本软件及源代码采用“良心授权”协议——用户每次使用本软件后如有所获益,应行一善事;如使用源代码开发了新的软件并获得收益,应将收益中不低于千分之一的金额捐赠给社会的弱势群体。
PDFPatcher.1.0.0.4185.7z.zip
PDFPatcher.1.0.0.4182.7z.zip
PDFPatcher.1.0.0.4172.7z.zip
PDFPatcher.1.0.0.4153.7z.zip
PDFPatcher.1.0.0.4142.7z.zip
PDFPatcher.1.0.0.4140.7z.zip
PDFPatcher.1.0.0.4137.7z.zip
请简要描述你遇到的问题
当输入图片为1bpp位深的BMP文件时,合并出来的PDF文件图片出现反色。我没有找到有设置B/W的选项位置。使用Windows照片查看器查看时颜色正常。
重现问题的步骤
步骤如下:
使用如下附件 ''
附件于文件:
问题文件
打开某功能 '....
使用 合并PDF和图片文件
功能
'
选中哪些选项,点击哪些按钮 '....'
略
出现的问题
当输入图片为1bpp位深的BMP文件时,合并出来的PDF文件图片出现反色。我没有找到有设置BW的选项位置。使用Windows照片查看器查看时颜色正常。
预期的结果或行为
在完成上面的操作步骤后,您觉得程序应该是怎样工作的。
正常情形下,合并的PDF文件应当正常显示颜色。
相关截图或文件
如果有必要,请附上截图或文件(最好能附上程序的界面截图,以便了解你现在使用的版本和操作选项等)
其它
与本问题相关的信息
此类图像在处理之后的扫描图像很常见。
jbig2enc库本身带有半色调算法,我认为压缩图片存储的功能应当不仅仅局限于压缩1bpp的图片,应该将8/24bit位深的灰度图/彩图也考虑在内,因为大部分的电子书很大,原因在于每一页都是jpeg图像,而内容却是白底黑字的文本。
如题..
请简要描述你遇到的问题
1.0.0.3802版本无法合并JPEG文件,同一JPEG文件在1.0.0.3794版本正常合并。
重现问题的步骤
步骤如下:
使用如下附件 '...'
Koala.zip
打开某功能 '....'
图片合并为PDF功能
选中哪些选项,点击哪些按钮 '....'
略
出现的问题
报错“Object reference not set to an instance of an object. The document has no pages.”
预期的结果或行为
在完成上面的操作步骤后,您觉得程序应该是怎样工作的。
其它
与本问题相关的信息
经过测试,在1.0.0.3794版本测试正常,怀疑为修复Palette故障时引入。附上1.0.0.3794版本生成PDF:
test.zip
首先感谢大大开源~
以下问题前期和大大反馈过,不知是否能加入近期的ToDo-List?谢谢!
“在【合并文件】模块,列表能否体现一下待合并PDF的文件合计数、页数合计数?”
使用菜单【工具箱/导出导入信息文件】功能时,将自动在.pdf文件所在目录下生成.xml文件,但是生成扩展名会变成“..xml”。
在导入时不会识别这个多出来的字符,必须手工更名为“.xml”才行。
无法点击识别图像文本按钮
是因为Office 2019版本太高?
在进行大变更之前,我先创建一个Issue,然后再做PR,以免工作和其他贡献者的产生重复或冲突。大家也可就此进行讨论,达成共识。最终决定权在wmjordan。
这个项目非常有价值,也很有潜力,如能将其进行国际化,相信会吸引更多的开发者加入到项目中来。
国际化待办事项:
可以增加再次打开记录上次阅读位置吗
比如书签里是:2017-03-15_“文化匠人,打造青岛城市之眼”——暨青岛德国总督楼旧址博物馆社教品牌惠民活动
合并后,成了:-03-15_“文化匠人,打造青岛城市之眼”——暨青岛德国总督楼旧址博物馆社教品牌惠民活动
使用场景
文件名前面已有数字,无法按名字排序,但按文件修改日期符合排序需求。
功能应该怎样实现
在文件列表增加一列修改日期,可按该列排序。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.