PDF转Word SDK效果对比

Hello 大家好,我是小瘪三。我们打工人平时办公免不了要对一些文档格式行转换。我们将探讨几款主流的 PDF 转 Word SDK,分析它们在我们打工人的实际工作中所呈现的优势与劣势。

  1. Solid:老牌的 PDF to Office 转档库,有几十年的积累。
  2. Aspose: 支持非常多的文件格式互转,也包含PDF 转 word 。
  3. Foxit:自主研发 PDF ,PDF to Office 也是最近刚推出的。
  4. ComPDFKit: 最近一家新锐公司,更新频率很高。补充一下谢谢

话不多说,直接对比一下 PDF 转 word 的效果。

对比表:

我分别挑选了一些不同特征的文档进行测试,其中包括页数多,包含表格,图文混排。涉及到论文,cad制图,金融等领域,先看一下这些文档的转档耗时。

Picture1

Picture2

12个文档中,foxit 有三个文档没有转换成功,其他三个 SDK 全部文档都转换成功了。Aspose  SDK 因为试用原因只能转换前4页,但是有些情况下对比其他三个转了全部页面的速度还慢。综合下来ComPDFKit的转换速度最快。接下来我们看一下具体效果。

 

效果文档 – 651页文档.pdf

原文档

Picture3

各SDK厂商转档对比

  • ComPDFKit:基本没啥问题,但是字体和原文档有区别

Picture4
Picture5

  • 福昕:可以看到会有一些小的识别错误,主要在跨行的时候,存在部分粗体识别错误的情况

Picture6
Picture7

  • Solid: 基本也没啥问题,没什么错误,不过也存在字体区别。

Picture8

Picture9

效果文档 – 证券文档.pdf

原文档:

Picture11

各SDK厂商处理结果:

  • ComPDFKit: 整体排版正确,第二页的部分字体会出现拖影现象,部分文字会出现超出文本框的现象。

Picture12

  • foxit:整体排版正确,第二页的部分字体会出现拖影现象,第一页的图表会出现超出文本框的现象。

Picture13

  • Solid:整体排版正确,第一页的图表会出现超出文本框的现象,第一页的页脚图片透明度识别错误。

Picture14

  • Aspose:整体排版正确,第二页的部分文字下有投影。

Picture15

效果文档 – 论文2.pdf

原文档:

Picture16

各SDK厂商处理结果:

  • ComPDFKit: 在公式部分的转换都是转换了文档中原有的字符,所以会出现乱码。

Picture17

  • Foxit:并没有区分小标题的粗体与正文的细体,且部分文本用图片代替,排版相对而言比较混乱。

Picture18

  • Solid: 对公式部分的支持比较好,但是部分符号使用了形变后的图片代替,比较影响观感。

Picture19

效果文档 – 图文混排.pdf

原文档:

Picture20

各SDK厂商处理结果:

 

图文混排版面都保持的不错

ComPDFkit, foxit, solid 文字的字体和原文档都解决得不太好,aspose 最接近, 但是aspose 的背景图片缩放不对。ComPDFkit有几个字最上方被裁掉了。

  • ComPDFKit: 

Picture21

  • Foxit: 

Picture22

  • Solid:

Picture23

  • Aspose:

Picture24

效果文档 – 图文带简单表格.pdf

  • foxit 的文字背景形状变了,变成了不规则的。
  • aspose 背景图片变小了。
  • ComPDFKit 的时间有一部分被裁掉了。
  • Solid 效果良好。

 

原文档:

Picture25

各SDK厂商处理结果:

  • ComPDFKit:

Picture26

  • foxit:

Picture27

  • Solid:

Picture28

  • Aspose:

Picture29

总结

这几家 SDK转换PDF为Word都各有优缺点,应该是pdf转成 word 的算法侧重点不同。可以根据自己的项目情况和项目预算选择合适的SDK公司。

本文来自投稿,不代表Worktile社区立场,如若转载,请注明出处:https://worktile.com/kb/p/65753

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
6325的头像6325
上一篇 2023年8月25日 下午5:54
下一篇 2023年8月31日 下午2:05

相关推荐

  • 企业费用管理神器:9款费控系统精选

    本文介绍了9款费控系统:合思、金蝶云之家、明道云、管家婆、用友U8、AIrbase、Yokoy、SAP Concur、Expensify。 在企业管理中,传统的费用控制不仅费时费力,还容易出错,最终影响企业的财务健康和运营效率,而费控系统是一种有效的解决方案,可以优化费用管理流程,提升整体工作效率。…

    2024年7月23日
    900
  • 数据库权限关系图表是什么

    数据库权限关系图表是一种以图表形式展示数据库权限分配和管理的工具。它可以有效地帮助我们理解和管理数据库中的各种权限关系。数据库权限关系图表主要包含以下几个部分:数据对象、用户(或用户组)、权限类型、权限级别、权限状态等。其中,数据对象是权限关系图表中的核心元素,它代表了数据库中的各种数据资源,如表、…

    2024年7月22日
    100
  • 诚信数据库是什么意思

    诚信数据库是一种收集、存储和管理个人或组织诚信信息的系统。它是一种用于评估和管理个人或组织行为的工具,通常由政府、商业组织或者非营利组织进行运营。诚信数据库的主要功能包括:1、评估个人或组织的诚信状况;2、提供决策支持;3、预防和控制风险;4、促进社会信用体系建设。 在这四大功能中,评估个人或组织的…

    2024年7月22日
    000
  • 数据库期末关系代数是什么

    关系代数是一种对关系进行操作的代数系统,是关系模型的数学基础,主要用于从关系数据库中检索数据。其操作包括选择、投影、并集、差集、笛卡尔积、连接、除法等。其中,选择操作是对关系中的元组进行筛选,只保留满足某一条件的元组;投影操作则是从关系中选择出一部分属性构造一个新的关系。 一、选择操作 选择操作是关…

    2024年7月22日
    500
  • mysql建立数据库用什么命令

    在MySQL中,我们使用"CREATE DATABASE"命令来创建数据库。这是一个非常简单且基础的命令,其语法为:CREATE DATABASE 数据库名。在这个命令中,“CREATE DATABASE”是固定的,而“数据库名”则是你要创建的数据库的名称,可以自己设定。例如,如…

    2024年7月22日
    100

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部