PDF转Word SDK效果对比

Hello 大家好,我是小瘪三。我们打工人平时办公免不了要对一些文档格式行转换。我们将探讨几款主流的 PDF 转 Word SDK,分析它们在我们打工人的实际工作中所呈现的优势与劣势。

  1. Solid:老牌的 PDF to Office 转档库,有几十年的积累。
  2. Aspose: 支持非常多的文件格式互转,也包含PDF 转 word 。
  3. Foxit:自主研发 PDF ,PDF to Office 也是最近刚推出的。
  4. ComPDFKit: 最近一家新锐公司,更新频率很高。补充一下谢谢

话不多说,直接对比一下 PDF 转 word 的效果。

对比表:

我分别挑选了一些不同特征的文档进行测试,其中包括页数多,包含表格,图文混排。涉及到论文,cad制图,金融等领域,先看一下这些文档的转档耗时。

Picture1

Picture2

12个文档中,foxit 有三个文档没有转换成功,其他三个 SDK 全部文档都转换成功了。Aspose  SDK 因为试用原因只能转换前4页,但是有些情况下对比其他三个转了全部页面的速度还慢。综合下来ComPDFKit的转换速度最快。接下来我们看一下具体效果。

 

效果文档 – 651页文档.pdf

原文档

Picture3

各SDK厂商转档对比

  • ComPDFKit:基本没啥问题,但是字体和原文档有区别

Picture4
Picture5

  • 福昕:可以看到会有一些小的识别错误,主要在跨行的时候,存在部分粗体识别错误的情况

Picture6
Picture7

  • Solid: 基本也没啥问题,没什么错误,不过也存在字体区别。

Picture8

Picture9

效果文档 – 证券文档.pdf

原文档:

Picture11

各SDK厂商处理结果:

  • ComPDFKit: 整体排版正确,第二页的部分字体会出现拖影现象,部分文字会出现超出文本框的现象。

Picture12

  • foxit:整体排版正确,第二页的部分字体会出现拖影现象,第一页的图表会出现超出文本框的现象。

Picture13

  • Solid:整体排版正确,第一页的图表会出现超出文本框的现象,第一页的页脚图片透明度识别错误。

Picture14

  • Aspose:整体排版正确,第二页的部分文字下有投影。

Picture15

效果文档 – 论文2.pdf

原文档:

Picture16

各SDK厂商处理结果:

  • ComPDFKit: 在公式部分的转换都是转换了文档中原有的字符,所以会出现乱码。

Picture17

  • Foxit:并没有区分小标题的粗体与正文的细体,且部分文本用图片代替,排版相对而言比较混乱。

Picture18

  • Solid: 对公式部分的支持比较好,但是部分符号使用了形变后的图片代替,比较影响观感。

Picture19

效果文档 – 图文混排.pdf

原文档:

Picture20

各SDK厂商处理结果:

 

图文混排版面都保持的不错

ComPDFkit, foxit, solid 文字的字体和原文档都解决得不太好,aspose 最接近, 但是aspose 的背景图片缩放不对。ComPDFkit有几个字最上方被裁掉了。

  • ComPDFKit: 

Picture21

  • Foxit: 

Picture22

  • Solid:

Picture23

  • Aspose:

Picture24

效果文档 – 图文带简单表格.pdf

  • foxit 的文字背景形状变了,变成了不规则的。
  • aspose 背景图片变小了。
  • ComPDFKit 的时间有一部分被裁掉了。
  • Solid 效果良好。

 

原文档:

Picture25

各SDK厂商处理结果:

  • ComPDFKit:

Picture26

  • foxit:

Picture27

  • Solid:

Picture28

  • Aspose:

Picture29

总结

这几家 SDK转换PDF为Word都各有优缺点,应该是pdf转成 word 的算法侧重点不同。可以根据自己的项目情况和项目预算选择合适的SDK公司。

本文来自投稿,不代表Worktile社区立场,如若转载,请注明出处:https://worktile.com/kb/p/65753

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
63256325普通用户
上一篇 2023年8月25日 下午5:54
下一篇 2023年8月31日 下午2:05

相关推荐

  • coreldraw如何导出jpg图片

    coreldraw导出jpg图片的方法 1、打开软件,绘制好想要的图像。 2、点击菜单上方的文件,找到导出。 3、选择导出的格式,这里我们选择jpg。 4、点击导出即可。 关于“coreldraw如何导出jpg图片”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“coreldraw如何导出j…

    2022年9月21日
    64400
  • mobilefile文件夹的路径怎么更改

    mobilefile是QQ软件的临时文件夹;该文件夹删除之后,再登录QQ还会再次生成该文件夹,可以在QQ的“文件管理”中找到“默认把接收到的文件保存到此文件夹中”更改目录来设置该文件夹的路径。 本教程操作环境:windows10系统、DELL G3电脑。 mobilefile是什么文件夹 Mobil…

    2022年9月8日
    46200
  • mysql中有没有关键字

    mysql中有关键字。mysql中提供了多种关键字:1、BETWEEN,用在WHERE语句之后的时间或者数字的范围查询;2、CALL,用于调用存储过程;3、CURRENT_DATE,获取当天日期;4、CURRENT_TIME,获取当前时间;5、CURRENT_USER,返回MYSQL的用户名;6、C…

    2022年9月22日
    32300
  • mysql中odbc的概念是什么

    在mysql中,odbc的中文意思为“开放式数据库连接”, 是用于访问数据库的开放式标准应用程序编程接口(API),允许与SQL数据库服务器进行连接。odbc是根据SQL Access Group的规范开发的,它定义了一套函数调用、错误代码和数据类型,可将其用于开发独立于数据库的应用程序。 本教程操…

    2022年9月20日
    74000
  • MySQL中流式查询及游标查询的方式是什么

    一、业务场景 现在业务系统需要从 MySQL 数据库里读取 500w 数据行进行处理 迁移数据 导出数据 批量处理数据 二、罗列一下三种处理方式 常规查询:一次性读取 500w 数据到 JVM 内存中,或者分页读取 流式查询:每次读取一条加载到 JVM 内存进行业务处理 游标查询:和流式一样,通过 …

    2022年8月31日
    81700
  • Python如何用NumPy读取和保存点云数据

    前言 最近在学习点云处理的时候用到了Modelnet40数据集,该数据集总共有40个类别,每个样本的点云数据存放在一个TXT文件中,每行的前3个数据代表一个点的xyz坐标。我需要把TXT文件中的每个点读取出来,然后用Open3D进行显示。怎么把数据从TXT文件中读取出来呢?NumPy提供了一个功能非…

    2022年9月2日
    81100
  • windows 0x00000bcb如何解决

    解决方法: 方法一: 1、首先我们通过左下角的开始菜单进入“设置” 2、然后在设置面板中打开“更新和安全” 3、然后在其中选择“检查更新”,更新一下最新的系统补丁,应该就可以连接到打印机了。 方法二: 1、要是更新系统后还用不了,就可以搜索并打开“设备管理器” 2、然后在其中展开打印队列,选择要使用…

    2022年9月15日
    56900
  • Mysql锁的内部实现机制是什么

    注:所列举代码皆出自Mysql-5.6 虽然现在关系型数据库越来越相似,但其背后的实现机制可能大相径庭。实际使用方面,因为SQL语法规范的存在使得我们熟悉多种关系型数据库并非难事,但是有多少种数据库可能就有多少种锁的实现方法。 Microsoft Sql Server2005之前只提供页锁,直到20…

    2022年9月15日
    55200
  • sumif函数如何使用

    sumif函数的使用方法: 1、首先进入excel,然后选择单元格, 点击fx,输入:SUMIF点击“转到”。 2、然后选择SUMIF函数,点击确定,选择“求和范围”。 3、然后点击“criteria”输入求和条件, 图中以>60数值举例,最后点击确定即可。 到此,相信大家对“sumif函数如…

    2022年8月27日
    32800
  • video接口指的是什么

    video接口指的是“复合视频接口”,是音频、视频分离的视频接口,一般由三个独立RCA插头组成,其中V接口连接混合视频信号,为黄色插口;L接口连接左声道声音信号,为白色插口;R接口连接右声道声音信号,为红色插口。 本教程操作环境:windows7系统、Dell G3电脑。 video是什么接口 复合…

    2022年9月2日
    1.1K00

发表回复

登录后才能评论
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部