网上其他介绍:e-PDF To Word Converter 是一款将AdobePDF文档转换成 Word 文档的工具软件,它支持文字,图像及其它内容的输出。这款软件可以脱离 Microsoft Word,Adobe Acrobat 或 Acrobat Reader 独立运行。完美的中文支持和原始版面转换,基本做到了百分百的原汁原味……目前唯一发现的不足,数字会被转换成全角数字,不知道可否在word中批量把数字换回半角,另外有些文字大小会小一号。试用了超多的pdf转word工具了,应该说这个是所见过版面保留最好的了,虽然还是有点缺憾。
上面的软件将文本类型的pdf转换为word的话还可以,但是一旦pdf的文档使用图像生成的,如扫描下来的资料,或者使用拍照图片生成的,在这些类型的pdf面前他们也是很无力哦,接下来就需要介绍一下一个叫OCR的东东了。
光学字符识别 , 简称OCR,是一种可以使你转换不同文档的技术, 比如将扫描纸质文档,PDF文件或者数码相机拍摄的图片转换成可以编辑的文档。假设你获得了一个纸质文件-比如,杂志、彩页或者你合作伙伴发给你的PDF 合同。很明显,光是一台扫描仪是不足以让这些文档转变成可以编辑的文档,也就是Microsoft Word。扫描仪可以做的只是创建图片或者一张黑白或者彩色的图像文档。为了从扫描文档、PDF或者数码图片中提取文字和数据,你需要OCR软件识别图片上的信息,从单词到句子,然后变成整个可以编辑的文档。
3、MS Office Document Imaging 将PDF转为Word
如果你购买了MS Office的相应套件,则可通过MS Office Document Imaging进行PDF到Word的转换。
Microsoft Office Document Imaging 是MS Office的一款选装组件,用于印刷文档的图像化扫描存储,并具有OCR功能。因此,也可以先把PDF虚拟打印为 Microsoft Office Document Imaging 格式 (MDI) ;再通过OCR转为可编辑的Word文档。(官方帮助: 2)
转载一下操作步骤:
① 从PDF到MDI:在PDF阅读器中,打印PDF,打印机选“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 (注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。 )
② 从MDI到Word:Document Imaging 转换为运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,确认即可。但是这个组件在Office 2010里被移除了,OCR识别功能现在是集成在OneNote里面,但我个人测试拍的实物照片从来没成功过…所以可能的话还是需要别的软件。










