设为首页收藏本站新手激活药事管理抗菌药物药师培训举报中心药考软件
本站已运行

临药网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信扫一扫,快捷登录!

  • wx_jytEetEe3X4N大家说:祝贺临床药师网建网17周年
  • r1235201314rclinphar说:祝贺走过17个春秋,希望越办越好,一直陪伴我们。
  • hhw859大家说:这里真好,可以下载好多课件
  • hhw859大家说:大家好,工作顺利
  • wx_HQ_AwAoX大家说:一起加油!
  • wx_CfsfWCUwfUnd大家说:加油!!!
  • 568721zsl临床药师网说说:感谢分享知识
  • clinphar大家说:春节快乐,万事如意!
  • cwc平台说:发挥全国各临床药师的力量,众人是柴火焰高,一定会越办越好
  • 神女应无恙好的平台说:好的平台,希望越办越好
  • wx_poNQQV902inq越办越好说:好的平台,希望吸引更多人才
  • 13885433081好的平台,希望越办越好说:好的平台,希望越办越好
  • HF^O^平台说:希望临药网这个平台越办越好!
  • jingxuchen平台说:给我们基层工作的药师提供了帮助,关键时刻雪中送炭,敞开胸怀素材共享,万紫千红总是春,越来越兴旺!
  • lipinshang平台说:10多年的临药网忠实粉,在这里学到了很多,查找资料非常方便,愿平台越来越好。
  • sd13jyyyxklss平台说:好的平台,知识丰富,开阔眼界,望越办越好
  • liutangren平台说:风雨同舟相处十五年,越来越好。
  • 求知临床药师网说:生日快乐!从牙牙学语长成15岁“帅哥”
  • gary平台说:希望临床药师网越办越好,为广大临床药师提供更多的资源和交流
  • Alst210507平台说:好的平台,希望越办越好
  • 15129825015临床药师网说:非常棒的平台,但愿越办越好。
  • 568721zsl临床药师网说说:药师学习平台,相信药师网越办越好
  • lzh0586临药网说:祝福网站越来越好,祝福同仁万事如意!
  • sunny-yaoshi临床药师网说:希望论坛越办越好,成为药学人员学习的首选网站!加油
  • 冬日暖阳~秀临药网说:此平台是药学人家园,常常来交流小憩,愿学科越来越好,愿药学人日子越来越好
  • 修行临床药师网说:好的平台,希望越办越好
  • sln123临床药师网说:对我们工作非常有帮助
  • 一千小可爱临床药师网说:感谢这个平台,临床药师网yyds
  • 小分队临床药师网说:这个网站的内容对工作和学习的帮助太大了。内容质量好,权威性高
  • chuyinghong药师说:临床药师真正体现药师价值的机遇来了!
  • gyh660222感谢老师为交流平台做的贡献。说:对我们工作很有帮助
  • 郜琪臻太好了,终于又见面了说:越办越好
  • sunqi3541盛京医院说:希望能被基地录取
  • gary大家说:祝临床药师网越来越好
  • 柠檬梅子临床药师网的老师们说:谢谢临床药学网给我们基层药师提供学习平台,希望我们也能进专业平台学习
  • 我是庆宇平台说:恭喜恢复开放,这是我们临床药师的福音啊!
  • 祥籽clinphar说:我们支持~感谢临药网
  • Terry0915大家说:无意间点开网页 居然可以上了 还开心呀 希望网站越办越好
  • gfelwaiz临床药师网说:希望功能越来越完善
  • clinphar大家说:数据基本恢复完毕,大部分版块已经开放。
  • 海上升明月clinphar说:祝临床药师网越办越好 一直到永远
  • yyhh425666什么时候取消密码呢说:祝药师网越办越好
  • 鸢舞轩临床药学说:希望能在这里学到更多
  • clinphar大家说:数据恢复中,会逐步开放及取消密码。
  • 水月洞天自己说:做好自己就OK其余随缘
  • 梁药师201902227临床药师网说:好平台,提高自我的一个学习平台
  • Lion898大家说:共同成长!祝各位药师越来越学识渊博!
  • qazw310临床药学说:可找到组织了
  • clinphar大家说:贺临床药师网建站13周年!
  • tianshenglu临床药师网说:这真是个非常实用的论坛,希望越来越好
总共63625条微博

动态微博

查看: 3440|回复: 5

不同格式的文件转成word文件较好的方法

[复制链接]

该用户从未签到

qingyun125 发表于 2009-4-5 09:58:48 | 显示全部楼层 |阅读模式
临床药师网(linyao.net)免责声明
禁止发布任何可能侵犯版权的内容,否则将承担由此产生的全部侵权后果;提倡文明上网,净化网络环境!抵制低俗不良违法有害信息。
一个比较好用的将PDF图书转成WORD的方法

各种格式文件ocr成word文件的方法

你还在为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷,识别效率低,让你痛苦不堪,有的只能识别字,对表格和图形无能为力,识别完了,版面乱七八糟,无法使用。现在好了,本文针对各种情况下文字识别进行总结,帮助大家掌握正确方法,节省时间,本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案:

1、PDF文件的识别:

1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 7专业版,注意不是acrobat reader(下载 http://www.xdowns.com/soft/4/136/2006/Soft_29430.html
),直接另存为rtf文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到word等中。

2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003(下载http://www.xdowns.com/soft/188/215/2006/Soft_28356.html ),并装上office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整个PDF文件识别输出到word文件中。

注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,然后复制到word中。(所有的识别软件都不能很好的处理图形的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。)

3)加密的Pdf文件:先下载解密软件(下载http://www.xdowns.com/soft/4/85/2006/Soft_29750.html ),解密后在参看1),2)
4)繁体pdf文件:用2)的方法识别到word后,用word中的“工具”--“语言”---“中文繁简转换”

2、caj文件的识别:

1)局部文字识别:直接使用caj浏览器(下载地址 http://www.xdowns.com/soft/4/136/2006/Soft_29737.html )的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样
3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。然后使用2)全部转化为word。

3、超星文件的识别:

1)局部文字识别:直接使用超星浏览器(下载地址 http://www.xdowns.com/soft/31/91/2006/Soft_27810.html )的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到word中,在合并到一起。打印时要填入打印页码从1到最后一页,不要选择打印全部。此外在打印选项中,还要将页面比例设成真实大小,而不是整宽。注意:识别速度比其他格式要慢很多,请保持耐心,但是最后当你看到轻松的生成全本书的word版本时,你会欣喜若狂的,呵呵。我的试验结果是一本280页的书,识别需要几分钟的时间。

3)超星相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的pdf文件,然后在用1、的方法转成word

4、其他情况下的识别:

使用snagit软件(下载 http://www.xdowns.com/soft/31/46/2006/Soft_29690.html
)将任何形式的文字可以变成图片,例如使用snagit将屏幕拷贝成图片,然后右键点击图片文件,用microsoft Office Document Image打开图形,其他和2)一样。

注意:其他的各种识别软件请不要在用,因为要么只能识别中文,要么只能识别英文,要么不能识别整个文件,要么不能识别屏幕拷贝图像,要么识别误差很大,要么不能识别表格,要么需要注册,要么识别速度很慢,要么使用不便(和word结合不紧),这些软件包括:紫光ocr,万方pdfocr,尚书,汉王,ScanSoft PDF Converter,pdf2word,以及各种被推荐的软件等等,我都装过,现在都像LJ一样删除了。只要安装了acrobat 专业版,snagit,office2003,现在你可以完美的做任何事,最重要的是这几个软件很好得到。

针对一些问题的补充:
经过一些试验,发现microsoft Office Document Image 存在一些不稳定的问题,例如在用caj打印到Microsoft Office Document Image Writer打印机时,发现用caj5.5版本比较快,(caj5.5不能加升级补丁),而caj5.0有时出现假死机。
另外页面显示大时,转化的识别率较高。
如果页数多的文件,包括超星,如果有问题,可以分多次转化。

再次补充:
1、由于虚拟打印到Microsoft Office Document Image Writer 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度和C盘空间以及内存空间,建议配置好的机器一次转化不要超过200页,配置差的不要超过100页,同时打印时在右下角系统栏中会出现打印机图,你可以双击,看到打印任务的进度,以免以为死机了。另外转化完成后请删除c:\windows\temp目录下的虚拟打印文件,否则你的c盘很快会被用光。

2、建议如果发生打印到Microsoft Office Document Image Writer很慢或者假死的情况,可以先打印到snagit虚拟打印机,会自动生成tiff文件,速度比Microsoft Office Document Image Writer快,然后在snagit中,选择打印机为Microsoft Office Document Image Writer打印机,(相当于再打印到Microsoft Office Document Image Writer打印机),然后选择snagit---outputs下的printer,然后选择snagit----file----finish output,即可生成msi文件,其他一样。转化完成后请删除c:\windows\systems32\snagit临时文件。
临床药师网,伴你一起成长!微信公众号:clinphar2007
  • TA的每日心情

    2020-9-5 12:18
  • 田地 发表于 2009-5-7 11:08:50 | 显示全部楼层
    好文,学习了,谢谢分享.
    临床药师网,伴你一起成长!微信公众号:clinphar2007
  • TA的每日心情

    2019-7-24 11:29
  • hubs 发表于 2009-5-7 15:14:58 | 显示全部楼层
    真是挺实用的,谢谢,一定要好好学习,
    临床药师网,伴你一起成长!微信公众号:clinphar2007
  • TA的每日心情

    2020-8-8 23:13
  • lzh19840525 发表于 2009-5-7 16:44:25 | 显示全部楼层
    楼主对计算机很在行吗?感觉你好厉害,O(∩_∩)O~
    临床药师网,伴你一起成长!微信公众号:clinphar2007

    该用户从未签到

    ayfyxwh 发表于 2010-3-5 10:26:34 | 显示全部楼层
    真的有用吗?感谢搂住分享!
    临床药师网,伴你一起成长!微信公众号:clinphar2007
  • TA的每日心情

    7 小时前
  • hyg 发表于 2010-3-5 20:39:43 | 显示全部楼层
    太复杂了,有简单点的吗?
    临床药师网,伴你一起成长!微信公众号:clinphar2007
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    1、禁止发布任何可能侵犯版权的内容,否则将承担由此产生的全部侵权后果。
    2、请认真发帖,禁止回复纯表情,纯数字等无意义的内容!
    3、提倡文明上网,净化网络环境!抵制低俗不良违法有害信息。

    快速回复 返回顶部 返回列表