computer 版 (精华区)
发信人: yahooboy (复活鸟), 信区: POPsoft
标 题: 表格识别
发信站: 听涛站 (Tue Oct 17 13:21:58 2000), 转信
BBS水木清华站∶精华区
发信人: duanjian (风云), 信区: NewSoftware
标 题: 表格识别
发信站: BBS 水木清华站 (Wed Apr 12 09:59:46 2000)
尚书五号的5.2版,对中英文的表格识别的非常好,表格正确率为100%(扫了十几张)
文字也不错,打印稿几乎100%,一页大概有两三个不正确,印刷稿也能在90%左右,
比清华文通的强,推荐使用
--
※ 来源:·BBS 水木清华站 smth.org·[FROM: 166.111.7.200]
发信人: wuduan (棒棒军), 信区: NewSoftware
标 题: Re: 表格识别
发信站: BBS 水木清华站 (Thu Apr 13 01:13:48 2000)
没错,
不过你不要象它公司的似的,来推销
它识别出来的东西也不怎么样,
如果一个表格中有一段空白,一段字,
那么那段空白就会被去掉,
再编辑很困难。
我是在和国外英文的识别软件比。
许多常见的英文ocr软件都能做到识别以后生成real page
就是说生成的(例如word文件)和原稿相差无几。
acrobat也属于此类。
而中文识别软件没有一个做到的,
至多也不过认识个表格。
做不到这一点并非因为中文识别天生比英文困难。
因为不是字识别不出来,而是识别后的排版问题。
象我刚才说的表格空白,
只需要加适当的空就行了,而中国的字识别软件却做不到。
实际上这反应出中国软件作者缺乏一种把东西做精的敬业精神。
【 在 duanjian (风云) 的大作中提到: 】
∶ 尚书五号的5.2版,对中英文的表格识别的非常好,表格正确率为100%(扫了十几张)
∶ 文字也不错,打印稿几乎100%,一页大概有两三个不正确,印刷稿也能在90%左右,
∶ 比清华文通的强,推荐使用
--
※ 来源:·BBS 水木清华站 smth.org·[FROM: ws18-38.jlu.edu]
BBS水木清华站∶精华区
--
※ 来源:.听涛站 cces.net.[FROM: 匿名天使的家]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:0.926毫秒