精华区文章阅读

发信人: yahooboy (复活鸟), 信区: POPsoft
标  题: 表格识别
发信站: 听涛站 (Tue Oct 17 13:21:58 2000), 转信

BBS水木清华站∶精华区
发信人: duanjian (风云), 信区: NewSoftware
标  题: 表格识别
发信站: BBS 水木清华站 (Wed Apr 12 09:59:46 2000)

尚书五号的5.2版，对中英文的表格识别的非常好，表格正确率为100%（扫了十几张）
文字也不错，打印稿几乎100%，一页大概有两三个不正确，印刷稿也能在90%左右，
比清华文通的强，推荐使用

--
※ 来源:·BBS 水木清华站 smth.org·[FROM: 166.111.7.200]
发信人: wuduan (棒棒军), 信区: NewSoftware
标  题: Re: 表格识别
发信站: BBS 水木清华站 (Thu Apr 13 01:13:48 2000)

没错，
不过你不要象它公司的似的，来推销
它识别出来的东西也不怎么样，
如果一个表格中有一段空白，一段字，
那么那段空白就会被去掉，
再编辑很困难。
我是在和国外英文的识别软件比。
许多常见的英文ocr软件都能做到识别以后生成real page
就是说生成的（例如word文件）和原稿相差无几。
acrobat也属于此类。

而中文识别软件没有一个做到的，
至多也不过认识个表格。
做不到这一点并非因为中文识别天生比英文困难。
因为不是字识别不出来，而是识别后的排版问题。
象我刚才说的表格空白，
只需要加适当的空就行了，而中国的字识别软件却做不到。
实际上这反应出中国软件作者缺乏一种把东西做精的敬业精神。

【在 duanjian (风云) 的大作中提到: 】
∶ 尚书五号的5.2版，对中英文的表格识别的非常好，表格正确率为100%（扫了十几张）
∶ 文字也不错，打印稿几乎100%，一页大概有两三个不正确，印刷稿也能在90%左右，
∶ 比清华文通的强，推荐使用

--
※ 来源:·BBS 水木清华站 smth.org·[FROM: ws18-38.jlu.edu]
BBS水木清华站∶精华区

--
※ 来源:．听涛站 cces.net．[FROM: 匿名天使的家]

computer 版 (精华区)