繁体文字识别 ABBYY 与 千百OCR 使用比较
ABBYY是一款知名文字识别软件,识别后格式保持相对完整。由于是国外软件,不知对古书当中的繁体识别效果如何,从百度上找了一些繁体竖排的图片,然后我们将其与一款免费小软件“千百OCR”作一比较。
图一,现代印刷的仿古书籍,清晰的文本两者都能轻松识别,识别出来的字数千百ocr更多,从右到左自动改为从上到下顺序清晰。abbyy的格式显得有些混乱。
图片2,有竖线干扰的书籍
ABBYY识别效果
整体图
识别后的结果
千百OCR的识别效果(识别后点繁体转简体按钮已经转为简体)
识别后的结果(识别后点繁体转简体按钮已经转为简体,部分文字没转成功)
前言X网
婉约词是五代时期的一种词派它舍弃了一大江东去一的豪壮俊XlZ.C
ufo2003
0