Ubuntu 14.04下用OCRFeeder进行中文OCR

OCRFeeder是我用过的Linux下OCR软件中中文识别较好的一个。它基于tesseract,人机界面友好可惜的是tesseract发展好像很慢。

先安装ocrfeeder,方法很简单仓库里就有0.7.11版,OCR引擎选择上有大改进这个后面说。

2014-04-16-174123

2014-04-16-174213-1

装完ocrfeeder再装中文的OCR识别库,随带安装的只有英文的识别库。

2014-04-16-174213

我安装的是简体中文识别库,从上图看可选的识别库是很多的。

接下来启动程序

2014-04-16-175653

添加一个图片开始识别

2014-04-16-181731

怎没没结果?看看引擎设置

2014-04-17-102046

2014-04-17-094619

这个版本添加了语言映射,这样就可以根据你当前会话的语种选取引擎,可是有中文映射呀,检查下tesseract的参数

2014-04-17-094801

参数没变啊,原来安装包虽然是chi-sim但语言名是chi_sim修改下OCR引擎定义

2014-04-17-094552

再识别,OK!

2014-04-17-094527

tesseract对于混排识别还是不理想,只有期待他的改进了。

投稿作者 作者网站

评论

 
 

发表评论

 
你的昵称*
电子邮件*
网址(选填)
我的评论*
  • 发表评论
  • 为您推荐


    请支持IMCN发展!

    谁在捐赠

    微信捐赠 支付宝捐赠
    微信捐赠 支付宝捐赠




    微信公众号二维码

    归档