基于视觉的数学公式识别算法介绍
小白学视觉
2020-10-10 03:52
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文为CSIG-DIAR 2020学术年会系列报道之一,转载自52cv,CSIG文档图像分析与识别专委会,为中国科技大学大学杜俊老师最新分享。内容较多,建议先收藏再阅读。
END
评论
OCR文字识别—基于CTC/Attention/ACE的三大解码算法
欢迎关注Smarter,构建CV世界观
本文全面梳理一下OCR文字识别三种解码算法,先介绍一下什么是OCR文字识别,然后介绍一下常用的特征提取方法CRNN,最后介绍3种常用的解码算法CTC/Attention/ACE。
什么是OCR文字识别?
一般来说,文字识别之前需要先对文字进行定位(文字检测主要有基于物体检测和基于分割两种方法),文字识别就是通过输入文字图片,然后解码成文字的方法。本文主要讲文字识别部分,文字识别主要分成三种类型:单字分类、整词分类和整词识别。当能够定位出单字时,可以用图像分类的方法直接对单字进行分类;当需要预测整词数量较少时,可以对整词进行分类;当有大量整词需要预测并且没有单字定位时,就需要用解码序列的
陀飞轮
0