真实教育场景手写/表格/公式OCR数据集
向AI转型的程序员都关注了这个号👇👇👇
机器学习AI算法工程 公众号:datayx
TAL_OCR_MATH小学低年级算式数据集
算数数据集为小学数学1到3年级的学生手写数学式子,共3万图片。每个数学式子经过手工裁剪。每个图像提供了对应标注。特殊数学符号标注方式请查看字符对应表。(文件87.04MB)
TAL_OCR_CHN手写中文数据集
手写中文数据集为30名大学生手写的中文古诗词,总计11739张图片,每张图片提供了对应的文本内容标注。(文件183.92MB)
TAL_OCR_ENG手写英文数据集
手写英文数据集为学生手写英文作文,总计1万行英文,对应1万张图片,每张图片提供了对应的文本内容标注。(文件222.16MB)
TAL_OCR_FORMULA手写公式数据集
手写公式数据集为真实教育场景下学生手写的各类公式数据,总计143466张图片,每张图片提供了对应的文本内容标注。(文件0.99G)
TAL_OCR_TABLE表格识别竞赛训练集
表格识别数据集为真实教育场景下学生拍照搜题的各类表格数据,总计1.6w张图片,每张图片提供了对应的表格结构和内容标注。(文件1.11GB)
全部数据集 获取方式:
转发本文至朋友圈,截图发给本微信公众号 datayx 即可。
机器学习算法AI大数据技术
搜索公众号添加: datanlp
长按图片,识别二维码
阅读过本文的人还看了以下文章:
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx