文字识别:一文读懂 Transformer OCR
深度学习时代的文字识别:行识别,主流有两种算法,一种是CRNN 算法,一种是attention 算法。
CRNN:CNN+RNN+CTC
白裳:一文读懂CRNN+CTC文字识别
attention :CNN+Seq2Seq+Attention
白裳:完全解析RNN, Seq2Seq, Attention注意力机制
两种算法都比较成熟,互联网上也有很多讲解的文章。
Attention Is All You Need (Transformer)这篇文章,设计了一种新型self-attention结构,取代了 RNN(LSTM\GRU) 的结构,在众多nlp相关任务上取得了效果上的突破,而后来的BERT、GPT等模型亦是来源于
凤舞九天
0