佛教界siri,AI佛法无边:“阿弥陀佛” ?| Mixlab 跨学科
共 1382字,需浏览 3分钟
·
2021-03-25 17:15
你不一定听说过龙泉寺,也不一定知道贤超法师,但你大概率应该看过,口头禅是:我去问问我师父,满载人性温暖的机器人贤二。
或者,你刚好听过贤二聊天机器人的智慧箴言:
贤二:佛教界的 siri
这款聊天机器人出品自北京龙泉寺。这里的僧团有 “北大清华分院” 的戏称,寺院设有动漫中心、信息组、科研组,也越来越多僧人的教育背景是高学历。他们能用最新的现代技术和手段传播中国文化和汉传佛教。
感兴趣的 Mixlaber 们可以试试跟贤二聊天(看他是怎么怼/开导你的。)
今天我们主要聊的是这个寺庙的另一个项目:AI 让佛经的诵读变得更简单!
AI 科技与佛法
2017年,龙泉寺成立人工智能与信息技术中心,研发出能识别各种不同大藏经版本的整列识别引擎,并成功的将《六十华严》的大藏经版本进行电子化。
2020 年 12 月由腾讯发起的 2020 Techo Park 开发者大会分论坛上,龙泉寺的法师超贤发表了关于《大藏经》团队实现:
AI 自动标点、
(古)文白(话文)翻译、
古籍文字识别等技术实践的 AI 佛教演讲。
超贤演讲中
—— OCR + 深度学习
所谓自动标点,是指在没有人工干预的前提下,根据算法给古籍文本自动标注现代中文标点的技术,这主要是为了方便现代读者阅读。
能以更高的准确性,给古文添加句号、逗号、问号、感叹号、冒号、分号和顿号其中标点符号。经过验证,他们所研发的 Transformer 标注结果,和人类的标注结果「几乎已经无法区分」。
图自:腾讯云
超分辨率与古籍图像重建
超分辨率是将低分辨率图像,重建为高分辨率图像的技术。
图自:腾讯云
RNN+LSTM+ResNet
自动标点,在 NLP 领域来说,就是一个简单的序列标注问题。解决这类问题的标准方法,就是使用循环神经网络(RNN)。
为了增强 RNN 的性能,在此基础上又发展出来了双向 RNN,但此前基于这些技术所实现的自动标点,效果仍不是很令人满意,贤超法师团队又引入了 ResNet 残差网络(Residual network)。
龙泉寺自动标点工具:
http://gj.cool/gjcool/index
中国贤二 vs 日本机器人明达