神秘「死海古卷」抄写员身份曝光,AI破解最古老希伯来圣经
新智元报道
新智元报道
来源:Wired
编辑:LQ
【新智元导读】近日,考古研究人员开发了一种机器学习工具,通过笔迹分析的方法,他们为确定《死海古卷》撰写人数提供了新的线索。
「死海古卷」被称为20世纪最重要的考古发现,但直到今天,关于古卷还有无数个「未解之谜」。
其中之一就是:谁把文字抄在羊皮纸上?一个人还是多个人?
对于这个问题,几天前发表的一篇论文有了新发现——利用人工智能技术分辨笔迹,最终,研究人员发现古卷之一《以赛亚书》并不是一个人抄完的,而是两个人一起完成的,他们的笔迹风格经过训练相似度非常高。
对于古代书写体系的研究被称为「古文字学」,传统的古文字学建立在研究者的经验之上,具有不可避免的主观性。
而一个人的笔迹在不同的状态下——累了、换了书写工具、手受伤了都会不一样,那么,如何判断笔迹变化是同一个人在不同状态下的自然变化,还是不同的人在经过训练后刻意的模仿?
死海古卷文字以希伯来文为主,《以赛亚书》也不例外,在这部发现最早、保存最完整的古卷中,希伯来字母中的第一个「aleph」至少出现过5000次,光凭人眼是很难判断这些字体的差异的。
左侧衬于下方的图表显示的是字母「aleph」,右侧浮于上方的是希腊文中第二个字母「Bet」
交给机器是一个不错的方法。
格罗宁根大学的研究员Mladen Popović表示,「模式识别和人工智能技术非常适合。」
让没有感情的机器来分辨笔迹
让没有感情的机器来分辨笔迹
那么如果让机器分辨这些笔迹呢?
首先,Popović与同事建立了开发了一种人工神经网络,他们可以通过训练将文本的墨迹与书写文本的羊皮纸或纸莎草纸分离开来,确保数字图像精确地保存了原始标记。
这很重要,因为古代墨水的痕迹直接关系到一个人书写时的肌肉运动和其他具体情况。
接下来,他们从《以赛亚书》的页面中创建了两个12x12的全字符 aleph 和 bet 自组织结构图,每个字母由多个相似字符的实例组成。这种结构图对于按时间顺序进行开发分析很有用。使用片段(支离破碎的字符形状)代替完整的字符形状,以获得更稳健的结果。
结果显示了两种不同的手写风格,这个结果甚至在团队为数据添加额外的噪音作为额外的检查之后依然存在。这项分析还表明,第二个书记员的笔迹比第一个书记员的笔迹更加多变,尽管这两种风格非常相似,这表明可能有一种共同的训练。
最后,波波维等人创建了「heat map」的视觉分析,在整个卷轴纳入了所有给定字符的变化。他们用这个方法为前27列和后27列创建了一个平均版本的人物,肉眼可以清楚地看到这两个平均版本的人物是不同的,因此有更多的证据表明第二个抄写员抄写了书卷的第二部分。
Popović表示:「现在我们可以通过笔迹的定量分析和稳健的统计分析来证实这一点, 在计算机的智能辅助下,我们可以证明这种分离在统计学上是显著的,而不是基于或多或少的印象主义证据进行判断。」
该研究也存在可疑之处,比如,他们的分析并没有完全排除这些变化是由于抄写员的疲劳、受伤或者换笔所致,但是「更直接的解释是换抄写员了」。
这次的研究也表明,从事古文字研究的学者可以通过与其他学科,比如人工智能的合作而获得突破。
「死海古卷」之谜
1947年,一位贝都因牧羊人在寻找一只丢失的山羊时在死海附近的库姆兰向一个洞穴中扔了一块石头。他听到一个空洞的声音,于是他就爬进了那个洞穴,在那里他发现了一个罐子,里面装着3卷古老的卷轴。
他将这些古卷拿到伯利恒的一位古董商那里鉴定,发现惊天宝物的古董商随即跟着牧羊人一起回到库姆兰继续寻找,他们总共找到7卷古卷(其他许多古卷则在后来才被发现),这就是我们今天所知的「死海古卷」。
这些死海古卷的古老文字由犹太人的祖先所书写,对犹太历史、文化和文字传承的研究具有如此重要的意义,却可望而不可及。
死海古卷大部分是用墨水书写在羊皮纸上,有些书写在纸莎草纸上,有一卷最独特的卷轴则是在铜上镌刻而成。大部分古卷以希伯来语书写,与现今的字母表或多或少有些相关。有些内容以希腊语和阿拉姆语书写。
参考资料:
https://www.wired.com/story/ai-helps-prove-two-scribes-wrote-text-of-dead-sea-scroll/
AI家,新天地。西山新绿,新智元在等你!
【新智元高薪诚聘】主笔、高级编辑、商务总监、运营经理、实习生等岗位,欢迎投递简历至wangxin@aiera.com.cn (或微信: 13520015375)
办公地址:北京海淀中关村软件园3号楼1100