深度学习人工智能帮助考古学家翻译古代碑

深度学习人工智能正在帮助解决现代世界中的许多问题。但它在帮助解决一些古老的问题方面也可以发挥作用,例如协助解决 2500年历史的黏土平板翻译 来自波斯阿契美尼德帝国的文件。

这些药片是1933年在现代伊朗发现的,已经被学者研究了数十年。但是,他们发现,数位板的翻译过程非常麻烦,而且容易出错。我技术可以提供帮助。

“我们有应用机器学习的初步实验,以识别平板电脑图像中存在哪些楔形文字符号,” 桑杰·克里希南(Sanjay Krishnan)芝加哥大学计算机科学系的助理教授告诉《数字趋势》。 “机器学习通过从人类标记的示例中推断模式来进行工作,这使我们将来可以自动执行注释。我们认为,这是对这些平板电脑的分析和研究实现重大自动化的一步。”

在这种情况下,人类标记的示例是来自 波斯波利斯设防档案馆的 (PFA)在线文化和历史研究环境(OCHRE)数据集。在DeepScribe中,芝加哥大学东方学院的研究人员与计算机科学系合作,他们使用了6,000多个带批注图像的训练集,建立了一个能够读取馆藏中未经分析的药片的神经网络。

当该算法在其他平板电脑上进行测试时,它能够以大约80%的准确度翻译楔形文字。希望将来能提高此基准。即使即使没有发生,该系统也可以用于翻译大量药片,使人类学者可以将精力集中在真正困难的地方。

“楔形文字是自公元前三千年以来使用的一种脚本,用于编写包括苏美尔语,阿卡德语和埃拉姆语的多种语言,” 苏珊·保罗副教授说,《数字趋势》杂志。

楔形文字对机器翻译提出了一系列特殊的挑战。首先,它是通过将芦苇笔打入湿粘土中来编写的。这使楔形文字成为极少数的三维脚本系统之一。其次,楔形文字是使用数百个符号的复杂脚本系统。每个符号根据其上下文具有不同的含义。第三,楔形文字片是古老的人工制品。它们经常被打碎并且难以解读,这意味着阅读一台平板电脑可能需要几天的时间。

克里希南说:“到目前为止,我们有一个初步的原型,表明这种技术在受控环境下非常有效。” “给出单个符号的清晰图片, [we can] 确定符号是什么。我们的下一步是开发考虑上下文和数据质量的更强大的模型。”