近日,谷歌DeepMind与诺丁汉大学研究团队开发的AI工具“埃涅阿斯”(Aeneas),能够破译千年罗马铭文,相关研究已于7月23日发表于《自然》杂志。以下是具体介绍:开发背景:古代罗马铭文承载着文明发展的珍贵信息,但因风化侵蚀往往残缺不全。每年约有1500条新的拉丁铭文被发现,传统修复方法要求历史学家通过寻找其与其他文本的相似处,将它们置于更广泛的语言和历史背景中,不仅耗时费力,还受研究者专业领域局限。工作原理:输入铭文的残缺转录文本和扫描图像后,系统会给出铭文可能的年代和起源地,并补全缺失的文字。其核心创新是上下文关联机制,通过训练语料库LED检索出与输入文本最相关的铭文平行例证列表,基于语义和语境进行比较分析。功能特点: 多模态分析:采用基于字符的处理方式,能同时分析铭文的视觉特征和文本内容,避免单词级别表示的局限性,可处理任意长度的文本缺失问题。 准确断代定位:针对公元前7世纪至公元8世纪的拉丁铭文进行训练,平均年代判断误差仅为13年,中位误差为0年,在地理归属任务中,表现明显优于仅使用文本的模型。实验效果:研究团队组织了23名铭文学专家参与人机协作实验,结果显示,90%的历史学者认为其检索的平行文本为研究提供了有价值的起点,关键任务中的信心水平提高了44%。在文本修复和地理归属任务中,人机协作的表现明显优于单独由人类或AI完成的结果。意义与局限:“埃涅阿斯”代表了AI在古代文本研究中的重大飞跃,为填补人类历史记录中的空白提供了前所未有的技术工具。但目前仅有5%的铭文能够匹配对应图像,且训练数据库规模相对较小,处理特殊铭文时可能表现受限,无法独立解读新发现的铭文。
|
|