河南日报社全媒体记者 张熠 朱晓玲
近年来,用人工智能辅助古文字研究成为学界的重要课题。2020年,全国首款AI甲骨缀合产品——“缀多多”正式推出,首次实现了人工智能批量缀合甲骨。当古老的甲骨文遇上AI技术,会碰撞出怎样的火花?交叉跨界的研究者对此深有感悟。立秋时节,记者专访了河南大学计算机与信息工程学院教授、河南大学黄河文化遗产实验室研究员张重生。
缀合是甲骨重获新生的必经之路
甲骨缀合,就是综合利用甲骨的各方面信息,将两片及以上的甲骨碎片拼接起来,变为完整或较为完整的材料。“比方说,3个花瓶打碎了,有5000多片各种形态的碎片,运用AI技术把这些碎片重组复原,这就是我在做的事情。”张重生这样描述他的工作。
作为最早的成系统的汉字,甲骨文是研究商周文化的第一手材料,而距今三千多年的商周甲骨破碎十分严重,目前发现的约16万片甲骨中,碎片占90%以上。为了更好地研究利用甲骨这一珍贵遗产,必须开展甲骨碎片的缀合复原工作。因为缀合并非通过甲骨实物,而是通过拓片和摹本,还要考虑到重复和仿制的问题,复杂性不言而喻。
张重生介绍,近年来利用计算机图像辅助甲骨缀合是最高效也是最经济的办法。很多从事甲骨缀合的学者都利用计算机来提高缀合效率,但过去的计算机缀合模型没有起到完全缀合的作用,甲骨学家还需承担大量的缀合工作,劳动强度很大。近几年,人工智能技术的突飞猛进,让研究者有机会更接近完全缀合的目标。
完整缀合出一块甲骨不亚于发现一块新甲骨
将三千多年前的甲骨碎片“拼拼图”,是破译古文字的基础。甲骨学者普遍认为,缀合出一块较为完整的、可用于甲骨文研究的甲骨,其价值不亚于发现一块新的甲骨。
张重生表示,缀合的每组甲骨具有唯一性。甲骨缀合,不仅要求甲骨的形状能严丝合缝连接,甲骨正反两面的纹路也要能对上,还要检查所刻的文字,从字体、风格再到叙事内容都要契合。
更复杂的是,由于甲骨分散在世界各地的博物馆、大学或研究机构,需要相关数据信息共享。“我们可以用数字化的方法进行甲骨碎片缀合还原,让相关学者将内容破译出来,继续研究。”张重生说。
“甲骨缀合是项苦差事。边缘记忆和匹配能力对于人脑来说是比较困难的,这恰恰是人工智能擅长的领域。”2018年,张重生团队开创了AI自动识别甲骨文的新范式,极大超越了传统算法。考虑到精准复原甲骨是学界的重大现实需求,团队从2019年开始设计甲骨缀合算法,并于2020年与首都师范大学联合研发出AI缀合软件“缀多多”,实验阶段甲骨缀合准确率达99%左右;应用阶段准确率为85%左右,在甲骨学历史上首次实现了人工智能批量缀合甲骨。
当前AI缀合还处于初级阶段
用AI缀合甲骨还有很多难题待解。张重生介绍,甲骨中的每个文字数据量分布非常不均衡,有些字出现的频率非常高,如“王”和“贞”,而另外一些字出现的频率则较低。目前,人工智能技术只能识别出现频率较高的甲骨文,对出现频率较低的甲骨文有可能识别不出来或正确率不高。对于甲骨文中的形似字,如“夕”和“月”,“比”和“从”,在形态上非常相似,只能依靠专家的经验辨识。此外,文字不是孤立地存在的,需要放入具体的文本环境中进行理解,而文本环境具有一定的不确定性,这无疑增加了甲骨文破译的难度。
对于利用人工智能破译甲骨文的前景,张重生认为,目前人工智能与古文字研究的结合还处于初级阶段,人工智能在对问题的规划求解、语义理解和创新知识等方面仍处于辅助地位,所以在未来较长的一段时间里,“人机耦合”将会是研究甲骨文的主要形态。所谓“人机耦合”,就是人与机器进行紧密结合和相互协作,在AI擅长的领域解决对人类智能来说比较困难的问题,在人类智能比较擅长的领域解决AI比较困难的问题。通过“人机耦合”,最终完整地解决问题。
“下一步,我希望AI缀合可以赋能更多的古文献研究,例如,秦汉简牍、敦煌遗书、吐鲁番文书等。”张重生说,“我的名字叫张重生,而我的工作就是让出土文献重获新生,所以我经常开玩笑说,我的名字已经说明了我的使命。”
看三千年前商人防病治病妙招
河南日报客户端记者 李林 杨之甜 通讯员 张佳婧
今年8月19日是第七个“中国医师节”。而事实上,人类与疫疾的斗争历史源远流长,早在三千多年前的殷墟甲骨文中,就有了关于疫疾的记载。
“在殷墟考古中常见公共大灰坑上面覆盖一层或两层纯净土,应是有意填埋垃圾,是当时防疫的实证。”8月17日,在殷墟博物馆二楼“伟大的商文明”展厅,志愿讲解员梁艳红正绘声绘色地讲述商王朝的医疗与防疫。治疗耳疾、检查龋齿、妇好分娩……一个个生动的小故事吸引游客围了一圈又一圈。
“商朝人已经有了卫生防疫意识。”梁艳红介绍,商朝人对身体各个部位的清洁特别讲究,甲骨文中用“盥”表示“洗手”之意,“沫”表示“洗头”之意,“浴”表示“洗澡”之意,“洗”则用来表示“泡脚”,不同部位的清洁都有专门的字来表示。从对殷代卜辞的研究和出土的殷周盥洗用具可以看出,当时人们已经养成扫地、洗手、洁面、泡脚等习惯。
梁艳红说,水井加盖、用多层石子对水进行过滤处理的做法,也体现商朝人讲究饮水卫生与质量,清洁水源、注意饮水卫生与防范疫病污染的先进理念。
“真没想到,生活在三千年前的人们都已经有防病治病‘妙招’了。”安阳市民蔡先生感叹。
“病疫猖獗之际,商朝人既有非理性的巫术祭祀,也有通过国家行政防控应对手段、社会群体群防形式、个人锻炼活动等,积极抵御病毒侵害,而且约定俗成演绎出许多预防疠疫传播蔓延的社会风尚习俗。”梁艳红介绍。
她举例,安阳殷墟小屯西地一个灰坑中曾发现一块牛肩胛骨,卜辞原文是:“乍(疫),父乙,妣壬豚,兄乙豚,化口……”意思是疫情突发,为众人御除疠疫举行了一系列祭祀先人的行事。这被研究者视为中国最早的关于疫疾的文字记载。
“商朝人甚至还尝试开颅术和针砭术。在安阳殷墟大司空东地,考古人员发现了一具儿童骸骨,其颅骨上有一规则的圆形孔洞,可能是当时采用开颅术治疗疾病的遗留。”梁艳红说,同样的发现还有多处,可见外科手术在当时已经初见雏形。
商朝已经能区分不同种类的疾病。记者了解到,出土的甲骨文中已发现50多种疾患的记载,包括现代医学中内、外、耳鼻喉、牙、泌尿、妇产、小儿、传染等各科,说明医学已达到相当高度。
此外,从甲骨文字形上可以看出商朝人对人体有了一定认识,这是商朝外科手术得以开展的前提。如甲骨文的“心”字,文字的构形已经可以清晰辨别出人体心脏的形状以及心脏结构的心房、心室和心脏瓣膜。
由此可见,甲骨文内容丰富,凌厉婉转的刀锋笔意记载着医疗卫生等方面的卓越成就,传承千年,影响至今。
文物小档案·后母戊鼎
1939年,后母戊鼎在河南省安阳市武官村出土,重832.84千克,是目前已知中国古代最重的青铜器,常用于重要的祭祀活动。
甲骨文双语小课堂
甲骨文“心”字,勾勒出人或动物心脏的轮廓,心包上还有两笔简练的斜线以表示心脏肌理和血管纹络,直观地反映了古人对人体解剖的朴素认识。本义是心脏。
The oracle bone script of the character“心”(xīn) shows the outline of a human or animal heart,with two simple slashes on the pericardium to represent the heart’s texture and blood vessels. This reflects the ancients’basic understanding of human anatomy. The character’s original meaning is“heart”.
(文字翻译 童林 张蕊)