传承好殷墟甲骨文
张 展 河南安阳
我的爱好是拼图,我的工作也是拼图,不过我拼接的是3000多年前的文明碎片——甲骨。借助人工智能技术,缀合残缺的甲骨片,这份工作听起来很有趣,其实做起来不简单。
2024年是甲骨文发现125周年,也是我来到甲骨文故乡河南安阳、应聘到安阳师范学院甲骨文信息处理教育部重点实验室的第五年。这一年,我所在的甲骨文传承研究创新团队荣获中国青年五四奖章集体,和同事缀合出的甲骨也超100组,助力殷墟甲骨文字传承工作。
和甲骨文结缘,我算是有点“跨界”。我博士期间的研究方向是数字图像处理与计算机视觉技术,跟3000年前深奥的甲骨文不沾边。2019年临近毕业时,我拿到了一部分甲骨文图像数据,开始研发第一版甲骨缀合程序。当年恰逢甲骨文发现120周年,我借助程序发现了一组可以缀合的甲骨碎片,当时兴奋极了。后来被告知,这组甲骨早已被前辈人工缀合过。虽然我一度非常沮丧,但也客观证明了借助人工智能缀合甲骨的有效性。
2024年殷墟博物馆新馆开馆,里面新展出了许多成版甲骨。其实,它们出土时并不完整,后期通过前辈大量的“拼接”。从甲骨文发现至今,大约存有16万甲骨碎片,许多还流落在国外。只有把更多的碎片“拼接”起来,才能更好地破译甲骨文。但从数以万计的甲骨碎片中,寻找并拼出完整的一块,并不是件容易的事。做甲骨文拼图有点像大海捞针,比如多个完整的甲骨碎成多个碎片,这属于多目标拼接,然后是图像边缘等距离拼接、图像的纹理拼接、图像中这些残词残句的拼接,我们需要开发1个软件,同时解决这4个问题。经过反复尝试,接受无数挫折,我们在去年实现了甲骨碎片图像的小批量缀合。
新的一年,殷墟甲骨的文字传承工作并未停歇。今年6月,实验室将组团到法国进行甲骨实物高保真数据采集,我希望能参与进来,和同事一起研发出甲骨文碎片较大规模缀合的程序,建立更全面和规范的甲骨文字形库和语料库。
(本报记者 张文豪采访整理)