“了不起的甲骨文”微信小程序界面
近日,由安阳师范学院、腾讯SSV数字文化实验室联合主办的“2025‘AI+甲骨文’成果展示暨协同创新交流会”在河南安阳举行,会上集中呈现了“数字甲骨共创计划”项目在甲骨文数字化保护、智能化研究和创新性活化方面取得的系列突破性成果,并正式发布了甲骨文智能体“殷契行止”,为古文字的保护、研究、焕活开启了全新可能。
共享
轻松体验甲骨识读的乐趣
长期以来,甲骨文研究一直面临“识别难、比对难、共享难”的挑战,由于拓片噪声复杂、字形异构多变,通用大模型难以理解甲骨文的特征规律。
为解决这些难题,腾讯优图实验室联合腾讯SSV数字文化实验室、甲骨文信息处理实验室、厦门大学人工智能研究院,以“AI+多模态语料融合”为基础,研发出字形检测与分类算法、AI摹本生成与字形匹配技术、甲骨校重与结构化比对算法,以及融合图像、文字与语义的多模态推理能力等多项关键技术。这些针对性算法的引入,使得AI具备了“理解古文字”的能力,有效解决了通用模型在专业领域中的适配难题。
这些关键技术的突破,为“殷契行止”智能体的研发奠定了基础。“殷契行止”智能体由安阳师范学院甲骨文信息处理教育部重点实验室与腾讯SSV数字文化实验室、腾讯优图实验室、厦门大学人工智能研究院共同研发。其面向专家与公众免费提供“双端服务”,用户只需上传一张甲骨图片,AI即可完成文字识别、释义查询、文献溯源和数字摹本生成。
“在专业端,‘殷契行止’智能体为古文字研究者提供智能识别、比对与检索工具,显著提升研究效率;在公众端,可以通过‘了不起的甲骨文’微信小程序轻松体验甲骨识读的乐趣,获取古文字知识。”安阳师范学院甲骨文信息处理教育部重点实验室相关负责人介绍。
腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声介绍,通过高质量的多模态数据库支撑,以及针对甲骨文特征定制的算法创新,使得“殷契行止”智能体在字符分类、字形匹配等关键任务上显著优于通用大模型。
成果
“数字甲骨共创计划”取得多项突破
“数字甲骨共创计划”自2022年启动以来,在甲骨文多模态数据集建设、智能辅助破译算法研发、流失甲骨数字回归、甲骨文化活化传承等方面均取得阶段性突破。
甲骨文数量庞大且分布碎片化,数据整合困难,过去研究者无法获得完整的语言背景和历史信息,使得对其翻译与解读变得更加困难。为推进智能化研究,“数字甲骨共创计划”构建了全球最大的甲骨文多模态数据集,包含143万甲骨文字形数据、1.5万片甲骨多模态数据及3000篇研究文献。安阳师范学院甲骨文信息处理教育部重点实验室主任刘永革介绍,基于这些数据研发的智能校重和缀合,《甲骨文三编》的校重工作时间从以传统方法的20余年缩短至一周,效率提升显著。与此同时,通过“人机协同”展开的研究,当前已为10多个未考释文字提供了破译线索。
自然侵蚀、灾害等因素对甲骨文的保存产生了非常大的威胁。“数字甲骨共创计划”首创甲骨文微痕增强技术,形成高保真全信息采集建模规范。截至目前,已完成1525片甲骨的数字采集,其中海外甲骨“数字回归”达950片,覆盖德国、法国、韩国等4个国家的9家收藏机构。目前,实现“数字回归”的海外甲骨部分数据已与国内数据库整合,有望通过AI算法,如字形匹配、碎片缀合等,辅助专家学者进行甲骨文研究。
保护
从单点突破走向系统创新
这一系列成果的取得,得益于数字甲骨共创中心建立的共建共享机制。数字甲骨共创中心汇聚了中国社会科学院、郑州大学、安阳市文物局、中国文字博物馆、殷墟博物馆、安阳博物馆等多家机构,让甲骨文保护从单点突破走向系统创新。
腾讯可持续社会价值副总裁、腾讯SSV数字文化实验室负责人舒展表示,数字甲骨共创中心凭借技术突破、在线工具打磨、创新模式培育,吸引了国内外的机构和专家共建共享、共创共益。此外,数字甲骨共创中心还通过数字研学、甲骨文体操、创意大赛等形式,让甲骨文从学术殿堂走进公众视野。
中国工程院院士、中国人工智能学会理事长、清华大学信息科学技术学院院长戴琼海认为,围绕“AI+甲骨文”三年共创形成的系列技术突破、规范化成果与在线工具,不仅提升了学术研究的效率,也为文献保护、数字回归与公众参与提供了可复制的实践路径。
中国社会科学院学部委员、甲骨学和殷商史专家代表宋镇豪则认为,当前,甲骨文研究已逐步形成文理结合、甲骨文学者与计算机学者跨学科人才积聚、产学研结合协同攻关的新局面,推动了甲骨文数字化从“技术突破”走向“成果落地”。