为了保护和传承传统文化,让古籍焕发新生,近年来,古籍工作成为党和国家关注的重点之一。为了推进古籍工作,中共中央办公厅、国务院办公厅于2022年4月发布了《关于推进新时代古籍工作的意见》,明确提出了推进古籍数字化的重要性。在2021年,字节跳动公益发起了“寻找古籍守护人”活动,邀请专家学者、文化名人和抖音达人加入,并推出了“古籍新说”系列访谈栏目,涵盖了古籍修复师故事、古籍知识专题和经典古籍解读等内容。2022年,字节跳动启动了古籍数字化工作,并与北京大学数字人文实验室合作,共同打造了古籍数字化阅读平台“识典古籍”。该平台于同年10月正式上线,受到了文史爱好者和研究者的积极反馈和支持。与其他古籍数字化平台不同,“识典古籍”是一个完全免费的公益平台,提供了分词检索、图文对照、繁简转换、字典释义、文白对照、实体百科等便捷功能。平台标注了古文中的人名、地名、书籍、时间、官职等信息,并添加了标点符号,使普通人也能更好地接触古籍,深入了解其中的文化内涵。目前,识典古籍已经免费开放了2900余部古籍,并不断扩充古籍资源。
产品上线后,由于资源丰富、功能众多,用户不时反馈找不到或不会使用的问题。为了满足多元化的用户需求,识典古籍进一步推出了古籍智能助手。用户只需选中原文,点击“问AI”,就能看到这句话的白话文翻译。用户还可以直接提问,智能助手会通过语义检索识典古籍的资料库,给出解答,并在回答中显示引用的参考资料和原文链接。智能助手的语义检索功能是其技术亮点之一。此外,智能助手还能通过大语言模型总结长篇古籍的主要内容,并提供可参考的研究问题,为研究和检索古籍提供便利。识典古籍与抖音百科合作,用户在阅读过程中可以看到对应的百科词条,获取超越当前文本的拓展知识。由于大语言模型生成式的特点,人工智能的回答可能会产生错误或“幻觉”。为了解决这个问题,古籍智能助手采用了检索增强生成技术,要求大模型根据可靠资料作答,一定程度上限制了“幻觉”的产生。同时,在界面上提示用户注意查证。识典古籍的研发人员表示,他们使用了字节跳动自主研发的云雀大语言模型作为智能助手的技术基础,并进行了多项定制和优化,以更好地满足用户需求和意图。
古籍智能助手是一个创新功能,目前还处于实验阶段,用户的使用和反馈对产品的进一步提升非常重要。字节跳动希望通过先进的技术,修复古老的记忆,通过数字化平台和人工智能工具丰富大众的文化生活,助力古籍焕发新生。
作者/王菡