将汇聚超百亿字文献,“尚古汇典”数字平台让古籍中的文字活起来

新民晚报   2023-08-26 15:41:59

中华优秀传统文化的传播,并非幽径,而是通途。将古籍的魅力带入现代生活,让古籍在数字时代发出耀眼光芒。8月25日,由上海世纪出版集团规划设计、上海古籍出版社具体实施、全力打造的古籍数字化综合服务平台“尚古汇典·古籍数字服务平台”(简称“尚古汇典”平台)在世纪出版园正式亮相。该平台为“2021-2035年国家古籍工作规划”重点项目。

历经三年计划与建设的“尚古汇典”平台聚合优质古籍资源,在光学文字识别、大数据、人工智能等数字技术基础上,为古籍整理出版者、古籍专业研究者及传统文化爱好者提供数字服务,赋能古籍整理出版、学术研究和国学传习。“尚古汇典”平台计划分期建设,保持更新及完善,持续为用户提供更丰富、更专业、更便利的古籍知识服务。本阶段主要目标为填补文史哲领域古籍数字资源的空白,充实平台文献内容,提供古籍阅读、检索、征引等服务。


(资料图片仅供参考)

目前已上线数据库包括典籍整理文献数据库,其中一、二期以上海古籍出版社出版的整理本古籍为主,共计入库1677种图书,达5亿字,收录资源涵盖经、史、子、集各部,包含“中国古典文学丛书”“清诗话”、历代大家全集、地方文献等经典系列,完整保留图书前言、注释、校勘等整理成果;中国地方文献总库·上海文献总库,一期以上海古籍出版社、上海市地方志办公室整理出版的“上海府县旧志丛书”为基础,共计收录88种图书,4000万余字。

复旦大学图书馆馆长陈引驰认为,上海古籍出版社是中国传统古籍整理最顶尖的出版社之一,“尚古汇典”平台把上海古籍出版社出版的经典著作,如“中国古典文学丛书”通过数字化方式展示出来,便于读者阅读与检索,对传统古籍进一步挖掘和充分利用具有重要意义。

武汉大学图书馆是“尚古汇典”平台首批试用者之一,馆长董有明表示,这一平台为新时代古籍整理数字化建设开启了新的行动表率,为中华优秀传统文化的传承和发展创造了新的空间,相信会得到广大师生的欢迎。

北京大学中国古文献研究中心副主任杨海峥评价,“尚古汇典”平台特色有三,其一,令古籍研究者提高效率,获得高质量古籍资源;其二,平台核心资源为古籍整理研究者确立了古籍整理的典范;其三,平台收录的资源具有权威性、优质性、全面性。

华东师范大学中文系副主任、古籍研究所所长方笑一表示,“尚古汇典”平台是学者整理和检索古籍的“利器”,文献丰富、分类合理、文本准确、检索便捷,高质量的古籍出版物是“尚古汇典”开发的文本基础,也是学术界放心使用“尚古汇典”的信心保证。

上海古籍出版社社长吕健表示,“当前的技术发展让我们看到了‘让古籍中的文字活起来’的更多可能性。例如,通过自然语言处理和机器学习技术,对古籍文本进行语义分析和主题挖掘,识别关键概念、主题和关系,帮助研究者发现隐藏在古籍中的知识和见解。借助这些技术,我们能够从中华文化的宝库中提炼题材、获得灵感,为智慧城市、文化旅游等领域提供知识服务。”古籍的知识服务离不开对资源的理解以及对数字化转型的业务洞察,同时,古籍数字化是一项复杂而漫长的事业,需要行业内外通力合作。“探索深度融合出版,为传统古籍出版注入新的生命力,推动中国传统文化的传承与创新,焕发古籍的活力与价值,不仅为广大受众提供丰富、精彩、优质的文化产品,更将古籍的魅力带入现代生活,让古籍在数字时代发出耀眼光芒。”

朱子全书 目前完备的朱熹著作集成

上海世纪出版集团党委副书记、总裁阚宁辉作总结讲话:“尚古汇典” 将优质的古籍出版资源进行集成,是上海世纪出版集团围绕优势出版领域、优质出版资源,向数字化、大众化进行转化的系列出版项目之一。目前,“尚古汇典”平台的发布是一个阶段性的成果,未来会有更多的产品、更多的工具、更多的场景、更多的子项目持续地推向市场、推向大众,供学界和社会各界使用。中华优秀传统文化的传播,并非幽径,而是通途,需要广大专家学者的提携和支持。

在未来,“汇典·古籍数字服务平台”还将在内容上继续吸收高质量的古籍文献,除了上海古籍出版社的已有内容外,还会囊括世纪出版集团内外相关出版社乃至长三角地区的古籍出版资源,并逐步开发更多的、具有特色的专题数据库,预计总规模将超过100亿字,在技术上发展除OCR以外的人工智能、大数据等古籍数字化关键核心技术,改进古籍整理出版作坊化的生产模式,缩短古籍知识生产周期,以达到升级古籍知识生产模式、知识服务模式的最终目标。商业运作方面,除针对B端等机构用户和C端个人用户的数据库销售外,还会利用平台模块化的技术开发能力,为机构和重大社科项目提供技术开发和优质数据加工等服务。(郭影)