哈佛CBDB数据库“落户”中国

哈佛CBDB数据库“落户”中国,学术数据库能否走向大众?

哈佛中国历代人物传记资料库(CBDB)是由哈佛大学费正清研究中心、北京大学中国古代史研究中心、台湾“中研院”史语所共同开发的历史人物数据库。它将数字技术引入传统的人文研究,可以通过检索人物ID或人名,返回丰富的结构化人物传记资料(生卒、别名、地理信息,任官、亲属关系、社会关系等);目前已收录从唐朝到清末共41万余名中国历史人物的传记资料。

近日,哈佛中国历代人物传记资料库(CBDB)与中文在线数字出版集团股份有限公司在上海签署项目合作协议,意味着这一学术数据库开始寻求大众化和商业化路径。

哈佛大学费正清研究中心教授包弼德(Peter K. Bol)在采访中向澎湃新闻表示:“学者没有能力进行商业运作,但‘中文在线’可以。他们把学者做的数据库,变成所有人都可以利用的工具,这非常好。这样学者就可以专注于学术,让商业和学术各自去完成擅长的部分。”

从右至左:哈佛大学费正清中国研究中心教授包弼德(Peter K. Bol)、中文在线数字出版集团股份有限公司董事长兼总裁童之磊、北京大学中国古代史研究中心史睿博士

此前CBDB数据库的使用者主要是历史研究人员,在设计上对普通读者的考虑不多。根据协议,“中文在线”将与CBDB项目组“共同打造中国古籍数据的数字人文资源平台,重构古文献研究服务新脉络,运用人工智能技术,聚合更多主题并优化用户体验”。具体包括:

一、在国内扩大CBDB的应用范围,引入更多图书馆领域合作方,充实CBDB数据库内容资源;

二、在资金等方面提供科研支持,吸引更多高端学术人才加入CBDB项目组;

三、将CBDB的成果分用户层级展示给不同的用户,如单独制作中小学传统文化教育中涉及的重要历史人物库,以方便中小学生学好相关知识。

北京大学中国古代史研究中心史睿博士认为,在传统的史学研究领域中,“数字人文”的途径还没有得到广泛应用;而这样一个新组合,除了希望把以前的工作做得更深入之外,也希望加入更标准化、更通用的工具,建成完善的“网络基础设施”,使数据库除了在学术上应用以外,也能推向公众,让普通人也更方便地了解中国历史人物的事迹、著作、生平等。

“中文在线”董事长童之磊表示,作为国内领先的数字出版企业,将利用其在技术、用户、渠道等方面的资源优势,使CBDB在更大范围内获得应用。“作为企业,以产品化的方式将学术数据库提供给读者,让更多人能通过CBDB数据库去了解中国和中国文化,这是中文在线想做的。”

哈佛大学CBDB数据库主页

据了解,资金是当下不少学术数据库面临的现实问题。过去十年来随着数字技术的发展和普及,一批服务于人文学科的数据库应用而生。但其中不少数据库的启动资金来自各种各样的“项目经费”,而随着“项目”年限到期,缺少资金支持的数据库往往难以为继。这类学术数据库的专业门槛较高,资料通常需要人工判读和录入,成本高、战线长。一些数据库面临可持续的问题,寻求商业化是可能解决困境的方案之一。

哈佛大学CBDB数据库在起步之初也使用人工录入的方式,主要依靠北京大学古代史研究中心的编辑小组手动校订。“过去CBDB的用户局限于学者,可能只有几千人,但将来我们的用户也许会有几千万人。商业平台收取一点点费用,就可以支持项目组学生们的工作,这非常重要。”包弼德说。

一些青年学者在采访中向澎湃新闻表示,学术数据库商业化无可厚非,前提是为了让更多人能够用到,而非垄断利润。他们关注哈佛CBDB和“中文在线”的合作,也期待新的尝试能给数字人文研究带来更多可能。

哈佛中国历代人物传记资料库(CBDB)与中文在线数字出版集团股份有限公司在上海签署项目合作协议

;