当前位置:网站首页 > 书目文献

中文古籍书目数据库的调查与分析

毛建军
内容提要 随着现代图书馆技术的发展,国内外图书馆相继开发建设了大量中文古籍书目数据库,文章对此作了调查和分析。
关键词 图书馆 古籍数字化 古籍书目数据库

古籍书目数据库是指在统一的机读目录格式下按照相应的标准和规范加工而成,并最终以计算机网络系统形式向用户提供相关古籍数据资源检索的大型目录数据库。古籍书目数据库的建设适应了图书馆工作现代化的需要,是古籍文献揭示的一次重大飞跃。上世纪80年代以来,随着现代图书馆技术的发展,国内外图书馆相继开发建设了大量中文古籍书目数据库,对古籍书目数据库的理论与实践研究将有利于国内古籍书目数据库建设的顺利实施。

 

  中文古籍机读编目的实践

 

随着计算机技术的发展,实现图书编目的计算机化逐渐成为图书馆管理自动化的一项重要工作。上世纪60年代,美国国会图书馆开始尝试馆藏图书书目的机读格式设计,于1965年推出MARC70年代国际图书馆协会联合会(IFLA)推出UNIMARC。其后,诸多国家接受了UNIMARC磁带进行本国书目数据库的建库工作。同期,中文古籍方面也开始了机读编目的尝试。1983年,美国加州研究图书馆组织(简称RLG)建立了一个自动化信息系统“美国研究图书馆信息网络(简称RLIN)”。80年代末,该组织提出一项计划,拟将中国清嘉庆以前的印本及抄稿本编制成计算机可读形式的中国古籍国际联合目录。[1]19919月“中国古籍国际联合目录”项目正式投入工作,共有18个图书馆参加了项目的工作。中国方面有北京大学、中国科学院、辽宁省图书馆、复旦大学、湖北省图书馆参加。

在中国台湾地区,为了推行中文图书编目的计算机化,19804月图书馆自动化作业规划委员会成立并积极开展中文图书编目的计算机化。1981年出版《中文图书机读编目格式》, 1982年出版修订版。1983年出版《中国编目规则》。1984年出版《中国图书分类法(试用本)》《中文图书标题总目初稿》。在具体古籍编目实际方面,台湾中央图书馆自1981年起开始着手以电脑机读方式建立书目数据库,19842月编目作业过渡到全面自动化,采用《中国机读编目格式》和《中国编目规则》,数据库中涉及古籍的数据量有汉学研究中心大陆出版品7257笔,中国善本古籍26396笔。[2]

中国大陆地区的古籍计算机编目工作稍晚一些。上世纪80年代,东北师范大学古籍所开始进行文献书目微机处理的试验。1988年初,古籍所所长吴枫教授到日本调研后,看到日本国内各大学及研究机构已将文献书目输入了计算机,深感国内计算机古籍编目的意义重大,便开始了利用计算机收集和整理《中国现存古籍书目》的工作。[3]1984年国家图书馆安装了具有汉字信息处理功能的M-150H计算机系统,开始利用美国国会图书馆的机读目录磁带(LCMARC)进行西文图书的辅助编目工作,并为国内用户提供专题和定题检索服务。1987年利用PDP11/73计算机进行普通中文图书的机读目录编目工作,随后建立了一批书目数据库。1995年,国家古籍整理出版规划小组决定筹建中国古籍书目数据库。[4]1995年下半年开始着手筹建普通古籍书目数据库的调研工作。1998年着手进行古籍书目数据库的建设。1999年编制了《古籍机读目录格式字段表》,其后,国家图书馆与北京大学共同研制了《古籍著录规则》(GB3792.7-87),编制了《汉语文古籍机读目录格式使用手册》等标准和规范。至2004年,馆藏善本古籍文献书目总库制作工作全部完成,实现了39万条数据的上网检索。[5]南京图书馆于1988年就开始购置计算机,进行古籍书目数据库建设的尝试。最初的工作是将馆藏10多万张古籍书目卡片输入到计算机中去,建成《馆藏古籍书目(草目)数据库》,数据库近20万条,包含馆藏古籍和影印、新印古籍。[6]199610月山东省图书馆选用“四库大汉字平台”和北京息洋电子信息技术研究所研制开发GCS编目软件开始了古籍书目数据库的回溯建库工作,数据库的设置按《中国文献编目规则·古籍》、CNMARC执行。分类法采用《中国古籍善本书目》使用的四部分类法。[7]

 

二 中文古籍书目数据库的建设

 

2.1 国外中文古籍书目数据库的建设

日本十分重视对中文古籍的整理和编目。1978年日本文部省提出并实施了情报系统计算机化,开始着手建立机读目录。同时,确定计算机在图书馆的主体地位,逐步实现文献检索(机读目录检索)的“无卡”管理。[8]由于汉籍书目的汉字处理较为困难,其发展相对缓慢。近十年,汉籍机读编目才取得进展,东洋文库、内阁文库、东京大学东洋文化研究所等机关已经在互联网上独立公开了他们的汉籍目录数据库。[9]东京大学东洋文化研究所于1998年公开的《东洋文化研究所汉籍分类目录》数据库,是全球最早投入使用的汉籍目录数据库之一。日本国立情报学研究所的NACSIS-CAT系统囊括了以各大学图书馆为中心的全国性的综合目录数据库并可以中文显示。[10]至今,日本已经建立的中文古籍书目数据库主要有:日本京都大学人文科学研究所全国汉籍协议会“全国汉籍——日本所藏中文古籍数据库”、东洋文化研究所所藏汉籍目录数据库、京都大学人文科学研究所“东洋学文献类目检索系统”、东洋文库所藏汉籍目录以及东京大学总合图书馆“汉籍目录”。

欧美地区东亚图书馆所使用的编目系统为RLIN-CJKOCLC-CJK系统。如果欧美前1520名东亚图书馆都完成数字化,北美就会有国家级的在线中文数据书目。[11]欧美地区最有影响的中文古籍书目数据库是哈佛燕京图书馆“线装古籍计算机检索系统”。2003年哈佛燕京图书馆邀请复旦大学图书馆眭骏、杨光辉等专业学者帮助完成这1800余种古籍线装图书的计算机编目工作。目前编目工作已经结束,读者可在哈佛燕京图书馆馆内的“线装古籍计算机检索系统”查询。[12]

其他国外中文古籍书目数据库参见附表一。

2.2 我国中文古籍书目数据库建设

2.2.1 台湾地区

台湾地区古籍书目数据库的建设开始于上世纪80年代。20世纪80年代初,台湾中央图书馆将馆藏善本制成机读目录,开启了台湾地区古籍书目数据库工作。其后,台湾故宫博物院、台大图书馆、中研院傅斯年图书馆等单位也都积极参加进来。台湾中研院自上世纪80年代推动史籍自动化计划以来也开发了大量的古籍书目数据库。随着计算机技术的发展以及机读编目实践的成熟,台湾地区古籍书目数据库的建设也逐步展开。1990年台湾中央图书馆编制成“台湾地区善本古籍联合目录”(数据量116034),向读者提供书名、作者、出版地、出版者、版本项以及主题检索服务。台湾中央图书馆“台湾地区家谱联合目录数据库”也很有特色。数据库可供相关单位汇入CMARCCNMARC以及USMARCMARC格式书目数据,以利查询、显示,兼提供著录及维护功能。“明人文集联合目录与篇目索引数据库”由台湾中央图书馆汉学研究中心研制,包括有故宫博物院图书馆、台湾大学图书馆、中研院傅斯年图书馆、台湾中央图书馆及汉学研究中心所藏明人文集的书目数据。中央图书馆台湾分馆开发的“台湾文献数据联合目录?”(32113)内容含台湾图书文献数据,凡古文书、古契、先贤遗著、士绅之文集、诗集、日记、账簿、族谱、家乘、祭祀公业资料等。台湾地区古籍书目数据库建设具有如下几个突出特点:一是突出数据库建设的长期性和计划性。二是注重数据库建设的交流与合作。三是重视古籍书目数据库的兼容与整合。

台湾地区古籍书目数据库详细参见附表二。

2.2.2 大陆地区

大陆地区参与古籍书目数据库开发与建设的单位主要是公共图书馆和科研院所图书馆。从目前已经建设的古籍书目数据库来看,其数据库著录的范围大致有如下几类:一是反映馆藏古籍的书目数据库。如南京图书馆古籍书目数据库、辽宁省图书馆古籍目录检索、山东省图书馆古籍书目查询。二是反映古籍特藏的书目数据库。如国家图书馆馆藏善本古籍文献书目总库、上海图书馆家谱书目数据库。三是突出地方特色的书目数据库。如福建省图书馆“福建联合家谱”、广东省立中山图书馆“广东海南家谱联合目录”。四是古籍书目之书目数据库。如金陵图书馆编制了年谱丛刊目录、古本小说目录、丛书集成初编目录、四库全书目录检索、续修四库全书目录检索数据库。

大陆地区古籍书目数据库参见熊伟华《古籍书目检索网站述略》。[13]

 

三 古籍联合目录数据库的理想与实现

 

自计算机用于古籍编目以来,古籍联合目录就成为古籍编目界的一个理想目标。从美国加州研究图书馆组织的“中国古籍国际联合目录”计划,到日本的“全国汉籍数据库”计划,由于种种原因,这些古籍联合目录数据库的尝试并没有取得预想的效果。

作为中文古籍收藏和使用主体的中国大陆和台湾地区,古籍联合目录数据库的建设则显得更为重要和迫切。截至目前古籍联合目录数据库的建设项目主要在大陆与台湾共同合作的“古籍联合目录数据库”和CALIS中国高等教育文献保障系统——古籍联合目录系统取得了阶段性成果。

199911月初,香港中文大学举办了“两岸五地华文数据库合作计划会议”。会议决议“古籍联合目录数据库”为两岸古籍书目数据库共建共享努力方向,“古籍联合目录数据库”委托台湾中央图书馆负责召集实施。会议决议采用“分别建库,集中检索”的原则,在各馆分别建库后,即进行数据库的整合,集中检索。目前“中文古籍书目数据库”共收集海内外图书馆所收藏中文古籍书目资料45万余笔,经合并部分重复书目,目前共有441 900笔。系统以元数据(Metadata)格式表达,可进行不限字段、题名(书名)、责任者(编著者)、四部类目(主题)、出版信息(出版者)、现藏者(收藏者)检索, 15项查询值。

中国高等教育文献保障系统(China Academic Library &Information System,简称CALIS)的宗旨是建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,为中国的高等教育服务。CALIS联合目录数据库建设始于1997年。2000CALIS决定将联机编目延伸至古籍文献。200312CALIS中国高等教育文献保障系统——古籍联合目录系统正式启动。至20061月联合目录数据库已经积累了260余万条书目记录,其中古籍数据量达40万条。

 

附表一:国外中文古籍书目数据库列表

资源名称

开发单位

网址

备注与说明

馆藏数据目录藏书检索

日本国立国会图书馆

http//opac.ndl.go.jp/index.html

收录中国清代以来的古籍文献约25万种

东洋文库所藏汉籍数据库检索系统

东洋文库

http//www.toyo-bunko.or.jp/TBDB/KansekiQuery3.html

底本:《东洋文库所藏汉籍分类目录》

善本书目索引

阪本龙门文库

http//www2.odn.ne.jp/aat72370/mokufs.html

阪本猷氏收藏古籍目录

东京大学总合图书馆汉籍目录

东京大学图书馆

http//kanseki.dl.itc.utokyo.ac.jp/kanseki/source/index.html

浏览检索; 6万条数据

东洋文化研究所藏汉籍目录数据库

东京大学东洋文化研究所

 

http//www3.ioc.utokyo.ac.jp/kandb.html

共有数据112755

全国中文古籍数据库

京都大学人文科学研究所全国汉籍协议会

http//www.kanji.zinbun.kyoto-u.ac.jp/kanseki/

收录日本30多家图书馆馆藏中文古籍

 

东洋学文献类目检索系统

京都大学人文科学研究所

 

http//www·kanji·zinbun·kyoto-u·ac·jp/db/CHINA3/index·html·ja·utf-8

题名、著者、分类检索

和汉古典籍分类目录

龙谷大学大宫图书馆

http//www.afc.ryukoku.ac.jp/koten/

浏览检索

纪州藩文库目录

和歌山大学图书馆

http//www.lib.wakayama-u.ac.jp/kmoku.html

图像格式;浏览检索

怀德堂文库图书目录汉籍之部

大阪大学文学部

http//kaitokudo.jp/Kaitokudo2-cgi-bin/Simple.exe StyleSheet=Top

分类检索;笔画检索

 

奎章阁古籍检索系统

韩国国立汉城大学

http//kyujanggak.snu.ac.kr/index.jsp

书目检索;全文阅读

 

Online Catalog

美国国会图书馆

http//catalog.loc.gov/

拼音输入,英文呈现

中文图书联合检索

大英图书馆

http//www.bodley.ox.ac.uk/rslpchin/search.htm

与牛津大学等六家单位合作共建

 

附表二:台湾地区古籍书目数据库列表

 

数据库名称

开发单位

网址

备注与说明

台湾地区善本古籍联合目录

台湾中央图书馆

http//nclcc·ncl·edu·tw/ttscgi/ttsweb @ 001 /opc/catalog/rarecat@@0·09414726047048022

116034笔;书名、作者、出版地、出版者、版本项、主题检索

古籍影像检索系统

台湾中央图书馆

http//rarebook·ncl·edu·tw/rbook·cgi/hypage·cgi HY-PAGE=home/rbook-home·htm

书目26619笔、图像书目8585笔;系统包括三个栏目:特藏珍品选介;善本资料查询;古籍影像检索

中文古籍书目数据库

台湾中央图书馆

http//rarebook.ncl.edu.tw/rbook.cgi/frameset4.htm

55万余笔

台湾地区家谱联合目录数据库

台湾中央图书馆

http//rarebook.ncl.edu.tw/rbook.cgi/frameset5.htm

14986种;书名、编著者、收藏者、出版者、主题检索

明人文集联合目录与篇目索引数据库

国家图书馆汉学研究中心

http//ccs.ncl.edu.tw/data.html

包括故宫博物院图书馆、台湾大学图书馆、中研院傅斯年图书馆、国家图书馆及汉学研究中心所藏明人文集。

台湾文献数据联合目录

中央图书馆台湾分馆

http//192·192·13·178/cgi-bin/gs/ugsweb·cgi o =dunidir

32113笔;包括中央图书馆、台湾省文献会、省立台中图书馆、中央研究院、台北市文献委员会等36个单位的数据

简帛金石数据库——书目

中央研究院史语所

http//saturn.ihp.sinica.edu.tw/-wenwu/search.htm

本系统采用中正大学信息研究所的GAIS系统

生命医疗史研究室数据库检索

中央研究院史语所

http//www·ihp·sinica·edu·tw/% 7Emedicine/book/search·htm

多项目查询、词组查询、排除字符及自然语言查询

中国大陆各省地方志书目查询系统

中央研究院

http//gis2.sinica.edu.tw/place/

本目录著录国内外所搜藏之中国各代地方志。收录地方志之刊本时间,起于宋元迄于今日(2003),并随时更新

故宫博物院图书文献数据库

台北故宫博物院

http//www.npm.gov.tw/tts/npmmeta/dblist.htm

另有:清代档案人名权威资料查询、清宫奏折档台湾史料等

家族谱牒文献数据库

台北故宫博物院

http//npmhost.npm.gov.tw/ttscgi/ttsweb/

族谱题名、编纂者、始迁祖、家族姓氏/地望、族谱来源检索

善本古籍资料库

台北故宫博物院

http//npmhost.npm.gov.tw/tts/npmmeta/RB/RB.html

题名、著者、版本、四部类目、卷次、朝代、元版宋版其它明版清版检索

中文善本微缩清单

台湾大学图书馆

http//www·lib·ntu·edu·tw/CG/resources/Chi/chi-micro.htm

浏览检索

 

[参考文献]

[1]艾思仁.中国古籍与21世纪的研究图书馆[J].津图学刊,1996(4)8-13.

[2]郑恒雄.中文书目资料库在台湾的建立与发展[J].图书馆工作与研究,1995(5)3-10.

[3]刘乾先,王彩云.文献书目微机处理研究报告——利用计算机整理及检索现存古籍书目[J].古籍整理研究学刊,1991(2)15-17.

[4]杨健. CALIS中文古籍联机合作编目的缘起与进展[J].图书馆理论与实践,2006(5) 54-56.

[5]张志清.中国国家图书馆古籍书目数据库的建设与共享[C]//台北:古籍联合目录数据库合作建置第三次研讨会,2004.

[6]马宁.南京图书馆藏古籍编目和数字化工作情况简介[C]//台北:古籍联合目录数据库合作建置第三次研讨会,2004.

[7]李西宁.山东省图书馆古籍建库情况[C]//台北:古籍联合目录数据库合作建置第三次研讨会,2004.

[8]吴美兰.日本的大学图书馆及其现代化历程[J].暨南学报(哲学社会科学)1992(2) 138-142.

[9]孙学雷.中国汉语古籍著录研[D].武汉:武汉大学,200565.

[10]江川和子.“东京大学东洋文化研究所所藏汉籍善本的全文影像数据库”的建构[C]//台北:数字时代汉学研究资源国际研讨会,2004.

[11]James K. M. Cheng. Chinese Digital Resources among Library Collections in North American and Issues Concerning the Sharing of Chinese Digital Resources World-wide[C]//台北:数字时代汉学研究资源国际研讨会,2004.

[12]沈津.北美地区中文古籍文献整辑工作近况举要[J].汉学研究通讯,2005(4)17-21.

[13]熊伟华.古籍书目检索网站述略[J].现代图书情报技术,2004(9)76-79.

 

[作者简介] 毛建军(1971),男,河南新乡学院中文系讲师,南京大学在读博士。已发表学术论文25篇。

原载:《图书馆论坛》2008年10月第27卷第5期
收藏文章

阅读数[39336]
百年·红楼梦 网络文化与文学研究
网友评论 更多评论
如果您已经注册并经审核成为“中国文学网”会员,请 登录 后发表评论; 或者您现在 注册成为新会员

诸位网友,敬请谨慎网上言行,切莫对他人造成伤害。
验证码: