少儿地方文献数据库工作之浅见

volks 分享 时间: 收藏本文

【简介】感谢网友“volks”参与投稿,以下是小编为大家准备的少儿地方文献数据库工作之浅见(共10篇),希望对大家有所帮助。

篇1:少儿地方文献数据库工作之浅见

少儿地方文献数据库工作之浅见

我国著名的地方文献专家杜定友先生曾提出“地方文献就是指有关本地区的一切资料”,是反映某一地区的政治、经济、文化、历史、地理、自然资源、科学技术等方面情况的文献资料的总称。它因“一地之百科”的深刻烙印和“原汁原味”的显著特色而受到社会尤其是学术界的广泛重视。而少儿地方文献因其使用对象和服务宗旨的差异,在其内容和形式方面又独具特性。

一般来说,少儿地方文献主要内容有: “全面报道和反映地区少儿工作与活动的综合性著作;地方党政机关、群众团体编印的各种有关少儿工作的材料;考察和研究地区少儿活动与组织的资料;反映本地区少儿活动与组织的历史沿革、发展概况、机构设置与变化的资料;历年来本地区具有一定影响的少年儿童和儿童工作者的事迹材料及本地区现已成名人士及外地区现已成为名人但儿童时代曾在本地区生活的人士的儿童时代资料……本地区儿童用品设计、生产企业的有关资料。”

笔者认为,这种范围的界定有一定的科学性,也具备了一定的实践性。然而,考虑到中小型图书馆人力、物力和财力的差异,以及少儿地方文献的广泛性,收藏少儿地方文献,应如杜定友先生所说的:宁缺勿滥”,应针对本地区儿童特点、教育水准、艺术欣赏水平、健康状况等,在广泛调研的前提下,本着有效利用的原则,建立一个内容丰富的数据库。

目前,许多省、市级图书馆把少儿地方文献资源建设与开发利用列为全馆工作的重点之一,但有一定规模、标准化、开放型的少儿地方文献数据库还很少。少儿地方文献数据库建设滞后于其他文献数据库的建设,应引起业内同仁的足够重视与思考。

1 收集文献是建立数据库的'基础

少儿地方文献的收集具有战线长、范围广、情况复杂、工作量大的特点。如何使少儿地方文献的收集卓有成效,使本馆的藏书结构具有自己鲜明的地方特色,更好地为本地区服务,这是一项长期而艰巨的任务。

首先,要组织一支精干的专门队伍负责此项工作。由于少儿地方文献的收集不同于正常的采访购书,它是一个由分散到集中的过程。需要与社会广泛接触,做大量艰苦细致的工作。因而,在人员的配备上要选择专业知识较丰富、业务水平较高,对少儿地方文献认识明确、责任感强、能吃苦耐劳、有敬业奉献精神且具有一定的社会交往能力的馆员,在组织上保证少儿地方文献收集工作的顺利进行。

其次,要搞好调查研究工作。收集少儿地方文献是一项复杂细致的工作。情况不明,心中无数,工作难免有盲目性,耗时费力,少有成效。俗语说:磨刀不误砍柴工”。运用各种手段,通过各种渠道,对本地区少儿地方文献资源进行调查摸底,了解掌握文献资源的历史与现状,包括各单位各部门编撰刊行的各种文献资料等情况,并在此基础上认真研究地方少儿文献的需求重点,从而有目的地建立面向用户的数据库。

此外,应选择行之有效的收集方法。一般说来搜集方法主要有以下几种:

(1)采购预订。要事先了解掌握出版动态与发行信息,对已发行问世的可将本馆所需书目提供给书店,请其协助提供存书信息,而后上门选购。也可以采取邮购或委托兄弟馆代购的方式。预订工作要超前了解出版计划,掌握出版信息,与当地出版部门或自行编发的单位直接取得联系,办理预订手续要及时,切勿延误疏漏,并登记备查,逐一落实。

(2)广泛征集。征集信函要在社会调查基础上印发,机关、团体、科研部门、企事业单位为主要对象。征集信函不仅要提出所征少儿地方文献的内容范围,更须附列拟征集的文献资料目录。如有条件,征集函要力求取得领导重视,请政府机关或宣传部门批转颁发,同时要逐一登门采访联系,并做好有关征集各项工作。

(3)馆际交换。利用图书馆网络的有利条件,开展馆际协作,也是图书馆获得所需地方文献的重要渠道。

(4)复印复制。对一些因刊行年代久远的文献和无法得到原件的文献可复印复制来保存。

2 科学组织数据,完善服务功能

在图书馆传统的少儿地方文献工作中,应编制“少儿地方文献资源基本情况一览表”,以便于研究和实际使用。其栏目内容一般包括书名(刊名、文件图册资料名称)、著者 (单位)、出版时间(编印期)、版本类型等,并附注现有收藏单位及藏书册数。

但在网络环境下则对此提出了更高的要求。首先,必须要求拥有完善的、结构合理的检索功能。数据库系统软件的开发要注重实用性和通用性,要求用户界面友好,操作简便快捷、易维护、易推广普及。检索功能体系应具备查询检索、修改删除、新增补充三大功能,同时考虑增设信息检索服务的辅助功能,如文献检索命中率统计功能、关键词或主题词检索频率统计功能等。查询检索功能要做到能对用户导引检索,提供多种不同的检索途径和检索点,不仅包括题名(书名)、责任者、分类号、主题词、关键词等常规检索项,而且还要有年份、地名等检索点。既要实现各项相互间的“与”、“或” 、“非 ” 的逻辑组配检索,

又要实现在一次检索结果的基础上实现多次循环检索,提高检索命中率。其次,要有适度的规模。国内市场对文献检索数据库中信息记录的最低要求是 5 万条以上。因而,少儿地方文献数据库建设也要适应时代的发展,要有一定的规模。数据资料不完备的小规模少儿地方文献数据库,市场需求小,很难打开局面,容易变成死库。为此,应构建中等规模乃至大型的少儿地方文献数据库,才能产生很好的社会效益和经济效益。再者,要有严格的质量保证。

(1)数据源要准确可靠。少儿地方文献数据库的数据源不仅要有保障,而且要准确可靠。(2)标引著录要规范标准。对少儿地方文献信息的标引必须统一标准和规范化。(3)软件系统要通用实用。软件系统对数据的存取、修改、检索、联网等起着决定性的作用,要求少儿地方文献数据库管理系统具有通用性和实用性,以利于多种少儿地方文献数据库的数据交换。(4)检索系统要实现网络化。少儿地方文献数据库检索系统不仅能以光盘和软盘形式在单机上运行,而且要具备网络功能,能在网上传输。

目前,大部分图书馆采用了ILAS 系统并在此平台上建立中文图书数据库。少儿地方文献书目可在此基础上进行数据深度加工,揭示文献的内容特征,着重用主题词标引,以凸显少儿地方文献的多重主题特点,准确全面揭示文献的内容,挖掘馆藏少儿地方文献的潜力。通过数据库建设,对馆藏少儿地方文献资源有了全面、系统、准确的掌握,进而有的放矢地合理布局少儿地方文献资源,实现跨层次、跨系统的少儿地方文献资源共享,在高起点、高层次上开展少儿地方文献资源的联合开发、利用。

3 强化宣传工作,推动开发利用

少儿地方文献对搞好地区少儿文化工作,促进经济发展有着重要的影响。古人有云“酒香不怕巷子深”。但现代社会信息量的巨增,使得供需双方往往脱节。故对于公共图书馆或是少儿图书馆而言,要搞好信息资源的开发利用工作,必须加大宣传工作力度,要不拘一格,多渠道、多形式,让用户真正认识到馆藏少儿地方文献数据库的作用,了解图书馆收集保存利用少儿地方文献的功能和目的,从而取得各单位、各部门和社会各界的理解和支持。

(1)广泛印发宣传材料。通过大力宣传,让所有的儿童文献信息用户都知道这里有丰富有序的资料储备。(2)设置专项宣传栏,召开读者座谈会。在少儿图书馆醒目位置设置长期的专项宣传栏,定期更换内容,并加强与重要少儿地方文献提供者与利用者的联系,定期或不定期以座谈会的方式互相沟通信息,发挥少儿图书馆的中介作用,营造良好的供需氛围。(3)利用广播、电视和报纸等新闻媒介做宣传。利用各种媒介,通过广播、电视、海报等进行宣传,让读者充分了解馆藏;还可以举办专题性的少儿地方文献展览。通过展览,大力宣传利用少儿地方文献的效果,从而吸引更多的读者,提高少儿地方文献的利用率。(4)向有关单位发函。编制少儿地方文献目录索引,为地方少儿经济与文化活动等提供信息,并将索引无偿提供给市委、市政府各级领导、各部办委局和少儿地方文献著作者。这既可方便其随时查找资料,又加强了与他们的联系。同时也在潜移默化中深化他们对少儿地方文献的利用意识。(5)结合图书馆宣传周和配合其他中心活动开展宣传。为扩大馆藏少儿地方文献的传播范围,以吸引更多的读者,可编制少儿地方文献刊物,介绍馆藏及新入藏的少儿地方文献等,还可登载一些读者对少儿地方文献的研究心得、意见等,在专门活动中宣传。(6)编制少儿地方文献网页。指派专人指导利用者使用本馆的少儿地方文献数据库,将已建立的少儿地方文献数据库提供网上服务,并将少儿地方文献刊物链入本馆主页。

总而言之,少儿地方文献数据库的建设与开发是一项系统工程,是图书馆数据库的重要组成部分。它需要社会各界的支持与关爱。

〔出处〕 图书馆学刊(4)

篇2:建立地方文献数据库之探索

建立地方文献数据库之探索

近年来,我国各种各样的数据库层出不穷,对数据库的开发、数据著录的格式、数据库的管理等数据库建设方面的问题均有不少论述,但对地方文献专题文献数据库的建立却稀有涉及。地方文献是以一个地区为记述范围且反映本地特色的文献资源,是了解和研究某一特定地区的工农业生产、科学文化、历史与现状的主要情报来源。在集中精力进行经济建设的新形势下,区域经济的研究更离不开地方文献的支持。图书馆要想更好地服务于社会,服务于地方经济建设,“建立地方文献数据库”已是当务之急。如何根据地方文献的自身特点,将那些具有浓郁地方特色的资料建成适合用户需要的特色数据库,更方便研究者的使用,则是图书馆人不可忽视而需要共同探讨研究的问题,笔者拟就此谈几点看法。

1地方文献数据库应建成全文、摘要、题录三种形式并存的库

地方文献是关于一个地方的全部资料,不仅其内容涉及一个地区的历史、现状、自然科学、人文科学、社会历史遗留等各个方面;著述形式也有方志、专著、期刊、族谱、地图科技报告、专利文献、学位论文、会议记录等新老成员;文献载体更有印刷型的书籍、缩微品、录音制品、录像制品、机读磁带、磁盘、光盘等众多品种……建立地方文献数据库就是要将这些不同来源、不同内容、不同著述形式、存于不同介质的原始数据存于同一库中综合使用。面对内容如此广泛、形式极其多样的地方文献,如何将其内容适度地呈现给用户,如何让使用者更快、更多地了解地方文献信息,这是建立地方文献数据库必须首先考虑的问题。

1.1 地方文献数据库中部分文献应建成全文式的

目前各种专题数据库的数据录入大都以书目数据为主,只对文献的特征、主题、分类等做一般著录。实际上,从用户角度来看,他们更需要的是全文数据显示,以便直接获取原始资料。

在进入信息时代的今天,地方文献不再仅仅以书籍形式出现,而更多的是发表于各种各样的报刊上,散见于各种各样的会议文件之中,甚至出现在各种各样的商业宣传品里,地方文献和其它文献一样力求以更快速度、引人注目的方式向社会传播。这部分文献大都以简短精要的论文形式出现,建成全文数据非常可行。再者,论文型的文献比较零散,不仅分布在不同的媒体介质上,而存贮地方文献的媒体介质本身又不全是地方文献的收藏范畴,若全部收集地方论文材料的原载体有一定难度,也不适宜,故这部分论文文献有必要建成全文数据,让用户直接获取原文、及时了解最新信息。

1.2 地方文献数据库中部分文献应建成摘要式的

随着科学技术的发展,文献的载体不断发生变化。地方文献在以传统的印刷书籍占据主角时,更多的非书资料正逐年增加。这部分非书资料虽然内容繁多,但其本身的检索使用都较方便,故不必要建成全文数据。然而非书资料仅从外表又看不出其具体收藏内容,故需要对原始文献进行深层次的挖掘,加工成文摘或提要式录入,以向用户简要介绍文献的.主要收藏内容,建成摘要数据库供用户选择使用。当然摘要式文献部分还应向用户提供原文献出处及其收藏地,以便用户及时找到原文,尽快获取所需信息。

1.3地方文献数据库中部分文献应建成题录式的

地方文献是有关某一个地方的一切资料,除我们常看到的白色文献外,一些单位的半机密资料数据或机密文件等灰色文献或黑色文献亦是地方文献的收藏对象。这部分资料不便于广大用户公开查阅,需要使用的用户可以同有关单位联系,根据具体的使用办法及注意事项查阅,所以只提供题录比较合适。为便于用户查找获取原始资料,题录式数据须注明具体的收藏地或收藏单位。

再者,地方文献中除图书、杂志、报纸、手稿等常见资料外,还有图片、画片、表格、票据等资料,这部分文献一般从其名称即可知其内容,没有必要建成全文或摘要。建成全文型也困难,故也可建成题录式数据,并准确注明其收藏地。

地方文献数据库应建成全文、摘要、题录三种形式并存的交叉信息混用库,尽可能将数据库建设得全面、深入、贴近用户,而又易操作可行。用户在使用时可以随时检索到自己所需要资料的内容,最大限度地满足读者的需求。

2 地方文献数据库应建成学科分类、地名归类、著述形式等多途径检索的库

地方文献库具有涉及内容广泛、时间序列较长、且资料来源复杂、贮存方式多样等特点。要将这些不同来源、不同途径、存于不同介质的原始数据归于同一库中供用户综合使用,须对其内容进行多方面、多角度、多层次的划分和揭示,给用户提供多条检索途径,以便用户能从不同角度查找自己供所需资料。

2.1建成具有学科分类检索功能的地方文献数据库

地方文献数据库应属于专题文献数据库,但因其文献内容广泛而丰富,涉及政治、经济、法律、军事、文化、文学、历史、地理、人口等多学科范畴,故又具有综合性数据库的特点。打开一个学科综合的数据库,广大读者最常用的方法就是依学科分类来检索文献。

不同的用户一般都有自身的研究领域,而且对该领域的文献最敏感、知识分类也最熟悉。为使用户能快速了解自身学科范畴的文献资料,并能较全面地浏览某地区在该学科领域的科技发展新动态,地方文献数据库必须依据学科专业来组织文献资料,分门别类地显示文献信息,实现按学科分类检索的功能。

学科分类检索功能主要是指依据文献内容的学科属性其特征,将成千上万种文献划分开,按照科学分类标准,将容文献编排类目,各分其类,数据库系统能按类提示文献息、提供文献线索,便于用户寻类索文、触类旁通。用户同可按学科分类的次第性,逐次寻找类目,查获数据库内含有关文献。

2.2 应建成具有地名归类检索功能的地方文献数据库

虽然学科分类检索能满足人们检索文献的一般逻辑思维方法,但是,随着科学技术的飞速发展,各种新学科、新科技不断涌现,学科间相互联系、相互渗透越来越强、而学科分类是属于一种先组式的检索体系,只能单维地提示文献特征,对文献的专指度跟不上交叉学科的发展,在反映新学科、新成果方面也总是滞后,给用户检索新的科技信息增加了不少困难,也降低了文献的检全率、检准率。因此有必要实现按地名归类检索的功能。

地名归类检索功能主要指依据文献所属的地区,将文献划分开来,按地域区分和隶属关系。将库容文献各归其地。这样可避开文献的学科分类,按地域提供文献线索,便于用户以地寻文、鸟瞰全貌。

地方文献都是以某一地区为记述范围且反映本地特色的,这些共同的地方特色,体现为文献的区域性。对研究地方特色的用户来说,他们更注重地方文献这一“区域性”特征,地名归类检索功能也正是满足了用户按地名揭示和组织文献的要求,用户不仅能以地名作为检索口,查检某一具体地区的有关文献资料,并能较全面地了解该地区的总体概况。

可以说,地名归类检索功能为“区域研究”的用户提供了一张地图似的资料检索途径,使他们对地方文献一目了然,广域的地方文献从而成为更具体的地方文献。

2.3 应建成具有著述形式检索功能的地方文献数据库

地名归类检索已是在学科分类检索的基础上,进一步拓宽了用户的查检途径,亦是在综合性数据库的基础上,体现了专题性数据库的检索要求,但对地方文献的不少用户来讲,学科的交叉渗透、地域的临界相关往往正是他们研究的焦点,这时候前述两种检索子系统都不能满足他们的要求,而著述形式则成为他们查找资料的第一入手点。地方文献数据库如能按著述形式组织文献,即实现按著述形式检索的功能,满足更多地方文献用户群的需求。

著述形式检索功能主要指依据文献的著述形式,将文献划分开来,如:地方志、地方史、地方报刊、地方年鉴、地方名人、地方论文、地方档案、地方图录等等,按著述形式的层次关系,依次设立子目,如:地方志层次下可分综合志、专门志等,将库容文献各归其位。

关于地方文献据库究竟应如何建成学科分类、地名归类、著述形式等多途径检索的库,数据库的检索系统又如何构建,笔者另有专文“地方文献数据库检索系统建立之设想”详细论及,在此不再赘述。

地方文献数据库建设是一项探索性工作,究竟建成一个什么样的数据库才是最适用的、用户最满意的,那是仁者见仁、智者见智,笔者这里的几点设想,不求同行赞同或采用,只求抛砖引玉。

〔出处〕 大学图书情报学刊(2)

篇3:地方文献数据库建设初探

吉安地区坐落在赣中南,是一座历史悠久的地理文化名城,拥有丰富的地方文献资源。建立吉安地方文献资源数据库,为地方经济建设服务,是图书馆与地方经济建设相结合的有效途径。

1 吉安地方文献数据的采集

地方文献是指有关当地的一切资料,表现为不同时期各种记载形式的文献,如:图书、杂志、报纸、图片、影片、画片、拓本、表格、传单、票据、文告、手稿、簿籍等。因此,地方文献的数据可以从时间、空间、内容等方面进行采集。

1.1时间顺序

吉安是一个历史悠久的文化名城,有着 5的历史。我们收集地方文献数据时,可以按照时间顺序,从古代―近现代―当代的顺序进行收集。如我馆编撰的《井冈山革命斗争史研究资料索引》,就是按照时间顺序进行的,从井冈山革命根据地的创立(1927.9―1928.2)井冈山革命根据地的巩固和发展 (1928.2―1929.1)井冈山军民坚持斗争(1929.1―1930.2)

1.2空间范围

地方文献具有典型的地域性,使得地方文献的出现始终与一定的地域相联系。吉安地理位置复杂,从地形、地貌到各区方言,再到各地习俗都有很大的区别。所以,我们可以按照地理空间,一般是按行政区划来划分。市下设县,县下设乡镇,直到村。以地名来收集地方文献,按地域区分隶属关系,以地名作为细类和子目,将库容文献各归其类,有利于编制地名归类文献检索子系统,形成一个树杈式的检索结构。

1.3 内容范围

地方文献是某一地域自然现象、社会现象的知识记录。天、地、人、事、物,包罗万象,按内容进行划分可分为:

1.3.1人文、历史类数据

(1) 吉安地区研究数据 (历史、现状、人文)。对于吉安市近500 年的历史,按时间空间顺序,对期间的历史、现状、人文、风俗进行收集,形成该地研究数据库。我馆历时 3年之久,编撰了《井冈山革命斗争史研究资料索引》,汇编了全国图书、报刊文献当中所载的有关井冈山斗争资料1300余条,集中反映了井冈山革命斗争史和井冈山精神。

(2) 本地区名人数据。吉安自古以来就人杰地灵,从“人生自古谁无死,留取丹心照汗青”的文天祥,到一代文豪欧阳修,再到贺子珍、袁文才、王佐等一代革命家,到曾庆红等新一代国家领导人。以这些历代名人组成专题数据库,对于其中的有特殊贡献的名人,可追加全文数据库、照片数据,辅之以字画、印章等必不可少的.内容。我馆目前正在建立《古代吉安名人研究资料索引》,计划将陆续出版欧阳修、文天祥、杨万里、刘过、刘辰翁、周大必等古代名人的研究资料索引,目前已出版 《杨万里研究资料索引》、《欧阳修研究资料索引》。

(3)古籍数据。包括本地的全部古籍地方文献的专题数据库。由于古籍珍贵,甚至有的是孤本,不便于查询,可通过光电扫描技术,存入计算机。如《杨万里研究资料索引》中收录了杨万里的诗、词、文;《欧阳修研究资料索引》中收录了其诗、词、文赋以及其史学观、经济观、书法等。

(4)地方志数据。包括本地全部史志的专题数据。按照地域范围,依次逐步采集。

(5)姓氏渊源数据。建立专题数据库,可根据需要建立全文数据库。

(6)谱牒多媒体数据。

(5)、(6) 两种数据在 《杨万里研究资料索引》和 《欧阳修研究资料索引》当中都有所反映,资料分别介绍了欧阳修、杨万里的家世、生平、年谱。

1.3.2 商情类数据

(1)行业动态数据。包括吉安地区热门、重点行业,如政策动态、市场、投资趋势,形成旅游、电子、生物等行业特色专题数据。

(2) 地方企业名录数据。吉安有许多企业,如电线电缆总厂、江西电视机厂、八三四厂。建立地方企业名录数据库,以公司名称、业务经营范围、产品名称等反映公司行业主题特征的字段作为基本索引字段,以公司地址、电话、员工数字段作为辅助索引字段。

(3)地市名特产数据。吉安地区有许多地方名特产,如:遂川狗牯脑茶叶、泰和武山乌骨鸡、安福火腿等,以他们的产地、用途、成分等字段来描述,形成专题数据库。

(4)旅游资料数据。吉安旅游区和待开发旅游区,如:井冈山旅游区、遂川汤湖、吉安青原山道教胜地、八都毛主席故居、君山湖度假村等,按他们的地理位置、主要景点、服务项目、历史典故等字段形成数据库。

(5)地区农业科技数据库。吉安是个以农业为主的地区,开发多种经济作物,如:茶叶、玉米、烟叶、甘蔗等等,数据库重点介绍地方特色产品的历史、种植、栽培、加工等技术。

1.3.3 综合数据

介绍该地各行业、各个方面的百科全书性综合数据。

篇4:地方文献数据库建设初探

2.1书目型数据库

书目型文献数据库即二次文献数据库,储存原始文献的题名、著者文献出处、文摘、主题词等项目。其价值在于把用户指引到所需要的原始文献,如欧阳修研究,把对欧阳修研究的文章进行二次加工,形成书目索引,可设计为书目型数据库。在对吉安地方文献进行分类时,可把本地区名人数据,人文、历史类数据,古籍、地方志数据建成书目型数据库。目前我馆建立的《古代吉安名人数据库》,就可按照其索引资料建立书目型数据库。

2.2 源数据库

源数据库即一次信息库,储存用户作为检索目的而要求获得的数据、事实或文本。其价值在于检索的结果可以直接满足用户的信息要求。按照信息形式不同可分为:

(1)数值型数据库。如:吉安地方工农业总产值、市场等。

(2)词典型数据库。把姓氏渊源数据、地方企业名录、地市名特产品数据、旅游资源数据、农业科技等建成词典型数据库。

(3) 全文本数据库。名人著作数据库、古籍数据库等可建成全文本数据库。

有些数据还可能是上述 3 种形式的结合。如:本地名人数据库中欧阳修、杨万里研究资料,包括了他们的原著及其研究论文、政治思想观点、家世生平和年谱等等,内容复杂,可建成一些复合式专题数据库。

2.3 数据库地址指针在数据库文档组织中的使用

利用倒排挡形式,把由基本索引字段构成的基本索引款目和由辅助索引字段构成的辅助索引款目采用倒排的形式,描述其特征标识、存取号、字段位置。在实践中,为了提高联机响应的速度,常采用两级索引的倒排文档结构,即将倒排文档分为词典文档和存取号文档,

词典文档也称为索引文档款目,内容包含特征标识、含有该标识的记录总数、关联到存取号文档的指针。词典文档相当于一个索引词表,其规模由索引词数量决定,基本不受数据库文献或数据记录增加的影响,可以极大提高系统对检索终端的响应速度。存取号文档的款目主要包括与词典文档指针关联的存储地址、含有该标识的记录存取号,以及该标识在记录中所处的字段及其位置。这样的两级索引结构不仅包括了原倒排的全部内容,而且使主机联机响应速度得到极大的提高。这是由于特征标识与含有该标识的存取号及其字段位置的分离。虽然使文档的结构更为复杂,却突破了原先倒排文档的索引款目会因记录的增加而数百倍增加,进而因文档的规模扩大而影响检索速度的限制。在 《欧阳修研究资料索引数据库》当中,由于数据库规模大,所以也可使用指针来达到提高联机响应的速度。如使用辅助索引倒排的两级结构。

另外,使用链接link把书目型数据库和文摘型数据库、全文数据库都可以连接起来,实现根据检索需求,查找地方文献的题录、文摘或全文的目的。

〔出处〕 科技情报开发与经济(9)

篇5:地方文献古籍书目数据库之建设

地方文献古籍书目数据库之建设

随着信息技术的高速发展,我国许多大中型图书馆都已实现了业务管理自动化,为图书情报信息的充分揭示和快速交流提供了方便。用现代化的手段代替手工编目,既是广大读者的要求,也是古籍编目工作者的夙愿。中国古籍数量浩繁,散落全国各地,除了大型图书馆以外,很多中小型图书馆也藏有大量古籍。目前,有条件的中小型图书馆已经使用或正准备使用计算机进行多种类型的古籍书目数据库编目制作,但建库经验及知识极其缺乏。甘肃省图书馆在西北地方文献古籍书目数据库的建设工作中积累了一定的经验,现就此略陈己见,以期有所裨补。

一、甘肃省图书馆西北地方文献古籍藏书状况

甘肃省图书馆由19成立的甘肃省立兰州图书馆和1944年建立的国立兰州图书馆合并而成,目前藏书总量已达270多万册,其中西北地方文献古籍是其馆藏特色之一。

甘肃省立兰州图书馆自本世纪初建馆之日起,就以征集各县志乘、乡贤遗作为藏书建设的中心任务之一。到了1944年6月,我国著名图书馆学家刘国钧先生在兰州创立了国立西北图书馆,提出藏书建设中的三项特殊任务:“募集西北文献,搜罗西北文物,编纂西北问题参考书。”(刘国钧《国立兰州图书馆与西北文化》)并成立了“西北文物研究室”,专事西北地方文献的搜集、收藏、研究工作。从刘国钧先生始,历届馆长都十分重视西北文献的搜求和开发利用,目前共收藏西北地方文献古籍约6000余种,2万余册,为西北地方文献的建设与开发利用打下了坚实的基础。

二、甘肃省图收馆西北地方文献古籍收录范围

凡甘肃、陕西、青海、宁夏、新疆各省(区)以及在自然区划、行政区划演变中与西北五省边连地界有关的历史地理、政治经济、民族宗教、语言文字、文化教育、科学研究、体育卫生、工农业生产布局、自然资源、自然生态变化等内容的各种载体的975年以前的文献资料,均属西北地方文献古籍的收录范围。

三、西北地方文献古籍书目数据库与其它书目数据库之区别

1 古籍正题名与普通图书正题名信息源之不同。《普通图书著录规则》规定正题名的信息源是版权页和书名页,尤其以书名页为主。但古籍正题名则依正文卷端所题著录,于是,在作200字段(题名与责任者项)时@a正题名取自古籍卷首卷端,而其它的如封面题名等著在相关题名字段。古籍最重要的题名说明文字是卷数,因此,200字段中的@e题名说明字段著录古籍的卷数,并用汉字数码标识(如:五卷)。若地方志书名不含纂修年代又须标识,其年号可标识于卷数前第一个@e子字段。如:徽郡志:嘉靖,八卷/(明)郭从道撰0@a徽郡志@e嘉靖@e八卷古籍200字段的责任者按卷首卷端所题著录,不予删改,完整照录。由于古人喜欢用别号著书,不用其真实姓名,而1949年以后出版的铅印古籍的平装本又以著者的真实姓名出版,使同一著者的同一著作在不同时代的出版物上有不同的称呼,为此我们在300字段作附注,说明责任者姓名、字号、别号等情况,并在701字段作检索。

2 古籍著录设立了许多相关题名字段。封面题名著在512字段;不在卷首的卷端题名与正题名不同时,著在514字段(卷端题名);古籍版心上的题名在515字段(逐页题名);古籍书根上的题名在516字段(书脊题名);另外的函套题名、别名、从属题名、第三个以上合刻题名在517字段(其它题名);对于古籍题名中的繁体字、异体字,在200字段使用简化字、规范字著录,而在517字段记录其繁体字、异体字,以便读者检索;未在古籍中出现的,由我们视具体情况补充的非统一题名的关键词题名或通俗题名,可著录在540字段(编目员补充的附加题名)。

3 古籍版本项由版本说明、版本附加说明及与本版有关的责任说明组成。其中版本附加说明是对版本类型的补充说明,包括版次、底本版本、影抄、彩色套印、活字制字材料,还包括版次日期的补充说明。如:西北胜迹/白锋编・―石印20010@a西北胜迹@f白锋编205##@b石印

4 古籍的出版地、出版者是鉴定古籍版本的依据,因此我们对于210字段(出版发行项)的各个子字段做得很详细,并在620字段著录出版地或制作地,刻书者还要在702个人名称或712团体名称字段加以揭示。

5 古籍著录规则中有13条内容要求著录在附注项,虽然,使用机读格式以后,一些内容已经在其它字段做了处理,但要在300字段著录的`内容仍然不少。如果软件在300字段预留的长度不够,这些内容是容纳不了的,只要一存盘或打印卡片,附注项内容就会丢失。因此,我们使用ILAS5.0版加大300字段的长度至字节,解决了这一难题。

6 为了说明古籍所含有的书目或索引及其部位,我们设定了320字段(文献内书目、索引附注);相反,说明古籍被何种索引、摘要著录过,或被何种文献引用过而被列入参考书目,用321字段反映。7 反映古籍底本的版本情况,所编的古籍是复制品(如:影印本),用324字段(原作版本附注);反映所编古籍的其它复制品信息,用325字段(复制品附注)。

8 许多古籍在一个题名下含有许多子目,很多读者只需要了解文献组成部分或某张照片而不是全文,为此我们设了327字段(内容附注)用于子目及重要内容的揭示。

9 古籍中繁体字较多,系统所使用的字符集中不含有这些繁体字,因此我们设定了393字段,用规定的形式、符号和文字描述字符集所缺字符,并注明其汉语拼音读音。

10 古籍往往含有许多子目或分册,并且这些子目单立成章,读者只需其中的某一篇而不知总书记名,这时我们设立了461(总集)、462(分集)、463(单册)字段,当分册作200字段时,总书记名用461字段标识;当总书记名作200字段时,各分册用463字段标识;当所编古籍有多层附属关系时,200字段记录的是子目、总书记名和附属名,另一个附属名则用462字段标识。

11 若单册书各卷有卷名,且各卷名有检索意义,我们使用464字段标识各卷。如:陇右金石录:10卷/张维撰.-卷二:唐20010@a陇右金石录@h10卷464#1@120010@a唐

12 所编古籍文献与一个或一个以上版本相同的文献装订在一起,为了揭示另一古籍文献,我们设立了488字段。

13 古籍中含有检索意义的附刻、附录、书目、年谱等资料,称为附属文献。附属文献的信息被著录在491字段;附属文献题名若不完整,我们则在题名的适当部位加[]号标识自拟题名,[]号内的自拟题名一般取自200字段的正题名。若200字段标识附属文献信息,则所属文献的题名信息著录于492字段。

14 606字段记录著作的内容主题。该字段本馆选定:西北地区――地方文献、地方文献――西北地区,作为西北地方文献的统一检索词。

15 610字段是用于表示著作主题内容的自选关键词(自由词),不是取自主题规范表,选词最多8个。我们规定,某些文献题名用词直接用作标引词含义不清者,应廓清其实际含义,另外用适当的词标引;尽量少用读者想不到的措辞形式,避免用不起作用的词;有些文献在标引时应舍去次要的主题概念;词的简称形式必须换成全称形式;宗教文献的标引尽量少用“戴帽”性质的词;民族文献的标引,以民族名称主题词为主标题。

16 古籍分类号按刘国钧分类法分,其分类号著录在686字段。

17 古籍在流传过程中可能有损失,它的残缺情况应该反映出来,我们在905字段加了两个子段@g残缺号、@r缺卷号。另外,普通图书一种最多是3-5个复本,一条记录中的条码号最多也就是20-30个,一般编目软件的905字段还能容得下,然而古籍就不同了,有的书一种就有几百册,一条记录中就有几百个条码号,905字段的长度不够,把条码号一个一个地打进去以后,一存盘就丢号。因此我们把软件系统改造了一下,改为@bxxxxxxxxx-xxxxxxxxxx号,只打一头一尾两个条码号。这样,既节省了占用的计算机空间,又提高了古籍编目人员的工作效率。

总之,以现有软件为基础,以《中国机读目录格式》、《汉语文古籍机读目录格式使用手册》为主导,再根据古籍及地方特点,是我馆建立西北地方文献古籍书目数据库最根本的指导方针。

〔出处〕 图书与情报(2)

篇6:地方文献数据库检索系统建立之设想

地方文献数据库检索系统建立之设想

【摘要】建立检索系统是地方文献数据库的重要内容,检索系统的好坏直接影响数据库的整体质量,根据地方文献本身及其用户群的特点,本着方便读者、有效利用地方文献数据库的原则,笔者提出了建立“学科分类检索子系统”、“地名归类检索子系统”、“著述形式检索子系统”等具体构想。

地方文献是指有关本地方的一切资料,表现为不同时期、各种记载形式的文献如:图书、杂志、报纸、图片、影片、画片、拓本、表格、传单、票据、文告、手稿、簿籍等。[1]可见,地方文献不仅涉及内容广泛、时间序列较长;而且具有资料来源复杂、贮存方式多样等特点,建立地方文献数据库就是要将这些不同来源、不同途径、存于不同介质的原始数据归于同一库中供用户综合使用。为方便用户的快速查找、有效利用地方文献数据库检索系统必须能给用户提供多条检索途径。根据地方文献本身及其用户群的特点,笔者认为地方文献数据库应建立特定的检索系统,该系统除具备常规的篇名、作者、机构、关键词等专项检索功能外,还应建立以下三种检索子系统。

l 学科分类检索子系统

地方文献数据库应属于专题文献数据库,但因其文献内容广泛而丰富,涉及政治、经济、法律、军事、文化、文学、历史、地理、人口等多学科范畴,故又具有综合性数据库的特点。

分类是人类认识、区别众多事物的基本逻辑思维方法。打开一个学科综合的数据库,广大读者最常用的方法就是依学科分类来检索文献。不同的用户一般都有自身的研究领域而且对该领域的文献最敏感、知识分类也最熟悉。为使用户能快速了解自身学科范畴的文献资料,并能较全面地浏览某地区在该学科领域的科技发展新动态,地方文献数据库必须依据学科专业来组织文献资料,分门别类地显示文献信息,亦即建立“学科分类检索子系统”,实现按学科分类检索的功能。

学科分类检索主要是指依据文献内容的学科属性及其特征,将成千上万种文献划分开,按照科学分类标准,将库容文献编排类目,各分其类,编制文献检索系统。该系统按类提示文献信息、提供文献线索,便于用户寻类索文、触类旁通。用户可按分类的次第性,逐次寻找类目,查获数据库内含的有关文献。[2]

建立学科分类检索子系统,实际上就相当于编制了一个地方文献的分类索引总目录,只要选好科学分类标准即可。我国目前建立的有关综合性文献数据库,大都采用《中图法》编制文献分类检索系统。《中图法》是一种历史最久、使用最广的分类工具,其分类体系严谨科学,现己成为我国文献分类的标准大法。地方文献数据库当然也应依据《中图法》建立“学科分类检索子系统”,依据分类法的等级序列,将不同学科的文献归位其相应级别,形成文献的并列性及次第性,作为地方文献数据库检索的主要人口。对该系统具体的建立方法,已有不少数据库的成功实践(如CAJ一CD等),这里不必赘述。

2 地名归类检索子系统

虽然学科分类检索能满足人们检索文献的一般逻辑思维方法,但是,随着科学技术的飞速发展,各种新学科、新科技不断涌现,学科间相互联系、相互渗透越来越强。而学科分类是属于一种先组式的检索体系,只能单维地提示文献特征,对文献的专指度跟不上交叉学科的发展,在反映新学科、新成果方面也总是滞后,给用户检索新的'科技信息增加了不少困难,也降低了文献的检全率、检准率,因此有必要建立另一种检索子系统以弥补学科分类检索子系统的不足,笔者由此提出了建立“地名归类检索子系统”的设想,以实现按地名归类检索的功能。

地名归类检索主要指依据文献所属的地区,将文献划分开来,按地域区分和隶属关系,以地名作为细类和子目,将库容文献各归其地,编制文献检索系统。该系统按地域提供文献线索,便于用户以地寻文、鸟瞰全貌。该系统可避开文献的学科分类,直接、方便、有效地了解和利用某一地区范围的相关文献资料,包括最新文献资料。地方文献都是以某一地区为记述范围且反映本地特色的,这些共同的地方特色,体现为文献的区域性[3]。某一地区在历史上经历了自然灾害、气候水文的变化;经历了人口的自然变动和机械变动;经历了各时代的政治、宗教、战争等影响,从而才形成本地区的经济特征、生活习惯和文化传统等等,也才有了地方文献的收藏。地方文献这一“区域性”特征,使得建立“地名归类检索子系统”成为可能。对研究地方特色的用户来说,他们更注重文献的区域性,建立“地名归类检索子系统”也正是满足了用户按地名揭示和组织文献的要求,用户不仅能以地名作为检索口,查检某一具体地区的有关文献资料,并能较全面地了解该地区的总体概况。以我馆收藏的徐州地区地方文献为例,建立一个地名归类检索子系统的检索结构:

该系统按市、县、乡、村的级别及隶属关系、形成一个树叉式的检索结构。结构的深浅、树叉的稀密,可依库容文献的收藏情况确定。进入系统后,首先列出第一级地名“徐州”,双击该条目,即可进入显示该级文献内容及下一级地名目录,依次下去,即可进行更为详细的查找。当进入到地名归类的最底层时,即只显示该层的所有文献。对任一级文献的进一步查找,可以配合设计“学科分类检索”或“著述形式检索”形式,以便用户更直接地索取到所需资料。建立“地名归类检索子系统”,可以说为“区域研究”的用户提供了一张地图似的资料检索途径,使他们对地方文献一目了然,广域的地方文献从而成为更具体的地方文献。

3 著述形式检索系统

地名归类检索已是在学科分类检索的基础上,进一步拓宽了用户的查检途径,亦是在综合性数据库的基础上,体现了专题性数据库的检索要求,但对地方文献的不少用户来讲,学科的交叉渗透、地域的临界相关往往正是他们研究的焦点,这时候前述两种检索子系统都不能满足他们的要求,而著述形式则成为他们查找资料的第一入手点。地方文献数据库如能按著述形式组织文献,即建立“著述形式检索子系统”,则可实现按著述形式检索的功能,满足更多地方文献用户群的需求。

著述形式检索主要指依据文献的著述形式,将文献划分开来,按著述形式的层次关系,依次设立子目,将库容文献各归其位,编制文献检索系统。仍以我馆收藏的地方文献为例,建立一个著述形式检索子系统的检索结构:

该系统是一种列举式的检索结构,不可能将已有的一切著述形式都罗列无遗,不同地区的地方文献数据库可依各地的地方特色及各种著述形式文献的多寡确立不同的检索结构及结构的深浅。如:我馆收藏的是徐州地区地方文献,因徐州是淮海战役的主战场,又是我国汉文化的发源地,于是将之归为“地方档案”的具体收藏。

“广、快、精、准”是对文献检索工作的需求,也是衡量数据库检索系统质量好坏的标准。在建立地方文献数据库时,若能注意几种检索方法的相互结合,即可让用户有选择地进行检索,尽快地获得所需资料,有效地满足读者“广、快、精、准”的检索需求,达到建立地方文献数据库的初衷。

参考文献

1 刘 青.地方文献特点和类型试论.四川图书馆学报..(1)

2 刘 喜等.节立农业文献数据库分类检索系统的建立.甘肃农业大学学报..(3)

〔出处〕 现代图书情报技术 2000(6)

篇7:试论地方文献保障系统中数据库之建设

网络环境下的图书馆,既是信息产品的消费者,又是信息产品的生产者。公共图书馆要使自己的信息产品在互联网上占有一席之地。必须开发馆藏特色资源,深入挖掘地方文献,建立具有地域特点和文化特色的文献资源信息库,并改进服务方式,增加服务项目和品种.满足本地区经济社会发展对文献信息的需求。

数量庞大的、种类繁多、形式多样的地方文献,是国家文献信息系统的重要组成部分。只有把全国各地图书馆收藏的这些具有浓郁地方特色的文献资料数字化,建成各种专题数据库,与国家图书馆数字化文献系统一起在互联网络中形成完整的中国数字图书馆。通过互联网络向世界展示,才有利于让世界了解中国,让中国走向世界。

1 “地方文献保障系统”概念的引入

地方文献本着为地区经济建设和文化发展服务的原则,其收藏的数量和质量在读者服务过程中起着决定性因素。同时,地方文献信息是网络信息惟一性资源的主体,所以,地方文献数据库在社会信息网络中同样也是独一无二的。正因为此,地方文献数据库在网络信息数据库中占有重要地位。

李岚清副总理曾明确指出:“要更新图书馆观念,利用现代信息网技术,实现图书馆信息资源的共享。”为此,我们必须转变观念,彻底摒弃文献资源建设中的保守主义、本位主义思想,提倡全局观念、资源观念、合作观念、双赢观念、投入产出观念、创新观念和服务观念,从建设战略资源的高度,统筹规划、合理布局、突出重点、兼及特色,搞好我们的文献信息资源整体建设,通过宣传、报道、学习、研究等各种手段把上述全新理念内化为所有图书馆人的共识,在此基础上牢固树立信息资源共建共享观念。在此新认识的基础上,公共图书馆在充分利用国家文献保障体系的前提下.应建立一套适合本地区发展、具有自身特色的地方文献保障系统,它不仅包括图书馆,而应该是整个地区地方文献收藏单位的联合体;既能满足本地区经济社会发展的需要,又可成为国家文献保障体系的一个子系统

笔者认为。地方文献保障系统是地方文献数据库建设的“物质保障”。而地方文献数据库建设的前提条件是组建一个本地区跨系统、跨行业的高层次的地方文献宏观调控机构(即本地区地方文献的主要收藏单位。甚至个人),统筹、规划、协调组织本地区地方文献收藏以及开发利用工作。由于省市级公共图书馆在地方文献的收藏数量上占有一定的优势,因此,该机构应以其作为牵头者,联合各区、县图书馆,尤其要联合当地的档案馆、党政机关、学术机构和社会团体的文献信息中心。因为这些单位所拥有的地方文献大多是内部出版物。非公开发行,这部分文献恰恰又是公共图书馆所缺藏的。因此,多家联合,既可以保证数据库的文献信息资源.又可以节约各家“单干”的费用。

这个调控机构的职能.主要有以下几个方面。

(1)在充分调查研究的基础上,制订出数据库建设的总体战略目标、战略步骤和重点,对数据库立项做出决策,避免各自为政和重复建设。

(2)完善、执行有关政策、法规和标准,推动数据库建设的标准化和规范化。由于地方文献数据库建设要依靠众多单位的合作,为保证数据库的'制作质量和查询效果。以便于数据的交换和共享,统一标准便成为十分重要的问题。

(3)选择一个成熟的网络数据库管理系统。该系统要配备完善的索引,包括篇名索引、主题词或关键词索引、分类索引、著者索引、地名索引等,索引要功能完备、操作简单、提供多途径的检索方法。

(4)根据数据库选题的内容,针对各成员单位不同的收藏特点,充分利用其各自的文献资源优势,合理、恰当地分配工作内容,对建库工作进行指导和监督,以保证数据库的质量。

(5)指定某个成员单位(如省市级公共图书馆)为中心管理机构,负责数据的整合、加工、规范以至最终完成数据库的制作工作,并负责数据库的网上发布、数据更新、技术维护等日常管理工作。

2 专题数据库规划的构思

针对地方文献种类繁多、形式各异的特点,在开展地方文献信息数字化时.应选择自身价值和使用价值都比较高的地方文献,建设信息型数据库,包括书目数据库(即本地区地方文献联合目录)、索引数据库、文摘或提要型数据库以及全文数据库。笔者认为。专题数据库的建设应全面、科学地进行评价,既要根据本地区经济建设和社会发展的需要,又要兼顾保存历史文化遗产,还应考虑面向全国和全球的传播意义。分期分批地建设一批宣传本地区并能够引起广泛社会影响以及经济效益好的专题数据库,可从以下两个方面考虑:

(1)从历史的角度,本着继承和发扬本地区灿烂文化的原则建设以下数据库:

●地方志数据库。包括本地区历代史志和各类专业志的专题数据库。

●本地人物数据库。包括本地有影响的历代和现代的人物及其研究成果。例如天津图书馆所建立的“津门群星”人物库.对收录的每位名人都编辑了全文人物小传。

●古籍数据库。包括本地区全部古籍地方文献的专题数据库。由于古籍一般年代久远,版本珍贵,不便于实物查阅。应通过光电扫描技术建立全文数据库。

●照片数据库。作为历史瞬间的记录、时代的缩影,照片资料是研究地方史不可或缺的参考资料。尤其老照片,是不可再生的。应根据照片内容建立不同专题的数据库。

●家谱数据库。家谱是一个地区古老的文化遗产。是地方文献重要的组成部分。应根据需要建立全文数据库。

● 民俗风物数据库。在漫漫历史长河中,各地区的生活习俗各异,形成了自己独具特色的风情文化。这些独有的地域特色,恰恰符合地方文献特色数据库的建库原则。

(2)从现实的角度,本着为本地区经济建设和社会发展的原则,建设若干数据库:

●地方法规数据库。随着我国法制建设步伐的加快及大众法律意识的增强,地方法规已成为地方文献服务的主要内容之一。该数据库应采取全文形式。并附加相关法律服务机构名录。方便读者进行相关咨询。

●行业信息数据库。包括本地区各行各业,特别是支柱性行业的发展动态、趋势、市场、投资等方面的信息以及各类研究报告,为政府决策和各类用户提供必要的参考。

●名优产品数据库。就是把本地区出产的、具有相当规模和行业优势的工农业产品作为信息资源。加以收集、整理和开发而成的数据库。利用多媒体技术。最大限度地揭示产品信息的内容,包括产品外形(图或动画),与产品有关的文字描述,产量、价格和库存的动态情况,生产者的背景资料以及使用者的情况。并且.通过网络与生产者建立联系,及时更新动态信息,便于读者全方位检索,在生产者与用户间筑起一条沟通的桥梁。

●企业名录数据库。包括本地注册的各类企业的名称、产品介绍、联系方式等。随着经济的发展,数据库应是动态的、不断更新和完善的。

●旅游资源数据库。以发展本地旅游经济为目的,宣传本地旅游区,挖掘待开发的旅游资源。“天津旅游”数据库,就是一个图文声像并茂的多媒体专题数据库。

●综合数据库。关于本地区历史、人文、现状等方面综合类数据库。如天津图书馆开发的“文化讲座”、“名人故居”等数据库,内容涉及天津历史沿革、民俗、建筑特色、名人轶事等,为读者提供百科性的检索服务。

地方文献专题数据库建设,应充分发挥多媒体技术的性能,集图、文、声、像于一体;对已成体系的静态的历史资料,如图片、拓本、手稿、票据、画片等,应利用数码摄影或扫描录入的方式建库。以保存文献资料的原形传真;对不断产生、发展变化的动态的现实资料,如录音、录像等,应利用相应的数字化软件工具把它们转换成数码格式输入数据库。

总之,在地方文献保障系统框架下,以本地中心公共图书馆为核心。联合各个地方文献收藏单位,共同建设开放型的地方文献数据库,为地方文献的拥有者和使用者提供一个地方文献信息检索、交流与交换的平台,从而改变以往数据库建设中各自为政的局面,使之走上“共建、共知、共享”的道路。

参考文献

1 胡长锋.地方文献保障系统建设构想.宁波大学学报,(2)

2 高坤育.地方多媒体文献资源库建设.情报探索,2002(4)

3 邓晓辉.谈网络环境下特色数据库的建设.图书馆学研究,(1)

(张岩 天津图书馆历史文献部馆员)

〔出处〕 江西图书馆学刊 第1期

篇8:谈地方文献书目数据库的整顿工作

地方文献是关于一个地方的全部资料,不仅内容涉及一个地区的历史、现状、自然科学、人文科学和社会历史遗存等各个方面,著述形式有方志、专著、期刊、族谱、地图、科技报告、专利文献、学位论文、会议记录等新老样式,文献载体更有印刷型的书籍、缩微品等众多品种。地方文献书目数据库的研制就是要将不同来源、不同内容、不同著述方式、不同存储介质的地方文献的原始数据存入同一库中综合使用。建立地方文献书目数据库是实现地方文献数字化的基础工作,更是地方文献开发及其业务工作自动化的前提。

沈阳市图书馆地方文献书目数据库建设工作始于 1995年,现有书目数据记录达 3 万余条,目前,此数据库仍在建设中,它能为各级领导决策提供依据和参考,还能直接服务于沈阳的经济建设,为沈阳地区的生产、科研提供切实可靠的信息;促进沈阳地区与其它省市的文化交流,提高学术研究水平;为编纂沈阳地方史志提供翔实的原始资料;为开展各项爱国主义教育提供宝贵的乡土材料;为外地人了解、认识沈阳的政治、经济、文化、习俗提供全方位的资料。总之,地方文献书目数据库为省内外读者的各项检索服务发挥了很大的作用。

2 建库中存在的问题及整顿的措施

沈阳市图书馆组建地方文献书目数据库以来,积累的问题逐年增多。这些问题不仅影响读者对地方文献资料检索的速度、准确度和全面性,更阻碍了该馆地方文献工作迈向数字化发展的进程,因此,对地方文献书目数据库的整顿工作显得尤为紧迫和必要。该馆的地方文献书目数据库的整顿工作在图书馆自动化集成系统(ILAS)V 5.00 版中编目子系统(2)―系统维护(7)―总书目库维护(1)状态下作业。 .

2.1对工作疏忽引发问题的处理

由于分编人员的误操作,将一种图书误认为另一种图书,该记录除 ISBN 个别字段与原书相符外,题名责任者等主要字段风马牛不相及。造成这种情况的原因可能由于 ISBN号标准自身的不完善,存在着丛书与多卷书只有一个号,或者盗版书盗用正版书号等。处理办法:保留正确字段,并对该条记录进行修改。

一书有两条以上的记录。完全相同的图书由于分次购入,不同复本之间往往会出现多条书目数据共存的现象。造成此种情况的原因是编目录入人员在建库操作中未按要求进行查重。同一种图书多条记录,不仅造成书目数据库的混乱,严重情况下还会降低检索速度,影响图书馆集成管理系统的运行。处理办法是进行数据合并,具体操作程序如下:先在编目子系统(2)―系统维护(7)―总书目库维护(1.)状态下将分散在几条记录上的条码加在一条记录上,然后记下要留下的记录号和欲删除的条码号,入流通子系统(3)―系统维护(7)―条码库维护(2)―条码记录库维护(1)中,将要删除的条码号挂到要留下的书目记录号上,然后存盘退出。再入编目子系统(2)―系统维护(7)―总书目库维护(1) . 状态下,将其它几条无用记录删除。事实上,合并记录在流通子系统 (3)―接收数据 (6)―书目记录生成条码库 (3)中也能运行。但是较为繁琐,且容易出错。我们在运行一段时间后改为入(3) ―(7) ―(2) ―(1)中执行。

著录内容不准确。这与编目人员的业务水平有关。问题主要集中在题名责任者项的正题名、并列题名及副题名说明文字著录、合订题名的准确性上,也是我们进行书目数据整顿的重点所在。

文献著录方式不一致,尤其是对于丛书、多卷书的著录没有视具体情况处理。

分类标引问题,主要是对“同书异号”、“异书同号”等差错进行修正。强调多卷书的分类号、索书号的一致性,尤其是对于二、三版改号部分的图书,在整顿过程中,注意将两个号均反映在690字段。此外,还存在外来数据源的分类号与本馆分类号不一致的情况,也需要根据具体情况进行修改,保留正确的分类号。

规范化问题。在形式上相同的字符,在计算机中的内码可能是完全不一样的。因此,文字、拼音、英文字母的大小写、全角、半角的误录入,标点符号的误录入等都是在整顿过程中应当注意的问题,如原先对统一书号均采用中圆点,现在一律改为下圆点,以利于检索,保证规范、标准。

2.2 根据新规范所作完善

随着国家图书馆对文献分类标准和文献著录格式的不断完善,地方文献书目数据库中的记录也必须相应地调整。

著录详简级次问题。回溯书目数据库中的地方文献,其书目数据著录比较齐全,而需要原始编目的地方文献,尤其是1985年以前的`书籍,著录得较为简略,通常仅有 010、200、701、905几个字段。

类改号的问题:由于《中国图书馆分类法》第三版、第四版的问世,地方文献书目数据库中的很多记录的分类号需要改动。

2.3 机读格式与ILAS系统的矛盾问题

例如合订题,按《中文普通图书编目手册》的著录方法应该是在 200 字段重复使用 但是在 ILAS系统中对此不识别,具体处理办法是在200字段录入第一个合订题名,其余在300、517字段中分别著录。

2.4补加新字段

在地方文献书目数据库中,每条记录均加上693字段以区别馆藏中的其它藏书,如果在 693字段后使用 @a 标上DW表明此条记录的文献资料为地方文献;如果在 693 字段后使用 @a标上DC表明此条记录的文献资料为地方出版物;如果在 693字段后使用 @a 标上DZ,表明此条记录的文献资料为地方作者的著述。利用这三种检索点,可以检索到属于馆藏范围的沈阳地方文献、沈阳地方出版物以及沈阳地区作者的所有作品。

3 数据库整顿人员须掌握的知识和技能。

要学习和掌握《中文图书编目规则》的有关内容。《中文图书编目规则》在修订、完善各类文献著录标准的基础上,将各类文献著录规则融为一体,并通过标目规范控制,形成既具有我国汉语言文字特点和目录学传统、又与世界书目控制原则相吻合的一套文献编目规则,对许多具体问题做出了规定。了解和掌握它,会使我们对地方文献的编目做到有据可依。

要准确理解 《中文图书机读目录格式使用手册》( 年8月)的有关内容,尤其对其中修订的内容要耳熟能详,以确保编目工作的准确无误,实现地方文献的款目数据的标准化、规范化。

要掌握快捷无误地操作计算机的技能,凭借这种高超本领,建立一套高标准、高质量的地方文献书目数据库。

〔出处〕 江西图书馆学刊(2)

篇9:论地方文献报刊信息数据库及主题标引工作

地方文献是指内容上具有地域性,同时具有重复使用价值的文献。由于它完整、系统地记录了特定地域内自然和人文方面的各种信息,从而为人们提供了研究特定地域内历史、现代及未来的有关资料。

地方文献的类型多种多样,报刊文献是其中的一种。它具有信息量大,传递周期短,内容相对客观、翔实等特点。但由于它的总量太大,有关的地方文献信息分散在不同时期、不同品种的报刊之中。仅靠浏览原始文献,迅速查到有关资料,几乎是不可能的。地方文献报刊索引就是为解决这一问题而编制成的一种检索工具。

在手工时代,地方文献报刊索引表现为篇目索引或题录索引的形式,即将报刊中所载地方文献篇目按一定顺序编排起来,以利读者查找文章的所在位置。这种索引不反映文章的具体内容,只具有指向和示址作用。同时,也对地方事物起着揭示和报道的作用。除了作为一种综合性的检索工具外,还可以在这种索引的基础上编制各种情报报导刊物,或围绕特定学科及专业进行定向报导和检索,以服务于地方的各项事业。

鉴于地方文献报刊索引的重要作用,许多公共图书馆都曾积极编制这种索引。例如,首都图书馆自50年代起开始编制《北京地方文献报刊资料索引》,涵盖了本世纪以来的内容;甘肃省图书馆也是在同一时期开始编制西北五省的地方文献报刊索引;长春市图书馆也曾编制了《东北地方文献索引》等检索工具。为了避免目录体系过于庞大,这种卡片式篇目索引一般仅以分类方式编排。因此读者也只能从分类途径对报刊上的地方文献信息进行检索。 进入计算机时代以来,以数据库形式来处理地方文献信息已成为图书馆地方文献工作的必然趋势。计算机所具有的自动识别与排序功能,使地方文献信息的编排检索变得更加方便、更加快捷。通过全文扫描技术完成的报刊全文数据库,使得报刊上的地方文献信息得到更充分地揭示和利用。由于计算机具有一次性输入,多途径输出的功能,因而在对地方文献信息进行存储与检索时,增加了篇名、著者、出版、文摘等多方面的途径。尤其是从主题途径检索地方文献信息的问题得到了很好地解决。

在地方文献报刊信息数据库(以下简称报刊信息库)中,分类标引和主题标引都是以揭示文献内在特征为目的的标引方法,只是揭示的角度有所不同。由于地方文献的史料特征极为明显,故地方文献的读者往往是从特定的事件、人物、时间、地域的角度入手进行检索。因而可以说主题检索是一种最直接反映地方文献内容特征的检索途径,也是建立检索工具和检索系统的基础和前提。近些年来,图书情报界对有关主题标引的原则和操作方法有过许多研究和探讨,撰写过很多的著作和文章。但由于地方文献中连续出版物本身所具有的特征,其主题标引的原则和方法与其它类型文献的标引还是有所不同。本文拟从报刊信息数据库的建设入手,探讨有关地方文献报刊信息主题标引的一些问题。

篇10:论地方文献报刊信息数据库及主题标引工作

2.1词表的编制

报刊信息库与其它类型数据库相比,最突出的特点是要反映地方文献本身所具有的特征。同时还要满足地方文献用户特殊的检索需求。因此,选择一部适合地方文献特征的主题词表是开展标引工作的首要问题。

《汉语主题词表》(以下简称汉表)是一部供机检使用的综合性基础型词表。它所收录的词汇可以供各个机构和行业从中选词,以编制适合本专业或本机构使用的专业词表。实际上,我国很多专业情报机构和图书馆都是在参考这部国家词表的'基础上编制自己词表的。在编表过程中,抽取主题词时当尽可能不破坏原有词表的词间关系。但必要时,词间关系及基本范畴还是需要重新确定的。

由于地方文献是对某一地域自然和人文现象的客观描述,它所表现出的地域性和专指性极强。用综合性的《汉表》来标引各地的地方文献,则将有相当部分的文献不能被准确地表达其主题概念;其次,地方文献的内容范畴与《汉表》中的基本范畴也有所不同。《汉表》是以学科体系作为划分范畴的基本依据;而地方文献则是以特定地方的自然环境、人文环境和地方事业作为划分范畴的基本依据。所以地方文献主题词表需要在《汉语主题词表》的基础上自行编制。

地方文献主题词表中所收录的主题词来源主要有:

①《汉表》中已有的词汇。这是地方文献与非地方文献都使用的综合性词汇,它占将来的地方文献主题词表所收词汇的绝大部分。由于是从《汉表》中选词,所以它们是相对规范的。

②《汉表》中没有的,带有地方特点的词汇,如:北京地方文献的“琉璃厂”、天津地方文献中的“皇会”、广东地方文献中的“早茶”等,这部分词汇虽然在未来的地方文献主题词表中所占比例不会很大,但它们却是出现频率相对较高的词汇。对于这部分词汇及其词间关系,地方文献工作者需要加以规范。

③《汉表》作为阶段性产品,它的编制受时间的限制,对于编表以后新产生的一些词汇它不可能收录,在新编的地方文献主题词表中收录这部分词,也需要加以规范。

由于编制先组式的主题词表需要一段相当长的时间,同时还要编制一系列的标引细则,这将会影响报刊信息库主题标引工作的迅速展开。因此,可以采用另一种方式,即首先确定一段时间为试验期,先进行地方文献的标引工作。由标引人员直接从报刊所载的地方文献信息内容中选取有检索意义的关键词作为主题词。这种主题词是未经规范的自然语言,也无词间关系可言,待积累了一定数量之后,再对其进行修改、充实,并参照《汉表》使之规范化。确定好词间关系和基本范畴,从而形成适用的词表。这种词表是后控式的,采用这种方式选词更直观,专指性强,还能使标引工作与修改词表同时进行。而且标引时不用考虑词间关系及查表抽词,所以标引速度快。在标引时采用自然语言,对标引人员的要求也相对较低。目前,广东省中山图书馆的地方文献数据库系统主题标引就采用了这种方法。

2.2主题词字段的设置

无论是先有词表,还是先进行标引工作,在报刊信息库中,都需要设置若干个主题词字段,以便展开具体的标引工作。在设置主题词字段时,一定要注意反映地方文献的时空特征;在空间方面完整、系统地记录特定地域内自然和人文方面的各种信息;在时间上又形成了一个连续的信息集合。这是一切地方文献工作最基本的原则。

在报刊信息库中,首先应设置涉及文献基本内容的“内容主题词”字段。此字段选词灵活性大,标引的内容也十分广泛。它对所有地方文献信息的内容范畴进行涵盖,也是以后编制地方文献主题词表时确定词表基本范畴的依据。从地方文献的性质和特征来看,它是对特定地区自然、社会、人文诸般事物的历史与现状进行全面系统地综合性记录,涉及的内容极为广泛。如反映一个地区所能观察到的天文现象、地质水文结构、地形地貌、气候与气象、物种与资源以及反映该地区的人文地理、历史、地方人物、社会经济、地方政治、社会结构、地方文化、教育等各个方面。

报刊信息库中“内容主题词”字段的主题词性质绝大部分是综合性的,与其它非地方文献数据库中的主题词无太大区别。例如“社会治安”,“计量管理”、“住宅区”、“软件产业”等;也有一部分是地方文献内容所特有的地方性词汇,如“敦煌石窟”、“庚子事变”、“厂甸”等;另外,新产生的一些地方文献信息的内容,也应通过内容主题词来表达。总之,凡是涉及到地方文献的所有内容特征,都应在此字段予以反映。

这一字段并非地方文献数据库所特有,有关具体标引方法的讨论从略。

另一种主题字段的设置应反映地方文献内容特征以外的其它特征。地方文献最大的特点,就在于文献所记载的现象、事实和人物都被限定在某一特指的时空范围内。也就是说。地方文献所涉及的内容范畴均会通过特定的时间、地点、团体机构、人物等因素反映和输出。地方文献用户的检索习惯也往往是从某一地域范畴、地区名称、某一事件、某一人物入手。因此,有必要在地方题录库中设置“地域主题词”、“时间主题词”、“团体主题词”和“个人主题词”诸字段。它们是揭示地方文献的本质特征所必须的字段。同时也是地方文献数据库系统中所特有的。

以上四个主题词字段所反映的是有关地方文献信息中客观存在的某些因素,如“地域主题词”中的“东城区”、“梅山县”、“个人主题词”中的“梅兰芳”、“秋瑾”等。尽管这四种主题词的标引与“内容主题词”的标引相比,相对容易些,但仍需积累到一定数量后进行规范。例如“团体主题词”中的机构名称是用全称还是用简称,以及“个人主题词”中的人物名称是用本名还是用笔名,这些都需要地方文献工作者在以后的工作中根据本地区的具体情况加以规范。

具体的标引方法是:

地域主题所标引的不是整体地方文献的地域,而是文章内容涉及的某一具体区域的名称,或者给文章内容带来影响的区域名称。如有关北京地方文献的内容不用标“北京”,直接标引具体的“东城区”、“昌平县”等行政区划名称;内容涉及到较具体的地名时也可标引地名,例如“王府井大街”、“方家胡同”等;如果文章中所反映的地区更详细,区(县)、街道(乡镇)、村等具体名称都有,可逐级进行标引,中间用分隔符隔开,如北京地方文献中的“顺义县%赵全营镇%北郎中村”;在标引中,遇到旧有的行政区划名称或旧地名时,为反映某一地区名称的历史发展沿革,应将现行行政区划名称与旧有行政区划名称同时标引作为检索点,现有行政区划名称或新地名标在前面, 旧行政区划名称或旧地名注于其后,可用括号括起。如“东城区(内三区)”。以上的标引方法主要是针对地方文献用户特定的检索需求而言。

年代主题标引的是文献内容所涉及的时间范围,而不是文献撰写或出版发行的时间。清以前的历朝历代均可使用“朝代%年号”的方法标引.如“清代%乾隆”,中华民国时期(1919年前)可标引成“民国时期”,到了1920年以后可以标引成“二十年代”、“六十年代”等。

团体主题和个人主题标引的是文章内容所涉及到某一具体机构、个人,或与某地方有关系的机构和个人。团体主题标引时,用机构和单位的标准全称,如“北京市中级人民法院”、“重庆市技术监督局”等;而个人主题的标引,是标具体人名,例如“梅兰芳”;如果遇到同一人物有本名与笔名时,要同时标引,如“鲁迅”与“周树人”、“老舍”与“舒舍予”之间可用符号“%”隔开;遇到清代人物或少数民族人物的名称较长时,一般应标引人物的全名,如“爱新觉罗・溥仪”。

总之,无论标引什么类型的主题词,标引人员都要站在用户的角度,即从索引的终极使用目的出发,给地方文献实际使用者提供有价值的地方文献信息。因此,在对报刊信息库进行主题标引过程中一定要确定好标引深度。地方文献报刊索引的标引深度,则取决于地方文献各类用户的检索需求。地方文献的研究级用户的检索需求包括:决策、管理人员宏观的检索需求、科研人员较专深的检索需求及设计生产人员的针对性检索需求等。

尽管采用数据库系统处理地方文献信息这一手段在全国各类图书馆的地方文献业务中开展得还不够普遍,但这是地方文献工作发展的必然趋势。结合地方文献本身的特点来制订适用的主题词表、分类表,是实现地方文献信息处理标准化的必要步骤。它可为今后进行联机检索,进入国家和地区网络,从而实现地方文献资源共享打下坚实的基础。同时,计算机多途径检索所产生的效果也会使地方文献信息资源得以更充分地研究与利用。

参考文献

1 韩朴.图书馆地方文献工作.北京:文津出版社,1992

2 中国科学技术情报研究所.北京图书馆.汉语主题词表.北京:科学技术文献出版社,1979

3 莫少强.建立地方文献数据库促进地区出版物资源共享.图书馆学通讯,1986,(3)

〔出处〕 图书馆学刊 1999(2)

相关专题 浅见少儿