先进性方面有关论文范文集 跟PRESSoo在连续性资源编目上的先进性*类论文范文集

本论文为您写先进性毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

PRESSoo在连续性资源编目上的先进性*

[摘 要]通过研究PRESSoo模型,调研相关国外论文,阐述FRBR在处理连续性资源时遇到的问题和FRBRoo处理连续性资源的局限,从PRESSoo对连续性资源的建模、关系模型、以及数据元素的记录3个方面,探讨PRESSoo在连续性资源编目上的先进性.

[关键词]FRBR FRBRoo PRESSoo 连续性资源先进性

[分类号]G254.364

PRESSoo 是针对连续性资源的概念模型,由ISSN国际中心和法国国家图书馆组成工作组共同开发.2013年1月,工作组发布PRESSoo初稿,之后几易其稿,直到2014年4月形成了较成熟的0.5版,并把该版本首次发给IFLA FRBR 评审组审阅.工作组获得评审意见并修订后,在2014年6月发布了1.0版.在2015年春季,1.0版经历了一场世界范围的评审并再次修订后,在2016年1月形成1.2版.经第三次评审和进一步修订后,于2017年5月在ISSN国际中心的上发布最新的1.3版.

在前两次评审中,PRESSoo获得IFLA FRBR评审组的认可.评审组认可PRESSoo是FRBRoo模型的有效扩展,且与FRBRoo保持了一致性,PRESSoo通过对连续性资源精细的建模提供了有价值的本体扩展.并且,PRESSoo 工作组收到的意见均未对PRESSoo模型框架本体提出任何异议,仅仅集中在对语句的描述上,希望文本语句更加清晰、框架更加统一.起初,由于PRESSoo发展在IFLA之外,并且没有经IFLA相关部门验证,所以它不能作为IFLA的标准.但是,随着IFLA编目部常务委员会决定成立一个工作组以专门负责PRESSoo概念模型的维护与修订,这一问题便得到解决.并且,在1.3版中,明确表明PRESSoo 由隶属于IFLA 编目部的PRESSoo评审组编制.

目前,PRESSoo 已经获得IFLA 的认可,这对它未来的应用和普及将会有极大的促进作用.那么,PRESSoo 在处理连续性资源编目时有哪些优势?笔者从PRESSoo的起源入手,剖析FRBR在处理连续性资源时遇到的问题,以及FRBRoo处理连续性资源的局限,讨论PRESSoo在连续性资源编目上的先进性.

1 FRBR、FRBRoo 和PRESSoo 简介

1.1 FRBR

FRBR(Functional Requirements of BibliographicRecords,书目记录的功能需求)研究报告由国际图书馆协会联合会(IFLA)于1998年颁布.该研究报告的目的是以清晰的语言界定书目记录相对于各种载体、各种应用、各种用户需求所发挥的功能.FR?BR采用“实体-关系”模型来描述各种实体(书目数据、个人、团体和主题)、属性(特性)以及与其他实体间的关系,评估每个属性和关系对书目数据用户所实施任务的相关性,并且把“实体-关系”模型以及属性和关系对用户任务的映射作为推荐给国家书目机构所创建记录的基本功能级别的基础,其推荐重点放在国家书目记录最应该支持的用户任务上,即查找、识别、选择、获取.

FRBR把书目数据中用户关心的主要信息分为3组实体.第1组包括书目记录命名或描述的知识或艺术创造的产品,即作品、内容表达、载体表现和单件.第2组包括那些对知识或艺术内容、物质生产与传播或其产品的保管负责的实体,即个人和团体.第3组包括一系列附加的实体,它们作为知识或艺术创作的主题,即概念、实物、事件和地点.在这3组实体中,第1组实体是FRBR的核心概念.

1.2 FRBRoo

FRBRoo(The object-oriented version of the FR?BR,书目记录功能需求的面向对象版)是一个正式的本体,意在抓取与表达书目信息的潜在语义,以便于书目信息与博物馆信息的集成、调解与交换,是FRBR 家族概念模型的面向对象版[1].2003 年,由FRBR/CIDOC CRM 协调组(FRBR/CIDOC CRMHarmonisation)召集来自IFLA 和ICOM-CIDOC(In?ternational Council of Museums - International Com?mittee for Documentation)双方的代表提议开发一套新模型,主要目标有两个:(1)利用CIDOC CRM提供的概念、工具、原理和符号惯例等表达FRBR模型;(2)调整(可能最终整合)分别用于图书馆和博物馆的两套面向对象的模型,从而有利于解决用于这两套信息文档结构的语义交互问题.提议之后,于2006年夏天,FRBRoo初稿问世.到2008年1月,完成0.9版并提交给IFLA FRBR评议组.之后经过不断修订,于2010 年发布1.0 版,2014 年发布2.0 版,2015年2月发布2.1版.

1.3 PRESSoo

PRESSoo是一个意在抓取与表达关于连续性资源书目信息的基础语义的正式本体,特别针对定期出版物(期刊、报纸、杂志等)[2].PRESSoo是FRBRoo

的扩展,它是基于FRBRoo模型建立的针对连续性资源的概念模型.

针对连续性资源的情况,PRESSoo通过定义新的类和属性作为基础元素来构建模型.在1.2版中,定义了14个类和46个属性,创建的模型主要有13个,分别是:正在出版的连续性资源模型,期刊、单册、文章间的模型(分印刷出版和电子出版两种情况);两种或多种连续性资源间的6种转承关系模型(分别是:继承、替代、吸收、分自、合并、分成);一种连续性资源由另一种“临时性替代”的模型;(停止出版的)连续性资源和它作为专著的影印版之间的关系模型;(停止出版的)连续性资源和它的网络出版电子资源之间的关系模型;连续性资源和其合辑之间的关系模型.

2 FRBR 在处理连续性资源时遇到的问题

FRBR模型与连续性资源记录的适用性间存在着矛盾,这些矛盾来自多个方面,与FRBR自身、连续性资源的特性、ISSN分配和《ISSN手册》编目标准等都有关系.主要表现在以下几个方面.

2.1 FRBR自身的问题

(1)FRBR作为一个概念模型,很多方面都具有不确定性.在FRBR的研究报告中,对此有明确的说明:对于书目记录本身,无论从内容还是结构上来说,FRBR都没有事先的假定;正确确定FRBR实体有难度;模型的某些方面值得作更详细的分析,也有进一步扩展的余地,各类文献属性的确认与定义可以通过专家的进一步评议和用户研究来扩展.尤其是“连续性”概念和电子格式所记录的实体的动态本质需要进一步的分析.

(2)FRBR 模型中关系是缺失的或模糊的.从连续性资源的连续特性来看,FRBR模型中关系是缺失的,或仅能通过例子来表述,亦或在说明第1组实体间的关系中没有表述或表述模糊.而且由于牵涉到多个方面,相关缺失的关系如何在它们创建的层级间来确定是困难的,如两个作品之间的关系、两个不同作品的内容表达之间的关系、相同作品的内容表达之间的关系等.另外,FRBR对连续性资源间特有的一些关系采取模糊化处理,这些关系包括取代(部分)/通过……被取代(部分)、吸收(部分)/通过……被吸收(部分)、语言版本(不同于译本)、地理版本、分成……和/分自、与……合并成/由……与……合并成等[3].

2.2 FRBR与连续性资源编目之间的问题

(1)进行连续性资源编目时,作品、内容表达和载体表现是混合在一起的,以MARC 21中相关字段为举例:如007字段,既有描述介质的信息(载体表现属性),也有资料类型(内容表达属性),如代码“sd”指光盘上的录音资料;如780/785字段,记录作品/内容表达实体间的关系;如245字段,既是作品的题名,也是内容表达的题名和载体表现的题名[3].(2)在处理连续性资源时,FRBR实体间对关系的记录是困难的.FRBR并没有明确区分作品的内容表达,指出这些实体间的概念界定由文化因素决定.像所有的FRBR实体一样,FRBR第1组实体是有属性的,并且与其他实体也有关系.它们可能会在不同的抽象层级与其他书目数据相关联,也可以在那些层级中可能涉及到的资源的个人和团体相关联.连续性资源不能很好地适用FRBR模型,既因为某种资源可能涉及到多种关系,也因为某些关系在第1 组实体等级内在多个层级可以产生这些关系.另外,在FRBR第1组实体作品和内容表达层级,连续性资源的书目记录往往是相当简单的,因此可以较好地适用FRBR模型.但是在内容表达和载体表现层级,连续性资源的书目记录往往非常复杂.连续性资源中涉及的多重关系在MARC连续款目字段的排列中集中反映,这样相同载体或近乎相同内容的多重性就严重影响了FRBR模型在连续性资源中的应用.

(3)对作品的不同定义产生的矛盾.对于大多数书目数据,目前使用基于内容的定义,对连续性资源使用以题名为基础的定义.尽管这两种定义都隐含于FRBR中,由于相同的作品在不同的抽象层级会产生不同的界定标准,矛盾因此产生.例如,一个题名变化可以且仅可发生在一个内容表达,或可以且仅可发生在一个载体表现.虽然可以通过使用统一题名人工解决,即把题名变化强加在从来没出现过的内容表达和载体表现上,但更圆满的解决方案可能是放弃作品的基于题名的定义.然而,这个解决方案要面对的是过去四十多年创建的包含数以百万计书目记录的数据库,库中内含连续性资源和专著,及整个ISSN系统[4].显然这个方案是不现实的.

(4)FRBR与ISSN分配标准之间的矛盾.如果ISSN是载体表现层级的标识,那么基于FRBR的编目规则规定,与当前的ISSN分配政策不匹配时,就要创建新的记录.ISSN分配原则是:一种不同载体的连续性资源只能分配一个ISSN.在FRBR中,一种情况是,对于相同的内容表达/作品,当连续性资源的字体、字体大小、页面布局等的显示特征发生变化、连续性资源的载体发生变化、连续性资源的出版者或包装等产品标志发生变化时,就会产生新的载体表现.另一种情况是,对于两个不同的内容表达或两个不同的作品,一个新的作品或一个新的内容表达意味着一个新的载体表现.而且FRBR规定,当一部作品的修改涉及显著的自主知识产权或艺术创作时,一个作品区别于另一个作品.当任何形式上发生变化(如字体、数字、符号到口语词)、用于描述一个作品的知识产权公约或工具发生变化(如从一种语言转换成另一种语言)、或进行文本修订或修改、增加时,一个内容表达区别于另一个内容表达.然而,在ISSN的标准中,这些变化不代表题名的主要变化,不会分配一个新的ISSN.

(5)FRBR 模型中的关系与连续性资源记录的关系映射的困难.美国加利福尼亚州圣地亚哥国立大学图书馆书目和元数据服务协调员Jones认为,在大多数情况下,目前采用MARC21编码的连续性资源记录的关系不容易映射到FRBR模型中的关系和多个抽象层级.主要原因在于:相同的关系在MARC21 格式和FRBR 模型中不明确,而且不能专门被定义或编码;在一个给定的目录中,相关连续性资源不能从其所在的MARC21连续款目字段中推导出;FRBR内容表达和作品层级的关系通常在载体表现层级被记录在MARC21记录中.显然,如果在FRBR 模型中的关系放在MARC21 内描述,这将需要大量修改书目格式.如果作品和内容表达采用规范记录,这也将需要大量修改规范格式.这样的做法,只能重新评估现有的MARC21书目记录中潜在的庞大的关系数据,以此与FRBR模型相匹配[4].显然,这种假设实施起来困难重重.

3 FRBRoo 处理连续性资源的局限

FRBRoo 为连续性资源定义了一个特别的类F18(连续作品),它是F19(出版作品)的一个特定子类.F18的实例是计划产生一系列具有共同特征的内容表达和载体表现的作品[1].可见,定义F18 之前,这系列作品需要有共同特征的内容表达和载体表现.但是在现实情况中,由于连续性资源的连续性特征,出版往往难以长期保持这些共同特征.当前的内容表达和载体表现并不代表全部.显然FR?BRoo对连续性资源的处理只是停留在作品层面,而忽略了它们的内容表达和载体表现[5].

具体在FRBRoo 模型中,连续性资源的每期单册被视为一种完整的出版物来建模,它由一个F19(出版作品)的实例、一个F24(出版内容表达)的实例、一个F3(载体表现产品类型)的实例(网络电子出版物除外)和若干F5(单件)的实例组成[5].一种连续性资源被看成是一个纯粹的概念集合,它定义了连续作品的共同特征,从而能够区分某一期是否属于这系列连续作品.这样描述的连续性资源相当于呈现的信息即被发现在过去单册中,又希望存在于将来的单册.

综合来看,FRBRoo对连续性资源的建模只是一个粗略的模型,还没有深入到连续性资源每种特殊类型的所有细节,特别是对连续性资源间的关系揭示是不充分的.

4 PRESSoo 的先进性

4.1 PRESSoo对连续性资源的建模

ISBD将连续性资源定义为出版发行随时间推移而没有预先确定结果的资源.PRESSoo承认在连续作品停止出版之前,没有一个单一的内容表达或载体表现能够描述这样一系列完整的连续作品.要对连续性资源建模,只能对连续作品和它已出版卷期之间的关系进行建模.在一个给定的时间点(例如,数据描述制作中或更新的时间点),所有已出版的卷册的内容表达总和并不代表完整的连续作品,而是被看作是一个尚不存在虚拟的完整的内容表达“组件”.只要没有确定连续性资源停止出版,连续作品通过仍在进行的F30(出版事件)的实例正被部分实现.这种情况正如图1所示.虚线表示类和属性的“虚拟”实例化,这些类和属性预期将在未来占有一席之地,但不属于现在,因此从严格意义上来说不能进行建模[2].

4.2 PRESSoo建立的连续性资源的关系模型

PRESSoo最突出的贡献是对连续性资源的复杂出版周期进行了精细化的建模.这些模型专注于某种正在出版的连续性资源发生的各种事件变化[6].通过定义Z1(连续出版物转换)用于描述一种或多种连续性资源停止出版,而另一种或多种连续性资源开始出版,主要包括:继承(连续出版物经历主要题名变更),替代(一种新的连续出版物取代前期连续出版物),拆分(一种连续出版物转换成至少两种连续出版物),以及合并(至少两种连续出版物转换为一种).

另外,分自与吸收不被视为连续出版物转换,因为它们并未将一种连续出版物的消失与另一种连续出版物的出现相结合,而只涉及前者或后者,它们分别通过定义Z2(吸收)和Z3(分自)来描述.一种连续出版物与另一种连续出版物之间的临时性替代(预先存在或为临时替代的目的而创建),不被视为连续出版物转换,而只是暂时消失的连续出版物在出版过程的中断,这通过定义Z4(临时替代)来描述.这3个新定义的类都有一个共同的特征,即连续性资源间转变过程中有其它连续性资源的产生,而没有一种连续性资源停止出版.

举“继承”关系例子来看(如图2所示),左边的F18连续作品视为先前题名{实例1},右边的F18连续作品视为后续题名{实例2}.图2可描述为F18连续作品{实例1}-Y1i由……继承(继承)-Z1连续出版物转换-Y2开始继承-F18连续作品{实例2},快捷方式为:F18连续作品{实例1}-Y29演变成(连续)-F18连续作品{实例2}.

4.3 PRESSoo数据元素的记录

连续性资源带来一个特定建模问题,对它们的描述并不只反映现有作品的特性,同时,只要所描述的资源仍然正在出版,也反映此资源未来行为的预期特征.编目专著和连续性资源两者之间的主要区别为:当编目专著时,是在对过去作出判断;当编目连续性资源时,既对过去作出判断,也对未来进行假设.E29(设计或程序)是在CIDOC CRM(CIDOCConceptual Reference Model,国际文献工作委员会概念参考模型)模型中定义的类,目的是为了说明计划行为,无论是否在以前计划过,还是目前仍在计划中.当开发PRESSoo模型时,此类被证明非常有用,甚至是核心的.它被用来作为Z12(发行规则)的超类,Z12是由连续性资源的编辑出版单位建立的出版政策元素,包括:规律性、出版频率、序列模式(卷期号)、语种、尺寸、印刷字体和排版规则等.连续性资源的书目信息实际包含遵循连续性资源出版过程的Z12(发行规则)的各种连续实例.在一条书目记录中的大多数数据元素属于Z12(发行规则),而不是在FRBRoo中声明的F18(连续作品)[2].

具体在模型中,属于Z12(发行规则)的不同类型数据元素会记录在Z12不同的实例中,例如:某期刊每月出版一期28cm长的英文期刊.这种期刊有3个特征:月刊、28cm、英语.在PRESSoo中,它们分别通过Z12三个不同的实例记录:月刊记录期刊的出版频率,28cm记录尺寸,英语记录语种.这与FR?BRoo笼统地记录在E29(设计或程序)的一个实例中是不同的.当发行规则中仅有一项数据元素发生变化,FRBRoo的记录方式在更新数据时不得不重复未变化的数据,而在PRESSoo 中则不需要.显然,PRESSoo的记录方式更实用.

5 结语

PRESSoo是面向对象的概念模型,是以类为核心进行数据记录,它不但可以记录相关数据之间的关联性,而且可以记录相关数据(出版事件)的发展过程.PRESSoo 工作组在充分认识FRBR 和FR?BRoo对连续性资源描述的局限性的基础上,经过多次修订建立了PRESSoo模型.目前,ISSN国际中心已经应用PRESSoo 模型在ROAD(the Directory ofOpen Access Scholarly Resources,开放存取学术资源目录)的RDF/XML 文件系统.随着ISSN国际中心的应用成功和各个成员国的普及,PRESSoo将会得到广泛的使用.

先进性论文范文结:

适合先进性论文写作的大学硕士及相关本科毕业论文,相关先进性开题报告范文和学术职称论文参考文献下载。

相关先进性毕业论文范文