高校图书馆研究生毕业论文范文 跟国外高校图书馆科学数据的元数据服务*方面专升本论文范文

本论文为您写高校图书馆毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

国外高校图书馆科学数据的元数据服务*

黄 鑫 邓仲华

(1.武汉大学信息管理学院 湖北武汉 430072)

摘 要:文章使用文献调研法,介绍了元数据服务研究现状,总结了元数据在科学数据管理中的多方面应用.同时以部分欧美高校图书馆为例,从元数据的介绍服务、创建服务、咨询服务和培训服务四个角度探讨了国外高校图书馆科学数据的元数据服务内容.

关键字:科学数据;科学数据服务;元数据;元数据服务

中图分类号:G254.364 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017034

随着数据密集型科研范式的兴起,科学数据逐渐成为科研活动的中心,科学数据的采集、分析、存储、共享和可视化开始成为科研活动的主题,科研成果的发现对科学数据的分析和计算也越来越依赖.元数据作为用于描述科学数据的数据,在科学数据的组织、存储、监护、检索、引用、出版等环节中都起到了至关重要的作用.高质量的元数据服务对于推进科研活动进程、加速科研成果产出具有重要意义,然而现有的科研工作者并不擅长创建元数据[1],图书馆作为传统科研支持与服务机构,积极开展科学数据的元数据服务极具必要性,如何面向科研人员的数据管理需求来开展元数据服务,开展什么内容的元数据服务是高校图书馆所需要思考的问题.

1 高校图书馆科学数据的元数据服务研究现状

Tenopir[1]在针对科研工作者的一项问卷调查研究中发现:(1)59.8%的受访科研工作者对自己的科研数据描述情况非常满意或比较满意;(2)26%受访者对于自己所使用的元数据创建工具表示满意,32%的受访者则表示不满意;(3)在元数据标准方面,56%的受访者表示他们不了解什么是元数据标准,22%的受访者表示他们习惯于使用自己实验室的元数据标准,该调查说明科研工作者并不十分擅长元数据的创建工作.2012年,Tenopir[2]再次对美国和加拿大地区的351所大学图书馆科学数据服务情况进行问卷调查,发现有11.9%的受访图书馆已经提供科学数据的元数据创建和转换服务,3.7%、10.1%和8.3%的受访图书馆计划在未来一年内、两年内和两年后提供元数据的创建和转换服务,66.1%的图书馆暂时没有相关的计划,另外,研究型大学相比于本科学位授予大学和职业大学的图书馆更倾向于开通元数据创建服务;受到N更多资助的大学图书馆更倾向于开通元数据的创建服务;拥有多于5000名学生的学校相比于人数少于5000人的学校更倾向于开通元数据的创建服务.Si[3]在对USA News排位世界前100名大学图书馆科学数据服务的调查研究中发现,28.7%的高校图书馆已经开始提供科学数据的元数据相关服务,涉及元数据的介绍和创建等方面.康奈尔大学科学数据管理服务团队RDMSG调查了一些受到N资助的科研工作者[4],结果显示:(1)40%的受访科研工作者曾经为自己的科学数据创建元数据,26%的受访科研人员从不创建元数据,32%的受访者则表示不确定;(2)仅有10%的受访者习惯按照一定的标准来创建元数据,9%的受访者从未按照标准来创建元数据,61%的受访者则表示不确定;(3)一些受访者会评论,说“我不知道什么是元数据”,这说明图书馆开展元数据介绍服务具有必要性.黄如花[5]调查了美国部分高校图书馆科学数据的元数据实践情况,从科学数据管理周期的角度分析了图书馆在科学数据计划阶段的元数据标准和元素推荐服务、科学数据描述与组织阶段的元数据标准选择服务和科学数据存储阶段的数据文档命名与格式规范服务.由研究现状可发现,现有高校图书馆对科学数据的元数据服务主要集中于实地调查研究,调查重点是科研人员使用元数据的习惯和技能程度,而对高校科学数据的元数据服务的具体内容、服务原则、服务方式等缺乏细致的总结与归纳.

2 元数据在科学数据管理中的应用

2.1

科学数据管理计划中的元数据

自2011年开始,美国国家科学基金会N要求科研项目申请材料中必须包含科学数据管理计划DMP,而元数据方案是数据管理计划的核心组成部分之一,项目申请者必须提交元数据的内容、格式和标准[6].英国生物技术与生物科学理事会BBSRC同样要求基金申请者提交个人的科学数据共享计划,其中包括元数据的格式和标准,如数据的来源或操作过程,以防止数据被误用,误解或混淆[7].英国医学研究理事会MRC发布了数据管理计划的导航文件,要求基金申请者提交数据生成的方法、分析过程、来源、编码、变量等元数据内容[8].另外,受到耶鲁大学[9]、麻省理工大学[10]、明尼苏达大学[11]等高校推荐的数据管理计划制定工具DMPTools也可以帮助科研人员创建元数据.

2.2

科学数据存储中的元数据

在科研人员计划将科学数据存储至机构仓储中时,需要为科学数据创建元数据,以增加数据的组织效率和被发现几率,也可用于数据的迁移和转换,数据标题、关键词、创建者、数据类型、来源和出处等是常见的元数据项.如普渡大学PURR数据仓储有一套较为完善的元数据生成工作流[12],提交给PURR的每个数据集都会获得完整的元数据,一部分元数据由提交数据的科研人员来创建,另一部分则由系统根据数据集特征自动识别并插入.PURR融合了多个元数据标准,以便充分描述更多类型的数据集,都柏林核心被用于数据发现和引用,METS标准用来表示数据集文件的结构和层次,MODS标准被用于标注数据集的创建者和访问权限,PREMIS标准则用来记录每个数据集经历的保存事件和知识产权.

2.3

科学数据检索中的元数据

元数据是数据检索的核心,用户需要向搜索引擎或服务馆员提交数据主题、题名、创作者、关键词等项目来获取所需科学数据.现在,元数据还被用于科学数据与科研文献之间的关联,通过对科学数据和科学文献添加数字对象唯一标识符DOI,可以有效的实现数据与文献之间的关联,用户可以在阅读科学文献时查看相关科学数据,也可以检索引用相关科学数据的科学文献.

2.4

科学数据监护中的元数据

元数据是数据监护的支柱,没有元数据的数据资源将不能被恢复,不能被识别,也将变得不可用[13].DCC发布的数据监护生命周期模型在其内环中强调了元数据作为“描述信息(Description)”和“表示信息(Representation)”的重要作用[14],在该数据监护生命周期模型中,与元数据相关的活动包括:(1)为数据集分配管理性元数据、描述性元数据、技术性元数据、结构性元数据和保存元数据;(2)采用适当的元数据标准以确保数据被长期合理的描述与控制;(3)收集数据表示信息,以充分理解数字资料和相关元数据.

2.5

科学数据引用中的元数据

科学数据引用领域经常采用一些被广泛使用的元数据标准,元数据标准的实施可以有效减轻数据互操作过程中的冗余,增强数据采集、认证和质量控制过程的自动化,这对于数据发现、复用和增值具有重要意义.另外,元数据标准还可以从知识产权的角度界定科学数据的使用权限.大英图书馆、德国国家图书馆等20多个国家的数据中心、图书馆、政府和科研机构联合创立了DataCite科学数据引用组织[15],旨在推进数据引用规范化,通过完善的元数据体系来帮助用户查找想要的科学数据是其提供的重要服务,它所发布的 “DataCite Metadata Schema”系列文档为科研用户推荐了一些核心元数据元素和使用规则[16],如将数据标识符、创作者、标题、出版者、出版年份、资源类型作为必选元数据,数据主题、贡献者、日期、语言、相关标识符、大小、格式、版本号、权利、地理位置、描述和基金情况作为备选元数据.

3 高校图书馆科学数据的元数据服务内容

本文选取哈佛大学图书馆、麻省理工大学图书馆、康奈尔大学图书馆、伊利诺伊大学图书馆、北卡罗来纳大学图书馆、明尼苏达大学图书馆、爱丁堡大学图书馆和缅恩大学图书馆为调查对象,原因如下:(1)它们都是在科学数据管理与服务方面发展最快、建设程度最高并位于前列的欧美科研型大学,大多都属于美国USA News排名世界前100位的大学;(2)它们都属于英国数据监护中心(Digital Curation Center,DCC)所认证的拥有科学数据管理和监护相关培训能力的欧美高校与独立科研院所;(3)它们同样属于Tenopir[1]和Si[3]的调查对象.本文将从元数据介绍服务、元数据创建服务、元数据咨询服务和元数据培训服务四个方面来研究高校图书馆科学数据的元数据服务内容(见表1).

3.1

元数据介绍服务

大多数科研人员在进行科学数据的存储准备工作时,并不十分重视元数据的创建问题.在2012年的图书馆与信息资源会议CLIR上[17],一系列的调查研究发现:“元数据和数据描述文档只有能够帮助科研人员完成科研任务或产生学术论文时才会受到科研人员重视,在一个科研项目结束后,为数据集增添合适的元数据会耗费科研人员更多的时间与精力,他们更愿意把时间花在科研成果的出版上,而不是元数据的增添以及数据的长期存储与监护上”.针对这个问题,部分高校图书馆会在其主页上通过解答问题的方式向科研人员介绍元数据的重要性,也有一部分高校将元数据的介绍服务置于数据管理计划DMP的介绍文档之中.如华盛顿大学图书馆[18]在主页中列出了“什么是元数据?”“我们为什么要了解元数据?”“元数据的国际标准有哪些?”等介绍性问题并做出了详细的解答.明尼苏达大学图书馆[19]主页的“data documentation and metadata”导航中列出了“Who”、“What”、“When”、“Where”、“Why”五个基本元数据示例.普林斯顿大学[20]、波士顿大学[21]则同样在其图书馆主页介绍了元数据的概念、基础元数据项、国际通用元数据标准等问题.

3.2

科学数据的元数据创建服务

在将个人科学数据存储到图书馆机构知识库的过程中,科研人员需要元数据创建方面的帮助,而图书馆也已经比较擅长为科研人员提供元数据的创建服务.根据Markey[22]对美国各大机构知识库的调查中发现:“科研人员普遍没有能力制定高质量的元数据”,另外,有74.2%的受访者认为:在将个人科学数据迁移到机构知识库的过程中,机构知识库“提供更好的元数据创建服务”是一项非常重要的因素.图书馆提供科学数据的元数据创建服务主要有四种形式:

(1)发布指导性文档的服务形式.密歇根大学的政治与社会科学校际研究联盟ICPSR[23]在其社会科学数据存储导航文档中设置了一个标题为“best practice in creating metadata”的文档,其鼓励科研用户使用Data Documentation Intiative (DDI)元数据规范来创建元数据,并设置了首席研究员、标题、资金来源、数据生产者、项目描述、加权、数据源、变量等十多个元数据项目,旨在引导科研人员为自己的社会科学数据创建合适的元数据.麻省理工大学图书馆[24]在元数据指导文档中列举了科研人员在创建数据时需要执行的重要操作:①记录与项目相关的所有文件名和格式、数据组织方式、生成数据的硬件设备和软件工具,以及数据更改或处理的信息;②数据命名结构中使用的代码、缩写或变量的说明;③记录数据获取的位置,以使其更容易被检索.并在“Things to document your data”目录下推荐了数据标题、创作者、标识符、日期、主题、资助者、权利、语言、位置和方法等元数据元素.伊利诺伊大学图书馆[25]发布的“Illinois Data Bank Metadata Documentation”文档详细介绍了伊利诺伊大学图书馆数据仓储所使用的元数据条目,并针对仓储内的科学数据资源设计了一组专用属性,科研人员需按照已公布的元数据条目和属性来上传数据.另外,它还将数据仓储元数据和数据引用元数据之间形成映射,向科研人员提供科学数据的出版和引用服务.

(2)自我提交表格的服务形式.高校图书馆的科学数据存储服务经常由一个自我提交的表格开始,通过下拉菜单或软件工具来实现,这些自我提交的表格是根据科研用户的需求,围绕着元数据标准体系设计的.哈佛大学的数量科学研究所IQSS所开发的Daterse项目[26]是一个集数据共享、出版和检索功能于一身的开源应用,科研用户可以创建自己的独立数据空间并上传数据,Daterse可使上传的数据更容易被其他科研人员或科研机构发现,从而扩大用户的学术影响力,其同样为科研用户提交科学数据时提供元数据创建服务.科研用户需要从一个自我提交的表格开始,录入数据标题、作者姓名、单位、数据描述、主题分类、关键词、上传者等默认元数据项目,也可以在数据集提交成功之后再次添加更详细的元数据项目,包括数据引用格式、期刊来源、数据创作时间、创作地点、软件工具、相关数据集等.北卡罗来纳大学的生命科学数据仓储Dryad[27]在科研用户提交科学数据时为其提供元数据创建服务,其中包括元数据录入环节,数据标题、作者、期刊名称、DOI、出版时间、期刊所在地理位置、主题分类等元素,另外,Dryad还允许科研人员录制并提交一个简短的YouTube视频来描述数据的上传过程.

(3)嵌入至科研过程中的服务形式.图书馆也会通过嵌入到科研过程之中的方式来帮助科研人员创建元数据,这种方式的优势在于:服务馆员、学科专家和科研人员针对特定项目问题进行密切交流,可以进一步加深服务馆员和学科专家对科研人员元数据需求的了解,从而提高元数据服务质量,而且,科研人员的统计行为,包括下载、共享、评论、链接等用户信息行为可以被用来提取元数据.康奈尔大学的Albert R. Mann图书馆建立了康奈尔大学地理信息仓储库CUGIR[28],为纽约州提供地理空间数据和相关元数据,特别强调与农业、生态、自然资源和人与环境相互作用相关的自然特征.由联邦地理数据委员会FGDC颁布的地理空间元数据内容标准CSDGM是目前使用最广泛的标准,由于CUGIR参与了很多地理空间数据交换所计划,所以CUGIR中提供的所有数据必须使用FGDC的CSDGM元数据标准.在很多案例中,康奈尔大学图书馆的馆员必须嵌入到科研项目过程中,通过与科研人员的紧密合作来帮助创建和改进元数据,以确保CSDGM元数据标准从项目开始就被科研人员所了解和使用.

(4)提供软件工具的服务形式.软件工具不仅被用于科学数据的元数据创建,还被用于将数据管理过程集成到科研工作流中,这对推动科学数据管理发展进程具有重要意义.康奈尔大学开发的VIVO工具[29],是一种基于语义技术的科研发现系统,接受国家卫生研究院NIH的资助,其允许研究者展示学术证书、学术关系、社交网络、科研出版物、经费、教学、服务等信息.VIVO中的信息不仅可以在普通浏览器网页中可读,也可以用于系统之间的交换.科研用户可以在VIVO中挖掘、聚合元数据,将新的元数据项目添加至个人科研出版物中,并与之前已经存在的元数据完全兼容.DMPTools[30]是用于创建数据管理计划的软件工具,向科研人员提供DMPTools是加利福尼亚大学、斯坦福大学、哈佛大学等高校图书馆的数据管理计划服务的一部分,科学数据的描述、元数据的创建是科学数据管理计划的重要组成部分,科研人员可以使用DMPTools为自己的科学数据创建元数据.

3.3

元数据咨询服务

科学数据的元数据咨询服务是指图书馆为科研人员提供元数据的开发、提取、复用、转换等元数据相关的咨询服务,属于图书馆科学数据咨询服务模式的一部分.当前,高校图书馆向学院机构、科研教师和学生开展科学数据的元数据咨询服务主要集中于科研型大学,根据Tenopir[2]在2012年的调查发现:只有17.9%的受访图书馆提供科学数据的元数据咨询服务,其大多是科研型大学,而普通高校和专职高校图书馆则并不倾向于提供此类服务,另外分别有7.8%、8.3%和7.8%的受访图书馆计划在未来一年内、两年内和两年之后将提供元数据咨询服务.伊利诺伊大学图书馆拥有独立的科学数据服务团队,也拥有独立的元数据服务团队,科研人员可以在其图书馆首页的“Research Data Service”导航中申请科学数据的元数据咨询服务,和大多高校图书馆不同的是,伊利诺伊大学的图书馆不仅提供邮件咨询与电话咨询,也提供服务馆员与科研人员面对面的咨询服务[31],其咨询内容包括:(1)提供各种类型的参考元数据;(2)讨论创建元数据的经验;(3)根据具体的科研项目提供元数据模板;(4)提供一个具体的项目元数据实例以供参考.康奈尔大学图书馆的技术服务中心设立了元数据服务部门,在元数据服务主管的指导下,元数据服务馆员的职能包括:(1)为图书馆机构知识库的科学数据集创建合适的元数据;(2)与其他图书馆员工合作,为元数据政策和程序的开发、实施和评估方面提供专业知识,同时监测元数据领域的外部发展,标准制定和不断变化的需求;(3)元数据维护,主要是在系统之间集成元数据并对资源间的关系进行扩展.康奈尔大学图书馆所提供的元数据咨询服务遵循以下原则[32]:(1)可持续性.不仅要满足用户现在的需求,也需要考虑用户未来的需求;(2)可扩展性.服务需要根据项目情况的变化而不断调整;(3)可访问性.扩展服务渠道以被尽可能多的人所了解;(4)可用性.服务易于被理解和使用;(5)成本规划.在追求高质量的产品和服务的同时承认预算限制;(6)明确责任.根据协议,合同或备忘录明确服务责任.其向科研人员提供的咨询服务内容包括:(1)审查科研项目元数据需求并提出参考建议;(2)分析现有元数据,在需要时设计并推荐转换策略;(3)使用最佳的项目元数据案例来教育和培训科研人员;(4)帮助科研用户确定项目元数据标准;(5)帮助创建数据模型,促进无缝访问,互操作性和重用;(6)帮助确定适合项目需求的访问类型和适当的存储库;(7)构建元数据工作流;(8)修改或重新格式化元数据以满足项目需求;(9)在整个项目生命周期中提供元数据质量控制.

3.4

元数据培训服务

科学数据的元数据培训服务是指图书馆为了科研人员能够更熟练地处理元数据相关的科研事务而开设的培训服务,包括研讨会、课程、学术交流会等形式,通过培训的科研人员将会获取科学数据管理能力认证,由于学科之间的元数据创建方式和标准差异很大,图书馆提供综合的关于元数据构建和管理的培训具有一定难度.科研数据管理课程MANTRA[33]由爱丁堡大学图书馆开发,被耶鲁大学图书馆、杜克大学图书馆等机构推荐,是一个免费开放的在线科学数据管理培训课程.该课程面向研究生、初级科研工作者和信息专业人士设计,可以帮助科研人员了解和学习如何管理日常科研活动中产生的数据.“学习数据描述方法,创建个人科学数据的元数据”是该课程九大教学单元之一,包含概念解释、步骤说明、示例教学、数据处理练习和视频剪辑浏览等项目,用户最多花一个小时即可学习完毕,该课程具有极高的易用性和可用性.北卡罗来纳大学教堂山分校为科研人员提供了一套数据监护能力认证课程[34],毕业生将成为能够对数据资源进行规划,管理和实施以确保数据长期完整性和可用性的专业人员,其科学数据管理能力将被图书馆、档案馆、博物馆,以及公司和政府机构所需求.“元数据架构和应用”是这套课程的一部分,具体内容有:(1)学习在数字环境中校验元数据;(2)学习在不同信息环境中开发和实现元数据模式;(3)学习创建机器可理解的元数据标准和技术应用.另外一门课程“数字资源的保存和访问”中也包括元数据的创建方法教学.缅恩大学图书馆同样在数据监护能力的培训中开通了元数据相关的课程[35]:(1)调查了用于描述和编码数据资源的元数据国际标准,以帮助科学数据的未来的发现和长期保存;(2)介绍了用于描述数字资源内容和上下文关系的元数据格式标准,并强调它们在图书馆、档案库和在线仓储中的应用;(3)总结了柏林核心和OAI等特定的元数据标准,以及它们在HTML、XML和RDF等标记语言中的表示方式.

4 结语

近年来,科学数据服务发展十分迅速,以哈佛大学、麻省理工大学、康奈尔大学为首的很多欧美高校纷纷以丰富的数据资源、强大硬件基础设施和软件工具、多功能应用平台为基础开展了科学数据的计算、咨询、出版和引用等服务,元数据是科学数据管理的基础,高校图书馆发展元数据的介绍服务、创建服务、咨询服务和培训服务符合科研活动需求,且极具必要性.本文以部分欧美高校图书馆作为调查对象,总结了图书馆科学数据的元数据服务内容,以期能促进我国图书馆科学数据服务的发展.

高校图书馆论文范文结:

大学硕士与本科高校图书馆毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写高校图书馆方面论文范文。

1、图书馆论文发表

2、中国高校科技期刊会

3、图书馆学刊

4、图书馆杂志

5、高校教师职业道德论文

6、图书馆建设杂志