关于数字图书馆相关论文范文文献 跟数字图书馆跨媒体语义检索模型方面论文范文数据库

该文是关于数字图书馆论文范文,为你的论文写作提供相关论文资料参考。

数字图书馆跨媒体语义检索模型

[摘 要]结合泛媒体时代信息资源的特点,分析了数字图书馆跨媒体语义检索的现实意义,介绍了图片、音频、视频等常见媒体资源的跨媒体语义检索技术,研究了数字图书馆跨媒体语义检索的基本流程,最后构建了数字图书馆跨媒体语义检索模型.

[关键词]泛媒体数字图书馆跨媒体语义检索

[分类号]G251.3

移动互联网技术的进步催生了各类新媒体工具,其以互联网和移动通讯为依托,具有极快的传播速度和即时社交等功能,很容易产生集聚效应.网络新媒体层出不穷,报刊、电视等传统媒体也依然具备优势,新旧媒体的交互与影响,形成了复杂的泛媒体环境,使得信息的形成传播机制更为复杂.在这样的环境下,数字图书馆的发展不再是拥有多样化媒体内容,而是将音频、视频等多种信息格式进行高效处理,并通过互联网传递给用户,满足他们随时随地获取信息的需求.面对泛媒体环境下海量的数字化信息,如何拓展用户信息资源获取渠道,提高信息检索效率,是数字图书馆需要考虑的问题.尤其是泛媒体信息异构分布,语义关系复杂多变,仅仅依靠传统的数据库和元数据检索方式,检索出来的跨媒体资源往往关联度差,很难满足用户的专业化需求.因此,要求数字图书馆建立适应泛媒体特点的语义检索模型,实现对跨媒体数据的采集与动态分析,从语义层面寻找不同模态信息的关联,为用户带来更为优质的检索体验.

1 数字图书馆跨媒体语义检索的现实意义

跨媒体语义检索是在多种媒体形态基础上,结合不同媒体的特点,从语义层面对相同或相关的信息进行处理,实现数字化资源的精准检索与高效存储.泛媒体环境下的跨媒体语义检索,属于符合知识认知的语义检索方法,对于数字图书馆的发展具有重要意义.

1.1 提升数字化资源采集力度

不同媒体形态数字化资源的异构与动态性,一直是困扰数字图书馆的难题[1].近年来基于内容的多媒体检索技术,虽然为数字图书馆跨媒体检索提供了便利,实现了不同模态资源的同步采集,但是在实际应用过程中,这种检索方法无法兼顾泛媒体信息的特征,无法揭示不同信息资源之间的关联,这就难以满足对数字化资源的深层次服务需求.跨媒体语义检索充分考虑多模态信息的语义关联,从知识认知的角度,分析不同类型资源的语义联系,让多种模态的信息资源能够被综合利用.它不仅突破了数字图书馆传统的数字化资源采集范围,提升了资源采集力度,也有助于构建更为系统的数字化资源体系[2].

1.2 推动数字化资源高效整合

目前国内很多图书馆依然以文本检索为主,即便建立了跨媒体检索系统,也仅仅是辅助检索工具,无法处理多样化的数据,无法满足泛媒体环境下用户对多模态信息资源的需求.而跨媒体语义检索的应用,依托先进的语义信息组织技术,挖掘不同模态信息存在的内在关联,促进语义信息高效组织,推动数字化资源整合,以统一的信息管理方式降低检索成本,提高了数字图书馆的服务效率.跨媒体语义检索将不同于媒体类型的数字化资源,如图像、文本、视频等,通过统一的资源整合服务平台,避免了根据不同媒体类型分别检索导致的资源浪费,也提升了数字图书馆的资源利用率.

1.3 为用户提供统一检索入口

数字图书馆跨媒体语义检索的应用,不仅解决了多模态信息资源的统一检索问题,也可以提供统一的信息检索入口,让用户依托移动智能设备,就可以随时随地检索海量信息,丰富了检索体验.基于跨媒体语义检索的一站式平台,避免了用户在检索不同类型数字化资源过程中,由于登陆不同的网站,采用不同的搜索引擎导致的时间浪费,节省了检索成本,提高了数字资源检索效率[3].同时基于语义的信息检索方式,能够实现对跨媒体资源的迅速采集与高效整合,从中发现不同资源的内在关联,并在对比分析基础上,反馈给用户所需的信息,强化用户对检索结果的认知.跨媒体语义检索也可以从用户感知角度,提供更多检索示例,方便其找到更多与需求相关的信息资源,从而获得更多的选择自由.

2 数字图书馆跨媒体语义检索的常见技术

跨媒体语义检索实现了对不同模态信息的特征识别、提取与融合,实现不同媒体的跨越式检索与信息归类,从语义层面消除用户理解上的障碍.根据信息的不同模态,以下主要介绍图片、音频、视频等常见的语义检索技术.

2.1 图片语义检索

数字图书馆对图片中语义信息的提取,是从先验知识的角度,将视觉特征映射至语义层面.检索系统可以借助机器学习的方式,生成与图片信息检索相关的语义规则,或者借助遗传算法、神经网络等人工智能方法,对图片中的语义信息进行提取处理,进而提升跨媒体图片信息检索的精准度.具体操作过程中,首先要从视觉层面提取图片的纹理、颜色、形态等特征,并从语义层面进行描述.其次,针对图片中包含的具体对象,分析不同对象之间的语义关系并进行描述.此外,根据语义描述结果分析检索对象的空间、场景关系,对于其中涉及的语义要素进行合并,根据对应的语义规则组合形成图片表达的意义.

2.2 音频语义检索

音频语义检索涉及对音频内容的分类,具体而言就是根据不同音频的声学特征,分析不同音频之间的语义关系,采用音频分类算法计算不同对象之间的语义距离,如利用决策树、神经网络等计算模型,进而提取其中的语义信息.一般可以从声学特征、物理特征、语义特征三个层面,对音频中蕴含的内容进行提取[4].其中物理特征包括编码方式、采样频率等原始数据,这是泛媒体信息的基本存在形式,在检索过程中可以直接浏览、调用,并轻松提取其中的物理数据.声学特征数据是从感官层面,表达用户对音频的感知情况,可以直接通过检索的方式识别不同音频的特征.而语义特征则是从语义层面,对音频内容、对象与关系进行描述和综合分析,进而获得其中蕴含的隐性知识.

2.3 视频语义检索

泛媒体时代视频内容日益丰富,对跨媒体视频资源进行语义检索,是通过符合人类思维的语义描述方式,对这些视频内容进行分析、过滤与检索,并将其中的语义信息以直观的方式展示给用户.一般而言,在语义检索过程中需要过滤视频中的常规特征,如形态、颜色、纹理等基本特征信息.然后从高层语义角度对其他信息进行处理,从而提高检索的精准性.用户可以肉眼的方式获取这些信息,因此并不需要二次处理[5].对于比较重要的特征信息,则将其转化至语义空间,通过语义规则推理、语义注释、统计学习等方法,提取视频资源中蕴含的多样化语义信息,并通过语义信息组织技术进行整合应用,为用户提供更有针对性的服务.

3 数字图书馆跨媒体语义检索的基本流程

泛媒体环境下数字图书馆本身拥有海量数字化资源,这些资源存在复杂的内在关联,有助于强化跨媒体检索的语义理解能力,提升跨媒体语义检索的精准化水平.总体来看,数字图书馆跨媒体语义检索的基本流程,涉及资源采集、特征提取、语义描述、本体构建等多个环节,如图1.

3.1 数字化资源采集维护

数字图书馆在跨媒体语义检索过程中,可以引入智能化代理技术,自动发现、捕获与采集不同网站中的数字化资源,或者自动对泛媒体资源进行识别与存储,提高数字化资源采集效率.同时依托图书馆资源分类标准,对这些采集获取的数字化资源进行整合处理,过滤不必要的内容,并存储于多媒体资源数据库中.泛媒体环境下数字化资源是动态变化的,用户对检索服务的需求也在发生变化[6].数字图书馆不仅需要做好数据采集工作,也需要根据用户需求变化,根据泛媒体资源的结构特征与变化趋势,及时做好馆藏数据库的更新维护工作.尤其是安排专业技术人员,对多媒体资源进行定期检查、更新,促进数据库结构优化.

3.2 特征提取和语义分析

数字图书馆在采集大量泛媒体信息资源后,需要借助语义分析技术,对这些信息资源进行统计,做好不同类型资源的语义分析、识别与注释工作,从中抽取有价值的概念,通过对比分析发现不同信息之间隐含的关系,将其揭示出来并纳入语义数据库中.在实施过程中,一方面需要参考本体库中的对应信息,建立泛媒体信息资源的语义关联树,依托机器学习或深度学习技术,采用逐层分析的方式,去挖掘信息资源之间的语义关联,获得更多有深度的内容;另一方面,要借助本体推理技术,促进底层特征向语义层面映射,通过特征提取消除语义鸿沟,保障语义检索的统一性和精准度.

3.3 本体构建与结果展示

数字图书馆跨媒体语义检索的核心阶段,就是构建跨媒体本体.这是因为泛媒体数据资源类型多样,结构多变,从中可以提取多种信息维度,不同信息之间复杂的联系,很容易导致语义的重复,增加语义检索的难度.这就需要通过本体构建的方式,根据语义特征提取与语义相关联的结果,消除数据表达中的维度重复问题,保障数据处理的标准统一[7].而本体库也是语义关联的重要参照,有助于底层特征向语义空间转化,进而优化语义数据库.在此基础上,数字图书馆可以利用深度学习技术,促进跨媒体信息资源整合和语义转化,通过可视化的方式形成全局视图,方便用户根据自身需求,自动登录检索页面获取所需的语义信息,并将最终结果以可视化的方式反馈至用户终端.

4 数字图书馆跨媒体语义检索模型的构建

数字图书馆跨媒体语义检索是泛媒体环境下的必然发展趋势,也是符合用户习惯的全新发展方向.为了减少跨媒体语义检索中的障碍,充分发挥其服务优势,数字图书馆可以构建融合语义信息组织、跨媒体检索、数据挖掘等技术,包含扩展查询、语义检索等功能模块的结构模型,保障图书馆检索系统的性能(如图2).

4.1 拓展查询模块

拓展查询模块的主要功能是根据用户提供的检索关键词,依托语义索引、语义推理和检索引擎,对用户所需资源进行拓展检索,形成相关度高的概念集合[8].然后对检索关键词进行概念拓展,扩大关键词的范围,以此作为新的查询条件,然后将其传递给语义检索模块.在拓展查询过程中,数字图书馆检索系统会依据参考本体库,调取其中的分类方法和叙词表,并将查询结果填充至领域本体库中.语义索引是根据语义索引存储表中的相关概念,迅速定位本体库中的具体概念,给出领域本体与语义之间的对应关系,可以帮助分析用户需求,为拓展查询提供依据.检索引擎则是将关键词传输至本体库中,将经过概念化的关键词,与本体库中的概念进行对比,以遍历的方式寻找其相关概念,以拓展的方式形成语义关系网,形成经过语义拓展的概念集.

4.2 语义检索模块

语义检索模块接收经过拓展查询的概念集合后,可以根据用户需求,开展泛媒体信息资源采集与处理工作,并从馆藏数据库中迅速调取相关信息,在数据资源归类基础上进行信息匹配,然后将检索结果反馈给用户.语义检索阶段需要做好多媒体资源的归类整理工作,无论是文本、图片还是视频资源,都可以通过建立多模态信息索引库的方式,在不同媒体之间搭建桥梁,以多模态信息交叉索引的方式,将多种形态特征的信息资源,转换至统一的语义空间,并对不同模态的资源进行语义描述,方便系统进行资源归并与深度挖掘.数字图书馆可以借助神经网络,获取检索对象的全局特征,通过语义映射实现对文本、音频等多媒体资源的关联检索,并采用语义相似度计算的方法,实现不同模态信息资源的语义匹配.

4.3 语义标注转换机制

数字图书馆跨媒体语义检索模型的构建,不仅需要做好拓展查询与语义检索,也需要建立语义标注转换机制.这是因为泛媒体信息资源规模大,在检索过程中的语义标注工作量大,可以通过建立统计模型的方式,设置对应的训练数据集,实现对多媒体信息资源的自动语义标注,提高检索系统运行效率.要想实现这一目标,需要数字图书馆引入大量训练数据集,根据泛媒体资源的语义分布情况,设置对应的统计决策模型,并做好对应模型的训练工作,提高语义标准的准确率.同时数字图书馆可以借鉴机器学习中的语义转换机制,采用对语义标注过程进行跟踪的方式,在语义标注后迅速实现信息传递,并将未经标注的信息传输至训练集中,结合先验方法减少语义标注模型的工作量,降低语义标注的复杂度.

5 结语

当前我国数字图书馆的建设如火如荼,其中信息检索系统的引入与应用是关键内容.泛媒体环境下跨媒体语义检索模型的构建,可以建立不同媒体之间的关联检索机制,从语义层面发现不同资源的内在联系,解决复杂维度数据的跨媒体检索问题,提升数字图书馆跨媒体检索效率.目前跨媒体语义检索的应用还处于初始阶段,部分技术与方法还不成熟,如何发挥其在数字图书馆中的作用还有待深入研究.

参考文献:

[1] 阳广元.基于本体的语义检索研究现状与热点分析[J].图书馆工作与研究,2017(10):24-30.

[2] 彭欣.基于深度学习的数字图书馆跨媒体语义检索方法研究[J].情报探索,2018(2):16-19.

[3] 崔婉秋,等.基于用户意图理解的社交网络跨媒体搜索与挖掘[J]. 智能系统学报,2017(6):761-769.

[4] 刘玉文,王凯,徐济成.一种医学本体多层概念语义关联度度量模型研究[J].九江学院学报:自然科学版,2017(2):66-73.

[5] 黄育,张鸿.基于潜语义主题加强的跨媒体检索算法[J].计算机应用,2017(4):1061-1064.

[6] 叶圣俊,孙济庆,李楠.基于词素的中文术语语义关联研究[J].图书馆杂志,2017(1):80-87.

[7] 张磊,赵耀,朱振峰.跨媒体语义共享子空间学习研究进展[J]. 计算机学报,2017(6):1394-1424.

[8] 蒋应锋,等.一种新的多尺度深度学习图像语义理解方法研究[J]. 光电子·激光,2016(2):224-230.

张伟民男,1968年生.硕士研究生,副研究馆员.研究方向:科学数据管理、信息管理.

(收稿日期:2018-05-06;责编:刘妍.)

数字图书馆论文范文结:

关于数字图书馆方面的的相关大学硕士和相关本科毕业论文以及相关数字图书馆论文开题报告范文和职称论文写作参考文献资料下载。

1、图书馆杂志

2、论文数字

3、数字通信杂志

4、数字媒体论文

5、图书馆建设杂志

6、参考文献后面的数字是什么意思