数字图书馆方面有关本科论文怎么写 跟基于用户画像的数字图书馆智慧阅读推荐系统有关毕业论文题目范文

本论文是一篇免费优秀的关于数字图书馆论文范文资料,可用于相关论文写作参考。

基于用户画像的数字图书馆智慧阅读推荐系统

赵 岩

(陆军军医大学图书馆,重庆 400038)

[摘 要]大数据时代用户需求日益多元化、 个性化, 数字图书馆引入用户画像建立智慧阅读推荐系统, 能够全面把握用户动态需求, 形成精准、 智慧的资源推荐服务模式.介绍了用户画像的特征与应用优势, 分析了大数据环境下数字图书馆用户画像的方法, 在构建基于用户画像的智慧阅读推荐系统基础上, 研究了基于用户画像的智慧阅读资源推荐流程.

[关键词]用户画像 数字图书馆 智慧阅读 资源推荐

[分类号]G250.76

大数据时代, 用户对知识的需求日益精细化和多元化, 传统的信息资源组织与服务方式, 已经无法满足社会需求, 也促使图书馆尽快实现转型升级.在开放的信息环境下, 广大用户不仅是信息资源的使用者, 也是生产者、 传播者和分享者.越来越多用户转向使用各类搜索引擎, 信息获取渠道更为多样, 在一定程度上影响到图书馆文献中心的地位.随着数据挖掘等技术的广泛应用, 用户信息数据与行为轨迹更加容易获取, 很多图书馆逐步开始重视对用户大数据的收集与分析, 掌握用户利用新型工具的情况, 跟踪了解用户需求变化, 深入分析影响用户需求的因素.尤其是数字图书馆在面向用户推送阅读资源过程中, 通过建立用户画像的方式, 描述和预测用户对不同资源的兴趣偏好, 可以为他们提供精准化的资源推送, 进而满足用户的个性化需求.作为将抽象的用户信息描述为具象的客观实体的方法, 用户画像被广泛应用于市场营销、 私人、 竞争情报分析等领域 [1] .笔者将用户画像引入数字图书馆, 掌握用户对阅读资源的需求偏好, 建立智慧阅读推荐系统, 以实现更为智慧化的阅读推荐服务.

1 用户画像概述

1.1 用户画像的概念

用户画像是由Alan Cooper最早提出的概念, 是借助调研问卷、 数据采集等方式获得用户特征信息, 并描述用户属性差异的目标模型.用户画像也称作人物角色, 可以看做用户所有活动的具象化表现特征.它是基于大量真实的数据, 在分析基础上具象化获得虚拟用户, 迅速掌握用户的基本信息、态度偏好和行为习惯.用户画像属于大数据时代的新兴概念, 与数据挖掘、 大数据分析等技术密切相关, 通过建立用户描述性标签, 对用户的基本信息进行分析, 以获得高度提炼的特征标识.用户画像与用户行为特点、 属性等联系密切, 可以让服务人员抛开个人喜好, 将关注点放在用户行为与动机上.

1.2 用户画像的特征

用户画像分为静态、 动态两类, 其中静态画像依据用户的基本信息, 由静态显示画像技术获取,建立后无法修改.动态画像需要动态采集用户信息, 利用贝叶斯函数、 神经网络等技术, 建立用户偏好的动态模型 [2] .一个良好的用户画像, 需要满足客观性、 共情性、 特殊性与目标性的要求.具体而言, 客观性即要求用户信息真实、 客观, 能够反映具体的人物.共情性即能够深入用户的世界, 观察、分析用户行为数据, 从内部体认其生活方式和目标方向.目标性即要求用户特征描述与研究目标一致.特殊性即每一个被研究的对象, 都具有与众不同的属性特点.大数据环境下可以获取的用户数据维度增多, 获取信息更加便利, 这就可以从用户生活习性、 社交圈、 事件信息等维度, 建立一个360度的立体用户画像.

1.3 用户画像的应用优势

用户画像在多个领域均有应用, 最早应用于市场营销领域, 如借助用户画像技术, 分析手机游戏用户的统计学特征, 获得用户群体的特征模型.在计算机领域, 通过机器学习方式编写程序, 构建基于用户画像的智能推荐系统, 可以实现对用户的精准推送 [3] .在私人领域, 用户画像可以辅助了解不同类型用户的需求, 将个人偏好与服务结合起来, 进一步优化用户体验.在企业产品运营中, 可以利用用户画像迅速定位目标群体, 根据用户标签提供特定服务, 保障服务质量和市场效果.在图情领域, 用户画像的建立可以挖掘用户兴趣偏好, 预测不同群体对文献资源的需求, 提高图书馆服务的精确性.

2 大数据环境下数字图书馆用户画像的构建方法

数字图书馆绘制用户画像是转变服务视角, 从用户角度进行战略规划, 以全方位用户数据采集、挖掘与分析, 改变单纯依靠经验或历史数据支持决策的新模式, 以保障图书馆资源、 服务环境与用户需求匹配.

2.1 精准识别目标群体

数字图书馆可以借助微信、 微博、 邮箱等第三方社交工具, 对用户群体进行定位、 识别与分类.这些社交媒体工具属于网络环境下用户的特定标识, 涵盖大量与用户相关的信息.而数字图书馆登录系统的注册信息, 也是识别、 区分用户群体的良好方法 [4] .数字图书馆也需要采集用户不同情境下的动态行为数据, 从媒体、 场景、 路径等多个维度,识别用户在不同状态下的访问轨迹.尤其是在移动网络环境下, 场景入口与媒体工具增多, 用户动态数据采集也更为复杂, 这就需要做好用户动态信息跟踪, 采用不同的数据采集方法, 掌握不同群体用户的行为习惯, 为图书馆制定决策提供参考.

2.2 用户数据统计分析

对用户静态与动态数据进行统计分析, 是用户画像构建的第一步.数字图书馆一方面可以采集系统注册信息、 用户借阅记录等静态信息, 对这些进行统计分析, 并做好静态信息的初步判断与处理工作.另一方面, 数字图书馆需要采用网页抓取工具、 大数据技术等, 对用户动态数据进行采集分析 [5] .这些数据是用户在浏览网页过程中留下的 “痕迹” , 包括下载记录、 网页浏览频次、 订阅与收藏内容以及社交信息等, 借助数据挖掘等技术,统一抓取和处理动态信息, 能够更好地掌握用户特征, 并从中抽象出用户标签, 根据对这些标签的组合与处理, 为微观层面用户画像的绘制奠定基础.

2.3 用户画像构建

数字图书馆用户画像的构建, 需要将重点用户群体作为绘制对象, 在分类基础上抓住他们的主要特征属性, 而并非针对所有用户进行描述.在具体画像绘制阶段, 也并非描述用户的所有标签, 而是从真实数据中抽离出虚拟形象, 进而代表某一类群体.首先数字图书馆需要客观分析既有数据资源,从中发现与分析对象相关性强的信息, 如使用资源频率、 浏览记录等, 确定其模型因子, 提出相关度不高的信息.其次, 数字图书馆要将可量化信息变为定性信息, 并对用户行为进行识别分析, 在分析多个变量相关性基础上, 找到某一类用户的共同特征.此外, 从用户、 资源与服务3个维度进行计算,清晰勾勒用户轮廓, 全面掌握用户需求与图书馆服务的匹配关系.

3 基于用户画像的数字图书馆智慧阅读推荐系统构建

图书馆描绘用户画像的目的之一, 就是精准识别和区分用户群体, 并为他们推送智慧化阅读资源.数字图书馆可以用户需求为导向, 在用户画像描绘和深度分析基础上, 结合个性化推荐、 系统过滤、 可视化等技术, 打造一个智慧阅读推荐系统, 实现精准的阅读资源传递和个性化服务 (如图1所示) .

3.1 数据采集处理模块

数据采集模块的功能是从数字图书馆服务系统和多个网页中, 主动搜集抓取与用户相关的数据, 包括静态与动态数据两类, 然后将其纳入用户行为日志中, 为后续数据处理获得完整的数据集.数据分析模块对用户数据进行清洗、 规范与分析处理, 获得与用户行为相关的权重标签, 并在整合处理基础上传递至用户画像模块, 为绘制用户画像奠定基础 [6] .在用户行为分析过程中, 可以采用统一标记的方式, 按照标记规则为不同用户设置对应的静态标签.而动态标签的设置, 可以采用数据挖掘算法进行大规模数据分析, 通过聚类算法区分用户, 并通过数据抽取的方式获得对应的标签.

3.2 用户画像深度分析

数字图书馆建立用户画像后, 对画像进行全方位分析, 包括观点偏差、 兴趣、 习惯等, 能够全面准确地掌握用户需求, 为他们提供最新的阅读资源,提高图书馆知识传播效率.具体而言, 数字图书馆可以借助层次分析法, 构建用户画像层次结构模型, 在不同层次间设置判断矩阵, 并逐层进行计算与检验, 获得不同层次因素的对应权重.然后对比分析不同的权重因素, 以加权计算的方式得到合成权重, 可以掌握用户画像模型对于服务目标的影响, 检验用户画像的综合服务能力, 如用户浏览频率、 订阅内容、 咨询量等, 对用户画像的服务能力影响较大.数字图书馆可以选择权值较大的标签, 将其作为提供个性化服务的依据.

3.3 智慧推荐功能模块

数字图书馆本身拥有较多用户群体的真实数据, 可以综合利用这些数据资源, 将用户群体画像、观点分析、 实时推送等结合起来, 形成智慧推荐功能模块, 最终形成完善的智慧推荐系统.该模块充分利用大数据技术, 对多元异构数据进行整合分析, 结合群体与个体画像的差异, 准确分析不同用户的潜在需求, 为制定智慧的阅读资源推荐方案提供指导 [7] .由于用户数据类型和存储方式多样, 在采集分析完毕后, 可以通过个体建模获得用户画像, 并通过用户观点分析、 偏差纠正等方式, 挖掘用户数据中存在的价值.然后迅速汇集所有用户信息, 将有用内容标签化、 可视化, 为每个目标群体建立对应的档案, 展示每个用户的兴趣爱好和行为习惯, 保障阅读资源推荐更加精准、 高效、 智慧.

4 基于用户画像的数字图书馆智慧阅读资源推荐流程

基于用户画像的数字图书馆智慧阅读资源推荐, 就是借助智慧阅读推荐系统, 在采集用户数据基础上描述用户画像, 并依据用户画像分析潜在需求与偏好, 并通过资源筛选匹配的方式, 主动推送用户感兴趣的阅读资源, 基本服务流程如图2.

4.1 基于用户画像的需求分析

数字图书馆智慧阅读推荐系统, 是馆藏资源与用户之间的传输纽带, 可以依据用户画像深度分析, 全面掌握不同用户的需求, 并在信息检索与匹配基础上实现智慧推送.智慧推荐系统一方面可以将用户画像进行标签化处理, 分析用户对常用资源的利用行为, 计算不同用户之间的相似性, 合理区分目标用户群体, 然后通过用户标签描述形成多个推送主题, 提高个性化推送效率.另一方面, 数字图书馆需要提取馆藏资源特征, 在合理分类基础上建立特征资源模型, 形成不同主题的资源集, 为用户需求匹配提供便利.推送结果通过图书馆服务平台进行展示, 包括移动终端、 服务系统界面等,并做好用户画像修正工作, 及时根据最新数据分析结果调整推送内容, 保障服务系统的有效更新.

4.2 用户行为与兴趣模型

数字图书馆根据目标用户画像中的多元化标签, 可以建立用户行为与兴趣模型, 对不同的用户数据进行分类、 分析、 描述与展示, 计算单个用户与群体用户之间的相似度.然后利用聚类分析方法,从用户标签体系中归纳出多个层次与主题, 并从多个角度对用户兴趣、 行为特点进行描述.这样可以全方位展现单个用户的特点, 也可以从多个层面了解群体用户的兴趣偏好, 以细粒度与粗粒度表达相结合的方式, 提高用户需求匹配的精准度 [8] .由于用户行为是动态变化的, 要根据用户数据动态跟踪与迭代计算结果, 不断修正完善用户行为与兴趣模型.对群体用户而言, 需要根据用户聚类分析结果, 对不同用户间的行为、 观点等进行相似度分析,寻找相似度高的用户群体, 建立对应的用户群体行为与兴趣模型.

4.3 目标群体精准资源推荐

数字图书馆在建立单个用户与群体用户模型后, 就可以开展分类资源匹配工作.数字图书馆可以利用馆藏资源聚类分析技术, 形成不同主题的数据集, 然后依据用户画像中的标签体系, 计算馆藏资源与用户标签的匹配度, 将与用户偏好相似度高的资源, 映射至对应的资源主题中.若获得匹配度高的资源, 则通过智慧推荐系统反馈给用户, 若匹配失败则再次进行资源采集与匹配, 直到满足用户需求为止.群体用户与单个用户的资源处理匹配过程大致相同, 都需要借助语义分析、 聚类分析与个性化推荐等技术.与单个用户相比, 群体用户还需要总结清晰的群体观点, 根据共同的群体特点与动态需求, 做好对应资源的聚类推送工作.

5 结语

数字图书馆用户画像的应用, 可以对用户群体进行精准识别与分析, 将来自不同群体、 不同领域的观点进行综合分析, 结合用户的个性化喜好, 筛选最符合用户需求的阅读资源.而基于用户画像的智慧阅读推荐系统, 就是根据用户画像智能分析结果, 以定向精准地方式进行阅读资源推送, 激发用户阅读兴趣, 改善用户阅读体验, 这样不仅能够提高数字图书馆服务水平, 也可以让阅读推广工作朝着高质量方向发展.

数字图书馆论文范文结:

关于本文可作为相关专业数字图书馆论文写作研究的大学硕士与本科毕业论文数字图书馆论文开题报告范文和职称论文参考文献资料。

1、图书馆杂志

2、论文数字

3、数字通信杂志

4、数字媒体论文

5、图书馆建设杂志

6、参考文献后面的数字是什么意思