关于知识相关论文如何写 和基于共享的网络化知识组织方法类论文如何怎么撰写

关于免费知识论文范文在这里免费下载与阅读,为您的知识相关论文写作提供资料。

基于共享的网络化知识组织方法

[摘 要]当知识组织被理解为同行之间的交流过程,共享导向的设计策略更有意义.分析了时期数据集数据模型,讨论了基于知识共享面向服务的知识组织体系结构设计策略.

[关键词]网络知识组织系统面向共享的设计面向服务的体系结构

[分类号]G250.7

1 引言

有了网络知识组织系统,可通过网络访问信息的概念、术语和它们之间的关系.如果网络知识组织系统允许编程访问,工具制作、出版、策展或寻找资源可以利用它的概念和条款来改进描述和查询.通常设计网络知识组织系统用作网络服务.一种网络服务在远程服务器上运行,并通过运行用户计算机上的客户端软件请求作出响应.查看网络知识组织系统的网络服务趋势表明服务导向的设计策略占主导地位.根据这一策略设计的系统有面向服务的架构.

从技术角度来看,面向服务的架构是指将典型客户端-服务器构建风格的变量子集用于设计网络应用中.这些包括被远程调用的公开程序服务,通过标准查询语言的远程数据访问服务,以及通过HTTP控制的资源公开表示服务.然而,面向服务的体系结构不仅是一系列技术选择的最佳结果,而且是广泛设计策略的结果.理解为一种策略,服务定位是将业务外包的逻辑应用到软件设计中.通过包含面向服务的体系结构,网络知识组织系统架构师有意或无意地采用了将知识组织作为一个过程的观点,可以外包给专业供应商.

但是,外包的逻辑不适合一些知识组织的做法.当知识组织被理解为可以与其他的“核心”活动分离的时候,设计网络知识组织系统的面向服务的策略可能会是恰当的.但是当知识组织被理解为同行之间交流的过程,共享的策略是比较适合的.作为实施面向共享的网络知识组织系统设计策略的一个例子,描述时期数据集中时期地名的设计,分析了时期数据集模型,使用JaScript对象符号链接的数据表示方法,以及时期数据集的变化管理.可得出的结论是通过解释时期数据集如何共享架构,有益于数据管理员和学者身体力行,这一切都是为他们设计的.

2 网络知识组织系统

知识组织系统是一种工具,可以通知用户在某些领域感兴趣的概念,与概念相关的不同名称或术语,以及概念之间的关系[1].例如字典、地名索引、分类法和主题.网络知识组织系统是一个可通过网络访问的知识组织系统,便于描述、发现或其他网络资源的检索[2].网络知识组织系统这一术语源于1997年以来的一系列研讨会,专注于开发用于网络知识组织系统的功能和数据模型.在网络知识组织系统的标签与其他类似目标的研究计划重叠下开展工作,如国际标准化组织的主题地图标准和通过更广泛的努力来创建语义网.其基本思想可以追溯到整合知识结构的超媒体系统的前期工作.在此,笔者使用网络知识组织系统术语,是想尽最大努力来说明通过网络访问信息的概念、术语和它们之间的关系.

在过去的二十年中,研究者和实践者已经解决了构建网络知识组织系统的许多问题.因此,网络知识组织系统已经从理论走向实践.联机计算机图书馆中心的图书馆联合体向其会员提供网络访问的词汇,来描述图书资料的形式和内容;盖蒂研究所提供网络访问的词汇,来描述艺术和建筑作品.地理名称等网络志已经成为关键的基础设施,可用于地名与地理坐标之间的转换.这些系统的成功部署,反映出大量的数据建模工作、语义、代表性和标准,其中大部分是记录在网络知识组织系统中的文献.然而,对构建应用的语用学关注相对较少,这依赖于网络知识组织系统的数据.为什么呢?原因之一是一系列关于网络知识组织系统如何被整合到软件系统的假设.这些假设很早就开始了,并继续管理今天的网络知识组织系统的设计.

在网络知识组织系统中的S提出了关于网络知识组织系统集成到软件系统的假设.知识组织体系中的S代表体系或结构.系统和结构名称是密切相关的概念:系统是各部分构成一个复杂的整体,而这些部分的排列和关系构成了系统的结构.知识组织是一个系统,因为它包含一致的和连贯的方式连接在一起的部分(概念和条款),形成一个复杂的整体.各部分的系统排列可定义为一种特定的结构.因此,知识组织系统中的S代表结构.网络化知识组织系统的文献介绍了S的第三种意义:服务.服务不在概念上涉及到系统或结构.条款服务的引进,从而反映了有关知识系统及其结构应如何在网络上为其他应用程序可用的假设.

自20世纪90年代末以来,研究人员一直致力于在网络上提供编程访问知识组织系统的方法研究.其目的是想通过人类用户的HTML界面区分系统图可以使用的知识组织系统和允许知识组织系统的编程使用的网络服务[3].可以看到,网络知识组织系统概念化的网络服务早期就有.在1998年举行的第二届网络知识组织系统研讨会上,勾勒出了“ 在网络上使用知识组织系统过程的功能模型”.这个模型的目的是:实现知识组织系统内容的显示或互动,同时实现“网络上用户计算机(客户端)的软件和管理参考工具与知识组织系统计算机上的软件之间的相互作用”.然而,在会议中指出,“这并不总是很容易在功能是否是正确的用户界面或客户端-服务器交互之间划一界线”.尽管有这个困难,勾勒出来的客户端-服务器模型,将主宰网络知识组织系统设计,以及使研究人员和信息技术设计师接受面向服务架构的信条.

3 面向服务的体系结构

两个技术报告似乎介绍了面向服务的体系结构这一条款[4].在这些报道中面向服务的体系结构的特点是主要作为数据处理逻辑从数据源的分离[5].事实上,这是一个用于网络知识组织系统的面向服务的体系结构的承诺,并提出[3]:“通过使用适当的网络服务,接口组件从数据源清晰分离”.但像这么多的信息技术条款,面向服务的体系结构有很大的解释灵活性,定义的突变和增殖的时间.在其最弱的意义上,面向服务的体系结构是用来描述任何模块化的软件系统,其组件在网络上能进行通信.另一方面,一个强大的面向服务的体系结构的定义,可能会进一步说明运用组件作为服务意味着什么.例如,服务可定义为“具有指定结果的可重复业务活动的逻辑表示”[6].

大多数系统被称为面向服务的架构的例子,衍生出客户端-服务器建筑的风格.客户端-服务器建筑风格把软件组件分为发送请求的客户端和响应请求的服务器[7].这个分法建立一个部门间的层次结构,其中单一的服务器通常会响应来自多个客户的请求.客户端和服务器可以分布在多个层面实现成分间的“松耦合”,提高其可重用性和可扩展性.面向服务的架构被广泛用来命名这种分层的客户端-服务器的建筑风格.但面向服务的架构还可以通过客户端和服务器通信来暗示具体机制.早期的面向服务的体系结构的实现倾向于使用远程过程调用机制.这些连接机制依赖于一个高层次的和特定于域的协议,该协议确定可以调用的程序,以及所采取的参数和他们返回的数据.例如,审查的词库服务协议[3]确定具体的程序来查询诸如更广泛和更窄(条款)的词库结构.

近年来,面向服务的体系结构与表述性状态转移更加紧密.远程过程调用式系统已经失去了人们的青睐,因为软件架构师已经意识到将网络理解为表述性状态转移风格中的一个系统设计的好处.表述性状态转移是客户端-服务器风格的派生.远程过程调用协议识别程序,表述性状态转移风格的系统识别资源,其在一些领域是利益主体的抽象概念.该系统提供了一个通用和统一的接口,通过陈述来互交和操纵资源.表示是文档,该文档对资源当前或预期状态进行编码信息.在网络上“具有表述性状态转移的”网络知识组织系统是:①用URI识别条款和概念;②使用标准化的文档结构表述条款和概念的状态;③通过标准的HTTP方法可以访问和操纵条款和概念.

面向服务的体系结构模式也包括连接数据服务.像一个表述性状态转移方式的网络架构体系,关联数据服务使用URI标识实体,使用标准的文件结构来表示这些实体的状态.但许多链接的数据部署走在HTTP统一接口之前,支持远程数据访问风格[8].远程数据访问方式的系统定义了一个标准的查询语言,管理客户端-服务器通信的语义.而不是多个接入点确定为可调用的程序(如远程程序调用的方式),或多个接入点确定为资源(如表述性状态转移的方式),有一个单一的接入点,提交查询.一个远程数据访问方式的网络知识组织系统的例子是词汇,其提供了一个SPARQL端点查询词汇描述盖蒂研究所维护的艺术建筑.SPARQL端点是远程数据访问方式的典型:客户问题的SPARQL查询到远程服务器,处理查询过滤、变换,或构造一个数据集返回到客户端.

4 面向服务的设计策略

如果远程程序调用方式、表述性状态转移方式和远程数据访问式架构都可以被称为面向服务的架构,这个条款真正的意思是什么?对面向服务的体系结构的最好理解是其不仅可作为一个特定的软件架构,而且可作为一个面向服务的设计策略的结果.面向服务的设计策略包括:①一套关于软件系统的理想特性的一系列想法;②一种软件系统应该如何发挥它们功能的思考方式.面向服务的架构有满意的性质-互用性、集成、可靠性、安全性、可量测性、可扩展性和可管理性[9],可反映“企业”软件文化的优越性,该文化主要负责宣传面向服务的架构.但软件系统应该如何发挥它们的功能的思考方式也反映了一般的企业实践,特别是外包的实践.外包涉及识别功能或过程,可以由一个专门的供应商进行.如果提供者对许多不同的客户进行这些过程,它可以实现规模经济,超越任何一个客户可以获得的东西.此外,如果所提供的功能的定义可以充分标准化,那么他们的规定可以商品化:客户可以很容易地在供应商之间切换,寻最低的成本而获得最高的服务水平.其次,服务为导向的设计策略,是将外包逻辑应用于软件:通过专业化和规范化,获得更高的效率和成本效益.

对学术和科学计算采用服务导向的传道者明确采用外包的逻辑:“在原则上,功能和资源这两个潜在能力可以被交给专业供应商.如果这样的专家可以为许多社区提供资源或操作所需的功能,那么在原则上规模经济可以再次实现.而科学家们可以专注于他们擅长什么,即提供内容和推进科学”[10].正是这种逻辑,而不是特定的技术,即网络化的知识组织系统的建筑师采用的包含面向服务的体系结构.“供应商可能会在门户网站上提供知识组织系统服务,而数字图书馆可能会提供各种馆藏进行搜索,可选择词汇搜索工具,或如果有标准协议,可允许用户来选择”[3].这是在过去的二十年中,引导网络知识组织系统发展的基本思想:知识组织是一种服务,可以由专业供应商提供,效率和规模经济可以通过集中知识组织的规定来实现,而知识组织可以通过标准化的协议、表述或查询语言来商品化.因此,尽管在具体实施方式(远程程序调用、表述性状态转移或远程数据访问)的细节上的差异,用于组织知识组织系统的用户和供应商之间的相互作用的服务导向策略仍然稳定.

设计网络知识组织系统旨在围绕一个概念和条款系统建立共识,以提高效率为目标,那么服务导向的策略是有意义的.例如,购买和销售的大型企业,可以规范买卖产品类别的定义和名称.在这种情况下,将标准分类的规定和维护作为一个业务流程是明智的想法,可以外包给专业供应商.专业供应商由企业提供费用支持,希望参与标准化过程,可以利用规模经济的优点经营共享的分类,这样比企业单独做要更便宜些.企业可以专注于提供商业价值和利润,而不是分类管理.

5 面向共享的设计策略与体系结构

但是并不是所有的知识组织系统都是为了规范概念和术语.一些知识组织系统可能意在绘制不同概念和条款的景观,而不是提供规范的名称和定义.在第6个部分,描述了一个这样的知识组织系统,它记录了由考古学家和其他学者撰写的历史时期的定义.这些学者的定义反映了他们的个人解释;他们不一定要建立共识.因此,外包的逻辑不适用,这些学者不应该“交出”他们定义的管理,他们自己是管理的最好的专家.他们通过定义所表达的判断是属于自己的,而不能被外部的“服务提供者”所虚构.然而,这些学者有兴趣传播定义变化的信息,他们不断更新其他人使用的定义.他们需要的是网络化的知识组织系统,促进概念和条款的传播,而不承担这种传播需要与外部服务供应商进入一个正在进行的外包关系.另一种设计策略是必要的,即共享的设计策略.

面向共享的设计策略与面向服务的策略在目标方面没有显著的差异:互用性、集成、可靠性、安全性、可量测性、可延展性和可管理性仍然是可取的.重大转变是在思考如何达到这些目标的方式.用于学术网络知识组织系统的面向共享的设计策略,不试图孤立条款和概念的管理作为一项专门的活动,而是使它与更广泛的学术关系过程紧密相连.不仅使单一的“服务供应商”为许多客户工作,而且使同行之间通信手段简单化,这样才能实现可量测性.标准化“单一真理的来源”的共识是明确不能作为目标,在现实中喜欢用更好的工具来管理不同的观点.同样,一些效率是为了更大的灵活性和自治性.

面向共享的设计策略并不一定会决定一个特定的网络知识组织系统的体系结构.但已被证明是与共享为导向的策略兼容的架构是分布式版本控制系统.分布式版本控制使人们能够在一个纯粹对等的方式中合作,分布式通过补丁交换:描述局部数据变化的文档.通过补丁分享的分布式协作已经证明在软件开发商中是相当成功的,最近以免费的分布式版本控制系统Git[11]和商业仓库托管服务GitHub的形式出现.以分布式版本控制为模型,导致用于网络化知识组织系统的面向共享的架构按照以下工作流程:

a.获得一份知识组织系统序列化的标准格式,或者从零开始创作出版一种新的知识组织系统.

b.与知识组织系统合作,在需要时进行修改以适应某个目标.

c.当一个人想要改变或更新一个人的知识组织系统:①获得该人的知识组织系统的副本.②产生一个补丁来描述自己的知识组织系统和该人的知识组织系统之间的差异.③向那人发送该补丁,以及他愿意加的任何解释或论证.那人可以选择申请或拒绝该补丁.如果他们接受,在应用接受的补丁前,可能会有冲突需要加以解决.

请注意,这个工作流程没有要求知识组织系统的规范或权威版本的概念.然而,能够参考知识组织系统的规范版本往往是有用的,最好办法是随着时间的推移,做一些数据质量的担保.

6 时期数据集的共享架构

时期数据集的设计反映了多年的经验,在网络上使用和发布数据.首先,重要的是不引入不必要的外部依赖关系.使用别人的数据总是会引入数据提供者的依赖关系.但是,如果某人有一份本地副本的数据,他依赖于供应商仅仅为了初始数据集和定期更新,而不是对数据的每一个查询.使用数据变得更像使用软件库,而不是一个实时的服务关系.如果数据提供者放弃他们的数据管理,用户仍然希望数据正常运行.因此,除非数据集是如此之大和复杂,需要特殊的资源,如用于处理查询的服务器集群,优先下载本地数据的副本,而不是通过网络服务访问.第二,难以承诺可靠维护,即使是一个简单长期的信息服务.安全补丁必须保持更新.错误必须是固定的.域名和SSL证书必须更新.如果信息服务是计算密集型的,诸如SPARQL端点的远程数据访问方式的服务就是这样,必须仔细地管理资源.要消耗太多内存或处理器的查询必须被阻止.这些都是保持信息服务的技术挑战.更可怕的是组织的挑战:谁有SSH 访问服务器?谁负责制定有关访问和版本控制的决策?试图设计时期数据集减少维持时期数据集的承诺降至最低.时期数据集的使用和浏览、可视化与编辑时期数据集的工具不需要任何时期数据集服务器来运行.

时期数据集体系结构是激进的回应[12],确定为部署信息服务的“根本性挑战”:“确定粒度的重用的经济层面:服务应是如何细或粗”.如果词库服务有访问协议的细粒度,例如,一个指定的程序来获得关于个人概念和术语的数据,使用它将非常慢,大部分接口需要多次呼叫而收集所需的数据来生成浏览界面[3].同义词的服务提供了粗粒度的“复合”程序,允许使用单个请求获得必要的数据.

最有可能响应查询过的数据集是整个数据集本身.在2004年,预期客户端缓存本地查询的整个知识组织系统的本地副本可能是不现实的.现在在浏览器存储中可能存储记录的成千上万的数据,使用JaScript可快速查询它们.如通用百科知识图谱等项目利用这个事实来提高数据的可用性:“三片段模式”界面采用时期数据集类似的方法,推动从服务器到客户端的查询过程[13].

避免采用面向服务的体系结构,时期数据集的设计也避免了面向服务设计过程的一些陷阱.在面向服务的设计过程中,分析了企业的做法,试图找出常见的重复活动.这些活动在逻辑上可以表示为服务,被支持的做法可以重新定义为那些服务的组成.目标是抽象的表示经常重复的活动,使他们可以外包,并提供最终商品化的规定.但在人文科学领域,学术实践抵制这种抽象和脱离语境的情况.问题并不是学者们无法分析他们自己的行为,而是这些实践并不是很容易脱离个体研究者的语境和他们的研究领域.举例来说,注记是一种在广泛的学术实践中观察到的活动,但是注记在其他学术活动中的关系也因学者不同而不同.注记是一个重复的活动,但它没有指定的结果,这是不容易抽象描述的.

而不是试图抽象描述学术活动,为了强加劳动分工,时期数据集重点是表述学术主张.表述主张有其自身的挑战,但他们是熟悉的,因为这正是知识组织系统的设计者一直关注和要实现的目标.例如,地名是学术关于地方断言的精选集.学者关于地名条目中需要什么样的信息比他们可以清楚地表达可能的方式可以更容易达成共识,他们可能将地名索引合并进他们的学术实践.时期数据集架构的设计便于公开文件和学术主张的对等共享.它是一个面向共享的架构,参与者通过使用共享的数据格式交换断言的陈述来合作.时期数据集设计故意阻碍时期数据集项目和它的用户之间的持续服务关系的建立.时期数据集项目不是承诺为业务提供商,而只是另一个同伴,其主张可以被共享.以事实区别于其他同行,它致力于打造一个值得信赖的管理过程,而并没有限制其他同行进行类似的承诺.

7 结论

当知识组织涉及同行之间的断言交流,共享为导向的架构比面向服务有更多的意义.学术交流涉及各种形式的知识组织.知识组织的某些形式涉及劳动分工,如图书学者与图书馆员的分工.但当学者们分享不太正式出版的产品,如数据集、软件,或工作说明,就没有明确的分工.这些学术类产品是学者们之间对等交流的载体.他们所采用的概念和术语的差异不可能被标准化,因为这些非常不同,这种形式的学术交流往往濒于险境.学者需要更好的方式来交换他们发展的不同概念和他们采用不同的术语方面的信息.像时期数据集的面向共享的网络知识组织系统可以帮助提供服务.

时期数据集提供制作、组织和共享期概念的学术断言方面的工具.如果这些工具被广泛采用,学术产品将开始使用时期数据集标识符查阅这些断言.一旦开始从自然环境下的学术产出收获时期数据集标识符,时期数据集发展的新阶段将有可能到来.加上历史时期名称的时期地名记录定义,可以建立一个学术工作的期集中指数.时期地名允许学者指出具体的时间定义,时间集中指数会指向相反的方向:从特定的时间名称定义到使用这些定义的特定的资源.如果足够大数量的资源引用时期数据集定义,甚至有可能培养统统计分类者,建议适当时期名称注释未标记的资源,或消除链接到时期数据集定义的文本中的时期名字.但是,首先必须使数据管理者和学者方便和有吸引力地采用时期数据集.可以预见,时期数据集的共享架构将在促进这一进程中发挥着重要的作用.

知识论文范文结:

关于知识方面的论文题目、论文提纲、知识论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

1、关于知识产权的论文

2、知识窗投稿

3、知识经济杂志社

4、知识窗杂志

5、电脑知识和技术杂志

6、电脑知识和技术期刊