两种文献计量可视化工具之功能比较分析:以国外电子政务研究为例
作者:李燕波
来源:《新世纪图书馆》2014年第11
        论文对目前常用的两种文献计量可视化工具CiteSpaceHistCite的功能进行比较分析。通过设计八个文献计量学指标作为两种工具的实验分析指标,以SCI2003—2012年电子政务主题的1388篇研究性文献为实验文献样本,对这两种工具在事先设定好的八个文献计量学指标中的功能表现进行分析。最终从具体分析功能、图谱可读性和支持的数据格式三个角度对这两个工具的功能进行了对比。
        关键词 文献计量学 可视化分析 CiteSpace HistCite 电子政务
        分类号 G250.252
        Analysis of the Functions of the Two Bibliometrics Visualization Softwares based on the E-government Research
        Li Yanbo
        Abstract Under the purpose of the two bibliometric visualization tools CiteSpace and HistCite comparative analysis eight bibliometric indicators are designed as the comparative indicators for the functions and 1388 papers on e-government research are download from the Web of Science during 2003-2012 as the experimental literature sample. Based on these functions of these two tools are compared by this paper. It compares their functions from the analysis functions the knowledge mapping readability and the data format.
        Keywords Bibliometric. Visualization analysis. CiteSpace. HistCite. E-government.
        1 文献计量可视化工具研究现状
        1926年洛特卡定律的发现[1],到美国化学家格罗斯兄弟文献学史上的第一次引文分析研究[2],再到1934年布拉德福定律[3]1948年齐普夫定律[4],国外学者二十世纪二十年代到六十年代为文献的定量研究做出了重要贡献,但这些先驱者早期的定量研究均是分散、不系统的。直到1969年,英国情报学家阿伦·普里查德发表《文献统计学还是文献计量学?》一文[5],首次使用文献计量学这一术语,取代了文献统计学。这就将研究对象从
期刊扩展到所有的书刊文献,使有关文献的定量研究统一在文献计量学学科之下,至此文献计量学研究逐渐走向系统化、广泛化。为适应文献信息量的增加,计算机、数学等方法在文献计量学中的应用研究逐渐展开,由此便产生了文献计量可视化的研究。20世纪50年代开始,加尔菲德开发的科学引文索引开始大规模的商业性应用,为文献计量可视化的发展奠定了坚实的基础。大量的文献计量学研究转向基于引文分析的可视化研究中,这其中的先驱当属加尔菲德对DNA研究历史图的产生,是在1964年用手工绘制的[6]。从那以后,文献计量可视化研究逐渐成为计算机科学、图书情报学研究的热点。经过近70 年的发展,在引文分析理论、复杂网络与社会网络分析理论、信息可视化技术的推动下,信息可视化逐渐成为国内外文献计量学一个崭新的研究热点[7]。文献计量可视化工具是文献计量可视化研究的具体实现手段,总体来说,时下常用的文献计量可视化工具主要源于三大领域。一是计算机科学领域的数据、信息、知识与知识域可视化研究;二是图书情报领域的引文分析可视化、知识地图和知识网络等研究;三是复杂网络系统和社会网络分析的研究。目前三者的研究方向和内容正在走向融合。文献计量可视化工具可以分为两类:一类为各种文献数据库附带的文献计量工具,(如Web of Science、中文社会科学引文索引、中国知网等),但可视化功能较弱;另一类为提供文献计量功能的软件,如美籍华人陈超美开发的CiteSpace、加菲尔德开
发的HistCite、佩尔松开发的BibexcelVladimir Batage ljAndrej Mrvar开发的Pajek、印第安纳大学开发的Science of Science、荷兰莱顿大学开发的VOSViewer等,而这其中CiteSpaceHistCite由于其较强的可视化功能被国内外学者所广泛使用。
        2 CiteSpaceHistCite功能分析
        2.1 CiteSpace核心功能
        CiteSpace软件主要基于共引分析理论和寻径网络算法等,对特定领域文献(集合)进行计量,以探寻出学科领域演化的关键路径及其知识拐点(以关键论文为代表),并通过一系列可视化图谱的绘制来形成对学科演化潜在动力机制的分析和学科发展前沿的探测。其所应用的主要数据包括Web of Science论文、Derwent 专利、Scopus等外文数据库论文,近几年由于国内用户的广泛使用,该软件又通过增加数据格式转换模块而实现了中文CSSCICNKI数据库格式的计量分析。CiteSpace软件的核心功能是探测和分析学科研究前沿的历时性变化趋势以及研究前沿与其知识基础之间的关系,陈超美博士在软件中设计了四个核心分析指标以实现这一功能,见表1
        1 CiteSpace核心分析指标
        2.2 HistCite功能
        该软件系SCI的发明人加菲尔德开发,能够用图示的方式展示某一领域不同文献之间的关系。可以快速帮助我们绘制出一个领域的发展历史,定位出该领域的重要文献,以及最新的重要文献。HistCite目前用于分析的文献信息只能来源于Web of Science数据库(以下简称WoS),HistCite核心分析指标见表2
        2 HistCite核心分析指标
        3 CiteSpaceHistCite功能实验比较研究:以国际电子政务主题文献为例
        3.1 数据来源
        WoS数据库中获取电子政务相关的研究性论文(包括期刊论文、会议论文和综述)1388篇。本文主要采用CiteSpaceHistCite两种可视化软件对电子政务这一主题的八种文献计量学指标进行比较分析,见表3
        3 文献计量学指标
        3.2 作者、机构和国家及其合作分布
        3.2.1 CiteSpace的发文量和合作关系分析功能
        1)发文量及合作关系分析功能。CiteSpace可以形成作者、机构和国家及其合作分布可视化分析图谱。其中每一个结点代表一个作者、机构或国家,结点大小反映的是发文量的多少,结点年轮颜反映的是发文时间分布,调由暖及冷指的时间由近及远,点击在任何一个结点上通过点击鼠标右键,便可具体了解某个结点所代表的作者、机构或国家的发文按时间分布的具体数值。结点之间的连线反映的是作者、机构或国家具有合作关系。CiteSpace的这些功能不仅有助于研究者发现相关主题的权威研究作者、机构或国家,而且对研究者挖掘该主题的研究团队、跨越机构或国家的合作具有十分有效的帮助,这为考察该主题的知识流动及共享提供了一个清晰的线索。而且由CiteSpace生成的图谱颜丰富、信息量大。
        2)作者共被引分析。CiteSpace可以根据作者发文被引及共被引情况,生成作者共被引分析图谱。其中结点大小反映的是该结点所代表的作者被引频次的高低,结点的年轮颜反映的是该作者被引历史,通过在该结点点击右键可以具体了解该作者的被引频次随年度变
化数值;结点之间的连线代表作者之间具有共被引关系(以下同)。结点外圈的颜若是紫,则代表该结点的中心性≥0.1(以下同),点的中心性是一个用以量化点在网络中地位重要性的图论概念,它是指网络中经过某点并连接这两点的最短路径占这两点之间的最短路径线总数之比。中间中心性高(在CiteSpace可视化图谱中,中心性≥0.1便认为较高)的点往往位于连接两个不同聚类的路径上,是十分重要的结点,需重点考察其研究内容。CiteSpace的作者共被引分析可以使众多的著者按照同被引关系形成一个著者相关,揭示出学科专业人员的组织结构、联系程度,进而反映出学科专业之间的联系及其发展变化状况[1]
        3.2.2 HistCite的发文量及其被引分析功能
        HistCite可以显示阈值范围内(即本研究中设置的被引频次≥30次的论文)的总作者数、机构数和国家数。也可以对作者、机构和国家的发文量、作者发文当前主题内被引频次、WoS被引频次三个文献计量学指标的分布进行分析,而且通过点击三个按钮可以分别对这三个指标进行排序,这些功能有助于研究者通过不同指标识别电子政务研究的发文情况、相关重要论文以及在WoS范围内具有较高影响力的论文,为发现重要的作者、机构和国
家和经典文献提供线索。但是该工具无法直接对作者、机构、国家发文的文献计量学指标进行可视化图形分析,只能在数据基础上借助EXCEL作图分析。而且该工具无法进行合作分析。为节省篇幅,仅列出作者发文分布分析,见表4
        4 HistCite的作者分析二维表
        3.3 期刊及其共被引分布
        3.3.1 CiteSpace的共被引分析功能
        期刊的共被引关系强弱反映了期刊的亲疏远近关系,通过期刊共被引分析可以挖掘学术期刊之间的关系并且进行期刊分类,考察学科的内部知识结构和联系情况[9]CiteSpace可以按期刊被引情况生成期刊共被引分析图谱,由此可以揭示对某一主题研究具有重要推动作用的期刊以及期刊的共被引关系。但是,CiteSpace无法实现期刊载文量分析。
        3.3.2 HistCite的载文量及其被引分析功能数据可视化分析工具
        5显示了HistCite对电子政务研究主题的期刊载文分布结果。这一功能与前述作者、机
构和国家分布分析所具有的功能一致。但该工具只提供了期刊的主题内和WoS范围内的被引分析,未能提供期刊的共被引分析。
        5 HistCite的期刊发文及被引分析二维表
        3.4 学科分布及共现关系
        CiteSpace是根据WoS数据库的学科划分标准而对相关主题的研究学科进行划分的,而WoS数据库的学科划分是依据期刊所属学科进行划分的。因此,CiteSpace学科共现图谱中结点较大的学科说明这个学科的相关期刊上发表这一主题的论文较多。学科之间的连线同样是学科共现关系的揭示,通过这种学科共现考察可以了解跨学科研究情况。