1.1 研究方法与数据来源

1.1.1 研究方法

本章的研究方法为知识图谱法(knowledge mapping)。知识图谱法是将应用数学、图形学、数据可视化技术、信息科学等学科的理论与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及知识基础,为学科研究提供切实的、有价值的参考。自“知识图谱”概念引进以来,多种文献可视化软件也纷纷出现,其中最为常用的是由陈超美教授研发的CiteSpace软件,又称为“引文空间”,它是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学、数据可视化背景下逐渐发展起来的一款多元、分时、动态的引文可视化分析软件。根据研究需要,本章主要采取国家合作网络分析、机构以及作者合作网络分析、期刊源分析、关键词共现分析以及关键词突现检测等多种分析方法,绘制科学知识图谱,以此来定位能源消费领域的研究热点以及前沿。

在利用CiteSpace进行图谱分析的过程中,会使用到一些指标,以下对几个重要指标进行简单的阐述。

中介中心性(centrality)是测度节点在网络中重要性的一个指标,CiteSpace中使用此指标来发现和衡量文献的重要性,该指标的计算方法是Freeman于1977年提出来的,其计算公式如下:

式中,gst为从节点s到节点t的最短路径数目,为从节点s到节点tgst条最短路径中经过节点i的最短路径数目。从信息传输角度来看,中介中心性越高,节点的重要性也越大。

CiteSpace中提供了三种计算网络中连接强度的方法,分别是Cosine,Jaccard和Dice方法,通常使用的是软件默认的Cosine算法,其计算方法如下:

式中,cijij的共现次数,sii出现的频次,sjj出现的频次。

Threshods(阈值)通过设定前中后三个时间段ccc以及ccv的阈值来提取数据,即数据的起始、中间和结尾按照cccccv赋值,其余用线性内插值算法处理。ccvccc三者的关系如下:

式中,c代表最低被引或出现频次,cc代表本时间切片中共现或者共被引频次,ccv表示共现率或者共被引率。

1.1.2 数据来源

Web of science是大型综合性、多学科、核心期刊引文索引数据库,它收录了8000多种具有高影响力的、经过同行专家评审的高质量学术期刊,覆盖领域甚广。因此在分析能源消费问题的知识图谱研究中,选取Web of science作为文献来源检索系统,更具有可信度和说服力。在Web of science数据库中,按照标题进行精确检索,检索词为“energy consumption”,检索时间为2008—2018年,共得到9544篇文献,为保证文献的正确性,剔除不相关文献,得到学术论文9354篇。数据采集方式汇总如表1-1。

表1-1 2008—2018年能源消费领域文献的数据采集