我们通常进行研究的是以文字为载体的信息,但是这种信息无法直观的展现其隐藏的信息。可视化分析的发展会将文字信息以图像的形式直观的展现出来,通过颜色、大小、形状等将信息进行更精确的分类。可视化不仅能直观展现出隐藏信息,还可以提高阅读速度,把握重要的关联性细节。
数据可视化、数据分析是图数据可视化方法论的重要环节,此外解决实际问题还需结合人机交互技术[[[]关迎晖,向勇,陈康。 基于Gephi的可视分析方法研究与应用[J]。 电信科学,2013,v。29S1:112-119。]]。图数据可视化方法论有以下4个关键步骤:
(1)数据采集与预处理
(2)绘图和布局
(3)数据可视化
(4)分析数据模型
图数据可视化方法论
4 Gephi的介绍及使用现状
常见的社会网络分析工具有Ucinet、Gephi、NetMiner、Iknow等,这些工具在可视化分析方面都有相似的地方,但又都有各自的特点。Ucinet和Gephi是情报领域分析工具中的佼佼者。邱均平、吴慧曾用Ucinet绘制共被引网络关系图谱,并发表了《基于SNA的国际科学计量学作者共被引关系研究—以SCIENTOMETRICS期刊2000-2010年数据为例》一文[[[]邱均平,吴慧。基于SNA的国际科学计量学作者共被引关系研究—以SCIENTOMETRICS期刊2000-2010年数据为例 [J] 情报科学,2012 (2):166-72]]。
Gephi是一个免费开源的复杂网络可视化分析的软件,它基于JAVA虚拟机(JVM),由来自各国的工程师和科学家联合研发。最早开始使用是在法国,为了支持、保护和促进Gephi的项目和使用,2008年法国成立了Gephi联盟并对其寄予厚望,要将其打造成“数据可视化领域的PS”[[[]邓君,马晓君,毕强。 社会网络分析工具Ucinet和Gephi的比较研究[J]。 情报理论与实践,2014,v。37;No。24708:133-138。]]。作为一款复杂网络的可视化分析软件,Gephi应用于各个学科领域,探测动态和分析图的交互并可视化,进行探索性数据、链接分析,并于近几年开始广泛应用于社交网络和生物网络分析。由于Gephi开放其API接口,开发人员可以利用接口编写或改进算法,使Gephi得以扩展和重复使用,创建新功能[[[] Khurana U,Nguyen V,Cheng H,et al。 Visual Analysis of Temporal Trends in Social Networks Using Edge Color Coding and Metric Timelines。 Proceedings of IEEE Conference on Social Computing 2011。IEEE,2011:549~554]]。
关于Gephi的应用,黄宇运用Gephi绘制社区划分网络并于《基于隐性语义挖掘的社区划分方法》一文中得出直观的社区可视化界面[[[]黄宇。 基于隐性语义挖掘的社区划分算法[D]。电子科技大学,2013。]]。在网络社区应用方面,邱晨子利用Gephi构建微博舆情网络图谱并对微博舆情信息传播的控制提出策略和建议[[[]邱晨子。 微博网络舆情热点生长分析模型研究[D]。大连海事大学,2013。]]。在统计计算领域,王佳秋利用Gephi对用户影响力进行计算和数据可视化,提出衡量电商用户在社交网络中的重要程度的方法 [[[]王佳秋。 基于用户行为及关系的微博电商企业影响力度量[D]。哈尔滨商业大学,2013。]]。