(二)复杂网络分析合作网络
结构和规模的研究涉及到网络中的组成成员、领域内的相互关联、团队的大小等,因此研究合作网络的结构和规模最常采用的方式是复杂网络分析,其中最为著名的就是Albert, Baraba´si, and Newman。Barabasi 等对合著网络随时间演化的现象进行研究[11],2001 年 Newman 利用社会网络分析法(SNA)对合著网络的研究发现一个科学家只需经过五到优尔个人就可以与其余任何一个科学家取得联系,科学界似乎形成了一个“小世界”[12],Yang H 等[13]发现,个体节点通过和高密度的邻近节点建立联系能够构建一个强强联合的网络。Abbasia 等[14]研究了科研合作网络的变化趋势。
在概念上将科学家或机构看成一组平面的点,将彼此之间的社会关系看成点与点之间的连线,已被证明是学习科学的社会性质有用的方法。由此产生的网络可以进行数学统计分析,从而通过宏观分析提供整个科学领域更丰富的描述、介观分析群体之间的特征、微观分析个体在整个领域的突出作用。
Laudel将科研合作定义为“一项由多个参与者进行系统合作,以达到研究的目的,从而获得相应的收益”的研究活动[15],现如今合作已经成为科学生产力发展的主要动力。本文探究机构的科学合作网络是一种描述机构之间科研合作关系的复杂网络,将科研合作抽象成一个网络,机构作为结点,机构之间的关系作为边,用来描述机构之间相互影响的关系。如果2个机构合作发表过1篇论文,就把这两个结点用一条边连接,对于一定范围内的科研合作情况进行考量,最终会生成一个描述科研合作关系的复杂网络。本文从科学数据资源库中提取两个合作网络,一个是在ClinicalTrials。gov网站注册的临床试验的机构的合作网络,另一个是基于这些试验发表论文的机构的合作网络。
(三)数据集合作网络研究
学术界对科学合作的研究成果比较多,但是绝大多数限于以科学论文作为研究对象,现在对合作网络的探究开始进行了突破,不仅仅再基于出版物的元数据,开始面向专利,数据仓储等,比如Meyer和Bhattacharya首次将专利文献与论文进行比较,虽然两者存在很多不同点,但是在计量上其实有很多相似之处,可以将论文计量的思路同样利用在专利上[16]。Singh[17]通过对专利的合作网络的探究得出专利合作对于未来信息流动起到推动作用的结论。但是目前,不管是国内还是国际上,关于数据集合作的研究文献非常少,2016年Mark R。 Costa[18]基于GenBank探究了在大型数据仓库中进行元数据追踪,从传统出版物的合作和数据集的合作中分析了合作模式。陈晓燕[19]构建了WEB数据集和论文合著SCH数据集并加以实证比较分析。由此本文也想到将论文计量运用在数据集计量上,因为他们同样拥有数据持有者,合作者,研究人员等元数据。
二、研究方法
(一)具体方法
本研究运用计量学指标,对ClinicalTrials。gov网站注册的临床试验和基于试验发表的论文等情况进行分析;运用Python编程完成原始数据向netdraw所需网络文件的转换和基本统计指标的计算;运用python生成合作试验机构与论文合作机构的共现网络文件,并转化为相应的合作网络文件,采用ucinet软件处理上述合作网络并计算各项指标。本研究涉及到的方法包括文献计量法、数理统计法、社会网络分析法(SNA)。
(二)数据来源
研究科学合作最常用的方式即根据出版物中元数据来提取合作关系,元数据包括作者,机构,期刊,日期等题录信息,基于此来研究合作网络可能会存在高估或者低估的现象。在临床医学领域低估是因为科学家们经常会在名义上非正式的合作,接受来自同行的反馈和帮助,例如和其他机构非名义上的合作进行临床试验但论文中并没有体现;高估是因为作者会夸大合作,特别是当合作关系是更为有名气的科学家,通过利用该科学家的知名度来提高出版物的知名度,但实际可能并没有合作进行试验只是参考了其相关数据。因此精确地理解合作机构和任两位科学家合著的论文之间的关系,将变得更难。由此,我们想到——从存储临床试验的数据库中提取元数据相比于仅仅提取出版物的元数据,是否使得合作研究更加精确,是否出版物的合作网络与科学研究数据库的合作网络存在一定的差异。针对上述提出的问题,我们选择了ClinicalTrials。gov网站作为数据源。 基于临床试验数据的合作网络研究(3):http://www.youerw.com/yixue/lunwen_23517.html