18
4.2 被忽视的核心价值:被信任的信息 18
结 论 19
致 谢 20
参考文献 21
1 绪论
1.1 选题的背景和意义
有这样一个著名的理论讲的是:在你和任何一个陌生人之间所间隔的,不会超过六个人,也就是说,我们最多只要经过六层关系就能认识一个陌生人。在Web2.0时代,互联网于我们而言,不再仅仅是一个获取信息的地方,同时也让我们变成为了制造信息和传播信息的人。这样就构成了一张张的关系网络。通过研究分析这些各种各样的关系网络,我们可以了解到用户们的思维方式,生活习惯,精神物质需求。而这些被挖掘出来的信息,可以帮助我们发展商业,文化等其他领域。
现实世界中,我们可以用网络模型来呈现出很多系统的框架结构,可以将这些网络结构看作是由节点和连接节点的边组成的集合。通常情况下我们使用节点来表示真实系统中的个体,用边来代表这些个体之间的某种关联,有一条边相连的两个节点被称作为相邻节点,而有一个点相连的两条边则被称作为相邻边。如果一个网络中的边是有方向的,那我们就把它称为有向网络;反之,就把它称作无向网络。在图论的概念中,图本身就是一种抽象化的网络,而图论中的一些方法同样也能够用来处理存在于复杂网络结构中的问题。例如,如果我们使用一个节点来表示一个人,用一条边来表示它所连接的两个节点(即节点所表示的两个人)之间的交往,这样就能构成一张反映人际关系的社会网络。
复杂网络具有聚集的特性:在一个社会网络结构之中,一个人朋友的朋友也有可能成为他的朋友,或者他的某两个朋友可能彼此之间也是朋友关系。我们用聚集性来描述这种事情的发生有多大的可能性,它表现出网络有多紧密,表达了网络连接的聚集程度。而我们通常会使用聚类系数(Cluster Coefficient)来描述一个网络所有节点的聚集情况。
“社会网络”指的是在社会中的成员以及存在于他们之间的相互关系的集合。社会网络中所说的“点”就是指代各个社会成员,而社会网络中的“边”指的是各个成员之间的不同社会关系。在社交网络中,成员之间的关系可以是有向的,也可以是无向的。论文网
随着网络社交理论的不断变革和创新,不同类型的社交网络不断出现。社交网络经过了以下的这么一个发展历程:早期理论阶段出现的六度分隔理论奠定了社交网络理论的形成。之后,出现了Friendster,它能帮助你结识陌生人,为你建立起认识关系,带来更加多的社会资本;然后,在人们越来越追求娱乐的过程中,出现了MySpace,它使用了新颖时尚的多媒体空间,增加了人们的人性化需求的同时,吸引到了更多来自他人的注意力;社交网络不断革新发展到今天,最热门的当属扎克伯格创建的Facebook,它把现实生活中的人际关系网络描绘到网络上,形成了一张张社交图,这样的方式是一种低成本的管理方法。在社交网络发展的整个过程中,我们可以看到它是把人们的现实生活信息越来越完整的从线下描述到线上。
数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程[1]。有时,需要从大量的、不完整的、有噪声的、随机的、模糊的实际应用数据中,提取隐含在其中的、人们所不了解的、但同时又是潜在的有价值的信息和知识,我们会对这些数据进行数据挖掘和知识发现(DMKD),随着DMKD研究的不断深入发展,通过数据挖掘而发现的知识就涉及到很多方面,如广义知识、关联知识、分类知识和预测知识等。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标[1]。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等等,从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法,传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等[1]。本文中,我们会用到有关知识。 社交网络核心社区成员挖掘算法研究(2):http://www.youerw.com/jixie/lunwen_73288.html