毕业论文

打赏
当前位置: 毕业论文 > 研究现状 >

用户上网行为分析研究现状

时间:2022-05-15 10:09来源:毕业论文
对于用户上网行为分析,国外进行研究总的来说比国内更早,约20世纪80年代。国外主要侧重于研究单个网站访问人群,对特定群体的访问记录及行为习惯作横向对比分析,目的在于实现

对于用户上网行为分析,国外进行研究总的来说比国内更早,约20世纪80年代。国外主要侧重于研究单个网站访问人群,对特定群体的访问记录及行为习惯作横向对比分析,目的在于实现网站优化和网络监测。在国外常用来分析网络用户行为的研究模型主要有以下几种:LOTOS,用来刻画系统可见的外部行为的时序模型;HMM,通过得到的概率分布来表现观测向量的隐马尔科夫模型;GOMS,用于分析网络复杂性的网络用户行为模型;UAN模型,以及采用表格结构来描述用户和界面交互实体的。80709

而国内主要侧重对服务器日志的挖掘分析,辅以算法得出用户行为习惯、上网规律等所需信息,其中较突出的是移动公司做过的统计:陕西移动公司通过WAP流量数据统计分析,得出每日WAP流量分布以安排信号站点设置,掌握用户需求走势以优化网站、软件整体布局;广东移动提出基于移动计费系统、历史账单记录等数据的统计分析,目的在于从整体上分析用户消费、操作等行为,实时产生多种满足公司内部不同需求的报表,以更好的服务客户。论文网

用户上网行为分析主要有三部分工作:数据采集,数据处理,得出结论。目前数据采集与其他两者相比技术上较为完善。

数据采集方面,日志整体解读(包括网络爬虫分析)、Web Beacons、JS页面标记等技术均被用于实际生活中。日志整体解读,就是将所有的服务器日志提取、清洗、分析,能较全面的得到绝大部分访问记录,但缺点是清洗数据代价过高且无用数据对分析结果影响较大,而其中网络爬虫分析,即写出一段能自动从网上追踪网页的程序,一般从一个网站的URL开始,沿着网站RUL线路逐级访问,直至达到其停止条件则不再继续追踪访问;Web Beacons技术在网站上布置一个很小的不能被访问用户察觉的透明像素块,每次该网页被访问即记录一次,但缺点很明显,有一些非用户访问(如蜘蛛)不能被记录;JS页面标记,就是在Web Beacons基础上将不可见的像素块换成了JS代码,这样能更灵活可靠地获取数据,但这种方式遇到以下禁止使用JS功能的情况就丝毫不起作用了。

数据处理方面,主要运用MapReduce技术(后文中会详细介绍)在集群上实现大数据处理计算。

结果展示方面,主要以图表形式,直观地表现出各部分占总体的百分比

用户上网行为分析研究现状:http://www.youerw.com/yanjiu/lunwen_93885.html
------分隔线----------------------------
推荐内容