本项目工程庞大,包括用户和标签数据库的设计,上网数据的采集、目标网站的筛选、 分布式爬虫的设计及实现、数据清洗和存储、标签规则以及 web 前端设计等,本人参与的是 用户画像和用户标签的设计和标签规则的设计和实现部分,所以,本文首先对房地产用户模 型进行分析,然后根据模型设计用户画像,第三章主要介绍了用户标签的设计和实现,最后, 第四章详细介绍了 DPI 标签库部署规则并给出项目示例输入输出。

本科毕业设计说明书 第 5  页

2。 用户画像构建

创建用户画像,首先要考虑的就是用户模型特点【10】。房地产行业不同于其他电商行业, 不仅需要考虑客户基本信息,还需要考虑用户购买能力及购房意愿等。因此,我们首先对用 户模型进行深入分析,再设计用户画像。

2。1 用户画像概述

用户画像,顾名思义,就是描述用户信息的一种方式,在互联网中的深层含义就是用户 信息标签化,具体来说就是企业或运营商通过对用户的生活习惯、兴趣爱好、消费数据等一 系列上网数据进行挖掘和分析,最终抽象出来的用户的商业全貌。用户画像所针对的用户, 一定是某个领域“典型”的“特征明显”的用户,或者是具有明显相似性的用户,比如本项 目分析的用户,就是江苏电信所有的入网用户;此外,创建用户画像一定是有针对性的商业 用途或者其他用途,这样不仅方便锁定目标用户,也方便用户建模。

创建用户画像,实质就是根据用户行为给用户打标签,其核心工作就是因地制宜地建立 一套标签规则,即用户的什么行为对应哪个或者那种标签,这些标签是人为的高度凝练的特 征标识。在创建用户画像时,我们还要考虑“颗粒度”,就是用户画像的细化程度【11】,如果 颗粒度太大,将无法完成精准营销,然而颗粒度越小挖掘的难度就越大,因此,我们在技术 允许的情况下,尽可能地对用户信息进行细分。

本文在设计用户画像过程中分为模型分析和维度分解两个阶段。

2。2 用户模型分析

战略目的、数据采集方式和目标用户群的不同,用户画像的维度和建立方式也会不同, 因此,我们首先研究了房地产行业的营销模型,对用户关联、用户基础信息、用户能力信息 和用户需求信息进行分析。

2。2。1“老带新”分析模型

据统计“老带新”买房占总成交量四成。因此,针对老客户交际圈的分析功能的实现很 有必要。通过交际圈分析模型能够主动地获取老客户交际圈的客户信息,并对其进行精准营 销。

利用老客户的通话信息,基站位置信息和电信用户画像,建立客户交际圈分析模型,用 以获取老客户交际圈中存在的目标客户信息,进而对目标客户实行精准营销。要求模型构建 客户与老客户之间的关联强弱图,实现新客户信息快速输出。

第 6  页 本科毕业设计说明书

“老带新”客户分析场景:

a) 根据客户的通话信息,关联与客户发生通话行为的号码,根据通话次数,判断通话客户 间的关系强弱;

b) 根据电信用户信息,对比关联号码客户与老客户的年龄、性别,判断关联号码客户的购 买需求;

c) 对比关联号码与老客户的位置信息,判断关联号码属于老客户的亲友圈、工作圈、社交 圈。

d) 最后,把老客户的工作圈或社交圈中与之年龄、性别相仿的关联号码客户,作为老客户 最有可能介绍或推荐购房的新客户信息输出。

上一篇:MATLAB基于稀疏表示的人脸识别算法实现
下一篇:基于ONE仿真平台的DTN网络路由协议分析研究

基于Apriori算法的电影推荐

资料:中國互联网发展现状分析【2114字】

电视进军互联网【2414字】

浅谈互联网的发展与隐私权保护【1640字】

互联网文化与电视文化的...

中國互联网发展现状分析【2360字】

互联网农业”背景下的电...

互联网教育”变革路径研究进展【7972字】

安康汉江网讯

ASP.net+sqlserver企业设备管理系统设计与开发

网络语言“XX体”研究

麦秸秆还田和沼液灌溉对...

张洁小说《无字》中的女性意识

我国风险投资的发展现状问题及对策分析

老年2型糖尿病患者运动疗...

新課改下小學语文洧效阅...

LiMn1-xFexPO4正极材料合成及充放电性能研究