b) 根据电信客户信息,筛选该批号码客户中年龄层次在 35-65 岁客户(该年龄层次客户购 买能力最强)。
c) 根据客户的位置信息,对第二步中客户进行筛选,筛选出客户位置轨迹没有两点一线规 律(说明不是工薪阶层)且位置轨迹多为郊区、新建商场等区域(说明客户可能在看房 或商铺)。由以上信息,判断该部分客户可能房地产投资人群,属于升值偏好型客户。
2。3 维度分解
根据江苏电信的业务特点,我们以静态数据和动态数据对用户维度进行划分。其中,静 态数据是一段时间内保持不变或规律变化的用户信息,比如性别、年龄等;动态数据是变化 着的用户信息,也是数据挖掘中比较复杂的难以分析和处理的数据。
第 8 页 本科毕业设计说明书
2。3。1 静态数据
a) 描述个人基本身份信息的指标。比如:年龄、性别、学历、民族等。 b) 描述个人家庭信息的指标。比如:是否已婚、子女、家庭成员等。
c) 描述个人社会地位的指标或标签。比如:职业、身份、经济情况等。
2。3。2 动态数据
a) 描述个人生存需求的指标。比如:衣食住行等各方面消费需求。
b) 描述个人社交圈行为的指标。比如:常用社交网络、关注的微信公众号等。 c) 描述个人成长需求的指标。比如:金融理财、学习教育、等级考试等。
图 2。1 用户维度信息
2。4 本章小结
本章首先解释了用户画像的含义,在分析了房地产目标用户模型特点之后,确定用户画 像维度。通过对房地产业营销现状的调研,根据“老带新”分析模型锁定客户交际圈,利用 客户的通话信息、短信交互信息、位置信息、互联网行为偏好和电信用户画像分析用户潜在 购房意愿以及客户类型,从而达到精准营销的目的。
本科毕业设计说明书 第 9 页
3。 房地产标签设计
3。1 标签概述
根据维基百科的定义,标签是一种无层次化结构的、用来描述信息的关键词。从本质上 讲,标签是关于资源的、用来描述、解释、定位某个信息源,或者使其易于获取、使用或管 理的结构化信息【12】。社会标签系统【13】已经广泛应用于各大网站,它可以说是数据爆炸时代 互联网行业的救星,在组织、检索和共享信息资源方面发挥了巨大作用。现在的社会化标签 系统,主要是基于“用户-资源-标签”的三维模型【14】,这是一个复杂的动态网络,它的拓扑 结构也多种多样。在这个三维模型中,用户是标签系统的核心,可以按照自己的意愿生成标 签,或者标注资源;资源在形式上不受任何限制,可以是网页,也可以是图片、视频、音乐 等;标签实质上是关于资源的关键词,这些词汇也没有限制,用户可以根据自己的需要和理 解,用适当的词汇,自由标注资源。
与标签相关的,还有一种大众分类法【15】(folksonomy,也译作分众分类或众分类法), 与传统层级式分类不同的是,大众分类法产生的分类是一种由用户生成的扁平结构的分类, 没有等级层次,比传统分类有更好的实时性和灵活性。
3。2 标签的设计
在设计标签表结构时,我们将描述用户行为的分为原子标签、类型标签和层级标签,类 型标签又分为 APP、web、搜索引擎、终端、位置五个大类。在 web 前端进行关键词搜索时, 会按照这五大类分类展示,如图 3。1:
第 10 页