弄清楚用户画像和用户标签体系
从早期的云计算、大数据,到现在的AI,万事万物都离不开数据。尤其是在大数据阶段产生了一个“收数”的概念,就是企业需要不断累积自身的数据,为业务提供必要的数据。尤其在营销、风控领域,当前大部分用户都离不开手机和电脑,所以每个人在网络上有什么具体行为、偏好等特征,需要有一种手段进行收集。于是就诞生了一个刻画人物的工具——用户画像。
# 什么是用户画像
我们先抛开专业定义,当我们写作文时,脑海里面回想一个人的时候,我们会用聪明、多金、有才等词语,完成一个人物的描述,这就是人物画像。而计算机是依赖数字完成计算,对计算机而言不懂什么是聪明、什么是多金。为了计算机能够衡量一个人是否聪明、多金,我们需要指定量化规则,例如每次考试都是在99分以上就是聪明,存款在10万以上就是多金,而这些具体的特征就是用户标签。所以用户画像由多个用户标签中的具体标签值构成,而用户标签是对某一类特定群体或对象的某项特征进行的抽象分类和概括,用户标签分为:
- 事实类
- 规则类
- 统计类
# 为什么需要建立用户标签
通过上面分析,我们知道用户标签就是特征的描述。在公司内部的不同人员、不同部门,会有各自的特征描述方法。而这些各自为战的数据,非常容易造成分析数据的不准确。我们早期做数据仓库,就是为了解决数据不一致的问题,而基于数仓的用户标签,理所当然必须要做到统一计算口径。
通过建立用户标签,能够解决统计口径、重复建设等问题:
- 解决标签统计口径不一致:例如在金融贷款业务中,如何统计公司的信贷通过率?如果没有做好统计口径,不同部门就会有不同的计算方法。例如风控部门计算依据是授信通过,而到了财务部门则是以是否放款为标准。当数据的统计口径不一致时,将会导致不同部门计算出的指标产生偏差,最终导致决策受到影响。
- 标签数据的重复建设。我们生活中为什么会建立字典? 其实就是为了减少汉字概念的重复定义。在企业中每个人都是数据的生产者和使用者,例如需要计算奢饰品人群的数量,我们会建立奢饰品标签,不同的团队在没有统一标签体系时,会各自建设满足自己的标签。例如分析师可能直接通过计算统计得到奢饰品人群,而开发人员可能直接通过营销平台的购买数据进行计算。
所以建立用户标签体系,就如同建立数据仓库一样,应该时一项必须优先进行的数据工作。
# 如何设计用户标签体系
IT行业中重复建设或者拍脑袋建设非常多,软件始终是围绕如何解决具体问题,所以数据建设的核心原则就是:从业务中来,到业务中去;以终为始,从怎么用,来倒推怎么设计。
特别是在公司业务中,千万不要先建立一个大而全的标签体系,或者直接照搬一些公司的标签体现。因为这些标签是基于别人公司业务,一旦你照搬这些业务后,在后期或早期进行业务验证时,发现无法满足业务的需求。所以从务实出发,我们需要从解决的问题出发,到推出标签体系。千万不要一谈到体系,就一下子弄一个大而全、逻辑完美的东西。
具体标签体系长什么样子?标签体系本质就是分类+属性。分类就是解决“is a”的问题,而属性解决“has a”的问题。例如“金融人士”解决分类问题,而“多金”解决属性问题,再进一步讲“属性”就是判断是否具备某个特征。而标签体系我们可以通过一级标签、二级标签、三级标签构成,其中三级标签就是叶子标签,也就是解决“has a”问题的“属性”。
一级标签 | 二级标签 | 三级标签 | 标签加工逻辑 | 数据源 |
---|---|---|---|---|
# 总结
不要给用户画像带上神秘属性,因为凡是都是为了解决问题,而不是去创造概念、术语。当我们建立用户标签,并且能够通过标签构建用户画像后,那就是一个正确的标签设计。例如当设计“多次进入高档场所”标签后,就要考虑具体业务场景,例如是高端人群营销、还是公安反恐场景。
总之需求来源于业务,用户标签也需要落实到业务。