转载自 人人都是产品司理
作者 @大鹏
原文地址 http://www.woshipm.com/pd/4268665.html
前段时刻上了一个用户画像的课程,别的也研读了一些叙述用户画像的文章;依据对上述学习内容的了解,一同结合作业实践,经过本文和咱们共享下有关用户画像的认知、建造办法、产品化和运用。
一、初识用户画像1. 用户画像
跟着用户的全部行为数据能够被企业追寻到,企业的重视点日益聚集在怎么运用大数据为运营剖析和精准营销服务;而要做精细化运营,首先要树立本企业的用户画像。
说到用户画像的概念,咱们区别下用户人物(Persona)和用户画像(Profile):
1)用户人物(Persona)
用户人物实质是一个用以交流的东西,当咱们评论产品、需求、场景、用户体会的时分,为了防止在方针用户了解上的不合,用户人物应运而生。
用户人物树立在对实在用户深刻了解,及高精准相关数据的归纳之上,虚拟的包含典型用户特征的人物形象。
如下是一个典型的用户人物:
2)用户画像(Profile)
用户画像更多被运营和数据剖析师运用,精准营销、运营剖析、个性化引荐都是依据用户画像的运用;用户画像是各类描绘用户数据的变量调集,能够精确描绘任何一个实在用户。
如下是一个简化的用户画像:
【“ID”:123456,“名字”:张建国,“性别”:男,“出生年月”:631123200,“原籍”:北京,“居住地”:北京】
【“教育布景”:校园:北京大学,专业:CS,入学年月:1220198400】
2. 用户标签和用户画像
1)用户标签
用户标签,即对用户某个维度特色的描绘,具有彼此独立、可枚举尽头的特色;搜集事务、日志、埋点等数据后,经过不同核算办法核算出用户特色、用户行为、用户消费、危险操控、交际等维度标签;例如:性别、年纪、近30日拜访次数、购买水平、常常活泼时刻段等,有关用户标签体系建造的具体描绘,见「2 建造标签和标签体系」章节。
2)用户画像
构建用户画像,便是给用户打上各种维度的标签。从事务价值来说,标签和画像是相似中心层的体系模块,为数据驱动运营奠定了根底,能够协助大数据“走出”数据仓库,针对用户进行个性化引荐、精准营销等多样化服务。有关用户画像体系、落地运用的具体描绘,见「3 用户画像产品化」「4 用户画像运用」「5 用户画像实践事例」章节。1.3 用户群组和用户标签
用户标签和用户群组是两个简略混杂、具有利诱的概念,下面测验区别:
3. 区别
1)用户群组
需求用户特色和行为组合,才干圈选出全面的方针群体;只要行为数据,只能看到这个人做过什么事,但这个人是男是女、年纪多大、注册多久 、购买才能怎么等信息都不知道,这样圈选出的用户群是有缺点的,一般不会直接运用于精准营销场景。
2)用户标签
树立用户标签,不必非要组合用户特色和行为事情,单用用户特色能够,单用行为事情也能够;依据用户特色、行为事情核算出的用户标签,实质也是用户特色,或许说用户特色自身便是标签。
3)群组是标签的一种运用办法
标签作为一个中心层体系模块,在精准营销场景,往往不会只运用一个标签进行推送,更多情况下需求组合多个标签来满意事务上对人群的界说,见下图:
这儿经过一个场景来介绍依据用户标签圈选用户群组的运用,某女装大促活动期间,途径运营人员需求筛选出途径上的优质用户,并经过短信、邮件、Push等途径进行营销。
经过圈选“阅读”“保藏”“加购”“购买”“查找”与该女装相关品类的标签来筛选出可能对该女装感爱好的潜在用户组合其他标签(如“性别”“消费金额”“活泼度”等)筛选出对应的高质量用户群,推送到对应途径。
因而,将用户特色、行为事情数据笼统成标签后,可经过组合标签办法找到方针潜在用户人群;从这个视点了解,用户群组是用户标签运用的一种办法。
二、建造标签和标签体系1. 标签的分类
标签自身会有许多分类办法,但从标签的完结规矩来看,大致能够分为以下3种类型:核算类标签、规矩类标签、机器学习发掘类标签。
1)核算类标签
这类标签是最为根底也最为常见的标签类型,例如,关于某个用户来说,其性别、年纪、城市、星座、近7日活泼时长、近7日活泼天数、近7日活泼次数等字段能够从用户注册数据、用户拜访、消费数据中核算得出,该类标签构成了用户画像的根底。
2)规矩类标签
该类标签依据用户行为、用户特色和确认的规矩发生;例如,对途径上“消费活泼”用户这一口径的界说为“近30天买卖次数≥2”;在实践开发画像的进程中,因为运营人员对事务更为了解,而数据人员对数据的结构、散布、特征更为了解,因而规矩类标签的规矩由运营人员和数据人员一同洽谈确认。
3)机器学习发掘类标签
该类标签经过机器学习发掘发生,用于对用户的某些特色或某些行为进行猜测判别;例如,依据一个用户的行为习气判别该用户是男性仍是女人、依据一个用户的消费习气判别其对某产品的偏好程度。该类标签需求经过算法发掘发生。
在项目工程实践中,一般核算类和规矩类的标签即能够满意运用需求,在开发中占有较大份额;机器学习发掘类标签多用于猜测场景,如判别用户性别、用户购买产品偏好、用户丢失意向等;一般地,机器学习标签开发周期较长,开发本钱较高,因而其开发所占份额较小。
事实上,终究标签体系中是以用户视角界说的,需求结合具体的事务;比方某电商事务标签分类,用户特色维度标签、用户行为维度标签、用户消费维度标签、危险操控维度标签、交际特色维度标签。
2. 标签建造流程
下图是一个标签建造流程,会偏重产品司理视角,首要描绘需求的剖析进程和产出文档,一同对标签的开发原理进行简略总结。
1)需求搜集与剖析
在需求搜集与剖析环节,能够按复原事务流程——清晰商业意图——从战略推标签——会聚标签的进程展开。
某服装零售商,经过布局线上商城和线下实体店来扩展运营。线上的话,首要是经过微信大众号引流到小程序,然后在小程序完结买卖。
下面经过该服装零售事例,具体描绘下,怎么进行标签需求的搜集与剖析:
辨认剖析事务流程和事务场景触点:
用户画像是依据事务的,因而,构建标签的第一个进程便是辨认与剖析用户的决议方案流程和事务场景,以便快速了解事务。
参阅下方事例事务流程的复原:
首先是经过各种场景被招引来的微信用户重视大众号成为了粉丝,然后大众号运营人员会给微信粉丝推送图文音讯进行粉丝运营;一同把粉丝引流到小程序商城,大众号粉丝终究会在小程序商城成交转化;在整个进程中,大众号运营人员会继续进行微信粉丝的保护和丢失粉丝的拯救等运营作业。
此处引荐:《有用需求剖析》中具体需求篇事务功用支撑主线需求剖析办法。
清晰每个事务场景触点的商业目:
的这一步依据之前对事务流程的整理,洞悉事务问题,清晰想要到达什么商业意图,并对商业意图进行拆分;参阅下方事例从清晰全体商业方针,到商业方针拆解和量化的进程:
O:假定该服装零售商线上的布局现已比较完善,现阶段的首要商业意图便是提高出售金额,因而“提高出售金额”便是该零售电商的北极星方针,那么提高流量、提高转化率、提高客单价、提高复购率便是拆解后的中心方针。
S:此处假定想要提高进入小程序商城的流量,能够采纳的战略也许多;比方,经过扫码重视后推送优惠券办法招引更多的微信用户重视成为粉丝;再比方,产出更高质量微信图文,更好的运营微信私域流量。
M:紧接上一步,针对推送优惠券招引用户重视大众号这个战略,咱们能够要点重视经过扫码办法重视大众号比率、取关的比率,新旧粉丝的比率。
此处引荐:
OSM模型(Objective、Strategy、Measurement)出售公式=流量*转化率*客单价*复购率
从商业意图导向运营战略规划及用户标签需求针对不同商业意图,对标签体系的建造也是不一样的,因而要从运营战略推导出标签;比方事务部门要做个性化引荐,做关于物或许人的爱好、偏好的标签会比较有价值;可是假如要做精细化运营,关于用户的留存、活泼标签会更有价值。
参阅下方用户标签选用的事例:
把提高扫码办法重视率作为量化的方针,选用的运营战略是经过推送优惠券办法招引微信用户扫码,新粉丝扫码重视后推送100元优惠券,老粉丝扫码后推送50元优惠券,那么履行运营战略进程中需求用到“是否新粉丝”这个标签。
在此阶段,能够预备一个简略的记载交流内容的Excel模板,列表头包含标签名、标签规矩、运用场景等,和事务方一同把交流内容记载下来。
安排标签关于安排标签,需求依据对事务和战略的了解,以用户视角进行分类办理。下面是一个参阅结构:
用户特色类标签:性别、年纪、省份、城市、注册日期、手机号码等;用户行为类标签:近30日拜访次数、近30日客单价、近30日活泼天数、近30日拜访时长、均匀拜访深度等;用户消费类标签:收入情况、购买力水平、已购产品、购买途径偏好、最终购买时刻、购买频次等;产品品类类标签:高跟鞋、靴子、衬衫、法度连衣裙、牛仔裤等;交际特色类标签:常常活泼的时刻段、活泼地址、独身、点评次数、好评度等;
2)产出标签需求文档
经过前面的需求搜集与剖析,已清晰了事务方的标签需求。为了顺畅交给研制,接下来还需求:编撰标签体系文档——依据标签规矩确认埋点——编撰数据需求文档。
编撰标签体系文档在此环节,数据产品司理需求依据前期和事务方的交流内容,产出具体的标签体系文档:
标签ID:例如, ATTRITUBE_U_01_001, 其间“ATTRITUBE”为人口特色主题,“_”后边的”U”为userid维度,“_”后边“01”为一级归类,最终面的“001”为该一级标签下的标签明细标签称号:英文格局称号,例如,famale标签汉语:女标签主题:描绘标签所属的主题,例如,用户特色维度标签、用户行为维度标签、用户消费维度标签;标签层级ID:标签所属的层级,一般会分为2级;称号:与ID对应的称号;标签类型:核算类标签、规矩类标签、机器学习算法类标签;更新频率:实时更新、离线T+1更新、单次核算;标签算法规矩:需求描绘挑选哪张数据表中的具体哪个字段,若需求多张表做相关,还需求阐明经过什么字段进行join;具体的算法逻辑和核算周期,比方“近7天付出次数”,便是需求核算近7天付出的总次数;运用场景描绘;排期;开发人;需求方;优先级;
依据标签规矩确认埋点:
前面现已清晰了标签的算法规矩,接下来要进一步确认应该埋哪些点来搜集所需的数据,下面是一个具体事例:
针对“购买产品品类偏好”这个标签,会用到点击下单按钮事情数据,以及产品称号、产品分类等事情特色数据,那么就需求对点击下单按钮事情进行埋点。
3)编撰数据需求文档
埋点取哪些数据现已确认了,就需求产出具体的数据需求文档,交给担任埋点的开发搭档进行埋点取数了。
在数据需求文档,应该清晰以下内容:
埋点名:click_order;埋点显现名:点击下单按钮;上报机遇:依据实践情况,挑选是何时进行上报。比方关于点击下单事情,能够挑选点击了下单按钮时就进行上报;埋点方法:依据实践情况,挑选是客户端埋点,仍是服务端埋点;比方“购买产品品类偏好”标签的下单按钮点击事情,因为仅仅想判别用户对购买产品的偏好,用户点击按钮后现已能阐明是否有偏好了,不需求等服务端回来是否成功的提示,因而合适选用客户端埋点方法;特色名:事情特色的称号,比方点击下单按钮事情的产品称号特色;特色值:比方衬衫;补白;
实践作业中,编撰标签体系文档、依据标签规矩确认埋点、编撰数据需求文档,会是一个相互完善弥补的进程。
4)标签的开发
在整个工程化方案中,体系依靠的根底设施包含Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除掉根底设施外,体系主体还包含ETL作业、用户画像主题建模、标签成果数据在运用端的存储3个重要组成部分。
如图所示是用户画像数仓架构图,下面临其进行简略介绍:
Hive数据仓库ETL作业下方虚线框中为常见的数据仓库ETL加工流程,也便是将每日的事务数据、日志数据、埋点数据等经过ETL进程,加工到数据仓库对应的ODS层、DW层、DM层中。Hive数据仓库用户画像主题建模:中心的虚线框即为用户画像建模的首要环节,会对依据数据仓库ODS层、DW层、DM层中与用户相关数据进行二次建模加工。标签成果数据在运用端的存储:在用户画像主题建模进程中,会将用户标签核算成果写入Hive。
因为不同数据库有不同的运用场景,下面别离进行描绘:
MySQL:
作为联系型数据库,在用户画像中可用于元数据办理、监控预警数据、成果集存储等运用中,下面具体介绍这3个运用场景:
元数据办理:MySQL具有更快的读写速度,途径标签视图中(Web端产品)的标签元数据能够保护在MySQL联系数据库中,便于标签的修改、查询和办理。监控预警数据:在对画像的数据监控中,调度流每跑完相应的模块,就将该模块的监控数据刺进MySQL中,当校验使命判别到达触发告警阈值时,就触发告警。成果集存储:存储多维透视剖析用的标签、圈人服务用的用户标签、当日记载各标签数量等。
HBase与Hive不同的是,HBase能够在数据库上实时运转,而不是跑MapReduce使命,合适进行大数据的实时查询;下面经过一个事例来介绍HBase在画像体系中的运用场景和工程化完结办法:
某途径运营人员为促进未注册的新装置用户注册、下单,方案经过App主页弹窗发放红包或优惠券的办法进行引导;每天画像体系的ETL调度完结后对应人群数据就被推送到广告体系(HBase数据库进行存储);满意条件的新用户来访App时,由在线接口读取HBase数据库,在查询到该用户时为其推送该弹窗。
Elasticsearch:
是一个开源的散布式全文检索引擎,能够近乎实时地存储、检索数据。关于用户标签查询、用户人群核算、用户群多维透视剖析这类对呼应时刻要求较高的场景,也能够考虑选用Elasticsearch进行存储。
5)标签发布与作用追寻
经过开发测验,上线后需求继续追寻标签运用作用及事务方反应,调整优化模型及相关权重装备。
三、用户画像产品化
从事务价值来说,标签和画像相似一个为前台服务供给数据支撑的中心层体系模块;开发完画像标签数据,假如仅仅“躺在”数据仓库中,并不能发挥更大的事务价值;只要将画像数据产品化后才干以规范办法提高数据处理链路上各个环节的功率,一同也更便于事务方运用。
下面别离从产品化后包含的标签出产架构和功用模块两个视点进行总结:
1. 用户画像产品体系架构
下图是一个用户画像产品体系的结构图,数据是从左到右的,首要包含数据搜集、数据接入、数据整合/标签核算、标签运用4个层级。
下面测验对其进行简略描绘:
<p style="font-size: 14px; color: #262626; line-he