如何解读分析结果
解读关键点
1,结合商业经验,从经验角度解读不同聚类结果的人群含义;
聚类分析是数据挖掘和统计分析中重要的研究领域,是技术手段;但对于生成群组的特征和使用价值还需要结合不同行业的商业经验进行解读。
2,结合标准偏差的数值进行辅助分析,标准偏差值越大,说明该群组内事件的特征性越显著;
标准偏差值通常用来表示当前群组内当前事件与数据集之间的偏差程度,标准偏差的绝对值越大,说明当前事件的特征越明显,更多聚焦于偏差值大的事件,可以帮助您更好的进行数据解读。
3,善用对照组,通过人群重叠程度对计算结果进行辅助分析;
模型参数中的对照组虽然不参与算法计算,但在计算结果的看板卡片上将会展示不同的聚类分组和对照组的人群重叠百分数;例如您可以选择【核心用户群】作为对照组,这样您就可以知道每个聚类分组中有多少是核心用户,从而进一步分析哪些流程事件有助于帮助您转化核心用户,善用对照组将对您解读分析结果带来很多帮助。
4,待分析的群组的用户数和系统内记录的事件数据需要尽可能多;
从统计学诠释的角度,数据集样本量越大,其标准化后的概率分布也将会更加符合标准正态分布,选择用户量更大的群组和更长的时间范围将使得分析结果更加精确。
5,不要忘记关注异常数据;
聚类分析的结果都是基于实际数据而进行的科学分析生成,是真实数据的模型呈现,因此展示异常的数据也有其实际价值,在进行分析时请不要忘记观察这部分数据,它可能是一个从未察觉到的业务新增长点,也可能是某个活动漏洞所导致的羊毛党运动,在对结果的诠释分析中请不要忽略它。
对于某次儿童食品营销活动的推广结果的研究(简单示例)
事件名称 | 发生平均次数 | cluster_1(2651人) | cluster_2(2278人) | cluster_3(1430人) |
有赞_有赞页面浏览 | 14.73 | 13.17 | 19.23 | 10.46 |
创蓝_接收短信 | 7.81 | 2.14 | 4.23 | 24.03 |
易企秀_浏览作品 | 26.70 | 29.93 | 36.61 | 4.93 |
云片_点击短信内短链 | 5.64 | 1.40 | 10.89 | 5.13 |
UDC_访问页面 | 80.51 | 2.16 | 67.08 | 247.15 |
UDC_启动应用 | 27.59 | 3.55 | 32.53 | 64.28 |
目睹_参与直播活动 | 5.53 | 11.17 | 1.28 | 1.84 |
小鹅通_学员签到 | 14.32 | 22.49 | 2.80 | 17.52 |
微盟_购买商品 | 9.02 | 17.33 | 2.13 | 4.57 |
有赞_有赞搜索 | 12.94 | 1.07 | 24.51 | 16.72 |
微博_评论微博 | 16.91 | 30.64 | 2.23 | 14.85 |
智简_订单完结 | 6.58 | 15.16 | 2.76 | 0.00 |
Cluster 1 的特点
事件名称 | 发生平均次数 | cluster_1 |
易企秀_浏览作品 | 26.70 | 29.93 |
微博_评论微博 | 16.91 | 30.64 |
目睹_参与直播活动 | 5.53 | 11.17 |
小鹅通_学员签到 | 14.32 | 22.49 |
微盟_购买商品 | 9.02 | 17.33 |
智简_订单完结 | 6.58 | 15.16 |
云片_点击短信内短链 | 5.64 | 1.40 |
UDC_访问页面 | 80.51 | 2.16 |
UDC_启动应用 | 27.59 | 3.55 |
有赞_有赞搜索 | 12.94 | 1.07 |
创蓝_接收短信 | 7.81 | 2.14 |
有赞_有赞页面浏览 | 14.73 | 13.17 |
【特点分析】:浏览内容和参与活动事件的意向度和频次都比较高,付费和购买能力比较强。
【评价】:该群体是比较优秀的核心用户。
Cluster 2 的特点
事件名称 | 发生平均次数 | cluster_2 |
有赞_有赞页面浏览 | 14.73 | 19.23 |
易企秀_浏览作品 | 26.70 | 36.61 |
云片_点击短信内短链 | 5.64 | 10.89 |
UDC_启动应用 | 27.59 | 32.53 |
智简_订单完结 | 6.58 | 2.76 |
创蓝_接收短信 | 7.81 | 4.23 |
UDC_访问页面 | 80.51 | 67.08 |
目睹_参与直播活动 | 5.53 | 1.28 |
小鹅通_学员签到 | 14.32 | 2.80 |
微盟_购买商品 | 9.02 | 2.13 |
有赞_有赞搜索 | 12.94 | 24.51 |
微博_评论微博 | 16.91 | 2.23 |
【特点分析】:对于品牌产品浏览比较频繁,但缺乏互动,对于直播活动和签到意向不大,缺少购买。
【评价】:该群体对品牌有认知,目前可能处于种草期,或非刚需,是潜在用户,可以考虑优化活动落地页转化,或尝试营销唤起。
Cluster 3 的特点
事件名称 | 发生平均次数 | cluster_3 |
创蓝_接收短信 | 7.81 | 24.03 |
UDC_访问页面 | 80.51 | 247.15 |
UDC_启动应用 | 27.59 | 64.28 |
小鹅通_学员签到 | 14.32 | 17.52 |
有赞_有赞搜索 | 12.94 | 16.72 |
微博_评论微博 | 16.91 | 14.85 |
智简_订单完结 | 6.58 | 0.00 |
易企秀_浏览作品 | 26.70 | 4.93 |
云片_点击短信内短链 | 5.64 | 5.13 |
微盟_购买商品 | 9.02 | 4.57 |
目睹_参与直播活动 | 5.53 | 1.84 |
有赞_有赞页面浏览 | 14.73 | 10.46 |
【特点分析】:UDC访问数据量极高,互动性一般,缺少购买。
【评价】:该群体可能为APP重度用户,也可能是机器人羊毛党,其在涉及福利活动的日常打卡,软件访问,平台搜索,页面浏览等事件上触发次数过高,后续需要结合其它数据进行进一步分析。