模型的目标并非要立即指控谁,而是要回答几个核心问题:
1. 量化问题:在当前的用户增长体系中,到底有多少资源(金钱、注意力、产品功能)被消耗在无法产生真实长期价值的动作上?其具体比例和成本是多少?
2. 定位问题:这些“无效动作”主要集中在哪些环节(渠道、活动、补贴策略、甚至产品设计)?其特征模式是什么?
3. 归因问题:是什么机制(考核指标、协作模式、利益结构)导致了这些无效动作的滋生和持续?
4. 预测与优化问题:基于历史数据,能否预测不同策略可能带来的“有效用户”与“无效动作”比例?能否为资源分配提供更优的决策依据?
他将这个私人项目命名为“UVAR模型”——用户价值真实度评估模型。模型构建分为几个核心步骤,完全在本地或利用公司数据平台的非敏感、聚合后数据进行,避免触及个人隐私和商业机密红线。
第一步:重新定义“用户价值”与“动作有效性”。
古民意识到,直接使用公司现有的“活跃用户”、“新增用户”等指标,无法有效区分价值。他需要建立一套更贴近真实商业价值的、可追踪的“用户价值分层体系”。
他基于用户行为数据,尝试构建一个“用户潜在价值评分”。这个评分是多个行为信号的加权综合,包括:
? 身份真实性信号:注册信息完整度、设备与IP的常规性、反作弊系统评分。
? 参与深度信号:访问频率、会话时长、核心功能使用率、搜索与浏览深度、互动行为(点赞、收藏、分享)。
? 转化质量信号:订单数量、客单价、补贴依赖度(使用补贴订单占比)、跨品类购买情况、复购间隔。
? 长期价值信号:留存曲线衰减率、预测的长期生命周期价值。
他使用历史数据,通过聚类分析和简单的回归模型,为每个注册用户计算一个初始的潜在价值评分(0-100分)。评分并非绝对精确,但足以将用户粗略分层:高潜、中潜、低潜、疑似无效/虚假。
同时,他将“动作”定义为:任何旨在获取、激活、留存用户的运营或产品行为,如一次广告投放、一个补贴活动、一个新功能上线、一次推送通知。每个“动作”都会关联一批受影响用户。动作的“有效性”,则通过观察受该动作影响的用户群体,其“潜在价值评分”的分布变化、以及后续真实转化行为(如付费、高粘性使用)的增量来评估。一个高“无效动作”嫌疑的行为,可能带来大量低价值评分用户,但对高价值用户无显著提升,甚至可能因打扰而损害高价值用户体验。
第二步:建立“渠道-动作-用户价值”追踪链路。
这是技术上的难点。他需要将广告投放数据(渠道、计划、创意、费用)、用户行为数据(从点击、注册到后续所有互动)、以及交易数据,在遵守数据安全规定的前提下进行跨表关联和分析。
他利用公司数据平台的用户唯一标识体系,构建了一条从“广告曝光/点击”到“用户注册”再到“长期行为”的虚拟链路。由于用户可能通过多个渠道接触,归因模型复杂。他采用行业通用的“最后一次点击归因”作为主要分析基准,同时辅助分析“首次点击”和“线性归因”下的差异,以了解渠道协同与价值分布。
对于非广告动作,如运营活动、产品功能改版,他则通过A/B测试框架的历史数据,或特定时间段内的用户行为对比来分析。
第三步:识别无效动作的模式与特征。
在能够追踪动作与用户价值关联后,古民开始系统性地扫描历史数据,寻找“无效动作”的模式。他定义了若干警报特征:
? 价值倒挂:用户获取成本(CAC)低于行业或内部常识性阈值,但带来的用户群体中,低价值评分用户比例异常高(例如超过40%)。这强烈暗示可能存在刷量或吸引纯羊毛·党。
? 行为坍缩:某个动作带来的用户,在特定时间点(如补贴结束后的第1天、第7天)出现行为数据的断崖式下跌,且后续无回升。表明该动作只刺激了短期、非持续性·行为。
? 同质化异常:来自同一渠道或同一类型动作的用户,其行为序列高度同质化(如注册后完成完全相同的、最小化的任务序列后沉寂),不同于自然增长用户行为的随机分布。
? 增益缺失:某个旨在提升用