标签作为目前最常见的数据资产类型之一,对于企业洞察用户图像、展开精细化操作具有重要的支持作用。企业标签体系的构建不是一朝一夕完成的,需要结合业务角度进行整体规划,更涉及到复杂的数据治理和数据资产管理等工作。本文为TechDay“治数营”第四期,与大家分享水平系统的方法论、过程及实践经验。目前,许多企业已投入或投入到自己的标签系统建设中,但由于数据未得到有效管理、没有整体标签系统计划、标签数据资产无法持续运营管理等原因,一些企业在标签系统建设过程中无法使用标签数据。面临着数据经验无法沉淀等难题。针对以上情况,个人可以深入整理自己的标签体系构建经验,最终总结企业级标签体系构建的方法论,通过简单的5个步骤完成高质量标签体系构建。

1.目标首先,我们必须根据需要制定一个标签系统的目标。根据标签的使用场景,标签体系的目的分为目的和系统目的两种。所谓目的,是指实际带来实质性收益的目的。例如,通过标签系统的应用,使用户的次日保留率提高20%。②系统目的是指使用和系统性能等方面的目的要求。例如,最终建成的标签系统/平台应能够可视化标签的创建和管理;在性能方面,可在1小时内完成1000万用户的标签计算和目标圈选择。2.标签系统在达到标签系统的目的之后,接下来开始标签系统的顶部。其中,以下几个核心问题值得关注1.如何确定标签目录我们建议企业充分结合业务需求和数据资产状况来确定标签目录,通过“业务+数据”共同驱动标签目录的生产。业务驱动比较了解,即根据业务要求确定生产的标签,例如企业需要创建“风险账户”和“黑名单”等标签以提高风险识别能力;为了提高收费转化率,可以制作“商品偏好”和“价格敏感度”等标签。数据驱动是指基于数据资产的标签要求。一般来说,业务人员倾向于专注于业务,而对底层数据情况知之甚少。这需要数据开发工程师、数据分析师等的深入介入,从数据资产中挖掘和提取有价值的标签,例如基于场景偏好数据,提取常驻地、旅游地偏好等标签;基于电子商务APP端内数据,提取消费水平、消费偏好等标签。值得注意的是,企业在实际设计标签目录和标签系统的过程中,不仅仅是简单的业务驱动或简单的数据驱动就能实现,而是业务方和数据方不断沟通,将业务需求与数据资产状况相匹配,最终完成一份标签目录的设计。关于经验总结标签,经常会遇到以下两种常见情况。误区1:标签越多越好。实际上,事务方不需要过多的标签,一般来说20%的标签可以满足事务方80%的需求。误解2:标签越先进越好。一些算法工程师或技术人员经常花费大量时间优化模型,构建复杂的模型标签。其实,标签、标签做好,基本上可以满足绝大多数方的需求。因此,企业在建立标签体系的过程中,需要考虑输入输出比,评估标签的实际应用需求强度,衡量不同标签对业务改进的效果。2.目前的数据基础能否支持标签体系建设数据建设是标签体系的基石,企业只有打好数据基础,才能构建高质量的标签体系。因此,在建立标签系统之前,企业需要对数据进行全面管理,提高数据的质量和可用性。

3.如何确定标签规则根据生产方式的不同,标签可分为事实标签、规则标签、模型标签等类型。事实标签的规则定义比较简单,数据分析师在理解业务数据的基础上,只要从业务侧的原始数据中提取即可。例如,从用户注册信息中提取标签,如用户的源渠道、性别和年龄。规则标签具有非常强的业务属性,需要业务人员和数据分析人员一起进行分析搜索,基于原始数据进行标签规则的制作和连接。例如,创建“大学生”标签,需要从各个维度对“大学生”进行特征,例如年龄方面一般在18-25岁之间,在线应用方面安装大学生管理类App等。个推一日数平台DIOS实现了智能特征洞察,结合自我标签体系建设实践及服务行业客户经验,个推一发现标签规则的定义是企业在构建标签体系过程中普遍面临的痛点、难点。即使是由数据分析师和业务专家组成的专业团队也需要花费大量时间和精力来理解数据和用户之间的关联,并从中提取标签规则。为了提高企业客户的标签生产效率,开发的数据智能操作系统-模型标签通常是参考现有的事实数据来预测群体偏好、特征和分类,以便根据用户损失群体的特征来预测其他用户群体的损失概率。一般来说,当事实标签和规则标签的覆盖范围、饱和度、准确度等不足时,就需要建立模型标签,以满足相关业务需求。DIOS是零代码构建机器学习模型传统的模型标签制作过程仍然比较复杂,涉及算法开发、模型构建和模型调整等复杂工作。DIOS将其建模方法“五步”商业化,实现了零代码建模能力,没有编程经验的工作人员也可以通过DIOS的可视化界面进行拖放,快速完成机器学习模型的构建。3.标签开发完成整体的标签系统,然后进入标签开发环。一般来说,标签开发的过程可以分解为过程开发、过程测试、过程在线等三个阶段。在工程开发阶段,研发工程师根据标签规则及数据源情况进行工程开发;然后由试验工程师结合业务要求及工程结果对标签质量进行试验验收,确保标签的准确性后最终进行生产。这涉及到一个非常重要的问题:如何验证新构建的标签的准确性。

有三种常用的验证方法:1.通过TGI进行逻辑完整性验证。例如,我们重新构建了一个男性标签,发现通过TGI贴上男性标签的人群中有很大一部分也被贴上了女性标签,这显然是一个非常不合理的现象。描述使用第三方平台。例如,通过广点通,使用第三者数据进行精度的验证。让我们做广告。在不同标签下围绕目标人群进行A/B测试,并根据投放结果验证标签的准确性。一旦完成工程测试和标签准确性验证,标签系统就可以正式在线运行了。我们建议企业首先在实际业务场景中进行小范围的多次检查,然后进行大规模的标签体系在线化,避免后期发生大范围的调整和变更。

4.标签的全生命周期管理作为重要的数据,还需要在标签系统联机后,对标签进行全生命周期的化管理。此外,我们建议企业建立标签质量保证体系,建立负责人制度,确保标签第一负责人及时应对相关事项;整理标签开发、阵容流程和经验,后续标签开发、测试、实现阵容等流程的规范化和标准化;更系统地进行标签质量监视,例如通过定时工序监视标签计算工序、度量、饱和度等信息。应用与反馈建立企业标签体系的最终目的是服务业务。有几种常见的标签业务应用场景:1.开发数据产品。例如,智能推荐系统基于标记大数据和算法。特征洞察力和目标群体的圈子选择。例如,一推基于自身数千种标签和亿级特征数据,对品牌所有者、APP进行细分人群的图像分析,并使用不同标签组合,智能圈选择符合目标特征的人,向客户做广告,提供触摸用户的支持。改善你的业务。一旦对目标人群的图像洞察完成,就可以进行更精细的操作。例如,品牌所有者可以针对具有不同兴趣偏好的消费者群体制定差异化的广告素材,选择不同的媒体平台,提高广告的效果。

针对不同场合的标签应用结果,企业需要做好后效分析,科学评价标签质量、覆盖度等,对新产生的下游数据进行入库处理,得到对整个标签体系生命周期的系统化管理控制,真正实现数据资产的持续增值。以上是TechDay“治数营”第四期直播内容,大家可以通过观看直播进一步理解标签体系的相关要点。您的位置:知道爆料馆>地区>广东>关注个推技术实践微信公众号,背景回复“标签”,取得本期生广播课件~2022年即将结束,个推TechDay“治数训练营”系列直播课程第一季也将正式结束!请大家关注个推技术实践视频号码,观看过去的精彩课程。