admin管理员组

文章数量:1566355

        在前面几篇博客中,博主已经为大家带来了什么是用户画像,以及项目的一个基础介绍。用户画像的核心就是打标签,本篇博客,我们来聊聊关于这个项目的标签系统。

文章目录

    • 1. 标签系统
      • 1.1 基础标签
        • 1.1.1、概览:基础标签
        • 1.1.2、新建:主分类标签
        • 1.1.3、新建:业务标签
        • 1.1.4、存储:标签数据
        • 1.1.5、新建:5级标签
        • 1.1.6、总述:新建标签
      • 1.2、组合标签
      • 1.3、微观画像
      • 1.4、标签查询
    • 小结


1. 标签系统

1.1 基础标签

1.1.1、概览:基础标签

        启动WEB 项目后,浏览器登录,默认账号与密码,点击【登录】即可,下图所示:

        进入系统后,直接显示【基础标签】页面,重要功能如下所示:


        上述所表述的5个按钮,主要构建标签、查看标签和编辑标签,具体说明如下:

    1、基础标签 Tag页
    
    2、基础标签 分类
    	按照标签体系划分标签为4级、5级标签
    	- 4级标签:业务标签
    	- 5级标签:业务标签对应的值(属性标签)
    
    3、新建主分类标签
    	1级、2级、3级分类标签
    	
    4、创建业务标签
    	具体业务标签,其中有很多相关设置,关于标签如何构建(读取数据源、运行Spark程序及调度策略)
    	
    5、针对业务标签操作
    	- 启动:业务标签运行程序生成标签
    	- 编辑:修改业务标签属性
    	- 删除:将业务标签删除
1.1.2、新建:主分类标签

        用户画像构建时,标签按照等级划分,大致如下所示:

        在WEB界面上,点击左下角【新建主分类标签】按钮,即可新建1级、2级和3级标签:

         但是如果要删除1级、2级和3级标签,必须到后台数据库删除。

1.1.3、新建:业务标签

        新建某个业务标签(实际开发标签,编写Spark 应用程序),截图选项如下:


        具体参数说明如下(以新建【年龄段】业务标签为例):

1、标签名称:年龄段
	
2、标签分类:商城-某商城-人口属性
	业务标签属于4级标签,所以分类时指定所属3级标签

3、更新周期:每天#2019-08-01 01:00#2029-08-01 01:00
	多久执行一次Spark任务
	
4、业务含义:注册用户的生日所属年龄段
	业务标签含义说明

5、标签规则:Key=Value形式,按照换行符分割
    inType=hbase
    zkHosts=192.168.10.20
    zkPort=2181
    hbaseTable=tbl_users
    family=info
    selectFieldNames=id,gender
    
6、程序入口:cn.itcast.tag.commons.models.pub.business.AgeRangeModel
	Spark Application程序的全名称

7、算法名称:Statistics
	业务标签计算模型类型:统计-Statistics、规则匹配-Match、挖掘-具体算法-DecisionTree、KMeans
	
8、算法引擎:/apps/tags/models/tag_9/lib/tags-20190703231621.jar
	Spark应用程序JAR包,通过页面选择jar包,上传到HDFs目录中

9、模型参数:Spark 应用程序执行资源参数设置
	--deploy-mode cluster --driver

本文标签: 企业级画像标签数据用户