血缘展示"/>
datahub lineage血缘展示
本文的datahub不是阿里的数据工具是元数据datahub
datahub官网
启动脚本可以按照官网来也可直接到源码中找到对应的docker路径下的yml文件进行启动
血缘的写法其实是python脚本最好(yml在测试中还问题,以后补充)
注意
血缘是虚假的,你脚本怎么执行,生成的血缘就是什么关系,这个的问题就是无法自动更新血缘关系
案例:源码路径metadata-ingestion/examples/library/lineage_emitter_rest.py
import datahub.emitter.mce_builder as builder
from datahub.emitter.rest_emitter import DatahubRestEmitter
lineage_mce = builder.make_lineage_mce([#参数 1 类型kafka 2 对应的topicbuilder.make_dataset_urn("kafka", "kafkadev.ATLAS_ENTITIES"),builder.make_dataset_urn("kafka", "kafkadev.ATLAS_HOOK"),],builder.make_dataset_urn("kafka", "kafkadev.ambari_kafka_service_check"),
)# 对应gms端口地址 8081为什么不能用,还没测试
emitter = DatahubRestEmitter("http://192.168.3.11:8080")
emitter.emit_mce(lineage_mce)
#意义:将kafkadev.ATLAS_ENTITIES和kafkadev.ATLAS_HOOK
#关联到kafkadev.ambari_kafka_service_check
最后执行直接使用
python 文件名
更多推荐
datahub lineage血缘展示
发布评论