和测试人员对碰，自己挖的坑，含着泪也要填完!

编程入门行业动态更新时间:2024-10-14 02:19:24

和测试人员对碰，自己挖的坑，含着泪<a href=https://www.elefans.com/category/jswz/34/1763058.html style= 也要填完!"/>

和测试人员对碰，自己挖的坑，含着泪也要填完!

昨天数据接完了，想着今天交给测试就完了，应该问题不大吧，卧槽，一天没休息！

1.坑点一：数据类型不一致导致spark使用的时候报类型不匹配的错！

接入的时候是数据库的数据类型，但大家都知道hive一般都是用string类型，所以我ods和dwd层的数据表建的都是string类型，数据映射成hive表时没有报错，那你以为就没问题了，你错了！
使用spark-shell查询相同的表，hive里查没问题，使用sparksql查就报错，你说神奇不神奇，sparksql很强大呀，还可以给你检测类型呢（我内心：你，真绝，我不想检查啊！）

3.个人解决方式，在接入到ods的时候就做数据类型的处理，一了百了，皆大欢喜！，代码贴一哈


val srcDF: DataFrame = xxx  #源df字段各种类型
val columns: Array[String] = srcDF.columns
val array: Array[Column] = columns.map(column => col(column).cast("string"))
val resDF: DataFrame = srcDF.select(arrayColumn :_*) #目标df全转成string类型