DataProc不解压缩作为存档传递的文件

编程入门 行业动态 更新时间:2024-10-24 22:18:00
本文介绍了DataProc不解压缩作为存档传递的文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧! 问题描述

我正在尝试使用.NET电光作业提交数据过程。

命令行如下所示:

gcloud dataproc jobs submit spark --cluster=<cluster> --region=<region> --class=org.apache.spark.deploy.dotnet.DotnetRunner --jars=gs://bucket/microsoft-spark-2.4.x-0.11.0.jar --archives=gs://bucket/dotnet-build-output.zip -- find

此命令行应调用find函数以显示当前目录中的文件。

我只看到2个文件:

././microsoft-spark-2.4.x-0.11.0.jar ././microsoft-spark-2.4.x-0.11.0.jar.crc 最终,GCP不会从指定为--archives的存储中解压该文件。指定的文件存在,并且路径是从GCP UI复制的。此外,我还尝试从存档文件(存在)中运行确切的程序集文件,但失败的原因是File does not exist

推荐答案

正如@daang提到的--archives和--files参数不会将zip文件复制到驱动程序实例,因此这是错误的方向。

我使用此方法:

gcloud dataproc jobs submit spark --cluster=<cluster> --region=<region> --class=org.apache.spark.deploy.dotnet.DotnetRunner --jars=gs://<bucket>/microsoft-spark-2.4.x-0.11.0.jar -- /bin/sh -c "gsutil cp gs://<bucket>/builds/test.zip . && unzip -n test.zip && chmod +x ./Spark.Job.Test && ./Spark.Job.Test"

更多推荐

DataProc不解压缩作为存档传递的文件

本文发布于:2023-11-16 20:53:31,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1607421.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:不解   文件   DataProc

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!