操作"/>
Spark基本操作
创建 SparkSession
from pyspark.sql import SparkSessionspark = SparkSession.builder \.appName("Word Count") \.getOrCreate()
构建 sc
from pyspark.sql import SparkSessionspark = SparkSession.builder \.appName("Word Count") \.getOrCreate()sc = spark.sparkContext
创建RDD
从内存生成创建
data = sc.parallelize([('a',1),('b',
更多推荐
Spark基本操作
发布评论