小记"/>
大数据-mapreduce-shuffle阶段包含的步骤-小记
partition(分区):
对map输出的key,value 的list进行分区
sort(排序):
对各个分区后的数据进行排序
combiner(优化):
在map端进行数据的局部聚合
group(合并):
将相同key的key作为唯一的key
将相同key对应的value提取出来组成一个value的list
更多推荐
大数据-mapreduce-shuffle阶段包含的步骤-小记
发布评论