启动spark-shell:
简单的RDD:
上述代码中使用的sc,这是Spark-Shell帮助我们自动生成的SparkContext的实例:
我们把生成的RDD的每个元素都乘以3:
上述的操作都是transformations我们需要触发一个action才能执行:
我们可以看到预期结果,但我们可以看到collect操作返回的是一个Array,所以数据不要太多,否则会出现OOM
下面执行下filter操作:
真的spark编程应该是完全函数式的,我们把上述操作用一行代码搞定:
时间: 2025-01-11 15:18:13