Spark
介绍
- 由Scala写成
原理
- 迭代数据可以保存在内存
体系
Spark Streaming(批处理)
实例
Word Count
JavaRDD<String> textFile = sc.textFile("hdfs://...");
JavaPairRDD<String, Integer> counts = textFile
.flatMap(s -> Arrays.asList(s.split(" ")).iterator())
.mapToPair(word -> new Tuple2<>(word, 1))
.reduceByKey((a, b) -> a + b);
counts.saveAsTextFile("hdfs://...");
http://spark.apache.org/examples.html