Apache Spark是一个大规模数据处理的统一分析引擎。
Apache Spark运行工作载荷在100倍速以上。
Apache Spark的组件包括:Spark SQL、Spark Streaming、MLib、GraphX。
Apache Spark应用模式:standalone、cluster mode, on EC2, on Hadoop YARN, on Mesos, or on Kubernetes。
Apache Spark可存取数据: Access data in HDFS, Alluxio, Apache Cassandra, Apache HBase, Apache Hive, and hundreds of other data sources。
Apache Spark主页: http://spark.apache.org/
原文地址:https://www.cnblogs.com/springwind2020/p/12344616.html
时间: 2024-11-12 18:23:47