概论
B KB MB GB TB PB EB ZB
大数据的三大特征
数量(Volume)
种类(Variety)
速度(Velocity)
Apache Hadoop 黄色大象。
Apache Lucene
Nutch 网页抓取、解析功能。大规模分布式集群。负载均衡。
2003年Google两篇论文:
- Google File System
- MapReduce:Simplified Data Processing on Large Clusters
时间: 2024-10-13 01:40:21