通过hadoop上的hive完成WordCount
启动hadoop
Hdfs上创建文件夹
创建的文件夹是datainput
上传文件至hdfs
启动Hive
创建原始文档表
导入文件内容到表docs并查看
用HQL进行词频统计,结果放在表word_count里
查看统计结果
原文地址:https://www.cnblogs.com/wxf2/p/9042306.html
时间: 2024-10-15 18:34:36
通过hadoop上的hive完成WordCount
启动hadoop
Hdfs上创建文件夹
创建的文件夹是datainput
上传文件至hdfs
启动Hive
创建原始文档表
导入文件内容到表docs并查看
用HQL进行词频统计,结果放在表word_count里
查看统计结果
原文地址:https://www.cnblogs.com/wxf2/p/9042306.html