hive 文件系统学习实例

Hive存储是基于hadoop hdfs文件系统的，通过默认内嵌的Derby 数据库或外部数据库系统（如mysql)组织元数据访问，下面就通过实际案例描述其存储过程。

1，在hive 中创建表，然后把外部csv文件导入其中（外部文件为Batting.csv, 内部表为temp_batting):

hive>create table temp_batting(col_value STRING);

hive> show tables;
OK
temp_batting
...

hive>LOAD DATAINPATH‘hive/data/Batting.csv‘ OVERWRITE INTO TABLE temp_batting;

2, 查看外部mysql数据库，可以看到新创建的temp_batting表：

mysql> use hive;
Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A

...

查看其在hdfs上存储路径：

可以看到是:
hdfs://localhost:9000/user/hive/warehouse/temp_batting

3，到hadoop 的hdfs文件系统中查看这个表路径：

[[email protected] rli]# hadoop dfs -ls /user/hive/warehouse
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.
...

drwxr-xr-x - root supergroup 02015-05-27 14:16 /user/hive/warehouse/temp_batting
...

[[email protected] rli]# hadoop dfs -ls/user/hive/warehouse/temp_batting

DEPRECATED: Use of this script to execute hdfs command isdeprecated.
Instead use the hdfs command for it.

Found 1 items
-rwxr-xr-x 1 root supergroup 6398990 2015-05-2714:02 /user/hive/warehouse/temp_batting/Batting.csv

可以看到其文件大小及内容。

结论：

Hive通过关联数据库系统记录文件的存储路径，属性等，实际数据存在hdfs系统中，当通过select等操作生成相应的map/reduce进程进一步数据分析处理。

时间： 2024-10-08 10:00:32

hive 文件系统学习实例

hive 文件系统学习实例的相关文章

Unix文件系统学习笔记之二：文件描述符、inode和打开文件表

FAT32文件系统学习(3) —— 数据区(DATA区)

FAT32文件系统学习(2) —— FAT表

FAT32文件系统学习(1) —— BPB的理解

Struts2+Spring+Ibatis用户注册、登录、管理入门学习实例源码下载

linux ext2 文件系统学习

文件系统学习

hive的学习入门（飞进数据仓库的小蜜蜂）

[Linux] linux文件系统学习