gpfdist工具的使用主要两步:
第一步:打开gpfdist服务:
gpfdist -d /home/admin -p 8081 -l /tmp/gpfdist.log &
参数解释:
-d 数据文件所放的目录,我这里的路径为/home/admin。
-p 设置访问gpfdist端口,这个可以根据实际情况写。
-l 设置日志文件所放的目录,这个参数也可以不用填写。
* 必须注意“&”这个符号绝对不能忘记填写,不然开始服务会失败。
如果执行成功请看下图中出现的 Serving HTTP on port 8787,directory /home/admin
第二部:编写导入的sql语句:
1)准备数据文件:
2)准备sql脚本:
create external table test001_ext ( id integer ,name varchar(128) ) Location ( ‘gpfdist://192.168.23.128:8081/test001.txt‘ ) Format ‘TEXT‘ (delimiter as ‘ ‘ null as ‘‘ escape ‘OFF‘) Encoding ‘GB18030‘ Log errors into public.test001_err segment reject limit 10 rows
Location中填写的gpfdist://服务器地址:端口/文件名称
服务器地址:就是安装linux系统的ip。
端口:就是上面自己配饰的访问gpfdist的端口。
文件名称:就是准备的数据文件名称。
format:设置加载数据文件的格式,delimiter as 定义数据之间的分隔符,这里用到的是空格, null as 定义了null用空值替换。
Encoding 设置数据的编码格式。
Log 设置了加载数据错误的日期会存放到test001_err这张表。
时间: 2024-11-10 07:16:34