有人提出要将4张表合并成一张。数据量比较大,有4千万条数据。有很多重复数据,需要对某一列进行去重。
思路:
1、导出数据。select into outfile。
2、传输到要导入数据的服务器上。
3、创建一张新表,主键和约束等与那三张表一样。
4、LOAD DATA INFILE导入。利用replace参数进行覆盖达到去重的目的。
LOAD DATA INFILE ‘/backup/tbl_get.csv‘ replace INTO TABLE emob.tbl_new;
LOAD DATA INFILE ‘/backup/tbl_jue.csv‘ replace INTO TABLE emob.tbl_new;
LOAD DATA INFILE ‘/backup/tbl_ors.csv‘ replace INTO TABLE emob.tbl_new;
原文地址:https://www.cnblogs.com/magmell/p/8855907.html
时间: 2024-10-06 21:52:22