使用DataX将.csv文件的数据读入Mysql数据库

一:DataX下载

下载页面地址:https://pan.baidu.com/s/10J83j25_ohC4O3XHl9diDQ

提取码: cq6n

二:安装

将下载后的压缩包直接解压安装到电脑上就可以了

三:测试

要想运行datax先要安装python环境:

检验是否存在python环境在cmd中输入python就会知道如果已经有python环境就如下所示出现版本等信息;

进入安装好的datax目录下bin目录中,里面有datax.py文件,可以在cmd中测试(此处是我自己的目录,具体根据自己的目录来输入命令):

python E:\大数据清洗工具\DataX\datax\bin\datax.py E:\大数据清洗工具\DataX\datax\job\job.json

下面是成功截图

以上运行结果乱码:在命令行输入:

       CHCP 65001

另外,如果你的python版本是3.x的话,则需要修改一下bin文件夹下的三个.py文件,参考链接地址为:https://github.com/HxYyWw/DatatX_python3/tree/master

四:应用(csv文件写入mysql)

csv文件

数据库建表

test.json文件

{
    "job": {
        "setting": {
            "speed": {
                "channel": 3
            }
        },
        "content": [
            {
                 "reader": {
                    "name": "txtfilereader",
                    "parameter": {
                        "path":["C:/Users/ASUS/Desktop/test.csv"],
                        "encode":"gbk",
                        "column" : [
                            {
                                "index":0,
                                "type":"string"
                            },{
                                        "index":1,
                                "type":"string"
                            }
                        ],
                        "fieldDelimiter":","
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "writeMode": "insert",
                        "username": "root",
                        "password": "995893",
                        "column": [
                            "name",
                            "value"
                        ],
                        "preSql": [
                            "truncate table datax"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=utf-8",
                                "table": [
                                    "datax"
                                ]
                            }
                        ]
                    }
                }
            }
        ]
    }
}

其中test.json文件主要的两部分:reader和writer两部分。

    1,reader解读

      “name”属性对应着读取对象的类型

      “parameter”中path属性对应读取对象的路径、encode属性对应读取对象的编码、column属性对应读取对象的表头(其中index属性对应表头的字段顺序,type对应字段的类型)、filedDelimiter属性对应读取对象的分隔符。

    2,writer解读

      “name”属性对应着读取对象的类型

      “parameter”中writeMote属性表示操作、username属性对应MySQL的用户名、password对应MySQL的密码、column对应的是表头字段(注:这里的字段顺序需要和读取对象的顺序一样)、preSql属性表示写入前进行的sql语句、connection属性中jdbcUrl表示数据库的连接路径,table表示表名

cmd运行命令:

1 python E:\大数据清洗工具\DataX\datax\bin\datax.py E:\大数据清洗工具\DataX\datax\job\test.json

  运行结果:

数据库中

如果连接数据库失败了,可能是没有jar包,在lib里放上连接Mysql数据库的jar包就好了。

原文地址:https://www.cnblogs.com/lover995/p/12411352.html

时间: 2024-10-08 12:06:35

使用DataX将.csv文件的数据读入Mysql数据库的相关文章

从csv文件导数据到MySQL

导入: load data local infile 'D:\\top-1m.csv'    (注意要加上local)10.21.into table `site` fields terminated by ',' optionally enclosed by '"' escaped by '"' lines terminated by '\n'; 导出: select * from `site` into local outfile 'D:\\top-1m.csv' fields t

C++ 把数组数据存入 CSV 文件,以及读取 CSV 文件的数据

1. CSV-百度百科 2. 代码 #pragma once //Microsoft Visual Studio 2015 Enterprise #include<iostream> #include<fstream> #include<string> #include<vector> #include<cstdio> #include<cstdlib> using namespace std; template<typenam

将csv格式数据导入MySql数据库

 将csv文件或者excel表格导入数据库的方法: Excel数据直接导入mysql会需要用到phpexcel开源类,详情使用可以参考这篇文章~ http://www.cnblogs.com/freespider/p/3284828.html 本文使用的方法是: Excel --> CSV-->MySql 首先将excel另存为csv文件,然后开始分析数据. 代码如下: <span style="font-size:18px;"><?PHP //将csv文

csv文件或者excel表格导入数据库

 将csv文件或者excel表格导入数据库的方法: Excel数据直接导入mysql会需要用到phpexcel开源类,详情使用可以参考这篇文章~ http://www.cnblogs.com/freespider/p/3284828.html 本文使用的方法是: Excel ——> CSV——>MySql 首先将excel另存为csv文件,然后开始分析数据. 代码如下: 1 <span style="font-size:18px;"><?PHP 2 //将

csv文件快速转存到mysql

目录 csv文件快速转存到mysql 连接数据库 读取csv文件内容: 创表: csv数据导入样式: 完整脚本: csv文件快速转存到mysql 连接数据库 连接数据库: con = pymysql.connect(user="root", passwd="root", db="test", host="47.95.xxx.xxx", local_infile=1) 将csv批量写到数据库,需要设置local_infile参数

将Excel数据导入mysql数据库的几种方法

将Excel数据导入mysql数据库的几种方法 “我的面试感悟”有奖征文大赛结果揭晓! 前几天需要将Excel表格中的数据导入到mysql数据库中,在网上查了半天,研究了半天,总结出以下几种方法,下面和大家分享一下: 一.用java来将Excel表格中的数据转到mysql中 这是我们用的第一种方法,就是在java找你感谢个类,然后这个类会将Excel表格中的数据存储到内存里,然后再从内存中读出来插入到数据库中,但是要 注意了,这里是存储到String[ ]数组里面,所以取出来的数据也是Strin

PHP如何通过SQL语句将数据写入MySQL数据库呢?

1,php和MySQL建立连接关系 2,打开 3,接受页面数据,PHP录入到指定的表中 1.2两步可直接使用一个数据库链接文件即可:conn.php <?phpmysql_connect("localhost","root","");//连接MySQLmysql_select_db("hello");//选择数据库?> 当然,前提是已经安装WEB服务器.PHP和MySQL,并且建立MySQL表“webjx” mys

Shell_mysql命令以及将数据导入Mysql数据库

连接MYSQL数据库 mysql -h${db_ip} -u${db_user} -p${db_pawd} -P${db_port} -D${db_name} -s -e "${sql}" db_ip:主机地址 db_user :数据库用户名 db_pwd:密码 db_port:端口号 db_name:数据库名称 sql:执行语句[增删查改] 将数据导入MYSQL数据库 load data [local] in file '${data_source}' into table ${ta

将pandas的DataFrame数据写入MySQL数据库 + sqlalchemy

将pandas的DataFrame数据写入MySQL数据库 + sqlalchemy [python] view plain copy print? import pandas as pd from sqlalchemy import create_engine ##将数据写入mysql的数据库,但需要先通过sqlalchemy.create_engine建立连接,且字符编码设置为utf8,否则有些latin字符不能处理 yconnect = create_engine('mysql+mysql