Mysql批量插入返回Id错乱（原因分析）

在项目中经常会有如下场景：

往数据库中批量插入一批数据后，需要知道哪些插入成功，哪些插入失败了。

这时候往往会有两种思路，一个是在插入之前判断相同的记录是否存在，过滤掉重复的数据；另外一种就是边插入边判断，动态过滤。

第一种方式对于数据量过大的情况并不适用，为了采用第二种方法，我们使用了“Mybatis批量插入返回自增主键”的方式进行处理。

mysql插入操作后返回主键是jdbc的功能，用到的方法是getGeneratedKeys()方法，使用此方法获取自增数据，性能良好，只需要一次交互。

        String sql = "insert IGNORE into user(user_name,password,nick_name,mail) VALUES (?,?,?,?)";
        List<User> userList = Lists.newArrayList();
        userList.add(new User("2","2","2","2"));
        userList.add(new User("3","3","3","3"));
        userList.add(new User("4","4","4","4"));

        try {
            conn = DatabaseUtil.getConnectDB();
            ps = conn.prepareStatement(sql,PreparedStatement.RETURN_GENERATED_KEYS);
            for(User user : userList){
                ps.setString(1, user.getUserName());
                ps.setString(2, user.getPassword());
                ps.setString(3, user.getNickName());
                ps.setString(4, user.getMail());
                ps.addBatch();
            }
            ps.executeBatch();

            ResultSet generatedKeys = ps.getGeneratedKeys();
            ArrayList<Integer> list = Lists.newArrayList();
            while (generatedKeys.next()){
                list.add(generatedKeys.getInt(1));
            }
        } catch (SQLException e) {
            LOGGER.error("error:{}", e.getMessage(), e);
        } finally {
            DatabaseUtil.close(conn, ps, null);
        }

getGeneratedKeys()返回的就是刚刚生成的id。

相应的如果在mybatis中使用的话，只需要在mybatis的mapper文件中设置参数“keyProperty="id" useGeneratedKeys="true"”即可。例如：

   <insert id="insertListSelective" keyColumn="id" keyProperty="id"
            parameterType="Bill" useGeneratedKeys="true">

   </insert>

为了满足我们的需求，我们需要对上述sql进行改造，思路就是在批量插入的时候，如果遇到重复的数据，就忽略，继续插入下一个记录，这时我们采用的是ignore：

MySQL 提供了Ignore 用来避免数据的重复插入.

IGNORE :
若有导致unique key 冲突的记录，则该条记录不会被插入到数据库中.
示例:
INSERT IGNORE INTO `table_name` (`email`, `phone`, `user_id`) VALUES (‘[email protected]‘, ‘99999‘, ‘9999‘);
这样当有重复记录就会忽略,执行后返回数字0

但是经过多次测试发现，对象返回的id错乱。

对于上述情况，如果没有重复数据就不会出现问题，于是就猜测是因为ignore的原因，经过查看源码，验证了自己的想法：

public void processBatch(MappedStatement ms, Statement stmt, Collection<Object> parameters) {
    ResultSet rs = null;
    try {
      rs = stmt.getGeneratedKeys();
      final Configuration configuration = ms.getConfiguration();
      final TypeHandlerRegistry typeHandlerRegistry = configuration.getTypeHandlerRegistry();      //指的是keyProperty="id" 这种参数
      final String[] keyProperties = ms.getKeyProperties();      //ResultSet的元数据，指的是有关 ResultSet 中列的名称和类型的信息。
      final ResultSetMetaData rsmd = rs.getMetaData();
      TypeHandler<?>[] typeHandlers = null;
      if (keyProperties != null && rsmd.getColumnCount() >= keyProperties.length) {
        for (Object parameter : parameters) {
          // there should be one row for each statement (also one for each parameter)
          if (!rs.next()) {
            break;
          }
          final MetaObject metaParam = configuration.newMetaObject(parameter);
          if (typeHandlers == null) {
            typeHandlers = getTypeHandlers(typeHandlerRegistry, metaParam, keyProperties, rsmd);
          }          //设置返回的keyProperty（反射）
          populateKeys(rs, metaParam, keyProperties, typeHandlers);
        }
      }
    } catch (Exception e) {
      throw new ExecutorException("Error getting generated key or setting result to parameter object. Cause: " + e, e);
    } finally {
      if (rs != null) {
        try {
          rs.close();
        } catch (Exception e) {
          // ignore
        }
      }
    }
  }

private void populateKeys(ResultSet rs, MetaObject metaParam, String[] keyProperties, TypeHandler<?>[] typeHandlers) throws SQLException {  for (int i = 0; i < keyProperties.length; i++) {    String property = keyProperties[i];    TypeHandler<?> th = typeHandlers[i];    if (th != null) {      Object value = th.getResult(rs, i + 1);      metaParam.setValue(property, value);    }  }}

注意代码中的这一句注释： // there should be one row for each statement (also one for each parameter) ，翻译过来就是每一个元素对应一个ResultSet

分析这段循环代码：

for (Object parameter : parameters) {
          // there should be one row for each statement (also one for each parameter)
          if (!rs.next()) {
            break;
          }
          final MetaObject metaParam = configuration.newMetaObject(parameter);
          if (typeHandlers == null) {
            typeHandlers = getTypeHandlers(typeHandlerRegistry, metaParam, keyProperties, rsmd);
          }
          //设置返回的keyProperty（反射）
          populateKeys(rs, metaParam, keyProperties, typeHandlers);
}

循环遍历要插入的元素，然后通过反射方式设置主键的值，但是注意每次遍历插入元素的时候，ResultSet也在往下遍历，这时候就有问题了：
stmt.getGeneratedKeys()永远返回的都是插入成功的记录的id，如果插入的集合中有几个重复的元素，这时候插入的集合元素与返回的ResultSet就对应不上了，所以才会造成之前的那个问题。

为了避免上述的问题，现在我们采用的方式是单条插入，挨个返回id。

原文地址：https://www.cnblogs.com/haolnu/p/8290078.html

时间： 2024-08-04 10:17:13

Mysql批量插入返回Id错乱（原因分析）的相关文章

MYSQL批量插入数据库实现语句性能分析

假定我们的表结构如下代码如下 CREATE TABLE example ( example_id INT NOT NULL, name VARCHAR( 50 ) NOT NULL, value VARCHAR( 50 ) NOT NULL, other_value VARCHAR( 50 ) NOT NULL ) 通常情况下单条插入的sql语句我们会这么写: 代码如下 INSERT INTO example (example_id, name, value, other_value)

mysql批量插入数据

review代码发现,同事mysql批量插入数据的实现方法是,用for循环遍历,将列表每个数据单次插入.相当于批量插入N条数据,进行了n次的数据库连接和插入操作. 底层有批量插入的方法,但是会有问题,所以已经停用,看下面实现是,取到一个数据库连接,来处理后面所有的插入操作.若这个列表ops所有的sql语句执行的数据库都是同一个的话,就没什么问题,若里面存在散库的情况,只要跟第一个不在同一个库的,都会执行失败. public void insertBatch(List<OpBatchUpdate>

MySql批量插入与唯一索引问题

MySQL批量插入问题在开发项目时,因为有一些旧系统的基础数据需要提前导入,所以我在导入时做了批量导入操作 ,但是因为MySQL中的一次可接受的SQL语句大小受限制所以我每次批量虽然只有500条,但依然无法插入,这个时候代码报错如下: nested exception is com.mysql.jdbc.PacketTooBigException: Packet for query is too large (5677854 > 1048576). You can change this va

JavaScript中的ParseInt("08")和“09”返回0的原因分析及解决办法

今天在程序中出现一个bugger ,调试了好久,最后才发现,原来是这个问题. 做了一个实验: alert(parseInt("01")),当这个里面的值为01====>07时都是正常的,但是在"08","09"就会返回0 (这种现象出现在ie内核的浏览器中,如360浏览器就会出现这种错误)(谷歌,火狐不受影响). 查阅资料得知着这种现象原因: 大神的解释: 01--07自然没有问题,但是09,08都是不合格的八进制形式,所以被按照0处理了.

java mysql大数据量批量插入与流式读取分析

总结下这周帮助客户解决报表生成操作的mysql 驱动的使用上的一些问题,与解决方案.由于生成报表逻辑要从数据库读取大量数据并在内存中加工处理后在生成大量的汇总数据然后写入到数据库.基本流程是读取->处理->写入. 1 读取操作开始遇到的问题是当sql查询数据量比较大时候基本读不出来.开始以为是server端处理太慢.但是在控制台是可以立即返回数据的.于是在应用这边抓包,发现也是发送sql后立即有数据返回.但是执行ResultSet的next方法确实阻塞的.查文档翻代码原来mysql驱动默

MySQL批量插入的分析以及注意事项

目录 1.背景 2.两种方式对比 2.1.一次插入一条数据 2.2.一次插入多条数据 3.拓展一下 4.Other 1.背景我们在工作中基本都会碰到批量插入数据到DB的情况,这个时候我们就需要根据不同的情况选择不同的策略. 只要了解sql,就应该知道,向table中插入数据的命令,至少有insert和replace这两种,使用哪一种命令,和自己的业务有关: 本文就针对insert进行批量插入进行阐述,然后根据自身经历分享几个注意事项. 2.两种方式的对比即使是insert命令,他也是有多种插

PHPexcel 导入import 数据到 mysql: mysql 查询数据是否存在, 如果存在返回id, 不存在, 插入返回id. 2) mysql_query , mysql_connect, mysql_select_db, mysql_error, mysql_num_rows,mysql_close

一: 要求: 上面的图表中的数据插入到 3张表中. 1)t_vide_warehourse 分类表: 此表中包含一级分类和二级分类. 二级分类是一级分类的子级. 2)t_video_info 包名表此表管理第一张表. 并且只有第二次分类才可以有包名 . 一个二级分类下可以有多个包. 3)t_video_file 文件表. 此表关联第二张表; 一个包下可以有多个文件. ----------------------------------

Mybatis+mysql批量插入性能分析测试

前言今天在网上看到一篇文章(后文中的文章指的就是它) https://www.jianshu.com/p/cce617be9f9e 发现了一种有关于mybatis批量插入的新方法,而且看了文章发现我原来的方法好像有点问题,但是由于文章中使用的环境是sqlserver而我经常使用的是mysql所以还是需要亲自来试试. 环境说明项目使用springboot mybatis 数据库mysql5.7 使用本地mysql所以网络可以忽略不计插入对象完全相同,只有id自增表结构如下: CREATE

MySQL批量插入数据的几种方法

最近公司要求测试数据库的性能,就上网查了一些批量插入数据的代码,发现有好几种不同的用法,插入同样数据的耗时也有区别别的先不说,先上一段代码与君共享方法一: package com.bigdata; import java.sql.Connection; import java.sql.Driver; import java.sql.DriverManager; import java.sql.PreparedStatement; public class TestBigData { /**