spark 插入数据到mysql时遇到的问题 org.apache.spark.SparkException: Task not serializable

报错问题：Exception in thread "main" org.apache.spark.SparkException: Task not serializableCaused by: java.io.NotSerializableException: org.apache.commons.dbcp2.PoolingDataSource$PoolGuardConnectionWrapper

出错的代码：

def saveMonthToMysql(everymonth_avg:RDD[(String, Float, String)])={
  DBs.setup()
  DB.localTx(implicit session =>{
    everymonth_avg.foreach(r=>{
      SQL("insert into price_month(name, avgprice, uploaddate) values(?,?,?)")
        .bind(r._1,r._2,r._3)
        .update()
        .apply()
    })
  }
  )
}

猜测原因可能是传入RDD了解决方法：

新建一个scala class  saveMonthToMysql放到里面并且将传入的参数改成

(String, Float, String)而不是

RDD[(String, Float, String)])

object Save {
  DBs.setup()
def saveMonthToMysql(everymonth_avg:(String, Float, String))={
    DB.localTx(implicit session =>{
      SQL("insert into price_month_copy1(name, avgprice, uploaddate) values(?,?,?)")
        .bind(everymonth_avg._1,everymonth_avg._2,everymonth_avg._3)
        .update()
        .apply()
    }
    )
  }
  }

使用的时候用rdd调用就可以

everymonth_avg.foreach(x=>{
      Save.saveMonthToMysql(x)
    })

原文地址：https://www.cnblogs.com/lq0310/p/10880691.html

时间： 2024-11-05 11:43:14

spark 插入数据到mysql时遇到的问题 org.apache.spark.SparkException: Task not serializable的相关文章

java插入数据至mysql数据库报错：check the manual that coresponds to your mysql server version for the right syntax to use near 'condition)values...解决方案

MySQL5.X(本地数据库) 使用java向表中插入数据时,每次数据库更新,pstm.executeUpdate();就会跳到IO报错,提示原因是sql语法有问题,如题可见当测试插入数据不含condition字段时,插入成功,尝试更名为conDition时,仍报错解决方案: 更改condition为conDi,原因可能时因为condition为数据库或java关键字不能使用,更名后不再受影响,插入成功. java插入数据至mysql数据库报错:check the manual that c

SQL多个主键的表，插入数据有重复时，查询数据的重复值？

SQL多个主键的表,插入数据有重复时,会提示违反主键约束不能插入的错误.那么,如何找到插入数据的重复值? 解决方法:使用group by 假设有个表#a,有saleid,vendorid,comid,price,saleprice,quantity等字段. 主键是:saleid,vendorid,comid三个.假设插入#a的数据源可能会有重复的. 即:saleid,vendorid,comid三个字段都一样的字段,那么插入#a的时候会报主键冲突,违反主键约束. 如果想找出#a表中插入重复的值可

【原创】问题定位分享（16）spark写数据到hive外部表报错ClassCastException: org.apache.hadoop.hive.hbase.HiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat

spark 2.1.1 spark在写数据到hive外部表(底层数据在hbase中)时会报错 Caused by: java.lang.ClassCastException: org.apache.hadoop.hive.hbase.HiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat at org.apache.spark.sql.hive.SparkHiveWrit

spark 插入数据到mysql时遇到的问题 org.apache.spark.SparkException: Task not serializable

spark 插入数据到mysql时遇到的问题 org.apache.spark.SparkException: Task not serializable的相关文章

java插入数据至mysql数据库报错：check the manual that coresponds to your mysql server version for the right syntax to use near 'condition)values...解决方案

SQL多个主键的表，插入数据有重复时，查询数据的重复值？

【原创】问题定位分享（16）spark写数据到hive外部表报错ClassCastException: org.apache.hadoop.hive.hbase.HiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat

spark 写入 redis 和 org.apache.spark.SparkException: Task not serializable

spark关于join后有重复列的问题（org.apache.spark.sql.AnalysisException: Reference '*' is ambiguous）

spark出现task不能序列化错误的解决方法 org.apache.spark.SparkException: Task not serializable

Python使用pyMysql模块插入数据到mysql的乱码解决

在代码中，插入数据到数据库时，如果不使用事务，将会导致速度极慢

sqlalchemy插入数据到mysql异常