django 批量导入数据

一、需求

我在数据库中建了一张表,用来保存ucloud云上的project id 和project name

models.py代码如下

#coding:utf-8
from django.db import models

class Project(models.Model):
    name = models.CharField(u‘项目名称‘,max_length=32,blank=True)
    id = models.CharField(u‘项目ID‘,max_length=32,unique=True,primary_key=True,blank=True)
    create_date = models.DateTimeField(u‘创建时间‘, auto_now_add=True)
    update_date = models.DateTimeField(u‘更新时间‘, auto_now=True)
    def __unicode__(self):
        return self.name

admin.py代码如下

from django.contrib import admin
from ucloud.models import *

class ProjectAdmin(admin.ModelAdmin):
    list_display = [‘name‘,‘id‘]
admin.site.register(Project,ProjectAdmin)

二、批量导入脚本

现在,我准备了一个脚本,通过UcloudAPI获取到了线上所有的项目的项目ID和项目名称

#!/usr/bin/env python
#-*-coding:utf8-*-
from Ucloud_API.config import *
from Ucloud_API.sdk import UcloudApiClient
from models import *

def get_project_info():
    ApiClient = UcloudApiClient(base_url, public_key, private_key)
    Parameters = {
        "Action": "GetProjectList"
    }
    response = ApiClient.get("/", Parameters)
    ids = [
        {‘ProjectId‘: _[‘ProjectId‘], ‘ProjectName‘: _[‘ProjectName‘]}
        for _ in response[‘ProjectSet‘]
        ]
    return ids
##脚本执行结果如下
[{‘ProjectId‘: u‘org-81‘, ‘ProjectName‘: u‘\u4e0a\u6d77\u522b\u6837\u7ea2\u4fe1\u606f\u6280\u672f\u6709\u9650\u516c\u53f8‘}, {‘ProjectId‘: u‘org-ja1wvv‘, ‘ProjectName‘: u‘\u5907\u6848\u4e13\u7528‘}, {‘ProjectId‘: u‘org-wrg10n‘, ‘ProjectName‘: u‘gitlab‘}, {‘ProjectId‘: u‘org-pni2a2‘, ‘ProjectName‘: u‘PublicTest‘}, {‘ProjectId‘: u‘org-kbxrx4‘, ‘ProjectName‘: u‘SPMS‘}, {‘ProjectId‘: u‘org-aws3dj‘, ‘ProjectName‘: u‘\u5b89\u5168\u6d4b\u8bd5‘}, {‘ProjectId‘: u‘org-vzfixt‘, ‘ProjectName‘: u‘OTA‘}, {‘ProjectId‘: u‘org-et55qg‘, ‘ProjectName‘: u‘99\u6570\u636e\u540c\u6b65\u4e2d\u8f6c\uff0c\u672c\u9879\u76ee\u4e0e99\u5185\u7f51\u6253\u901a\uff0c\u4e0d\u5141\u8bb8\u6dfb\u52a0\u4efb\u4f55\u673a\u5668‘}, {‘ProjectId‘: u‘org-ghan2t‘, ‘ProjectName‘: u‘Ops‘}, {‘ProjectId‘: u‘org-qf4d2n‘, ‘ProjectName‘: u‘iPms‘}]

ProjectId对象表中的id字段,ProjectName对应表中的name字段。

下面是批量导入数据的代码:

#!/usr/bin/env python
#-*-coding:utf8-*-
from Ucloud_API.config import *
from Ucloud_API.sdk import UcloudApiClient
from models import *

##通过API获取数据
def get_project_info():
    ApiClient = UcloudApiClient(base_url, public_key, private_key)
    Parameters = {
        "Action": "GetProjectList"
    }
    response = ApiClient.get("/", Parameters)
    ids = [
        {‘ProjectId‘: _[‘ProjectId‘], ‘ProjectName‘: _[‘ProjectName‘]}
        for _ in response[‘ProjectSet‘]
        ]
    return ids

##批量导入数据
def update_project_info():
    info = get_project_info()
    pids = []
    for _ in info:
        projectid = _[‘ProjectId‘]
        pids.append(projectid)
        project = None
        try:
            project = Project.objects.get(pk=projectid)
        except Project.DoesNotExist:
            project = Project(pk=projectid)
        project.name = _[‘ProjectName‘]
        project.save()
    # 删除本地有但是ucloud上没有的项目
    projectids = [_[‘pk‘] for _ in Project.objects.all().values(‘pk‘)]
    diff_ids = list(set(projectids).difference(set(pids)))
    Project.objects.filter(pk__in=diff_ids).delete()

这里导入数据的思路如下:

try:
    project = Project.objects.get(pk=projectid)
except Project.DoesNotExist:
    project = Project(pk=projectid)

先通过get方法获取对象,如果对象bu‘存在,则用下面的方法创建该对象

project = Project(pk=projectid)

如果对象存在,通过下面的方法更新ProjectName

project.name = _[‘ProjectName‘]
project.save()

另外还有一个需要注意的地方是,数据库中的数据要更新。

例如:线上之前有一个项目aaa,但是后来被删除了,那么则需要从数据库中删除该对象。

使用以下方法;

projectids = [_[‘pk‘] for _ in Project.objects.all().values(‘pk‘)]
diff_ids = list(set(projectids).difference(set(pids)))
Project.objects.filter(pk__in=diff_ids).delete()

将数据库中的对象列表转换成集合,将线上获取到的对象列表也转换成集合,然后通过

set1.difference(set2)

的方法来获取在set1中存在,但在set2中不存在的对象,然后用下面的方法删除

Project.objects.filter(pk__in=diff_ids).delete()

批量导入数据还可以使用下面的方法执行

def update_project_info():
    info = get_project_info()
    pids = [_[‘ProjectId‘] for _ in info]
    for i in info:
        Project.objects.get_or_create(id=i[‘ProjectId‘],name=i[‘ProjectName‘])
    projectids = [_[‘pk‘] for _ in Project.objects.all().values(‘pk‘)]
    #获取数据库中存在,但线上不存在的projectid
    diff_ids = list(set(projectids).difference(set(pids)))
    #删除数据库中多余的数据
    Project.objects.filter(pk__in=diff_ids).delete()
Project.objects.get_or_create(id=i[‘ProjectId‘],name=i[‘ProjectName‘])

get_or_create() 有就获取过来,没有就创建,用它可以避免重复,但是速度可以会慢些,因为要先尝试获取,看看有没有

三、如何执行脚本

我们可以将导入数据的方法通过问url的方式,来执行

#coding:utf-8
from django.shortcuts import render
from django.http import HttpResponse,JsonResponse
from sdkucloud import *
# Create your views here.
def index(request):
    return HttpResponse(‘index‘)
def pull_project(request):
    update_project_info()
    return HttpResponse(‘OK!‘)

编辑$APPName/urls.py

from django.conf.urls import include, url
from django.contrib import admin
from ucloud.views import *
urlpatterns = [
    url(r‘^$‘,  index),
    url(r‘^pull_project/$‘, pull_project)
]
时间: 2024-10-03 23:16:18

django 批量导入数据的相关文章

Dynamics 2015 数据管理 之 如何批量导入数据到 正式区(一)

单一个项目的数据导入可以在具体功能 中导入,大体位置如下. 如果项目新上线的话,要批量导入数据的话,就要到如下的功能中实现了. 进入方式: 在 设置 ---- 数据管理 下载 下载后,用EXCEL打开, 给业务人员批量输入数据. 编辑好以后,上传吧,点 导入. 下一步即可以,导入以后,可以返回看看数据导入的情况,格式有没有错误等.

利用OLEDB+SqlClient实现EXCEL批量导入数据

以下是几个自己写的类 /// <summary> /// 取得Excel对象 /// </summary> /// <param name="strConn">OLEDB连接字符串</param> /// <param name="sql">SQL语句</param> /// <returns></returns> public static DataTable GetE

asp.net线程批量导入数据时通过ajax获取执行状态

最近因为工作中遇到一个需求,需要做了一个批量导入功能,但长时间运行没个反馈状态,很容易让人看了心急,产生各种臆想!为了解决心里障碍,写了这么个功能. 通过线程执行导入,并把正在执行的状态存入session,既共享执行状态,通过ajax调用session里的执行状态,从而实现反馈导入状态的功能! 上代码: 前端页面 <!DOCTYPE html> <html lang="en"> <head>  <meta charset="UTF-8

redis pipe 批量导入数据

redis pipe 批量导入数据 速度非常快, 文本需要支持redis的协议, 使用Python生成文件 代码如下 delimiter = "\r\n" data = "*3" + delimiter + "$3" + delimiter + "set" + delimiter + "$" + str(len(row[0])) + delimiter + row[0] + delimiter + &quo

使用python向Redis批量导入数据

1.使用pipeline进行批量导入数据.包含先使用rpush插入数据,然后使用expire改动过期时间 class Redis_Handler(Handler): def connect(self): #print self.host,self.port,self.table self.conn = Connection(self.host,self.port,self.table) def execute(self, action_name): filename = "/tmp/temp.t

Excel批量导入数据之数据校验

最近,工作上接到Excel批量导入数据的需求.在这里,小编想分享的是数据校验那些事,至于如何读取Excel数据,大家可以百度下. 一般而言,Excel批量导入数据,我们都会给客户提供一个固定的模板以输入我们期望的数据.然而,客户的操作,我们是无法预料的,他们有可能增加一列或者删除一列,有可能去掉Excel某个字段的输入限制等等. Excel模板,有可能只有一个,有可能若干个.各个模板的数据列,或交叉相同,或存在个性化列. 同一个模板,也许因某列数据的不同,而需要填充不同数据列. ...... 面

数据库中批量导入数据,有两列的值需要从其他表中查出来,我现在没有思路,求解惑

我现在批量往数据库里导正式数据(sql insert),但是数据中有三列分别是岗位,办事处,大区,给的数据中只给了岗位的值,办事处的值可以通过岗位值在岗位表查到,大区的值可以通过办事处的值在办事处表里查到.现在我已经把其他数据都导进去了,只剩办事处和大区没有值,我该如何批量更新这两列的值啊 导入的数据的表: 岗位表: 办事处表: 本人sql不是很好,希望sql大神能给出来解惑一下,拜谢~ 数据库中批量导入数据,有两列的值需要从其他表中查出来,我现在没有思路,求解惑 >> mysql 这个答案描

Redis批量导入数据的方法

有时候,我们需要给redis库中插入大量的数据,如做性能测试前的准备数据.遇到这种情况时,偶尔可能也会懵逼一下,这里就给大家介绍一个批量导入数据的方法. 先准备一个redis protocol的文件(redis protocol可以参考这里:https://redis.io/topics/protocol),这里是用java程序来输出的,java代码如下: <<RedisBatchTest>> public class RedisBatchTest { public static

Django 批量插入数据、自定义分页器、多表关系的建立及Form组件(待更新。。。)

目  录 django批量出入数据 自定义分页器 创建多对多表关系的建立 form组件 form组件钩子函数 一.django批量出入数据 视图函数: from app01 import models # 向表中插入1000条数据 def index(request): # 方式1: # for i in range(1000): # models.Book.objects.create(title='第%s本书'%i) # book_Queryset = models.Book.objects