pandas 连接数据库直接查表建立dataframe。loc,sort_values数据清洗操作

#导入pandas
import pandas as pd
import numpy as np

#导入SqlAlchemy
from sqlalchemy import create_engine

if __name__ == "__main__":
    #建立数据库引擎
    engine = create_engine(‘mysql+pymysql://root:mysql@localhost:3306/mymac‘)
    #写一条sql
    sql = ‘select id,name,age,gender from student‘
    #建立dataframe
    df = pd.read_sql_query(sql,engine)
    # print(df)
    #按照年龄倒序    正序:ascending=True
    #翻译为sql  select * from student order by asc | desc
    # df = df.sort_values([‘age‘,‘gender‘],ascending=False)
    # print(df)

    #取年龄最小的学生  在尾部取值
    #翻译为sql select * from student order by age limit 1
    # df = df.sort_values([‘age‘]).tail(1)
    # print(df)

    #求整个班的平均年龄
    avg_age= df.age.mean()
    #使用loc方法指定字段
    print(df.loc[(df[‘age‘]<avg_age ) & df[‘gender‘]==1])

    #获取指定字段
    # print(df.loc[df[‘gender‘]==1,[‘id‘,‘name‘]])

    #将dataframe写入数据表,表名,数据引擎,索引是否入库
    # df.to_sql(‘student_copy‘,engine,index=False)

    #前提要安装好 openpyxl   安装命令 pip install openpyxl
    #导入成excel文件
    # df.to_excel(‘student.xlsx‘)

    # print(Student.objects.all())

原文地址:https://www.cnblogs.com/Niuxingyu/p/10482314.html

时间: 2024-10-19 14:52:47

pandas 连接数据库直接查表建立dataframe。loc,sort_values数据清洗操作的相关文章

pandas基础命令速查表

pandas基础命令速查表 数据的导入 数据的导出 创建测试对象 数据的查看与检查 数据的选取 数据的清洗 数据的过滤(filter)排序(sort)和分组(group) 数据的连接(join)与组合(combine) 一.数据的导入 pd.read_csv(filename) # 导入csv格式文件中的数据 pd.read_table(filename) # 导入有分隔符的文本 (如TSV) 中的数据 pd.read_excel(filename) # 导入Excel格式文件中的数据 pd.r

表建立联合索引

表建立联合索引后,以两个字段为例,如果想查询速度快,where条件中要么带上两个字段,要么带上前面的,如果只有后面的不会变快. 实例:以下联合索引:itemid和clock 这个联合索引 如果where字段查clock的话 是不能走索引的, 所以查询会慢 . 要想查询变快的话,查itemid,或者两个一起查.

汇编指令速查表

一.数据传输指令───────────────────────────────────────它们在存贮器和寄存器.寄存器和输入输出端口之间传送数据.1. 通用数据传送指令.MOV 传送字或字节.MOVSX 先符号扩展,再传送.MOVZX 先零扩展,再传送.PUSH 把字压入堆栈.POP 把字弹出堆栈.PUSHA 把 AX,CX,DX,BX,SP,BP,SI,DI 依次压入堆栈.POPA 把 DI,SI,BP,SP,BX,DX,CX,AX 依次弹出堆栈.PUSHAD 把 EAX,ECX,EDX,

测试启发法速查表

本文是测试大师Elisabeth Hendrickson的测试启发法速查表. 一.通用启发法 这些启发法绝对适用于任何种类的接口和任何种类的系统. 抽象 剔除模型中的细节.忽略低层级的细枝末节,以此进行简化,让模型可以更少地关注具体细节,而更多地聚焦与概念层面. 例如,对于交互图来说,无需详尽地描述一组通信,你也可以只画一条线,再取个名字来描述这些通信的核心交互即可.如果是在测试邮件客户端,那么在发送邮件时客户端可能要经历如下步骤:连接到服务器.鉴权.传输数据.与其在模型中记录所有步骤,你可以直

50个数据科学和机器学习速查表【转】

在数据科学领域有成千上万的包和数以百计的函数公式,你虽然不需要掌握所有的这些知识,但是有一个速查表在你的学习中是非常重要的.学习大数据包括对统计学.数学.编程知识(尤其是R.python.SQL)等知识的理解,还需要理解业务来驱动决策.这些表单也许能给你一些帮助. Python的速查表 Python在初学者中非常受欢迎,同样足以支持那些最受欢迎的产品和应用程序,它的设计让你在编程的时候感觉同用英语写作一样自然,Python basics 或者Python Debugger的速查表覆盖了重要的语法

Git命令速查表【转】

本文转载自:http://www.cnblogs.com/kenshinobiy/p/4543976.html 一. Git 常用命令速查 git branch 查看本地所有分支git status 查看当前状态 git commit 提交 git branch -a 查看所有的分支git branch -r 查看远程所有分支git commit -am "init" 提交并且加注释 git remote add origin [email protected]:ndshowgit p

Git 常用命令速查表(图文+表格)

一. Git 常用命令速查 git branch 查看本地所有分支git status 查看当前状态 git commit 提交 git branch -a 查看所有的分支git branch -r 查看远程所有分支git commit -am "init" 提交并且加注释 git remote add origin [email protected]:ndshowgit push origin master 将文件给推到服务器上 git remote show origin 显示远程

Git 常用命令速查表(三)

转自:http://blog.csdn.net/ithomer/article/details/7529841 本文将对Git 命令,做一下全面而系统的简短总结,整理成简洁.明了的图表结构,方便查询 一. Git 常用命令速查 git branch 查看本地所有分支git status 查看当前状态 git commit 提交 git branch -a 查看所有的分支git branch -r 查看远程所有分支git commit -am "init" 提交并且加注释 git rem

故障代码含义速查表 DEBUG代码

故障代码含义速查表 DEBUG代码 1.特殊代码"00"和"FF"及其它起始码有三种情况出现: ①已由一系列其它代码之后再出现:"00"或"FF",则主板OK. ②如果将CMOS中设置无错误,则不严重的故障不会影响BIOS自检的继续,而最终出现"00"或"FF". ③一开机就出现"00"或"FF"或其它起始代码并且不变化则为板没有运行起来. 2.本