python实例pyspark

%pyspark

#查询认证用户

import sys
#import MySQLdb
import mysql.connector
import pandas as pd
import datetime
import time

optmap = {
                ‘dbuser‘ : ‘haoren‘,
                ‘dbpass‘ : ‘G4d‘,
                ‘dbhost‘ : ‘172.12.112.5‘,
                ‘dbport‘ : 3306,
                ‘dbname‘ : ‘GMDB‘
                 }

def sql_select(reqsql):
    ret = ‘‘
    try:
        db_conn = mysql.connector.connect(user=optmap[‘dbuser‘], password=optmap[‘dbpass‘], host=optmap[‘dbhost‘], port=optmap[‘dbport‘], database=optmap[‘dbname‘])
        db_cursor=db_conn.cursor()
        count = db_cursor.execute(reqsql)
        ret = db_cursor.fetchall()
    except mysql.connector.Error as e:
        print (‘Error : {}‘.format(e))
    finally:
        db_cursor.close()
        db_conn.close
        return ret

userlist = []
def renzhengsingger(startday,endday):
    t1 = int(time.mktime(time.strptime(startday,‘%Y-%m-%d %H:%M:%S‘)) )
    t2 = int(time.mktime(time.strptime(endday,‘%Y-%m-%d %H:%M:%S‘)))
    for n in range(0,10):
        reqsql = "select PERFORMERID,sum(DURATION)/3600 from PERFORMERSHOWTIMERECORD%d where STARTTIME >=%s and STARTTIME <%s group by PERFORMERID ;" %(n,t1,t2)
        ret = sql_select(reqsql)
        
        userlist.append(ret)
    #print userlist    
    for i in range(0,10):
        for p in userlist[i]:
            print p[0],p[1]
            
renzhengsingger(‘2017-08-01 00:00:00‘,‘2017-09-01 00:00:00‘)

======================================================================================================================

%pyspark

#查询认证用户

import sys
#import MySQLdb
import mysql.connector
import pandas as pd
import datetime
import time

optmap = {
                ‘dbuser‘ : ‘haoren‘,
                ‘dbpass‘ : ‘G4d‘,
                ‘dbhost‘ : ‘172.12.112.8‘,
                ‘dbport‘ : 3306,
                ‘dbname‘ : ‘IMDB‘
                 }

optmap1 = {
                ‘dbuser‘ : ‘haoren‘,
                ‘dbpass‘ : ‘G4d‘,
                ‘dbhost‘ : ‘172.12.112.5‘,
                ‘dbport‘ : 3306,
                ‘dbname‘ : ‘GMDB‘
                 }

def sql_select(reqsql):
    ret = ‘‘
    try:
        db_conn = mysql.connector.connect(user=optmap[‘dbuser‘], password=optmap[‘dbpass‘], host=optmap[‘dbhost‘], port=optmap[‘dbport‘], database=optmap[‘dbname‘])
        db_cursor=db_conn.cursor()
        count = db_cursor.execute(reqsql)
        ret = db_cursor.fetchall()
    except mysql.connector.Error as e:
        print (‘Error : {}‘.format(e))
    finally:
        db_cursor.close()
        db_conn.close
        return ret

def sql_select1(reqsql1):
    ret = ‘‘
    try:
        db_conn1 = mysql.connector.connect(user=optmap1[‘dbuser‘], password=optmap1[‘dbpass‘], host=optmap1[‘dbhost‘], port=optmap1[‘dbport‘], database=optmap1[‘dbname‘])
        db_cursor1=db_conn1.cursor()
        count = db_cursor1.execute(reqsql1)
        ret1 = db_cursor1.fetchall()
    except mysql.connector.Error as e:
        print (‘Error : {}‘.format(e))
    finally:
        db_cursor1.close()
        db_conn1.close
        return ret1

#定义查询认证用户函数
def renzhengsingger(startday,endday):
    t1 = int(time.mktime(time.strptime(startday,‘%Y-%m-%d %H:%M:%S‘)) )
    t2 = int(time.mktime(time.strptime(endday,‘%Y-%m-%d %H:%M:%S‘)))
    reqsql = "select PERFORMERID,from_unixtime(ADDTIME) from PERFORMERINFO where ADDTIME >=%s and ADDTIME < %s" %(t1,t2)
    ret = sql_select(reqsql)
    for i in ret:
        #print i[0]
        id = int(i[0])%10
        reqsql1 = "select sum(DURATION)/3600 from PERFORMERSHOWTIMERECORD%d where STARTTIME >=%s and STARTTIME <%s and PERFORMERID=%d" %(id,t1,t2,i[0])
        #print reqsql1
        ret1 = sql_select1(reqsql1)
        print i[0],",",i[1],",",ret1[0][0]
        
renzhengsingger(‘2017-08-01 00:00:00‘,‘2017-09-01 00:00:00‘)

时间: 2024-10-06 13:38:26

python实例pyspark的相关文章

使用docker安装部署Spark集群来训练CNN(含Python实例)

使用docker安装部署Spark集群来训练CNN(含Python实例) 本博客仅为作者记录笔记之用,不免有很多细节不对之处. 还望各位看官能够见谅,欢迎批评指正. 博客虽水,然亦博主之苦劳也. 如需转载,请附上本文链接,不甚感激! http://blog.csdn.net/cyh_24/article/details/49683221 实验室有4台神服务器,每台有8个tesla-GPU,然而平时做实验都只使用了其中的一个GPU,实在暴遣天物! 于是想用spark来把这些GPU都利用起来.听闻d

【转载】python实例手册

今天西爬虫的时候遇到了问题,在网上不停地查找资料,居然碰到两篇好文章: 1.python实例手册   作者:没头脑的土豆 另一篇在这:shell实例手册 python实例手册 #encoding:utf8 # 设定编码-支持中文 0说明 手册制作: 雪松 更新日期: 2013-12-19 欢迎系统运维加入Q群: 198173206 # 加群请回答问题 请使用"notepad++"打开此文档,"alt+0"将函数折叠后方便查阅 请勿删除信息,转载请说明出处,抵制不道德

Python实例 -- 爬虫

1 #coding="utf-8" 2 3 import urllib2 4 import re 5 import threading 6 import time 7 8 """ 9 抓取代理发布页的ip和port10 http://www.xici.net.co/nn/%d 11 """ 12 13 proxylist = [] 14 15 16 def get_proxy_from_cnproxy(): 17 global

python实例手册

python实例手册 #encoding:utf8 # 设定编码-支持中文 0说明 手册制作: 雪松 更新日期: 2013-12-19 欢迎系统运维加入Q群: 198173206 # 加群请回答问题 请使用"notepad++"打开此文档,"alt+0"将函数折叠后方便查阅 请勿删除信息,转载请说明出处,抵制不道德行为. 错误在所难免,还望指正! # python实例手册下载地址: http://hi.baidu.com/quanzhou722/item/cf447

【NLP】Python实例:基于文本相似度对申报项目进行查重设计

Python实例:申报项目查重系统设计与实现 作者:白宁超 2017年5月18日17:51:37 摘要:关于查重系统很多人并不陌生,无论本科还是硕博毕业都不可避免涉及论文查重问题,这也对学术不正之风起到一定纠正作用.单位主要针对科技项目申报审核,传统的方式人力物力比较大,且伴随季度性的繁重工作,效率不高.基于此,单位觉得开发一款可以达到实用的智能查重系统.遍及网络文献,终未得到有价值的参考资料,这个也是自然.首先类似知网,paperpass这样的商业公司其毕业申报专利并进行保密,其他科研单位因发

第一个python实例--监控cpu

1 #第一个python实例:监控cpu 2 #/bin/bash/env Python 3 from __future__ import print_function 4 from collections import OrderedDict 5 import pprint 6 7 def CPUinfo(): 8 ''' Return the information in /proc/CPUinfo 9 as a dictionary in the following format: 10

python实例31[列出目录下所有的文件到txt]

代码: (使用os.listdir) import os def ListFilesToTxt(dir,file,wildcard,recursion):    exts = wildcard.split(" ")    files = os.listdir(dir)    for name in files:        fullname=os.path.join(dir,name)        if(os.path.isdir(fullname) & recursion

Python实例31[批量对目录下文件重命名]

经常会遇到下载的文件或电子书,名字中间都包含了一些网址信息,实际使用中由于名字太长不方便,下面的脚本使用正则表达式来对目录下的所有文件重命名:例如: 修改前:[大家网]Mac OS X for Unix Geeks[www.TopSage.com].mobi修改后:Mac OS X for Unix Geeks.mobi python代码如下 import osimport re def rename_dir(dir,regex,f):  if not os.path.isdir(dir) or

python实例31[生成随即的密码]

代码: import randomimport stringimport time # strong.high = 3  #random for the whole passwd#storng.middle = 2  # include one special sign#strong.ow = 1  # just include characters or digits def mkpassByRandom(size=8, strong = 2):    chars = []    chars.