python 调用hive查询实现类似存储过程

需求：数据仓库中所有表的定义结构保存到新的文件中，保存后类似下面数据，重复的数据只保留7月份即可

****************ods_log_info*****************
lid string
uid string
mb_uid string
operation string
module string
result string
ts string
remark1 string
remark2 string
remark3 string

****************ods_mbportal_201407*****************
data_time_thread string
data_module string
data_operation string
data_result string
data_ipaddess string
day string

****************************************************************************

#!/usr/bin/env python

import sys
import re

from hive_service import ThriftHive
from hive_service.ttypes import HiveServerException
from thrift import Thrift
from thrift.transport import TSocket
from thrift.transport import TTransport
from thrift.protocol import TBinaryProtocol

try:
transport = TSocket.TSocket(‘localhost‘, 10000)
transport = TTransport.TBufferedTransport(transport)
protocol = TBinaryProtocol.TBinaryProtocol(transport)

client = ThriftHive.Client(protocol)
transport.open()

query = ‘‘‘
show tables ‘‘‘

client.execute(query)
row = client.fetchAll()
fp = open(r"dw_struct.txt","w")
p = re.compile("201[34][01][0-6|8-9]")
print "Excuting ZZZZZZZZZZ"
for line in row:
m = p.search(line)
if m == None:

qq = "desc " + line
client.execute(qq)
result = client.fetchAll()

fp.write("****************" + line + "*****************\n")
for resLine in result:
if not resLine.startswith("col"):
fp.write(resLine + "\n")
fp.write("\n")
fp.close()
print "Excute OK"

transport.close()
except Thrift.TException, tx:
print ‘%s‘ % (tx.message)

python 调用hive查询实现类似存储过程

时间： 2025-01-02 18:24:05

python 调用hive查询实现类似存储过程的相关文章

Python调用SqlPlus查询Oracle

用Python查询Oracle,当然最好用cx_Oracle库,但有时候受到种种限制,不能安装Python第三方库,就得利用现有资源,硬着头皮上了. 用Python调用SqlPlus查询Oracle,首先要知道SqlPlus返回结果是什么样的: (这是空行) Number Name Address ------------ ----------- ------------------ 1001 张三南京路 1002 李四上海路第1行是空行,第2行是字段名称,第3行都是横杠,有空格隔开,第4

python 调用mysql存储过程返回结果集

存储过程: delimiter | create procedure get_product_info(in imid int(10),int iuser varchar(20)) begin select * from tb_test where mid = imid and user = iuser; end; | delimiter ; python调用: import mysql.connector cnx = mysql.connector.connect( user='test',p

hadoop中的hive查询cdn访问日志指定时间段内url访问次数最多的前10位（结合python语言）

hadoop环境描述: master节点:node1 slave节点:node2,node3,node4 远端服务器(python连接hive):node29 需求:通过hive查询到cdn日志中指定时间段内url访问次数最多的前10个url ps:用pig查询可以查询文章: http://shineforever.blog.51cto.com/1429204/1571124 说明:python操作远程操作需要使用Thrift接口: hive源码包下面自带Thrift插件: [[email pr

python调用数据库并查询

http://blog.csdn.net/pipisorry/article/details/48024795 python调用数据库命令 conn = sqlite3.connect(".\database_name") for row in conn.execute("SELECT name, value FROM table_name"):... from:http://blog.csdn.net/pipisorry/article/details/48024

Python调用微博API

上头叫通过微博ID获取用户发布过的历史微博内容,于是研究了下新浪微博提供的API 1 首先在微博开放中心下"创建应用"创建一个应用,应用信息那些随便填,填写完毕后,不需要提交审核,需要的只是那个app-key和app-secret 2 在"微博开放平台"的"管理中心"找到刚才创建的应用,点开这个应用,点开左边"应用信息"栏,会看见"App key"和"App Secret"的字样,这两个

Python调用C/C++程序

编程中会遇到调用其他语言到库,这里记录一下Python调用C++. Python底层是C, 所以调用C还是比较方便.调用C++有些麻烦. Python提供了ctypes, 方便将Python类型转为C类型,实现传参数.函数返回类型的对应.ctypes网址:https://docs.python.org/2/library/ctypes.html 使用Python调用C/C++主要有三步: (1) 编写好C/C++函数 (2) 把C/C++函数打包成库文件 (3) Python加载库文件并调用代

使用shell+awk完成Hive查询结果格式化输出

好久不写,一方面是工作原因,有些东西没发直接发,另外的也是习惯给丢了,内因所致.今天是个好日子,走起! btw,实际上这种格式化输出应该不只限于某一种需求,差不多是通用的. 需求: --基本的:当前Hive查询结果存在数据与表头无法对其的情况,不便于监控人员直接查看,或者导出到excel中,需要提供一个脚本,将查询结果处理下,便于后续的查看或者操作. --额外的:A.每次查询出来的结果字段数.字段长度不固定:B.每个数据文件中可能包含不只一套查询结果,即存在多个schema. 想法: 对于基本需

Python调用C语言

Python中的ctypes模块可能是Python调用C方法中最简单的一种.ctypes模块提供了和C语言兼容的数据类型和函数来加载dll文件,因此在调用时不需对源文件做任何的修改.也正是如此奠定了这种方法的简单性. 示例如下实现两数求和的C代码,保存为add.c //sample C file to add 2 numbers - int and floats #include <stdio.h> int add_int(int, int); float add_float(float,

python调用MongoDB

-------------------python调用MongoDB------------------- 1.官方文档:http://api.mongodb.org/python/current/tutorial.html 2.linux下安装指令:sudo pip install pymongo 3.测试python驱动: 1 #coding=utf-8 2 3 ''' 4 测试python驱动 5 ''' 6 7 #引用对应的包 8 import pymongo 9 10 #创建一个mon

猜你喜欢

WdatePicker设置时间与倒计时

之前苦于jQuery的datetimepicker插件不知道如何设置秒数,用了同学推荐的WdatePicker,真心好用. 相关文档用法可以上http://www.my97.net/dp/index. ...

祸福相依，大难之后的O2O迎来新福报？

今天的O2O似乎已经成为了一个人人都不愿意提的名词,很多原本做O2O的创业者,如今都不提自己是O2O,只说是互联网+.创业者们实际上仍然是在干着O2O的事情,之所以不敢提不愿提,无非就是一提O2O,投 ...

set nocompatible source $VIMRUNTIME/vimrc_example.vim source $VIMRUNTIME/mswin.vim behave mswin &quo ...

zabbix报错：Too many processes on node1

zabbix报错:Too many processes on Xining City 报错信息:Too many processes on Xining City(服务器名称) 报错原因分析: 服务器 ...

find the closest sum to a target value

problem: given an array of integers including positive and negative, a target value. find 2 numbers ...

OpenCL

OpenCL 编辑 OpenCL(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式.免费标准,也是一个统一的编程环境,便于软件开发人员为高 ...

.pfx格式和.Cer格式的区别

注:本文为个人学习摘录,原文地址:http://blog.csdn.net/ghevinn/article/details/12648043 作为文件形式存在的证书一般有这几种格式: 1.带有私钥的证 ...

3.4 Templates -- Displaying A List of Items(展示一个集合)

一. 概述 1. example 如果你需要遍历一个对象集合,使用Handlebars的{{#each}}. <ul> {{#each people key="id" ...

tcc893x基于Linux内核的普通GPIO操作总结

采用非平台方式进行配置GPIO引脚采用非平台方式进行配置gpio引脚,是直接对其gpio组寄存器进行读写.由于不能直接对寄存器物理地址进行操作,所有需要利用ioremap将gpio寄存器的物理地址映 ...

Swing中怎样使JScrollPane中滚动条始终在最下面

最近用swing写了一个简单的聊天界面,但是页面上的JScrollPane一直移动在最上面,下面是解决怎么让JScrollPane移动到最后一行的几种方法: 1. 利用JTextArea的select ...

论IDC服务和价格哪个更重要

从客户的角度来看,当然希望选到价格合适且服务质量较好的IDC.那么如何确定它是一个优秀的IDC呢? 优秀的IDC应具备以下条件: 利用百度等互联网搜索引擎,找到IDC的官方网站,了解IDC相关信息(资 ...

日常遇到的小问题

日常开发过程中,总会遇到各种小问题,特此记录下各种解决. 1. eclipse中部署项目到tomcat,启动tomcat时报错: Resource is out of sync with the fi ...

健壮的、便捷的、异步的SocketChannel实现(转)

Socket通信比较常见的问题有如下几种: 1.设置收发超时: 2.正确的每一个bit的收发: 3.物理线路故障的保护: 4.始终能正常工作: 5.尽量少占系统资源: n.…… 而Socket编程有一 ...

the computer spends over 96% of its time waiting for I/O devices to finish transferring data

COMPUTER ORGANIZATION AND ARCHITECTURE DESIGNING FOR PERFORMANCE NINTH EDITION

hibernate,spring,struts的流程以及使用理由

1.读取并解析配置文件 2.读取并解析映射信息,创建SessionFactory 3.打开Sesssion 4.创建事务Transation 5.持久化操作 6.提交事务 7.关闭Session 8. ...

理解CSS中的三种选择器>+~

1. p~ul p和ul有相同的父元素,选择出p元素之后的所有ul元素,其中,p和ul不一定是紧随,但是必须有相同的父元素 E+F 相邻兄弟选择器.选择匹配F的元素,且该元素位于 ...

iis上如何架设HTTPS网站

对于HTTPS网站,大部分都比较陌生,觉得很难,其实只要申请好证书,只要在服务器上做下小配置就可以完成首先,申请一个ssl证书免费申请https://buy.wosign.com/free/Fre ...

增强iOS应用程序性能的提示和技巧(25个)

转自 http://www.cocoachina.com/newbie/basic/2013/0522/6259.html 在开发iOS应用程序时,让程序具有良好的性能是非常关键的.这也是用户所期望的 ...

LINQ返回DataTable类型 list转dataset 转换为JSON对象

using System.Web.Script.Serialization; using System.Collections.Generic; using System.Reflection; us ...

阿里云服务器Linux CentOS安装配置（11）安装Wordpress

1 安装Apache yum install httpd -y vi /etc/httpd/conf/httpd.conf Listen 80 改成 Listen 81 #ServerName www ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.