pyhton读取json格式的气象数据

原文关于读取pm25.in气象数据的pyhton方法,以及浅析python json的应用

以pm25.in网站数据为例。

1、方法介绍

首先感谢pm25.in提供了优质的空气污染数据,为他们的辛勤劳动点个赞。是python3.3,windows系统,读取数据的时候用到了python的json处理的4个方法,很经典常用。所谓4个方法是:

a)       json.loads()

输入string,返回json。

b)       json.dumps()

输入json类型的数据,返回包含json数据的string,可以这样用的好处是可以进行按key字典排序,json.dumps( json_res, sort_keys=True).

c)       json.load()

输入类文件对象,返回json对象,

json.load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)

d)       json.dump()

输入json对象,用法:

json.dump(obj,fp,skipkeys=False,ensure_ascii=True,check_circular=True,allow_nan=True,cls=None, indent=None, separators=None,default=None,sort_keys=False, **kw),obj是json对象,fp是要保存的文件。

说明:

包含utf-8编码的html在被windows系统下保存时,会在文件头有BOM,ultraedit编辑器十六进制看到开头是EF BB BF,这个事情很捣乱,导致读取json数据文件时报错,解决办法是:data_file  = open(r‘c:\Python33\all_data‘,encoding=‘utf_8_sig‘).read()

加上encoding=‘utf_8_sig‘,否则一个json数据开头为BOM标记,整个程序无法识别。

还有要注意,整个传递值的时候,必须统一用utf-8编码,一但不用会产生很多混乱,开始没有注意耽误了不少时间。如

# 请求数据

def requestData( data_file):

# 输入str,返回json数据

json_res = json.loads(data_file, encoding=‘utf-8‘)

# 输入json,返回str,目的是排序

encodedjson = json.dumps(json_res, sort_keys=True)

# 输入str,返回json,务必要以utf-8加载json数据

decodejson = json.loads(encodedjson, encoding=‘utf-8‘)

return decodejson

2、json数据的分类

json数据分为两类:

一个是对象,如{‘a‘:1,‘b‘:2},或者{‘c‘:3,‘d‘:4},对应python里的dict

一个是json数组,[{‘a‘:1,‘b‘:2},{‘c‘:3,‘d‘:4}],相当于2维数组,相当于python的一个list,dict里的对象的位置是随机的,要想用固定顺序需要用dict = collections.OrderedDict(),如本来是{‘a‘:1,‘b‘:2},普通dict输出可能是{‘b‘:2,‘a‘:1},只有OrderDict才是保证{‘a‘:1,‘b‘:2}这样的输出。

3、pyhton的excel处理

codecs.open(out_file, ‘a‘, ‘gbk‘)

dictWriter = csv.DictWriter(f, list(d.keys()))

dictWriter.writeheader()是写excel文件的列名,只写一次, dictWriter.writerow(d)是按行写数据。

PS: 如果想要加入crontab 需要在文件头加#!/usr/bin/python,否则不行。

4、实现

下面全部程序:

# 请求数据
def requestData(data_file):
    # 输入str,返回json数据
    json_res = json.loads(data_file, encoding=‘utf-8‘)

    # 输入json,返回str,目的是排序
    encodedjson = json.dumps(json_res, sort_keys=True)

    # 输入str,返回json,务必要以utf-8加载json数据
    decodejson = json.loads(encodedjson, encoding=‘utf-8‘)

    return decodejson

# 输出数据
def out_data(out_file, d):
    if not os.path.exists(out_file):
        print(out_file)
        header = False
    else:
        header = True
    f = codecs.open(out_file, ‘a‘, ‘gbk‘)
    dictWriter = csv.DictWriter(f, list(d.keys()))
    # only write header when create a new csv
    if not header:
        dictWriter.writeheader()

    dictWriter.writerow(d)

    f.close()

# 主程序
if __name__ == ‘__main__‘:

    # data_file  = open(r‘c:\Python33\all_data‘,encoding=‘utf_8_sig‘).read()
    nowstrp = time.localtime()
    out_file = time.strftime(‘%Y%m%d‘, nowstrp) + ‘.csv‘
    d = collections.OrderedDict()

    headers = {‘User-Agent‘: ‘Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)‘}
    chaper_url = ‘http://www.pm25.in/api/querys/all_cities.json?token=appkey(appkey自己去申请,5工作日给答复)‘
    # ie9:Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)
    # 创建request请求
    url_request = urllib.request.Request(chaper_url, data=None, headers=headers)
    # 打开网址
    url_file = urllib.request.urlopen(url_request)

    if (url_file.getcode() == 200):

        chaper_url = ‘http://www.pm25.in/api/querys/all_cities.json?token=appkey‘
    else:
        chaper_url = ‘http://www.pm25.in/api/querys/all_cities.json?token=appkey‘

    try:
        print(chaper_url)

        headers = {‘User-Agent‘: ‘Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)‘}

        # ie9:Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)
        # 创建request请求
        url_request = urllib.request.Request(chaper_url, data=None, headers=headers)
        # 打开网址
        url_file = urllib.request.urlopen(url_request)
        data_file = url_file.read().decode(‘utf-8‘)

        # status code: 200 OK
        while (url_file.getcode() != 200):
            raise Exception(‘Server connection error, status code:‘ + ‘ ‘)
            # request again after 3min
            time.sleep(3 * 60)

            headers = {‘User-Agent‘: ‘Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)‘}

            # ie9:Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1;Trident/5.0)

            url_request = urllib.request.Request(chaper_url, data=None, headers=headers)

            url_file = urllib.request.urlopen(url_request)
            data_file = url_file.read().decode(‘utf-8‘)
            # 返回数据为json格式
            # json_res = data_file.read().decode(‘utf-8‘)

        decodejson = requestData(data_file)
        # 存储json天气数据为data_json.txt
        f = open(‘data_json.txt‘, ‘w‘, encoding=‘utf-8‘)
        json.dump(decodejson, f)
        f.close()
        # 下面一句是当数据文件为本机的文件时,才用到的必须加utf_8_sig
        # data_final=open(r‘c:\Python33\11.txt‘,encoding=‘utf_8_sig‘).read()

        for element in decodejson:
            print(element)
            d[‘area‘] = element[‘area‘]
            d[‘position_name‘] = element[‘position_name‘]
            d[‘aqi‘] = element[‘aqi‘]
            d[‘co‘] = element[‘co‘]
            d[‘co_24h‘] = element[‘co_24h‘]
            d[‘no2‘] = element[‘no2‘]
            d[‘no2_24h‘] = element[‘no2_24h‘]
            d[‘o3‘] = element[‘o3‘]
            d[‘o3_24h‘] = element[‘o3_24h‘]
            d[‘o3_8h‘] = element[‘o3_8h‘]
            d[‘o3_8h_24h‘] = element[‘o3_8h_24h‘]
            d[‘pm10‘] = element[‘pm10‘]
            d[‘pm10_24h‘] = element[‘pm10_24h‘]
            d[‘pm2_5‘] = element[‘pm2_5‘]
            d[‘pm2_5_24h‘] = element[‘pm2_5_24h‘]
            d[‘primary_pollutant‘] = element[‘primary_pollutant‘]
            d[‘quality‘] = element[‘quality‘]
            d[‘so2‘] = element[‘so2‘]
            d[‘so2_24h‘] = element[‘so2_24h‘]
            d[‘station_code‘] = element[‘station_code‘]
            d[‘time_point‘] = element[‘time_point‘]

            # 逐行写excel文件
            out_data(out_file, d)

            # os.system(‘pause‘)
            # time.sleep(180)

    except Exception as e:
        error = traceback.format_exc() + ‘\r\n‘
        print(error)
        print(‘\r\n‘)
        f = codecs.open(‘error.log‘, ‘a‘, ‘utf-8‘)
        f.writelines(error)
        f.close()
        os.system(‘pause‘)
时间: 2024-08-05 03:09:49

pyhton读取json格式的气象数据的相关文章

Android读取JSON格式数据

Android读取JSON格式数据 1. 何为JSON? JSON,全称为JavaScript Object Notation,意为JavaScript对象表示法. JSON 是轻量级的文本数据交换格式 JSON 独立于语言 JSON 具有自我描写叙述性,更易理解 相比 XML 的不同之处: 没有结束标签 更短 读写的速度更快 使用数组 不使用保留字 JSON 使用 JavaScript 语法来描写叙述数据对象,可是 JSON 仍然独立于语言和平台.JSON 解析器和 JSON 库支持很多不同的

MariaDB 10.0.X中,动态列支持 JSON 格式来获取数据。

MariaDB 10.0.X中,动态列(Dynamic Columns),可以支持 JSON 格式来获取数据. 为了兼容传统SQL语法,MariaDB 10和MySQL5.7支持原生JSON格式,即关系型数据库和文档型NoSQL数据库集于一身. 使用说明: ###表结构 create table assets (   item_name varchar(32) primary key, -- A common attribute for all items   dynamic_cols  blo

Flex 处理 Json 格式的返回数据

前序 : 首先,知道什么是json,知道json 的格式是什么样子的,其次,理解json 处理的需求是来自于Flex和Java 的Servlet通信不能通过对象的方式传递,因此需要json.最后,注意flex json 和Java的json处理需要引入不同的包 : flex 中需要:as3corelib.swc 包的添加的位置,flex目录下还是ecplilse 项目路径下(但是这个不确定一定要放在此处) Java 中需要:json-lib-2.2.2-jdk15.jar 和 jsoup-1.6

spring mvc接收参数方式,json格式返回请求数据

1 使用方法形参使用变量接收提交的数据 2 在方法的形参中使用模型接收数据 3 如果在提交的表单中有多个数据模型,需要创建一个新的Bean,里面的属性是要接收的对象变量. 4 接收提交的日期字符串,转换成Date类型.需要使用@InitBinder来转换 5 批量删除数据,使用数组接收要删除的id,在页面中使用相同name属性 6 批量提交,如何接收数据?需要新建一个Bean,List或者LinkedList/ArrayList来接收. 7 在两个不同的action方法之间执行转发.在retur

Ajax实现异步操作实例_针对JSON格式的请求数据

最近写了一篇ajax异步操作XML格式的,今天就写关于json格式的. 一.简单了解Json 1. JSON有两种表示结构,对象和数组. 1.1 对象: { key1:value1, key2:value2, ... } 1.2 数组 [ { key1:value1, key2:value2 }, { key3:value3, key4:value4 } ] 二.ajax如何利用json对象数据传递 $.ajax({ type: "post", url: "Hand/Ajax

PHP记录和读取JSON格式日志文件

我们有时需要记录用户或者后端的某个操作事件的运行情况,可以使用后端语言如PHP将操作结果记录到日志文件中,方便测试和查找问题.尤其是这些在后端运行的而前端不能直接看到运行结果的,那么就可以用日志文件记录下来,如果你经常跟一些接口开发如支付宝接口.微信卡券接口打交道的话,日志记录就必不可少了. 我们讲的PHP记录日志,就是将日志信息写入到一个日志文件中,区别于内存日志.写入日志的流程是:打开日志文件(如果不存在则新创建),然后将日志内容追加到日志文件的后面,最后关闭日志文件. 本文中,我们将日志内

接口自动化(三)--读取json文件中的数据

上篇讲到实际的请求数据放置在json文件内,这一部分记述一下python读取json文件的实现. 代码如下(代码做了简化,根据需要调优:可做一些容错处理): 1 import json 2 3 class operateJson(): 4 def __init__(self,jsonPath=None): 5 self.jsonPath = jsonPath #传入json文件路径 6 7 #读取json文件的内容 8 def readJson(self): 9 with open(self.j

.net core读取json格式的配置文件

在.Net Framework中,配置文件一般采用的是XML格式的,.NET Framework提供了专门的ConfigurationManager来读取配置文件的内容,.net core中推荐使用json格式的配置文件,那么在.net core中该如何读取json文件呢? 1.在Startup类中读取json配置文件 1.使用Configuration直接读取 看下面的代码: public IConfiguration Configuration { get; } Configuration属

Django-choices字段值对应关系(性别)-MTV与MVC科普-Ajax发json格式与文件格式数据-contentType格式-Ajax搭配sweetalert实现删除确认弹窗-自定义分页器-批量插入-07

目录 models 字段补充 choices 参数/字段(用的很多) MTV与MVC模型 科普 Ajax 发送 GET.POST 请求的几种常见方式 用 Ajax 做一个小案例 准备工作 动手用 Ajax 实现效果 contentType 前后端传输数据编码格式 ajax 提交数据 ajax发 json 格式数据 ajax 传文件 序列化组件 利用 sweetalert 搭建页面(弹窗) 弹窗中文支持不太好,手动修改样式 页面数据没刷新的问题 自定义分页器 批量插入测试数据 bulk_creat