Python 分析天气,告诉你中秋应该去哪里

中秋佳节以到,不知道各位小伙伴儿有没有想好去哪里玩呢。不过说实在的,每到节假日,到处都是人山人海,那句“我动也不能动”,还不时的出现在我的耳畔呢。

但是又说回来,假期出游,除了人的因素外,天气的因素是不是也要考虑下呢,今天,我们就带大家来看看,中秋小长假,哪些地方适宜出游。

获取数据

数据的获取,就从中国天气网站上直接抓取,网络上的一些 API,有的信息不是很全,只能获取最近3天的数据,有的又需要付费,还不如自己抓来的痛快。

http://www.weather.com.cn/weather15d/10124020102A.shtml

网站也没有做什么限制,我们抓数据的时候,只需要控制好访问频率,不要影响人家的正常运行就可以。

同时还需要准备四个数据文件

  • 省会城市列表,provincial_capital
  • 全国城市 id 信息表,china-city-list.csv
  • 著名景点名称列表,attractions
  • 全国景点 id 信息表,china-scenic-list.txt

抓取的过程不再详细说明了,直接给出完整代码

# coding = utf-8
"""
@author: zhou
@time:2019/9/5 14:36
@File: main.py
"""

import requests
from bs4 import BeautifulSoup
import time
import os

def get_data(name, city, code):
    print("正在下载城市%s的数据" % city)
    url = ‘http://www.weather.com.cn/weather15d/%s.shtml‘ % code[2:]
    res = requests.get(url).content.decode()
    content = BeautifulSoup(res, "html.parser")
    weather_list = content.find(‘ul‘, attrs={‘class‘: ‘t clearfix‘}).find_all(‘li‘)
    items = map(parse_item, weather_list)
    save_to_csv(name, city, items)
    time.sleep(1)

def parse_item(item):
    time = item.find(‘span‘, attrs={‘class‘: ‘time‘}).text
    wea = item.find(‘span‘, attrs={‘class‘: ‘wea‘}).text
    tem = item.find(‘span‘, attrs={‘class‘: ‘tem‘}).text
    wind = item.find(‘span‘, attrs={‘class‘: ‘wind‘}).text
    wind_level = item.find(‘span‘, attrs={‘class‘: ‘wind1‘}).text
    result = {
        "time": time,
        "wea": wea,
        "tem": tem,
        "wind": wind,
        "wind_level": wind_level
    }
    return result

def save_to_csv(name, city, data):
    if not os.path.exists(‘%s_data.csv‘ % name):
        with open(‘%s_data.csv‘ % name, ‘a+‘, encoding=‘utf-8‘) as f:
            f.write(‘city,time,wea,tem,wind,wind_level\n‘)
            for d in data:
                try:
                    row = ‘{},{},{},{},{},{}‘.format(city,
                                                     d[‘time‘],
                                                     d[‘wea‘],
                                                     d[‘tem‘],
                                                     d[‘wind‘],
                                                     d[‘wind_level‘])
                    f.write(row)
                    f.write(‘\n‘)
                except:
                    continue
    else:
        with open(‘%s_data.csv‘ % name, ‘a+‘, encoding=‘utf-8‘) as f:
            for d in data:
                try:
                    row = ‘{},{},{},{},{},{}‘.format(city,
                                                     d[‘time‘],
                                                     d[‘wea‘],
                                                     d[‘tem‘],
                                                     d[‘wind‘],
                                                     d[‘wind_level‘])
                    f.write(row)
                    f.write(‘\n‘)
                except:
                    continue

if __name__ == ‘__main__‘:
    import pandas as pd
    provincial = pd.read_csv(‘provincial_capital‘)
    china_city_code = pd.read_csv(‘china-city-list.csv‘)
    china_scenic_code = pd.read_csv(‘china-scenic-list.txt‘, sep=‘\t‘)
    china_scenic_code.columns = [‘ID‘, ‘name‘, ‘area‘, ‘provincial‘]
    attraction = pd.read_csv(‘attractions‘)
    provincial_data = pd.DataFrame()
    attraction_data = pd.DataFrame()

    # 省会抓取
    for i in provincial[‘city‘].values.tolist():
        for j in china_city_code[‘City_CN‘].values.tolist():
            if j == i:
                provincial_data = pd.concat([china_city_code[china_city_code[‘City_CN‘] == j], provincial_data])

    for city in provincial_data[‘City_CN‘].values.tolist():
        city_id = provincial_data[provincial_data[‘City_CN‘] == city][‘City_ID‘].values.tolist()[0]
        get_data(‘weather‘, city, city_id)

    # 景点抓取
    for a in attraction[‘attractions‘].values.tolist():
        for c in china_scenic_code[‘name‘].values.tolist():
            if c == a:
                attraction_data = pd.concat([china_scenic_code[china_scenic_code[‘name‘] == c], attraction_data])

    for attrac in attraction_data[‘name‘].values.tolist():
        city_id = attraction_data[attraction_data[‘name‘] == attrac][‘ID‘].values.tolist()[0]
        get_data(‘attraction‘, attrac, city_id)

省会天气分析

我们首先来看看省会天气,毕竟省会城市是每个省份的中心,也是旅游的重点城市。

降水和温度

对于降水的概率,我采取的是如果预报是有雨,则设置降水概率为80,如果是预报是晴,则降水概率为20.

weather_dict = {
    "snow": 100,
    "rain": 80,
    "cloud": 50,
    "overcast": 60,
    "sun": 20
}

在中秋节这一天,各个省会城市的降水和温度

能够看出,大部分城市在这一天都是天公不作美的,降水的概率都非常的大。而温度的话,大概率降水的城市,温度都不是很高,早晚出行,可能还会很凉哦。温度最高的应该就是南昌了,还能达到30°C,一个艳阳高照的日子,是不是去看看革命圣地?

接下来我们再通过一个双轴图来更加直观的查看下降水和温度的情况

看来在进入9月之后,全国普遍的温度都在慢慢回落了,温度适宜出行,但是就是会伴随着绵绵的细雨呀。

再来看下几大城市在中秋前后一周的天气情况

北京

北京的气温还是比较平稳的,没有太大的波动,可能早晚一件薄外套就能hold的住,不过这几天,应该都会是阴蒙蒙的,不会有太好的阳光。

上海

上海的降水概率要比北京大一些,不过温度倒是相差不多。

杭州

杭州的平均温度还是要高一些,降水的概率也较高,毕竟典型的东南沿海城市嘛,雨天的西湖,你期待不?

成都

成都基本天天下雨了,那还出门看大熊猫嘛,这是个问题啊!

著名景区天气

下面我们再来看看一些著名景区的天气情况,我大好河山,景区太多了,只能简单列举一些最著名的地方来看看了。

降水情况

在我选取的这些景区当中,大部分都是会有降水的,不过也会有阳光明媚的地方。

比如说黄山和八达岭长城,预计会是晴天,去爬爬长城和黄山,是不错的选择。
而美丽的九寨沟和西湖等,虽说会下雨,但是在雨天漫步,也不失为一种情趣吧。

降水和温度

我们再来看看各地的温度情况

不知道为啥承德的温度会那么低,感觉去避暑已经不太合适了,而长白山已经只有7°C了,慌不慌?

降水与温度分布

降水

进入9月,东南沿海降水明显增多,京津地区也是阴雨连绵,这是一场秋雨一场寒的节奏吗!

温度

东南半壁,温度还是比较适宜的,现在的天气下,不冷不热,正是出游好温度。

好了,今天的分析就到这里了,那么,你中秋节最终的选择是哪里呢?

源码地址

https://github.com/zhouwei713/data_analysis/tree/master/weather

原文地址:https://blog.51cto.com/10487107/2437849

时间: 2024-11-07 20:41:31

Python 分析天气,告诉你中秋应该去哪里的相关文章

Python分析盘点2019全球流行音乐:是哪些歌曲榜单占领了我们?

写在前面:圣诞刚过,弥留者节日气息的大家是否还在继续学习呐~在匆忙之际也不忘给自己找几首好听的歌曲放松一下,缠绕着音乐一起来看看关于2019年流行音乐趋势是如何用Python分析的吧! 昨天下午没事儿,随便听了下音乐,结果搜到了一份数据比较好玩,所以拿了来做个数据分享案例. 这份数据是由国外比较火的音乐软件spotify提供的,很有代表意义. 不过涉及到的指标都比较专业,我不是太懂,只能根据自己的理解去做分析,有懂音乐的朋友可以提出专业的看法. 这次的数据分析工具是Python,当然如果你Pyt

分享python分析wave, pcm音频文件

最近研究的,我用的是python3.3, 用matplotlib画图, 下面代码演示分析pcm文件,如果是wave文件,把wave的文件头去掉就是pcm文件了. 代码如下 1 # -*- coding:utf-8 -*- 2 3 import array 4 import os 5 from matplotlib import pyplot 6 7 fileName = 'e:/music/qianqian.pcm' # 2 channel, 16 bit per sample 8 file =

python分析apahce网站日志的例子

有关python实现apahce网站日志分析的方法. 应用到:shell与python数据交互.数据抓取,编码转换 #coding:utf-8 #!/usr/bin/python'''程序说明:apache access.log日志分析 分析访问网站IP 来源情况 日期:2014-01-06 17:01 author:gyh9711 程序说明:应用到:shell与python数据交互.数据抓取,编码转换'''import osimport jsonimport httplibimport cod

Python 分析Twitter用户喜爱的推文

CODE: #!/usr/bin/python # -*- coding: utf-8 -*- ''' Created on 2014-8-5 @author: guaguastd @name: analyze_favorite_tweet.py ''' if __name__ == '__main__': # import json #import json # import search from search import search_for_tweet # import get_fri

以下是几个告诉你到哪里去的指南

注册成为开发者 "App Distribution Guide"中的"Managing Accounts"会教你如何成注册苹果开发者. 学会设计漂亮的应用界面 "iOS Human Interface Guidelines"教你如何设计出遵循iOS用户界面惯例的应用. 学习语言 "Programming with Objective-C"描述如何定义类.发送信息.封装数据.以及使用Objective-C编程语言完成各种各样的任

python分析nginx日志的ip,url,status

Python 脚本如下: #!/usr/bin/env python #_*_coding:utf-8 _*_ __author__ = 'lvnian' #!/usr/bin env python # coding: utf-8 import MySQLdb as mysql import sys, os db = mysql.connect(user="root",passwd="[email protected]",db="intest",

今晚九点|如何使用 Python 分析 web 访问日志?

主题:如何使用 Python 分析 Web 访问日志 内容 Python 基础 字符串.字典.文件.时间 Web 访问日志 实战 提问 主讲师:KK 多语言混搭工程师,热爱开源技术,喜欢GET新技能,5年 PHP.Python 项目开发经验,带领团队完成多个中.小型项目开发,对安全.云等多个领域富有浓厚兴趣,擅长于 WEB 安全开发.性能优化.分布式应用开发&设计等多方面,做事认真负责,乐于分享技能,现任 51Reboot.com Python 实战班讲师 任何语言都有使用场景,只有合适和不合适

利用Python分析“女神大会”,分析码农最喜欢的top10女星!

前言 懂球帝上的"女神大会"专栏,作为一个大型"钢铁直男"聚集地,"懂球帝"上对各位女神的评分,对广大"钢铁直男"群体也具有一定代表性.这么好的地方,咱们必须得用Python分析一波了呀. 基本环境配置 版本:Python3 系统:Windows 相关模块:requests.bs4.pandas 用pip安装即可. 数据来源 目前女神大会更新至了第 90 期,总共出场了 90 位女神,界面如下:我们通过 fiddler 获取该

python分析apache和nginx日志文件输出访客ip列表的代码

把做工程过程中比较好的代码片段做个备份,下面资料是关于python分析apache和nginx日志文件输出访客ip列表的代码. ips = {} fh = open("/var/log/nginx/access.log", "r").readlines() for line in fh: ip = line.split(" ")[0] if 6 < len(ip) <=15: ips[ip] = ips.get(ip, 0) + 1