Python Pandas 分析郁达夫《故都的秋》

最近刚学这块,如果有错误的地方还请大家担待。

本文用到的Python包:

Ipython, Numpy, Pandas, Matplotlib

故都的秋原文参考:http://www.xiexingcun.com/mingjiaxiejing/302.htm

1. 郁达夫在文章结尾的落款处点明了日期。

一九三四年八月,在北平

但是1934年的数据我暂时找不到,只好拿2004年的代替,月份锁定在8月(公历 参考 知乎 民国时期的人知道公元纪年吗?)。

2.

可是啊,北国的秋,却特别地来得清,来得静,来得悲凉。

在灰沈沈的天底下,忽而来一阵凉风,便息列索落地下起雨来了。一层雨过,云渐渐地卷向了西去,天又青了,太阳又露出脸来了;著着很厚的青布单衣或夹袄曲都市闲人

江南,秋当然也是有的;但草木雕得慢,空气来得润,天的颜色显得淡,并且又时常多雨而少风;一个人夹在苏州上海杭州,或厦门香港广州的市民中间,浑浑沌沌地过去,只能感到一点点清凉,秋的味,秋的色,秋的意境与姿态,总看不饱,尝不透,赏玩不到十足。

北京的秋天: 冷,降温快?

上海的秋天:清凉,降温慢?

In[11]:bj=pd.read_csv(‘beijing2004‘,parse_dates=True,index_col=‘CST‘)

In[12]:matplotlib.style.use(‘ggplot‘)

In[13]:bj=pd.read_csv(‘beijing2004‘,parse_dates=True,index_col=‘CST‘)

In[14]:bj[‘Mean TemperatureC‘].plot()

上图为北京2004全年气温图

上图为上海2004全年气温图

上面两幅图中都缺了一月份气温信息,但是可以明显看出来北京上海两地夏季气温峰值几乎一致,但是北京的冬天比上海低了10度左右,我贴下2010年的北京气温图。

北京2010年全年气温曲线图

In[78]:bjmonth=bj[‘Mean TemperatureC‘].groupby(bj.index.month).mean()

In[79]:shmonth=sh[‘Mean TemperatureC‘].groupby(sh.index.month).mean()

In[80]:bjmonth.name=‘Beijing Mean‘

In[81]:shmonth.name=‘shanghai Mean‘

In[82]:monthMean=pd.concat([bjmonth,shmonth],axis=1)

In[83]:monthMean.plot(kind=‘bar‘)

2004北京月最高最低气温对比图

上面两张图可以看出来,北京上海都是在7月份的时候气温达到一个顶峰,北京过了七月半可能受冷空气影响气温会陡然下降一次(北京2014年全年气温曲线图),7-8月平均昼夜温差10度。8月份晚上气温已经不到20度了,再考虑到当时北京还不是一个工业化城市,体感温度会再低一些。

上海海洋性气候的因素多一些,即便到12-1月份,平均温度也不到0度,温度下降的也很平稳。也就不会有一层秋雨一层凉的感觉。

北京的秋天可以从7月半开始 到10月份结束,两个半月的时间足够给人留下深刻的印象。郁达夫应该也是正巧赶上8月左右的一次小降温有感而发。

时间: 2024-10-12 20:25:30

Python Pandas 分析郁达夫《故都的秋》的相关文章

Python pandas 0.19.1 Indexing and Selecting Data文档翻译

最近在写个性化推荐的论文,经常用到Python来处理数据,被pandas和numpy中的数据选取和索引问题绕的比较迷糊,索性把这篇官方文档翻译出来,方便自查和学习,翻译过程中难免很多不到位的地方,但大致能看懂,错误之处欢迎指正~ Python pandas 0.19.1 Indexing and Selecting Data 原文链接 http://pandas.pydata.org/pandas-docs/stable/indexing.html 数据索引和选取 pandas对象中的轴标签信息

用pandas分析百万电影数据

用pandas分析电影数据 Lift is short, use Python. 用Python做数据分析,pandas是Python数据分析的重要包,其他重要的包:numpy.matplotlib . 安装pandas(Linux, Mac, Windows皆同): pip install pandas 电影数据来源:http://grouplens.org/datasets/movielens/ 下载数据文件解压,包含如下4个文件: users.dat 用户数据 movies.dat 电影数

python pandas 中文件的读写——read_csv()读取文件

read_csv()读取文件1.python读取文件的几种方式read_csv 从文件,url,文件型对象中加载带分隔符的数据.默认分隔符为逗号read_table 从文件,url,文件型对象中加载带分隔符的数据.默认分隔符为制表符(“\t”)read_fwf 读取定宽列格式数据(也就是没有分隔符)read_cliboard 读取剪切板中的数据,可以看做read_table的剪切板.在将网页转换为表格时很有用2.读取文件的简单实现程序代码: df=pd.read_csv('D:/project/

Python pandas 'HDFStore requires PyTables' Issue

Python pandas 'HDFStore requires PyTables' Issue 在运行mobike.py过程中,一直报错,原因是pip install tables命令中安装的pytables文件其实是存在问题的,后续有人修正了这个问题并发布了新的tables库 因此在安装的时候 pip install tables==3.3.0 Python pandas 'HDFStore requires PyTables' Issue

python日志分析

微秒   毫秒 datetime seek定位指针 从行尾到行首 fd.seek(-2,1)  1  当前位置 fd.tell() fd.seek(-2,2)  2   最后位置 fd.tell() fd.seek(0,0)   0  最前位置 read(1)读一位    read() 全部都读 tac与cat    行首到行尾 reversed   翻转字符串 只读一部分    通过时间判断 200 404  503  十分钟之内   第八列  apache.log 1.首先匹配时间格式, D

python & pandas链接mysql数据库

Python&pandas与mysql连接 1.python 与mysql 连接及操作,直接上代码,简单直接高效: 1 import MySQLdb 2 3 try: 4 5 conn = MySQLdb.connect(host='localhost',user='root',passwd='×××××',db='test',charset='utf8') 6 7 cur = conn.cursor() 8 9 cur.execute('create table user(id int,nam

Python代码分析工具:PyChecker、Pylint

1 概述 PyChecker是Python代码的静态分析工具,它能够帮助查找Python代码的bug,而且能够对代码的复杂度和格式等提出警告. PyChecker可以工作在多种方式之下.首先,PyChecker会导入所检查文件中包含的模块,检查导入是否正确,同时检查文件中的函数.类和方法等. PyChecker可以检查出来的问题有如下几种: 全局量没有找到,比如没有导入模块 传递给函数.方法.构造器的参数数目错误 传递给内建函数和方法的参数数目错误 字符串格式化信息不匹配 使用不存在的类方法和属

Python性能分析指南(未完成)

英文原文:http://www.huyng.com/posts/python-performance-analysis/ 译文:http://www.oschina.net/translate/python-performance-analysis 虽然你所写的每个Python程序并不总是需要严密的性能分析,但是当这样的问题出现时,如果能知道Python生态系统中的许多种工具,这样总是可以让人安心的. 分析一个程序的性能可以归结为回答4个基本的问题: 1.它运行的有多块? 2.那里是速度的瓶颈?

第五次作业——python效能分析与几个问题(个人作业)

第五次作业--效能分析与几个问题(个人作业) 前言 阅读了大家对于本课程的目标和规划之后,想必很多同学都跃跃欲试,迫不及待想要提高自身实践能力,那么就从第一个个人项目开始吧,题目要求见下. 阅读 阅读<构建之法>第一章至第三章的内容,并在下方作业里体现出阅读后的成果.特别是第2章中的效能分析及个人软件开发流程(PSP). 参考文章: <构建之法>教学笔记--Python中的效能分析与几个问题 四则运算器效能分析 软工第2次作业-四则运算器 题目描述 可以选择以下题目(或者自主选择题