python for data analysis chapter1~2

Q1：numpy与series的区别：index

Tab补全（任意路径Tab）

内省（函数：？显示文档字符串，？？显示源代码；结合通配符：np.* load *?）

%load .py

ctrl-c（强行中断）

%timeit（执行时间）%debug? %pwd

%matplotlib inline（否则你创建的图可能不会出现）

单行注释#

多行注释，多行字符串‘’‘ ’‘’

Q2：赋值，浅拷贝和深拷贝

1、赋值：简单地拷贝对象的引用，两个对象的id相同。

2、浅拷贝：创建一个新的组合对象，这个新对象与原对象共享内存中的子对象。

3、深拷贝：创建一个新的组合对象，同时递归地拷贝所有子对象，新的组合对象与原对象没有任何关联。虽然实际上会共享不可变的子对象，但不影响它们的相互独立性。

is/is not（检查两个引用是否指向同一个对象）

Q4：is和==

只有数值型和字符串型，并且在通用对象池中的情况下，a is b才为True，否则当a和b是int，str，tuple，list，dict或set型时，a is b均为False。

Q3：可迭代对象，迭代器，生成器

字符串是不可变的序列

Q5：.replace()和修改有什么区别

不改变原str内容

字符串格式化：‘{0:.2f} {1:s} are worth US${2:d}‘.format(4.5560,‘Argentine Pesos‘,1)

val.encode(‘utf-8‘) val.decode(‘utf-8‘)

Q6：为什么有的要()有的不要

.day is not a method, you do not need to call it.

datetime(2019,2,26,20,30,21).strftime(‘%m/%d/%Y %H:%M‘)：将datetime转换为字符串

datetime.strptime(‘20091031‘,‘%Y%m%d‘)：将字符串转换为datetime

如果某个条件为True则后面的elif和else代码怪则不会执行

continue：跳过continue条件值进入下一次循环

break：到达条件值break结束循环（只结束最内层for循环，外层for循环继续运行）

while条件符合

pass

三元表达式：value=true-expr if condition else false-expr

原文地址：https://www.cnblogs.com/janekim/p/10440853.html

时间： 2024-10-07 04:48:20

python for data analysis chapter1~2的相关文章

Python For Data Analysis -- NumPy

NumPy作为python科学计算的基础,为何python适合进行数学计算,除了简单易懂,容易学习 Python可以简单的调用大量的用c和fortran编写的legacy的库 The NumPy ndarray: A Multidimensional Array Object ndarray,可以理解为n维数组,用于抽象矩阵和向量 Creating ndarrays 最简单的就是,从list初始化, 当然还有其他的方式,比如, 汇总, Data Types for ndarrays

Python For Data Analysis -- Pandas

首先pandas的作者就是这本书的作者对于Numpy,我们处理的对象是矩阵 pandas是基于numpy进行封装的,pandas的处理对象是二维表(tabular, spreadsheet-like),和矩阵的区别就是,二维表是有元数据的用这些元数据作为index更方便,而Numpy只有整形的index,但本质是一样的,所以大部分操作是共通的大家碰到最多的二维表应用,关系型数据库中的表,有列名和行号,这些就是元数据当然你可以用抽象的矩阵来对这些二维表做统计,但使用pandas会更方便

《Python For Data Analysis》学习笔记-1

在引言章节里,介绍了MovieLens 1M数据集的处理示例.书中介绍该数据集来自GroupLens Research(http://www.groupLens.org/node/73),该地址会直接跳转到https://grouplens.org/datasets/movielens/,这里面提供了来自MovieLens网站的各种评估数据集,可以下载相应的压缩包,我们需要的MovieLens 1M数据集也在里面. 下载解压后的文件夹如下: 这三个dat表都会在示例中用到,但是我所阅读的<Pyt

Python For Data Analysis -- IPython

IPython Basics 首先比一般的python shell更方便一些比如某些数据结构的pretty-printed,比如字典更方便的,整段代码的copy,执行并且可以兼容部分system shell , 比如目录浏览,文件操作等 Tab Completion 这个比较方便,可以在下面的case下,提示和补全未输入部分 a. 当前命名空间中的名字 b.对象或模块的属性和函数 c. 文件路径 Introspection, 内省 ?,在标识符前或后加上,显示出对象状况和docst

《python for data analysis》第四章，numpy的基本使用

<利用python进行数据分析>第四章的程序,介绍了numpy的基本使用方法.(第三章为Ipython的基本使用) 科学计算.常用函数.数组处理.线性代数运算.随机模块-- # -*- coding:utf-8 -*-# <python for data analysis>第四章, numpy基础# 数组与矢量计算import numpy as npimport time # 开始计时start = time.time() # 创建一个arraydata = np.array([[

《python for data analysis》第十章，时间序列

< python for data analysis >一书的第十章例程, 主要介绍时间序列(time series)数据的处理.label:1. datetime object.timestamp object.period object2. pandas的Series和DataFrame object的两种特殊索引:DatetimeIndex 和 PeriodIndex3. 时区的表达与处理4. imestamp object.period object的频率概念,及其频率转换5. 两种频

使用Python进行Data Analysis（1）

Python是一门热门语言,可以应用于多个方向,比如网络变成,云计算,爬虫,自动化运维,自动化运维以及数据科学等. 本文就数据科学方向,介绍如何使用Python进行Data Analysis 1. 工具安装工欲善其事,必先利其器.可以使用工具Anaconda和Jupyter Notebook以及Python2.7进行开发 1.1 Python 2.7: 下载地址:https://www.python.org/downloads/release/python-2716/,选择对应的操作系统版本进

Python for Data Analysis | MovieLens

Background MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据. ratings.dat UserID::MovieID::Rating::Timestamp users.dat UserID::Gender::Age::Occupation::Zip-code movies.dat MovieID::Title::Genres 通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中. * head=Non

[Python For Data Analysis] Numpy Basics

创建数组 import numpy as np # np.array 将一个iterable object转换为 ndarray data2 = [[2, 3, 4], [5, 6, 7]] arr2 = np.array(data2, dtype = np.float64) #[[2. 3. 4.] # [5. 6. 7.]] arr3 = np.array(data2, dtype = np.int32) #[[2 3 4] # [5 6 7]] # astype 方式将一种数据类型的arr