python 使用pandas,完成对excel的操作: 遍历,求偏度(skew)的小程序

excel有针对偏度的计算函数 skew(), 但是不清楚怎么使用excel进行遍历, 数据量很大。

尝试使用python进行解决。

第一次学习python,没想到了在克服安装各种包的难过之后,居然成功实现了。

python3.3:

#this is a test case

# -*- coding: gbk -*-
print("hello python!中文")

#env config
import xlrd
import os
import xlwt3
import numpy

import pandas as pd
#from pandas import Series,DataFrame
#import pandas

data = xlrd.open_workbook("E:\\data.xlsx")
table = data.sheets()[0]   #this need to be verify more

#print ("check")
print (table.nrows)
print (table.name)
print ("############################")

#total line num
line_num=table.nrows

cell_sectionA=table.cell(1,0).value
cell_sectionB=table.cell(1,1).value
#print (cell_sectionA)
#print (cell_sectionB)

start_value=cell_sectionA

#we need to recode the start value ,but not the end.
sectionB_each_time_start=0
#sectionB_each_time_end=i is ok.

for i in range(1,line_num):
    if start_value != table.cell(i,0).value:
        cacu_num=i-sectionB_each_time_start;
        #print (cacu_num)
        #print ("********************************")
        data={}
        for j in range(0,(cacu_num-1)):
            data[j]= table.cell((sectionB_each_time_start+j+1),1).value
            #print (data[j])

        df = pd.Series(data)
        #print("skew\t")
        #print("skew: %d  %f" %(table.cell(sectionB_each_time_start+1,0).value,df.skew()))
        print("%d"%table.cell(sectionB_each_time_start+1,0).value)
        #print("%f" %df.skew())

        #after caculate ,update the variable.
        sectionB_each_time_start=i-1
        start_value=table.cell(i,0).value

#file=xlwt3.Workbook()
#table_for_wt=file.add_sheet("test1");

#table_for_wt.write(0,0,cell_b)
#table_for_wt.write(1,1,cell_b)
#file.save(‘E:\\wtest.xls‘)

  

时间: 2024-11-10 14:09:30

python 使用pandas,完成对excel的操作: 遍历,求偏度(skew)的小程序的相关文章

小白学 Python(23):Excel 基础操作(上)

人生苦短,我选Python 前文传送门 小白学 Python(1):开篇 小白学 Python(2):基础数据类型(上) 小白学 Python(3):基础数据类型(下) 小白学 Python(4):变量基础操作 小白学 Python(5):基础运算符(上) 小白学 Python(6):基础运算符(下) 小白学 Python(7):基础流程控制(上) 小白学 Python(8):基础流程控制(下) 小白学 Python(9):基础数据结构(列表)(上) 小白学 Python(10):基础数据结构(

Python利用pandas处理Excel数据的应用

最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做自动化测试的时候,如果涉及到数据的读取和存储,那么而利用pandas就会非常高效,基本上3行代码可以搞定你20行代码的操作!该教程仅仅限于结合柠檬班的全栈自动化测试课程来讲解下pandas在项目中的应用,这仅仅只是冰山一角,希望大家可以踊跃的去尝试和探索! 一.安装环境: 1:pandas依赖处理Excel的xlrd模块,所以我们需要提前安装这个,安装命令

Python用Pandas读写Excel

Pandas是python的一个数据分析包,纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. Pandas提供了大量能使我们快速便捷地处理数据的函数和方法. Pandas官方文档:pandas.pydata.org/pandas-docs… Pandas中文文档:www.pypandas.cn 一.安装包 pandas处理Excel需要xlrd.openpyxl依赖包 pip3 install pandas pip3 install xlrd pip3 install o

python excel读写操作

1.读操作 xlrd 下载地址:https://pypi.python.org/pypi/xlrd 使用代码 # encoding : utf-8 #设置编码方式 import xlrd #导入xlrd模块 #打开指定文件路径的excel文件 xlsfile = r'D:\AutoPlan\apisnew.xls' book = xlrd.open_workbook(xlsfile) #获得excel的book对象 #获取sheet对象,方法有2种: sheet_name=book.sheet_

python之excel读写操作

一.xlrd和xlwt安装 1.下载xlwt安装包https://pypi.org/project/xlwt/#files 2.解压后进入文件目录 3.执行python setup.py install 二.读取操作 1 # -*- conding:utf-8 -*- 2 __author__ = 'dsh' 3 # How to read from an Excel using xlrd module 4 import xlrd 5 # 关联指定路径中的xls文件,得到book对象 6 fil

python对Excel表格操作

操作场景,给一个Excel表格随机生成10万个手机号码 python中常见的对Excel操作模块 xlwt module 将数据写入Excel表 xlrd module 读取Excel表格 xlsxwriter modole  xlwt模块的升级版,用于处理大量数据 先用xlwt写入Excel操作 import xlwt # 将数据写入Excel import random book = xlwt.Workbook(encoding='utf-8',style_compression=0) #

python之pandas简单介绍及使用(一)

一. Pandas简介 1.Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.pandas提供了大量能使我们快速便捷地处理数据的函数和方法.你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一. 2.Pandas 是python的一个数据分析包,最初由AQR Capital Management

对于excel的操作

对于excel的操作,python 可用的包比较多 1.xlrd & xlwt 这两个模块主要是在操作xls的文件,对于xlsx的文件处理很挫,甚至xlwt都不支持 2.pandas 作为数据分析利器,在处理excel方面也比较犀利 3.xlsxwriter 有丰富的特征,支持很多功能,缺点是不能打开/修改已有文件 4.openpyxl https://www.cnblogs.com/zeke-python-road/p/8986318.html 原文地址:https://www.cnblogs

python之pandas用法大全

python之pandas用法大全 更新时间:2018年03月13日 15:02:28 投稿:wdc 我要评论 本文讲解了python的pandas基本用法,大家可以参考下 一.生成数据表1.首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:?12import numpy as npimport pandas as pd2.导入CSV或者xlsx文件:?12df = pd.DataFrame(pd.read_csv('name.csv',header=1))df = pd.D