爬虫实践——数据存储到Excel中

在进行爬虫实践时,我已经爬取到了我需要的信息,那么最后一个问题就是如何把我所爬到的数据存储到Excel中去,这是我没有学习过的知识。

如何解决这个问题,我选择先百度查找如何解决这个问题。

百度查到的方法千万种,我先选择看得懂的文章下手,不断尝试,最后解决了问题

那么到底如何解决这个问题呢?

解决这个问题要用到三个模块分别是xlwt、xlrd和xlutils

在使用这两个模块时要先下载安装它们,我用的是pycharm编写程序,我用到的安装方法是:

#在文件中导入xlwt、xlrd 和xlutils

import  xlwt

import xlrd

import xlutils

再写入它们之后,会报错,把鼠标分别移到xlwt上点击一下,

它的头上会有一个红色的小灯泡,点击灯泡再点击install and import package "xlwt"

xlrd和xlutils同理

这样这三个模块就安装好了

模块安装好了,下一步就是要学会如何使用这三个模块了

xlwt模块:

 1 import xlwt
 2
 3 file_name = r‘C:\Users\樱花雨\Desktop\test.xls‘#这是你要保存文件的文件路径和文件名
 4 workbook = xlwt.Workbook()#表示新建xls工作簿
 5 sheet1 = workbook.add_sheet(‘worksheet‘)#新建xls表,表的名字是worksheet
 6 for a in range(1,16):
 7     # 把数据写入xls中,行,列,值
 8     sheet1.write(0, 0, ‘I‘)
 9     sheet1.write(0, 1, ‘love‘)
10     sheet1.write(0.2, ‘python‘)
11     # 保存xls到file_name的路径下和文件名
12     workbook.save(file_name)

xlrd和xlutils模块:(xlrd参考链接:xlrd)

 1 import xlrd
 2 from xlutils.copy import copy
 3
 4 xlsfile = r‘C:\Users\樱花雨\Desktop\test.xls‘
 5 #打开xsl文件
 6 book = xlrd.open_workbook(xlsfile)
 7 #获取表格的名字
 8 sheet_name = book.sheet_names()
 9 print(sheet_name)
10 #获取工作表
11 #(1)通过索引顺序获取
12 #sheet = bool.sheets()[0]
13 #(2)通过名称获取
14 #sheet = book.sheet_by_name(r‘worksheet‘)
15 #(3)通过索引顺序获取
16 sheet = book.sheet_by_index(0)
17 #获取表中的行数
18 nrows = sheet.nrows
19 #获取表中的列数
20 ncols = sheet.ncols
21 print(nrows)
22 print(ncols)
23 #获取表中整行的内容
24 row_data = sheet.row_values(0)
25 #获取表中列内容
26 col_data = sheet.col_values(0)
27 print(row_data)
28 print(col_data)
29 #获取表中单元格的内容
30 cell_value = sheet.cell_value(3,0)
31 print(cell_value)
32 #获取表中单元格的内容
33 cell_value2 = sheet.cell(3,0)
34 print(cell_value2)
35 #修改或添加单元格内容
36 #ctype:0 empty ;1,string;2 number;3 date;4 boolean;5 error
37 #value:写入单元格中的内容
38 #xf:0
39 #sheet.put_cell(row,col,ctype,value,xf)
40 sheet.put_cell(1,2,1,"test",0)
41 cell_value2 = sheet.cell(1,1)
42 print(cell_value2)
43 #保存xlsfile
44 wb = copy(book)
45 wb.save(xlsfile)

原文地址:https://www.cnblogs.com/yuyedekafei/p/11629049.html

时间: 2024-10-12 21:09:59

爬虫实践——数据存储到Excel中的相关文章

Python爬虫爬数据写入到EXCEL中

Python抓数据写到EXCEL中.以前都是写到txt中然后再导入到excel.现在直接写到excel中. #coding=utf-8 import xlwt import requests from bs4 import BeautifulSoup import sys reload(sys)   sys.setdefaultencoding('utf8')  #打开excel文件 data=xlwt.Workbook() #获取其中的一个sheet table=data.add_sheet(

Python2爬虫获取的数据存储到MySQL中时报错"Incorrect string value: '\\xE6\\x96\\xB0\\xE9\\x97\\xBB' for column 'new' at row 1"的解决办法

由于一直使用python3进行编码,在使用Python2时,将爬虫数据连接数据库进行存储时,出现如上的报错,经查资料 是数据库编码问题. 如下转自:http://www.cnblogs.com/liuzhixin/p/6274821.html 的博客,在此感谢博主的慷慨分享之情. 错误原因:我们可以看到错误提示中的字符0xF0 0x9F 0x98 0x84 ,这对应UTF-8编码格式中的4字节编码(UTF-8编码规范).正常的汉字一般不会超过3个字节,为什么为出现4个字节呢?实际上是它对应的是智

如何使用免费控件将Word表格中的数据导入到Excel中

我通常使用MS Excel来存储和处理大量数据,但有时候经常会碰到一个问题—我需要的数据存储在word表格中,而不是在Excel中,这样处理起来非常麻烦,尤其是在数据比较庞大的时候, 这时我迫切地需要将word表格中的数据导入到Excel中.相信大家也碰到过同样的问题,下面我就给大家分享一下在C#中如何使用免费控件来实现这一功能.这里,我使用了两个免费API, DocX和Spire.Xls. 有需要的朋友可以下载使用.下载地址: DocX:codeplex官网 Spire.Xls: E-iceb

Java基础知识强化之IO流笔记45:IO流练习之 把文本文件中数据存储到集合中的案例

1.  把文本文件中数据存储到集合中      需求:从文本文件中读取数据(每一行为一个字符串数据)到集合中,并遍历集合. 分析:      通过题目的意思我们可以知道如下的一些内容,      数据源是一个文本文件.      目的地是一个集合.      而且元素是字符串.      数据源:   b.txt -- FileReader -- BufferedReader  目的地:  ArrayList<String> 2. 代码示例: 1 package cn.itcast_02; 2

c#.net循环将DataGridView中的数据赋值到Excel中,并设置样式

Microsoft.Office.Interop.Excel.Application excel =                new Microsoft.Office.Interop.Excel.Application();            excel.SheetsInNewWorkbook = 1;            excel.Workbooks.Add(); //设置Excel列名            excel.Cells[1, 1] = "学号";     

机房收费系统———如何将MSFlexGrid中的数据导入到Excel中

机房收费系统进行了一段时间了,虽然说大体上跟学生信息管理系统一样,不过也有不一样的地方.比如说报表.如何将MSFlexGrid中德数据导入到Excel中等等.这些东西原来没有接触过,第一次接触难免有些陌生.这些问题困扰了我好长-时间,一看到它头都大了.不过,提高班名言——不将就是发现的源动力.本着这一原则,慢慢的攻克了这些问题. 机房收费系统中好几个地方需要将MSFlexGrid中德数据导入到Excel中,这是在学生信息管理系统中没有的功能.首先,首先需要在vb里面引用我们所需要的对象:Micr

将数据库的数据导出到excel中

这篇文章主要介绍了asp中把数据导出为excel的2种方法:分别用excel组件.文件组件实现,需要的朋友可以参考下.我们在做项目的时候经常要将数据库的数据导出到excel中,很多asp用户并不知道怎么写.这里总结了两种方法来导出excel,希望能帮到大家. 方法一:用excel组件 方法二:使用文件组件 可以看出,第一种方法是直接导出的是excel文件,而第二张方法是到处的是文本文件,只不过后缀名改成了xls. 然后看起来就是excel了. 经过对比第一种方法的效率没有第二种方法的效率高,而且

JAVA之旅(十七)——StringBuffer的概述,存储,删除,获取,修改,反转,将缓存区的数据存储到数组中,StringBuilder

JAVA之旅(十七)--StringBuffer的概述,存储,删除,获取,修改,反转,将缓存区的数据存储到数组中,StringBuilder 讲完String,我们来聊聊他的小兄弟 一.StringBuffer概述 关于StringBuffer这个对象,Buffer是什么意思?缓冲区的意思,String一旦初始化时不可以被改变的,而StringBuffer是可以的,这就是区别,特点: StringBuffer是一个容器 可以字节操作多个数据类型 最终会通过toString方法变成字符串 存储 S

将datagrid中数据导出到excel中 -------&lt;&lt;工作日志2014-6-6&gt;&gt;

1.下载log4j jar包,放入lib目录, 导入项目中   下载地址 http://logging.apache.org/ 2.创建log4j.properties 文件  目录 Src  下面是一个 log4j.properties的例子(注:来源于网上,非本人所写) ################################################################################ # 其语法:log4j.rootLogger = [ leve