1.读取txt
read() 读取整个文件。
readline() 读取一行数据。
readlines() 读取所有行的数据。
例:
#coding=utf-8
from selenium import webdriver
user_file = open(‘user_info.txt‘,‘r‘)
values = user_file.readlines()
user_file.close()
for serch in values:
username = serch.split(‘,‘)[0]
print username
password = serch.split(‘,‘)[1] print password
2.读取csv
#coding=utf-8
import csv
#读取本地 CSV 文件
my_file=‘info.csv‘
date=csv.reader(file(my_file,‘rb‘))
#循环输出每一行信息
for user in date:
print user
3.读取xml
XML 即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进 行定义的源语言。
xml 有如下特征: 首先,它是有标签对组成:<aa></aa> 标签可以有属性: <aa id=’123’></aa> 标签对可以嵌入数据: <aa>abc</aa>
例:
#coding=utf-8
import xml.dom.minidom
#打开 xml 文档
dom = xml.dom.minidom.parse(‘info.xml‘)
#得到文档元素对象
root = dom.documentElement
print root.nodeName
print root.nodeValue
print root.nodeType
print root.ELEMENT_NODE
mxl.dom.minidom
mxl.dom.minidom 模块被用来处理 xml 文件,所以要先引入。
parse()
xml.dom.minidom.parse() 用于打开一个 xml 文件,并将这个文件对象 dom 变量。
documentElement
documentElement 用于得到 dom 对象的文档元素,并把获得的对象给 root
每一个结点都有它的 nodeName,nodeValue,nodeType 属性。
nodeName 为结点名字。
nodeValue 是结点的值,只对文本结点有效。
nodeType 是结点的类型。
getElementByTagName()可以通过标签名获取某个标签。它所获取的对象是以数组形式存放。如 “caption”和“item”标签在 info.xml 文件中有多个,那么可以指定数组的下标在获取某个标签。
root.getElementsByTagName(‘caption‘) 获得的是标签为 caption 一组标签; tagname[0] 表示一组标签中的第一个。
tagname[2] 表示一组标签中的第三个。
getAttribute() getAttribute()方法可以获得元素的属性所对应的值。