Python xml 解析百度糯米信息

先利用爬虫利用百度糯米提供的api来采集北京当天的团购信息，保存为numi.html

import xml.etree.ElementTree as ET
import os

class Nuomi():

   def __init__(self):

       self.numi=[]
   def Parse(self,filepath):

tree=ET.parse(filepath)
       root =tree.getroot()
       for url in root.iter(‘url‘):
           nuomi_lei={}
           data=url.find(‘data‘)
           if data is not None:
               display=data.find(‘display‘)
               if display is not None:
                   try:
                       nuomi_lei[‘title‘]=display.find(‘title‘).text
                   except Exception as e:
                       print("No title")
                   try:
                       nuomi_lei[‘businessTitle‘]=display.find(‘businessTitle‘).text
                   except Exception as e:
                       print ("No businessTitle")
                   try:
                       nuomi_lei[‘value‘] =display.find(‘value‘).text
                   except Exception as e:
                       print ("No value")
                   try:
                       nuomi_lei[‘price‘]=float(display.find(‘price‘).text)
                   except Exception as e:
                       print("No pire")
                   self.numi.append(nuomi_lei)
       return(self.numi)

if __name__ == ‘__main__‘:

   nuomi=Nuomi()
   date=nuomi.Parse(‘numi.html‘)
   print(len(date))

时间： 2024-10-26 07:23:15

Python xml 解析百度糯米信息的相关文章

Python XML解析

Python XML解析什么是XML? XML 指可扩展标记语言(eXtensible Markup Language). 你能够通过本站学习XML教程 XML 被设计用来传输和存储数据. XML是一套定义语义标记的规则,这些标记将文档分成很多部件并对这些部件加以标识. 它也是元标记语言.即定义了用于定义其它与特定领域有关的.语义的.结构化的标记语言的句法语言. python对XML的解析常见的XML编程接口有DOM和SAX,这两种接口处理XML文件的方式不同.当然使用场合也不同. pyth

Python XML 解析

什么是 XML? XML 指可扩展标记语言(eXtensible Markup Language). XML 被设计用来传输和存储数据. XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识. 它也是元标记语言,即定义了用于定义其他与特定领域有关的.语义的.结构化的标记语言的句法语言. Python 对 XML 的解析常见的 XML 编程接口有 DOM 和 SAX,这两种接口处理 XML 文件的方式不同,当然使用场合也不同. Python 有三种方法解析 XML,S

python xml解析例子

# -*- coding: utf-8 -*- """ Created on Thu Apr 16 23:18:27 2015 @author: shifeng """ ''' 功能:解析CDR_sample.xml文件,输出格式为DNorm接收的格式,并将训练集的"label"写入到文档中 xml文件:见CSDN资源共享参考博客:http://www.cnblogs.com/fnng/p/3581433.html '''

python xml解析和生成

解析使用xml.etree.ElementTree 模块,生成使用xml.dom.minidom模块, ElementTree比dom快,dom生成简单且会自动格式化. <?xml version='1.0' encoding='utf-8'?> <baspools> <bas> <basprovider>0</basprovider> <portal_version>1</portal_version> <tim

Python XML解析和处理

movies.xml <collection shelf = "New Arrivals"> <movie title = "Enemy Behind"> <type>War, Thriller</type> <format>DVD</format> <year>2013</year> <rating>PG</rating> <stars&g

python xml解析之 xml.etree.ElementTree

import xml.etree.ElementTree as tree import io xml = '''<?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100&

[Python3]XML解析处理 - Element Tree

概述本文就是python xml解析进行讲解,在python中解析xml有很多种方法,本文通过实例来讲解如何使用ElementTree来解析xml.对于其他的xml解析方法,请自行去查找资料. 请注意,本文不是ElementTree手册,不会将所有的特性进行演示,笔者从实际用到的一些关键特性进行实例演示,对于其他特性,大家可以参见官方文档学习和了解: https://docs.python.org/3/library/xml.etree.elementtree.html 什么是ElementT

使用python如何解析XML？

本文和大家分享的主要是使用python解析XML相关内容,一起来看看吧,希望对大家学习python有所帮助. 什么是XML? XML 指可扩展标记语言(e X tensible M arkup L anguage). XML 被设计用来传输和存储数据. XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识. 它也是元标记语言,即定义了用于定义其他与特定领域有关的.语义的.结构化的标记语言的句法语言. python对XML的解析常见的XML编程接口有DOM和SAX,这两

使用由 Python 编写的 lxml 实现高性能 XML 解析

lxml 简介 Python 从来不出现 XML 库短缺的情况.从 2.0 版本开始,它就附带了 xml.dom.minidom 和相关的 pulldom 以及 Simple API for XML (SAX) 模块.从 2.4 开始,它附带了流行的 ElementTree API.此外,很多第三方库可以提供更高级别的或更具有 python 风格的接口. 尽管任何 XML 库都足够处理简单的 Document Object Model (DOM) 或小型文件的 SAX 解析,但开发人员越来越多碰

猜你喜欢

PHP面向对象之php数据对象（PDO）——图书查看管理

首先创建相关的有关的数据库:数据库的名字我用的是books表名用的是book(下面是完整的数据库,里面的img/img01.jpg是显示的图片的路径) CREATE DATABASE books DE ...

20170117老男孩linux实战运维培训-SSH KEY免密码验证分发、管理、备份实战讲解01

这一节说的SSH ssh制造私钥和公钥私钥是钥匙公钥是锁把公钥分发到各个要登录的linux服务器上 #ssh-keygen -t dsa 使用这个命令后将会在本机生成一对密钥私钥 id_dsa ...

伸展树整理

伸展树 1.在伸展树上的一般操作都基于伸展操作:假设想要对一个二叉查找树执行一系列的查找操作,为了使整个查找时间更小,被查频率高的那些条目就应当经常处于靠近树根的位置.因此,在每次查找之后对树进行重构 ...

及其相伴相生的巨大不r2

会议确定将持续加大对实体书店的扶持,着力将实体书店打造成现代城市中的"文化场".全面推进"扫黄打非"进基层工作,进一步强化社会管理基础建设.深入推进软件正版化工 ...

软件开发技术基础复习要点

软件开发技术基础复习要点 1.生存周期: 指一个软件从提出开发要求开始,经过需求分析.设计.制造.调试.使用.维护,直到软件产品被淘汰为止的整个过程. 2.简述软件工程的基本原理: 用分阶段的生命周期 ...

C#类、接口、虚方法和抽象方法

虚方法和抽象方法都可以供派生类重写,它们之间有什么区别呢? 1. 虚方法必须有实现部分,并为派生类提供了重写该方法的选项.抽象方法没有提供实现部分,抽象方法是一种强制派生类重写的方法,否则派生类将不能 ...

POJ #2448 A New Operating System

Time Limit: 20000MS Memory Limit: 65536K Total Submissions: 1165 Accepted: 110 Case Time Limit: ...

1.Illustrator简介

我的Illustrator学习博客图片直接键盘上复制粘贴快捷键分类1 分类2 分类3 分类4 1 2 3 4 5 这是插入表格 1 这里可以插入代码, 2 学习淘宝时可以插入代 ...

maven的setting，仓库连接为阿里云

<?xml version="1.0" encoding="UTF-8"?> <!-- Licensed to the Apache Soft ...

【POJ 3265】Problem Solving

Problem Solving Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 1645 Accepted: 675 De ...

Missing artifact com.sun:tools:jar:1.5.0解决办法

前一阵子下了最新的JavaEE版本的eclipse,导入maven工程之后,pom文件一直报Missing artifact com.sun:tools:jar:1.5.0.很纳闷,tools.jar ...

【洛谷P1948】[USACO08JAN]电话线Telephone Lines

题目描述 Farmer John wants to set up a telephone line at his farm. Unfortunately, the phone company is u ...

https笔记

TCP提供了可靠的,面向连接的字节流服务. 1)应用数据分割成TCP认为适合发送的数据块,通过MSS(最大数据包长度)来控制. 2)重传机制 3)对首部和数据进行校验 4)TCP对收到的数据进行排序, ...

how to send mail from 3rd

http://www.advancedintellect.com/post/2011/03/02/Exchange-2010-and-SMTP-settings.aspx Enviroment: Ex ...

CAD中用户选择实体

在CAD的很多操作中都会有需要用户选择实体的时候,这里将我最近项目中用到的方法分享一下,程序原意是希望用户选择一个单行文本或者多行文本,并返回所选文本的内容,直接上代码: CString CPaint ...

CPU性能命令

基本概念: CPU使用率:通过测量一段时间内cpu实例忙于执行工作的时间比例获得,以百分比表示 CPI(每指令周期数):用来描述cpu如何使用它的时钟周期,同时也可以用来理解CPU使用率的本质:CPI ...

SQL优化策略高级优化经常使用-1（The Return Of The King）

1 经常使用的优化策略 1.1 语句 1.1.1使用实际的列名当我们查询SQL语句时.你是否觉得使用实际的列名比使用*更快呢?答案是肯定的. 为了证实这一点,感兴趣的朋友能够自己验证一下.我这 ...

滑动到底部或顶部响应的ScrollView实现

关于使用可见:滚动到底部或顶部响应的ScrollView使用示例APK可从这些地址下载:Google Play, 360手机助手, 百度手机助手, 小米应用商店, 豌豆荚两种实现方式的主要 ...

解析UNICODE方法

php7开始支持unicode function parse($string) { $string = str_replace('\u', '}\u{', $string); $string = l ...

C++环境下DLL和LIB文件目录及名称修改

DLL工程,Debug版本下输出文件由basetool.dll basetool.lib 改为basetoolD.dll basetoold.lib 需设置: 1.配置属性-常规-目标文件名 $(Pr ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.