文件截图:
我将豆瓣某用户的想读、在读、读过书籍的名称以及链接采集下来并存入xml文件中,上图为某用户想读书籍的信息截图。
存储好书籍的链接以后,我们若想根据这个链接去访问每一本书的书籍主页并获得详细信息时,要面临的第一个问题就是:如何使用Python语言读取多个同名标签的文本值呢?
1 import xml.dom.minidom 2 3 #打开xml文档,其中abc代表想要读取的xml文件名称 4 dom = xml.dom.minidom.parse(‘abc.xml‘) 5 6 #得到文档的元素对象 7 root = dom.documentElement 8 9 #bookUrl代表想要读取的标签名称 10 info= dom.getElementsByTagName(‘bookUrl‘) 11 12 #因为xml文件中存在多个同名的标签,因此我们需要使用for循环来遍历每一对符合要求的标签读取、显示它们的文本信息 13 for i in range(len(info)): 14 url=info[i].firstChild.data 15 print(url)
程序运行结果:
https://book.douban.com/subject/30361646/
https://book.douban.com/subject/27064871/
https://book.douban.com/subject/11442993/
https://book.douban.com/subject/26584727/
https://book.douban.com/subject/26928713/
https://book.douban.com/subject/27055756/
https://book.douban.com/subject/27044356/
https://book.douban.com/subject/26901114/
https://book.douban.com/subject/1186348/
https://book.douban.com/subject/2109619/
https://book.douban.com/subject/27005639/
https://book.douban.com/subject/26739163/
如有错误,恳请大家指正,共同进步~
原文地址:https://www.cnblogs.com/LiXinx/p/10367018.html
时间: 2024-11-11 04:16:42