python3读取BJDA药品经营企业数据

#-*- coding:utf-8 -*-
#读取北京FDA的药品经营企业数据
# 20161125 zhangshaohua
import re
import urllib.request
import urllib.parse
import os

def getContent(url,pat,charSet):
    #指定网址、正则表达式、编码方式,返回指定内容
    page = urllib.request.urlopen(url)
    content = page.read().decode(charSet)
    pattern = re.compile(pat)
    result = re.findall(pattern,content)

    return result
#读取首页
url = ‘http://www.bjda.gov.cn/eportal/ui?pageId=331148‘

#取总记录数,每页20条
zjls = getContent(url,‘总记录数:(\d{1,5}),‘,‘UTF-8‘)

vdzjls = int(zjls[0])
vdzjls = int(round(vdzjls/20,0)) 

for i in range(51,vdzjls):
    url = ‘http://www.bjda.gov.cn/eportal/ui?pageId=331148&currentPage=‘+str(i)
    pattern = ‘artileId=(.*)">查看‘
    page_id = getContent(url,pattern,‘UTF-8‘)
    for url_id in page_id:
        try:
            subid = url_id
            suburl = "http://www.bjda.gov.cn/eportal/ui?pageId=331631&artileId="+subid
            qymc = getContent(suburl,‘企业名称:</th>\r\n.*?<td>(.*?)</td>‘,‘UTF-8‘)
            zcdz = getContent(suburl,‘注册地址:</th>\r\n.*?<td>(.*?)\s{0,3}</td>‘,‘UTF-8‘)
            xkzh = getContent(suburl,‘许可证号:</th>\r\n.*?<td>(.*?)</td>‘,‘UTF-8‘)

            print(qymc,zcdz,xkzh)
            file_object = open(‘bjda.txt‘,‘a‘)
            file_object.write(qymc[0])
            file_object.write(‘,‘)
            file_object.write(zcdz[0])
            file_object.write(‘,‘)
            file_object.write(xkzh[0])
            file_object.write(‘\n\r‘)

        finally:
            None
        file_object.close()

vdzjls  = int(zjls[0])

print(‘药品零售企业读取完成!‘)

  经历了读取HDA的练习,此次读取BJ的数据开始比较顺畅。在读取996条数据时出错,再次出现换行造成的问题;

多次试错后用‘\s{0,3}’成功解决.

正则表达式要继续学习,才能不断进步,避免遇“”坑“”时能顺利通过!

时间: 2024-08-24 12:44:51

python3读取BJDA药品经营企业数据的相关文章

如何引导企业数据“价值变现”,看能源化工业的数据化管理

核心内容:供应链管理,阿米巴管理,能源化工行业四大业务特点,六大管理现状,管理经营数据化五大问题,能源化工行业数据四大特点,基于能源行业业务.管理.数据特点的数据决策管理支持方案(PC端集成.移动办公.微信集成.可视化大屏) 穹顶之下:能源化工行业发展大背景 2014年6月,<能源发展战略行动计划>(2014-2020)[1]发布,着重突出了控制消费总量.保证能源安全.控制煤炭消费.优化能源改革.推进能源体制改革等方面.[2]2014年,我国已经成为煤炭.石油.天然气的净进口国,石油对外依存度

企业数据云备份

如今,企业更多的依靠网络科技来提升工作效率和竞争力,各种网络应用模式让数据信息量不断增多.根据IDC统计数字,2014年全球信息总量达到1.2ZB(1 ZB相等于1万亿GB),而平均每个企业所需的应用数据,更占了整体储存数据的80%. 在这个环境下,为数据信息进行备份变得更加重要,抛开传统的备份方式不说,近年兴起的云备份也是一种不错的选择,但是必须做好网络安全工作! 云备份 迎合移动办公趋势 小编认为,数据信息已经成为企业运营的命脉所在,必须有多重的备份保障.某些发达国家甚至订立法规,要求一些行

DataPipeline丨新型企业数据融合平台的探索与实践

一.关于数据融合和企业数据融合平台 数据融合是把不同来源.格式.特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享. 企业数据融合平台,通常的表现形态为运行着大量数据同步和转换任务的分布式系统.其源端一般为各类偏实时的业务数据存储系统,目的端为各类数据仓库/对象存储. 二.企业数据融合平台的典型架构 下图为数据融合平台的典型架构,源端是不同的数据存储系统,另一端是各种类型的数据仓库,关系型数据库或者文件存储等.中间为数据融合平台的简单架构,组件Source connector

未来科技城 x 奇点云打造「企业数据大脑」,助力1.3万家企业服务

“当前,政府数字化和数字政府建设已成为一种趋势.一种必然,并且有了一条水到渠成式的实现路径.” 上升为国家战略的数字中国建设加速了”智慧政务“的生动实践,杭州未来科技城的「企业数据大脑」就是一个典型. 从17年8月开始,入驻的企业迅速增多,这是科技城政府特别直观的感受.伴随而来的,是业务处理日趋复杂.政务信息资源的急剧增长,而已有数据管理模式已不适应大数据时代政务的特点.为贯彻落实“最多跑一次”改革,推进“三化融合”,推行“互联网+”政务服务模式,更精准地服务企业,杭州未来科技城政府联合奇点云,

利用java反射机制实现读取excel表格中的数据

如果直接把excel表格中的数据导入数据库,首先应该将excel中的数据读取出来. 为了实现代码重用,所以使用了Object,而最终的结果是要获取一个list如List<User>.List<Book>等,所以需要使用泛型机制去实现.下面会给出代码,可能会稍微复杂一点,但注释很清晰,希望大家耐心阅读. 在上代码之前简单说一下思路: 1.excel表格必须有表头,且表头中各列的值要与实体类的属性相同: 2.先读取表头信息,然后获取表头列数,接着确定需要使用的set方法的名称,并存到数

集团性企业数据信息系统解决方案

集团性企业数据信息系统解决方案 总体需求分析 某商业集团是一家集精品百货.时尚百货.精品超市及大卖场.便利店为一体的大型现代化集团.此商业经过10年的发展,目前拥有2家大型百货商场,6家大型综合超市卖场,100多家超市便利店,是以现代企业制度为根基的民营实体商业和现代服务业,并拥有百货.商超.产业.地产四大事业部. 随着企业规模不断扩大,需要处理的业务不可避免的也越来越多,越来越细.那么为了规范管理和信息共享,企业不得不借助于各种业务系统,例如财务系统.OA系统.会员信息系统等等. 随着这些系统

Microsoft EDP(enterprise database protection)选择应用程序在哪里可以访问企业数据

在配置策略时,对Rule template设置完成后,添加corporate identity.关于corporate identity, 目前没有什么好的理解,翻译过来就是“公司标识”,我也理解不了什么意思,建议填“公司的域”. 然后就是选择应用程序在哪里可以访问企业数据选择应用程序在哪里可以访问企业数据步骤:name:自己添个容易理解的名字就行network element:网络种类"****" definition: 对应网络种类在定义 network elemnt: enter

企业数据备份流程

众所周知,数据是关乎企业的发展的.那么,既然企业数据涉及到企业的机密,那么数据肯定是要严谨保护的.所以肯定不能直接上传到网盘,否则也是不安全的一种做法,首先应该对要备份的数据进行加密,加密后再进行二次加密再上传才能保证安全. 那么,小编认为百度云盘及其他的同步盘可以暂且不讨论了,一起来看看关于多备份的客户端吧. 关于多备份: 多备份是国内第一家基于全球云平台技术的数据保护服务品牌,同时获得IDG和极客帮千万级投资;多备份是深圳市木浪科技有限公司旗下品牌.借助于云计算技术,以及互联网团队的0贴近的

集团企业数据信息系统建设方案

集团企业数据信息系统建设方案 FineReport数据信息系统的总体流程为:整合和获取数据,将数据应用于报表的开发,将开发完的报表进行逻辑展示处理和部署,最后呈现给使用者使用. 开发报表的过程中,必须结合企业流程和企业内部的系统数据,进行统一搭建,最终要求开发出一个结合了各个系统数据的报表决策平台.开发过程中坚持"契合需求,方便高效"的原则,为企业员工.管理者以及决策者提供一个实用.方便.高效的工具. 本章将按照建设目标,从业务展示和BI分析两个方面对数据信息系统进行举例阐述.所用截图