获取法院企业失信信息

#coding:gbk
import sys,re
import urllib.request
#from bs4 import BeautifulSoup
def getId(url,i):
    postdata = urllib.parse.urlencode({‘currentPage‘: i})
    postdata = postdata.encode(‘utf-8‘)
    page = urllib.request.urlopen(url,postdata)
    html =str(page.read(),"utf-8")
    reg=re.compile(r"\[<a .*id=\"(\d+)\">查看.*\]")
    return reg.findall(html)

#===============================================================================
# def getInfo(url):
#     page = urllib.request.urlopen(url)
#     html =str(page.read(),"utf-8")
#     return html
#===============================================================================

fname = "C:/Users/Songxiaodi/Desktop/result.txt"
file = open(fname, ‘w‘)

for i in range(1,3): #页数,根据需要填写,也可以通过正则从网页中分析出来。
    try:
        tt = getId("http://shixin.court.gov.cn/unitMore.do",i)
        print (tt)
        for k in tt: #k 是detail页面的id,每页的id
            html_value="http://shixin.court.gov.cn/detail?id="+k
            html=str(urllib.request.urlopen(html_value).read(),"utf-8")
            html=html.replace("\\n","")
            print(html)
            html=eval(html) #字符串转dict
            file.write(str(html["id"])+";"+html["iname"]+";"+html["caseCode"]+";"+                       html["cardNum"]+";"+html["businessEntity"]+";"+html["courtName"]+";"                       +html["areaName"]+";"+html["partyTypeName"]+";"+html["gistId"]+";"+html["regDate"]+";"                       +html["gistUnit"]+";"+html["duty"]+";"+html["performance"]+";"+html["disruptTypeName"]+";"+html["publishDate"])

            file.write("\n")
    except Exception as err:
        print(err)

file.close()
时间: 2024-12-09 03:47:51

获取法院企业失信信息的相关文章

【爬虫】关于企业信用信息公示系统-加速乐最新反爬虫机制

( ̄▽ ̄)~*又得半夜修仙了,作为一个爬虫小白,花了3天时间写好的程序,才跑了一个月目标网站就更新了,是有点悲催,还是要只有一天的时间重构. 升级后网站的层次结构并没有太多变化,表面上是国家企业信用信息公示系统 的验证码又升级了.之前是 点按后滑动拼图方式: 现在的验证码主要是按顺序点击图片汉字验证码,但也不排除会出现以前的点按拖动验证码: 验证码的破解这里就不详细介绍了,需要的可以私信我们一起讨论研究下,详细可参考极验验证码破解-源码+破解手册,极验二代和三代验证码破解的方式基本都是一个套路的

微信网页授权认证获取用户的详细信息,实现自动登陆-微信公众号开发干货

原创声明:本文为本人原创作品,绝非他处转账,转载请联系博主 从接触公众号到现在,开发维护了2个公众号,开发过程中遇到很多问题,现在把部分模块功能在这备案一下,做个总结也希望能给其他人帮助 工欲善其事,必先利其器,先看看开发公众号需要准备或了解什么 web开发工具:官方提供的开发工具,使用自己的微信号来调试微信网页授权.调试.检验页面的 JS-SDK 相关功能与权限,模拟大部分 SDK 的输入和输出.下载地址:web开发工具下载 开发文档:https://mp.weixin.qq.com/wiki

AppCan移动开发技巧:3步走,获取移动APP签名信息

大家知道,在移动APP开发里,与应用包名一样,应用的签名信息需是唯一的,否则将会出现应用冒领.重复安装等问题.之前分享过安卓应用的签名如何获取(点击查看),这里将继续以AppCan平台为例,分享如何获取APK包的签名信息及相关注意事项. 获取APK包签名信息 为了保证每个应用程序开发商的合法ID安全,防止部分开发商通过使用相同的包名混淆和替换已经安装的程序,开发者需要对发布的APK文件进行唯一签名,保证每次发布的应用版本的一致性(如果自动更新,则不会因为版本不一致而无法安装). 操作步骤: 1.

百度地图的使用之获取数据库表中信息的坐标点显示在地图上

//通用封装好的js: var map = new BMap.Map("container"); //建树Map实例 var point = new BMap.Point(103.976032, 33.845509); // 建树点坐标 map.centerAndZoom(point, 6); // 初始化地图,设置中心点坐标和地图级别. //地图事件设置函数: map.enableDragging(); //启用地图拖拽事件,默认启用(可不写) map.enableScrollWhe

开源项目成熟度分析工具-利用github api获取代码库的信息

1.github api github api是http形式的api,功能还是比较丰富的,博主因为项目的原因主要用到的是提取project信息这项功能,返回的数据是JSON格式. api页:https://developer.github.com/v3/ Options: (H) means HTTP/HTTPS only, (F) means FTP only --anyauth Pick "any" authentication method (H) -a, --append Ap

.net 获取https页面的信息 在iis7.5服务器上不管用

原文:.net 获取https页面的信息 在iis7.5服务器上不管用 让我纠结了一天多的问题,给大家看下,有相同情况的可以不用浪费时间了,本人当时找了好半天都没找到什么有用的信息,项目在本地没有问题,但部署在服务器后,获取不到https页面的信息,加入下面的代码就可以了,因为iis7.5的安全协议比较高的原因. 我的获取页面需要cookie,不需要的可以去掉: GET的方法: 1 /// <summary> 2 /// 获取URL访问的HTML内容 获取https 页面的 3 /// <

微信公众号开发之网页授权认证获取用户的详细信息,实现自动登陆

原创声明:本文转来源本人另一博客[http://blog.csdn.net/liaohaojian/article/details/70175835]绝非他人处转载 从接触公众号到现在,开发维护了2个公众号,开发过程中遇到很多问题,现在把部分模块功能在这备案一下,做个总结也希望能给其他人帮助 工欲善其事,必先利其器,先看看开发公众号需要准备或了解什么 web开发工具:官方提供的开发工具,使用自己的微信号来调试微信网页授权.调试.检验页面的 JS-SDK 相关功能与权限,模拟大部分 SDK 的输入

Java并发学习之二——获取和设置线程信息

本文是学习网络上的文章时的总结,感谢大家无私的分享. Thread类的对象中保存了一些属性信息能够帮助我们辨别每一个线程,知道它的一些信息 ID:每个线程的独特标示: Name:线程的名称: Priority:线程对象的优先级.优先级别在1-10之间,1是最低级,10是最高级. Status:线程状态.在java中,线程只有6种状态:new,runnable,blocked,waiting,time waiting 或terminated. 现在写一个程序,将线程的信息保存到文件中方便查看 pa

Android_获取手机各种详细信息

TelephonyManager类主要提供了一系列用于访问与手机通讯相关的状态和信息的get方法.其中包括手机SIM的状态和信息.电信网络的状态及手机用户的信息.在应用程序中可以使用这些get方法获取相关数据. TelephonyManager类的对象可以通过Context.getSystemService(Context.TELEPHONY_SERVICE)方法来获得,需要注意的是有些通讯信息的获取对应用程序的权限有一定的限制,在开发的时候需要为其添加相应的权限. 以下列出TelephonyM