爬虫—天眼查接口函数

from selenium import webdriver
import time
import re
from bs4 import BeautifulSoup
import urllib

#获取企业基本信息数据
def get_enterprise_data(ename):
#搜索页面链接地址
keyword = urllib.parse.quote(ename)
url = ‘http://www.tianyancha.com/search/‘+keyword
#获得搜索结果页面
driver = webdriver.PhantomJS(executable_path=‘/root/phantomjs-2.1.1-linux-x86_64/bin/phantomjs‘)
driver.maximize_window()
driver.get(url)
time.sleep(2)
#从搜索结果中点击第一个结果
driver.find_element_by_class_name(‘query_name‘).click()
time.sleep(2)
#抓取第一个结果的网页，匹配出需要的字段
soup = BeautifulSoup(driver.page_source,"html.parser")
basic_info_list = soup.find_all(‘p‘,class_="ng-binding ng-scope")
data = []
qiyemingcheng = driver.title.split(‘】‘)[1].split(‘信息查询‘)[0]
data.append(qiyemingcheng)
for i in basic_info_list:
data.append(i.get_text().strip())

return data

print(get_enterprise_data(‘科润智能‘))

时间： 2024-10-12 16:33:50

爬虫—天眼查接口函数的相关文章

Oracle官网JNI简介和接口函数分析

第一章概述本章主要介绍JNI(Java Native Interface),JNI是一种本地编程接口.它允许运行在JAVA虚拟机中的JAVA代码和用其他编程语言,诸如C语言.C++.汇编,写的应用和库之间的交互操作. JNI的最大优势在于没有强加任何限制在JAVA虚拟机的下层实现上,因此,JAVA虚拟机供应商能够提供JNI的支持而不影响虚拟机的其他部分,程序员只需写出一个版本的本地应用和库,就可使之运行在一切支持JNI的JAVA虚拟机上. 本章包含了以下的要点: ? JNI概述 ? 目标 ?

自定义类签发校验token-实现多方式登录-自定义反爬类-admin后台表管理字段自定义-群查接口-搜索-排序-分页

目录复习今日签发token 校验token 案例:实现多方式登陆签发token 案例:自定义认证反爬规则的认证类 admin使用自定义User表:新增用户密码密文群查接口各种筛选组件数据准备 drf搜索过滤组件 drf排序过滤组件 drf基础分页组件复习 """ 频率组件:限制接口的访问频率源码分析:初始化方法.判断是否有权限方法.计数等待时间方法自定义频率组件: class MyThrottle(SimpleRateThrottle): scope = 'sm

签发token、校验token、多方式登录签发token的实现、自定义认证反爬规则的认证类、admin使用自定义User表：新增用户密码密文、群查接口各种筛选组件数据准备、drf搜索过滤组件、drf排序过滤组件、drf基础分页组件

签发token 源码入口 # 前提:给一个局部禁用了所有认证与权限的视图类发送用户信息得到token,其实就是登录接口 # 1)rest_framework_jwt.views.ObtainJSONWebToken 的父类 JSONWebTokenAPIView 的 post 方法 # 接收有username.password的post请求 # 2)post方法将请求得到的数据交给 rest_framework_jwt.serializer.JSONWebTokenSerializer 处

Django rest_framework实现增删改查接口

目录 Django rest_framework实现增删改查接口写接口前的知识准备 __all__的使用方法序列化类配置 Response二次封装连表深度查询单查群查接口单删群删接口单增,群增接口整体单改群改接口局部修改数据视图给序列化传参 Django rest_framework实现增删改查接口本文使用Django的rest_framework框架的ModelSerializer模块和ListSerializer模块实现单查群查.单删群删.单增群增.单改群改接口. 写接口

COM接口函数通用Hook方法

本文是我的本科学位论文, 今发表在此, 以示原创之据第1章绪论研究背景研究意义相关技术简介 COM概述 COM内存模型描述及C语言和C++语言实现调用约定 Hook API原理 Windows钩子原理及进程注入开发及调试环境第2章问题抽象及关键技术研究实验01:通过调试器查看C++类的虚函数表实验02:通过函数指针调用C++虚函数实验03:交换两个相同C++类的虚函数表实验04-1:替换C++虚函数表中的虚函数(__thiscall)地址实验04-2:替换C++虚函数

Linux操作系统中的系统调用接口函数

在分析病毒样本时发现有些系统函数是必用,有些超常用,现在都列出来,希望和大家交流转载请注明出处:http://blog.csdn.net/u010484477 O(∩_∩)O谢谢进程控制 fork 创建一个新进程 clone 按指定条件创建子进程 execve 运行可执行文件 exit 中止进程 _exit 立即中止当前进程 getdtablesize 进程所能打开的最大文件数 getpgid 获取指定进程组标识号 setpgid 设置指定进程组标志号 getpgrp 获取当前进程组

天眼查数据采集规则

天眼查等各种企业查询信息在依法公开各种企业信息的同时对自己的数据做足了反爬措施但是作为一个技术人员应该时时刻刻的知道凡是浏览器能展现出来的信息就是一定能爬到的以下是截图, 这样采集别人的数据是不对的但是天眼查的数据肯定也是其他地方采集过来的,我们这里只讨论技术如果想进一步和我们一起探讨数据采集的问题可以电话联系 13252223874

STM32 对内部FLASH读写接口函数

因为要用内部FLASH代替外部EEPROM,把参数放在STM32的0x08000000+320K处,其中20K是bootloader,300K是应用程序. 原理:先要把整页FLASH的内容搬到RAM中,然后在RAM中改动,然后擦除整页FLASH,再把改动后的内容写入原Flash页.下面程序调试通过. /******************************************************************************** Function Name :

关于网易云音乐爬虫的api接口？

抓包能力有限,分析了一下网易云音乐的一些api接口,但是关于它很多post请求都是加了密,没有弄太明白.之前在知乎看到过一个豆瓣工程师写的教程,但是被投诉删掉了,请问有网友fork了的吗?因为我觉得他写的代码都比较pythonic,符合pep8规范.知乎另外几名大V比如@路人甲虽然经常分享数据,但是很少分享源代码,github也没有公布,公开过的代码我觉得他很多基础的pep8细节都忽略了,而且他的爬虫的效率非常低,比如爬网易10k+评论,在专栏说爬了6个小时之类的很辛苦之类的话,但是看他的代码别

猜你喜欢

jquery点击改变class并toggle

<html> <head> <meta charset="utf-8"> <title></title> <scr ...

[2016-03-28][POJ][3616][Milking Time]

时间:2016-03-28 17:27:03 星期一题目编号:[2016-03-28][POJ][3616][Milking Time] #include <algorithm> #in ...

Course Schedule II 解答

Question There are a total of n courses you have to take, labeled from 0 to n - 1. Some courses may ...

题目链接 http://acm.hdu.edu.cn/showproblem.php?pid=5124 这题题目做的好悲催,比赛时题目意思不理解,也没有深究了,赛后又看了很久没有看懂,问了很多才搞懂, ...

基于OpenGL编写一个简易的2D渲染框架-11 重构渲染器-Renderer

假如要渲染一个纯色矩形在窗口上,应该怎么做? 先确定顶点的格式,一个顶点应该包含位置信息 vec3 以及颜色信息 vec4,所以顶点的结构体定义可以这样: struct Vertex { Vec3 p ...

Ubuntu 14.04 下安装google的浏览器——Chrome

小编用过好多浏览器,但最后还是选择Chrome, 因为这款浏览器确实做的不错,可是Ubuntu下自带的是火狐,因此小编在这里和大家分享一下如何在Ubuntu下安装chrome浏览器工具/原料安装U ...

asp.net oa系统开发方案

思道OA开发版 2016下载地址http://www.345oa.com/develop/ 思道OA基于Microsoft .NET/ASP.NET 4.0开发,数据库SQL Server,开发工具V ...

Linux_学习_Day2~3

文件管理&目录管理没有指定字段排序,默认按至左而右进行排序. 以第三个字段进行排序. uniq只是检测相邻的两行. -d显示重复项,-D显示相同行,-c显示每行显示的次 ...

龙果支付开源项目对账接口介绍

一. 微信对账接口(微信支付和对账接口都很规范) 1． api的地址 https://pay.weixin.qq.com/wiki/doc/api/jsapi.php?chapter=9_6 2．对 ...

nginx的日志切割

手动切割: 手动切割只需要两个1:备份,2新开找到日志生成目录将原来的日志移动备份 , 1:mv acess.log 20170324.log 2:找到master process 的主进程号码,p ...

android自定义控件几种方式总结

方式1:不继承任何组件 , 直接在代码里面调用实例化.public class ProgressDialog { private Dialog dialog; public ProgressDialo ...

在触屏设备上面利用html5裁剪图片(转)

前言现在触屏设备越来越流行,而且大多数已经支持html5了.针对此,对触屏设备开发图片裁剪功能, 让其可以直接处理图片,减轻服务端压力. 技术点浏览器必须支持html5,包括fileReader, ...

Android中对list的日期元素进行排序

最近在项目中需要将读取的数据按照时间的降序进行排序. 具体的步骤如下: 1.读取数据,存入List中 2.取出数据中的时间戳,由String转换成Date 3.使用冒泡排序对List中元素按照Date ...

wcscpy wcscpy_s strcpy strcpy_s的区别

原型声明:extern char *strcpy(char *dest,const char *src); 头文件:string.h 功能:把从src地址开始且含有NULL结束符的字符串赋值到以des ...

Winters are just damn freezing cold in Nvodsk! That's why a group of n friends prefers to take a tax ...

关于fileUpload的路径问题

HttpPostedFileBase uploadFile = Request.Files[file] as HttpPostedFileBase; string fileN = uploadFile ...

TCP 中的Push flag 的作用

发送方使用该标志通知接收方将所收到的数据全部提交给接收进程.这里的数据包括接收方已经接收放在接收缓存的数据和刚刚收到的PUSH位置一的TCP报文中封装的应用数据.还是看一个简单明了的图示吧:

SOA 服务架构之简介及理解

也许你已经深入其中却不知,今天我们拨开云雾见月明,阐明SOA是何方神圣! SOA 英文:Service-Oriented Architecture,面向服务的架构. 是一种面向通用集成服务的.松耦合的 ...

C语言运算符和优先级

关于C语言运算符和优先级,经整理众多博客资料汇入自己的实战,如下: a.算术运算 C语言一共有34种运算符,包括常见的加减乘除运算. 1) 加法:+ 还可以表 ...

夺冠支持率:巴西榜首西班牙第2 英格兰获4%选票

YouGov的调查显示,40%的球迷认为英格兰几乎或者根本没有夺冠希望,53%的英格兰民众根本不关心三狮在巴西表现如何,而2010年这个比例是47%,只有4%的球迷看好英格兰夺冠,南非世界杯他们则被1 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.