Python+Google Hacking+百度搜索引擎进行信息搜集

记录一下在用python爬取百度链接中遇到的坑:

1.获取百度搜索页面中的域名URL

BeautifulSoup获取a标签中href属性后,链接为百度url,利用request直接访问默认会直接进行跳转,无法获取所需域名

此时需要将requests的allow_redirects属性设置为False,禁止进行跳转,requests默认会进行跳转

再使用.headers[‘Location‘]获取最后链接:final_url = baidu_url.headers[‘Location‘]

2.百度中的链接返回不统一

获取到实际域名链接后,发现还有一些奇怪的东西

访问后发现非site搜集域名

突然想到,很有可能是百度的广告

那就需要筛选出包含baidu.php?的链接去剔除掉

a="1"

b="123"

if a in b:来进行筛选

3.百度安全验证

当在百度搜索链接中加入pn页码参数时,便会出现百度安全验证

4.链接根域名的去重问题

原文地址:https://www.cnblogs.com/str1ve/p/12550571.html

时间: 2024-11-06 16:28:49

Python+Google Hacking+百度搜索引擎进行信息搜集的相关文章

具体实例谈google和百度搜索引擎

谷歌彻底被禁让人惋惜,百度的“道德”,能力让人堪忧. 对于程序员来说,使用百度就代表被他折磨. 希望天朝的国民早日醒悟过来,切不可闭关锁国,妄自尊大. 中国已经拉下了无数步,如果还继续这样会不会被拖死. 具体实例谈google和百度搜索引擎

20155205 郝博雅 Exp6 信息搜集与漏洞扫描

20155205 郝博雅 Exp6 信息搜集与漏洞扫描 一.实践内容 (1)各种搜索技巧的应用 (2)DNS IP注册信息的查询 (3)基本的扫描技术:主机发现.端口扫描.OS及服务版本探测.具体服务的查点 (4)漏洞扫描:会扫,会看报告,会查漏洞说明,会修补漏洞 基本问题回答 (1)哪些组织负责DNS,IP的管理. Internet 域名与地址管理机构(ICANN)是为承担域名系统管理,它设立三个支持组织,地址支持组织(ASO)负责IP地址系统的管理:域名支持组织(DNSO)负责互联网上的域名

2016424王启元 Exp6信息搜集与漏洞扫描

一.原理与实践说明 1.实践内容 本实践的目标是掌握信息搜集的最基础技能.具体有: 1.各种搜索技巧的应用 2.DNS IP注册信息的查询 3.基本的扫描技术:主机发现.端口扫描.OS及服务版本探测.具体服务的查点 4.漏洞扫描:会扫,会看报告,会查漏洞说明,会修补漏洞 2.基础问题 问:哪些组织负责DNS,IP的管理? *全球根服务器均由美国政府授权的ICANN统一管理,负责全球的域名根服务器.DNS和IP地址管理. 全球根域名服务器:绝大多数在欧洲和北美(全球13台,用A~M编号),中国仅拥

20145309 《网络对抗技术》信息搜集与漏洞扫描

实践过程记录 DNS IP注册信息的查询 whois域名注册信息查询 whois域名注册信息查询 加上www时,查询的信息为域名注册信息,不能查到子域名(baidu.com)的注册信息 注册的信息:注册人.组织.地址.城市.地区.电话.邮件等. nslookup,dig域名查询 nslookup,dig域名查询 IP2Location 地理位置查询 搜索引擎进行信息搜集 搜索特定类型文件 路由探测 tracert路由探测 基本的扫描技术(以及nmap) 主机发现 其中发现另一虚拟机win xpe

20155211 Exp6 信息搜集与漏洞扫描

20155211 Exp6 信息搜集与漏洞扫描 实践内容 (1)各种搜索技巧的应用 (2)DNS IP注册信息的查询 (3)基本的扫描技术:主机发现.端口扫描.OS及服务版本探测.具体服务的查点 (4)漏洞扫描:会扫,会看报告,会查漏洞说明,会修补漏洞 实践过程 问题回答 (1)哪些组织负责DNS,IP的管理. 答:Internet 域名与地址管理机构(ICANN)是为承担域名系统管理,它设立三个支持组织,地址支持组织(ASO)负责IP地址系统的管理:域名支持组织(DNSO)负责互联网上的域名系

Exp6 信息搜集与漏洞扫描 20164323段钊阳

20164323 Exp6 信息搜集与漏洞扫描 回答问题 1.哪些组织负责DNS,IP的管理. 全球根服务器均由美国政府授权的ICANN统一管理,负责全球的域名根服务器.DNS和IP地址管理.全球一共有5个地区性注册机构:ARIN主要负责北美地区业务,RIPE主要负责欧洲地区业务,APNIC主要负责亚太地区业务,LACNIC主要负责拉丁美洲美洲业务,AfriNIC负责非洲地区业务. 2.什么是3R信息 官方注册局.注册商.注册人. 注册人(Registrant) 注册商(Registrar) 官

2018-2019-2 网络对抗技术 20165202 Exp6 信息搜集与漏洞扫描

博客目录 一.实践目标 二.实践内容 各种搜索技巧的应用 DNS IP注册信息的查询 基本的扫描技术:主机发现.端口扫描.OS及服务版本探测.具体服务的查点 漏洞扫描:会扫,会看报告,会查漏洞说明,会修补漏洞 三.实验中遇到的问题及解决 四.基础问题回答 五.实验总结 一.实践目标 掌握信息搜集的最基础技能与常用工具的使用方法. 二.实践内容 各种搜索技巧的应用 1.通过搜索引擎进行信息搜集 搜索特定类型的文件:有些网站会链接通讯录,订单等敏感的文件,可以进行针对性的查找, 如Google,ba

2018-2019 20165208 网络对抗 Exp6 信息搜集与漏洞扫描

目录 2018-2019 20165208 网络对抗 Exp6 信息搜集与漏洞扫描 实验内容 实践过程记录 1. 外围信息搜集 2. 主机探测和端口扫描 3. 网络服务扫描 4. 漏洞扫描 实验后问题回答 实验感想 2018-2019 20165208 网络对抗 Exp6 信息搜集与漏洞扫描 实验内容 1.1 各种搜索技巧的应用 1.2 DNS IP注册信息的查询 1.3 基本的扫描技术:主机发现.端口扫描.OS及服务版本探测.具体服务的查点(以自己主机为目标) 1.4 漏洞扫描:会扫,会看报告

20155320 Exp6 信息搜集与漏洞扫描

20155320 Exp6 信息搜集与漏洞扫描 [实验后回答问题] (1)哪些组织负责DNS,IP的管理. (2)什么是3R信息. (3)评价下扫描结果的准确性. [实验过程] 1.信息搜集 通过DNS和IP挖掘目标网站的信息 whois用来进行域名注册信息查询.就以搜狗搜索为例,输入whois sogou.com可查询到3R注册信息,非常全面,简直啥都出来了. whois查询时最好不要加www等前缀,因为注册域名时通常会注册一个上层域名,子域名由自身的域名服务器管理,在whois数据库中可能查