百度搜索URL参数含义

百度搜索URL参数含义

(2014-08-19 15:46:13)

转载▼

  分类: Android开发

http://blog.csdn.net/followingturing/article/details/7850317

http://www.baidu.com/s?wd=justin&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&rsv_sug3=6&rsv_sug9=eb&rsv_sug4=354&rsv_sug2=0&inputT=1284

原创文章,版权归andxu所有,如转载请征求本人同意,并一定保存本页链接。

——————————————————————————————————————————————————

在做搜索时候,关注搜索引擎的URL格式是一个很重要的问题,以百度为例,整理一下常用的格式和技术:

Eg.几个百度搜索的URL

http://www.baidu.com/s?lm=0(搜索结果时间限制) &si=&rn=10(每页显示的数目) &ie=gb2312&(语言)ct=0 &wd=?%6??& (关键词)pn=10 (在第pn比上10后加上1页) &ver=0 &cl=3 &uim=6 &usm=0

http://www.baidu.com/s?ie=utf8&bs=mc&f=8&rsv_bp=1&rsv_spt=3&wd=百度搜索url含义&inputT=12534

ttp://www.baidu.com/s?wd=libreoffice+cal+???????&rsv_bp=0&rsv_spt=3&oq=libreoff&sug=libreoffice&rsv_n=1&rsp=0&inputT=23204

http://www.baidu.com/s?word=jay+site:blog.csdn.net&tn=sitehao123&ie=utf-8

所以关键问题:怎么正确认识百度搜索的参数?

就目前的认识,整理一下参数:

序号 参数 含义
1 tn 搜索框所属网站。比如 tn=sitehao123,就是 http://www.hao123.com/ 左上那个搜索框(指通过什么方式到达百度首页搜索界面;)
2 s?wd 指关键词, “wd=” 是英文的word的缩写,参数表示的是搜索关键词的内容,如果是汉字那么这个参数是汉字的十六进制形式,如果是英文,那么这个参数就用该英文来表示
3 rsv_bp (0,1,2) 0是首页输入;1是顶部搜索输入;2是底部搜索输入
4 rsv_spt (1,3还有其他的数字,暂时没发现) 指的浏览器内核;
5 rsv_ers xn* (*取0或1) 指的是搜索词后,翻页出现对应的相关搜索,从0开始。如果在url里已经是0的话,那对应的相关搜索就从1开始(这个参数还有很多密,这个只是初步测试)
6 rsp 指的是相关搜索排序(从0开始)
7 sug 这个参数只有在你修改下拉框文字时才会出现,指的是下拉框出现的关键词
8 oq 指的是你在输入搜索词时,输入一半,选择了下拉框之前输入的词;oq= 指的是搜索词,只有当url地址出现rsp而非rsv_bp时,oq才指的是从搜索词跳转到相关搜索。
9 inputT 从你打开百度主页,在对话框输入数据的时候开始计时,到你点击百度一下的时间计算。(只有在顶部搜索,首页搜索才会出现)。
10 s?bs 指的是上一次搜索的词, “bs=”参数应该是英文“base”的缩写,也就是“基于...”的意思,通俗点说就是在搜某一个关键词后再次搜索其它关键词的意思。bs=这个参数是百度用来判断某个关键词的相关关键词而设置的,也就是百度通过用户的搜索行为来判断某个关键词的相关关键词.(Maybe Before Search)
11 f (1,3,8) 也许还有其他的,暂时发现就这3种,1指的是相关搜索,表示用户选择了搜索页面最下面的“相关搜索”中的某个关键词。;3下拉框搜索 表示用户输入一定的词语之后出现“联想词语”,用户最终用鼠标选择了某个关键词;或用键盘选择了某个关键词后直接按回车。;8用户自主搜索,表示用户直接点击“百度一下”按键(有bs变量时才出现f=8)
12 ieInput Encoding 输入编码。百度似乎不支持其它编码。 默认值是“gb2312”
13 ct 语言限制。0-所有语言,1-简体中文网页,2-繁体中文网页;其它不确定或者无效或。默认值为0.
14 rn 每页包含的搜索结果数目。默认值为10
15 pn 搜索结果的页码,从零开始计数。即pn = ${结果页码-1}*rn。
16 lm 搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。
17 q5 搜索内容位置限制.0-所有内容;1-网页标题(相当于使用‘title:‘查询前缀);2-url(相当于使用‘inurl:‘查询前缀);其它值等效于0.默认值为0
18 q6 搜索内容网站限制.例如q6=sohu.com,表示只搜索sohu.com的网页;相当于使用了‘site:前缀‘.默认值为空
19 dq 不建议使用该参数.查询内容来原的地区限制. 具体值有百度确定.默认值为空.试了一下,使用这个参数的效果很差.
20 cl 百度提交的搜索类型(Class),cl=3为网页搜索,cl=2为百度新闻
21 rs2 暂时未知
22 sc 暂时未知
23    
时间: 2024-10-10 06:50:04

百度搜索URL参数含义的相关文章

百度URL参数解析

百度URL参数解析 在用Python爬取百度搜索的内容时,发现百度搜索的url非常的长,往往会跟一大段的参数,但其实很多参数都是没有必要的,如同样是搜索java关键字,可以通过 http://www.baidu.com/s?wd=java 如此简单的URL来获取,而下面这个超级复杂的URL也是同样进行了关键字java的搜索: http://www.baidu.com/s?wd=java&rsv_spt=1&rsv_iqid=0xd3c8c51900052eb3&issp=1&

Python实验:百度搜索关键字自动打开相关URL

#! python # coding: utf-8 # python实现百度搜索关键字,并依次用浏览器打开前五个搜索结果 ## ##Beautiful Soup 是一个模块,用于从HTML 页面中提取信息(用于这个目的时,它比正则表达式好很多).BeautifulSoup 模块的名称是bs4(表示Beautiful Soup,第4 版).要安装它,需要在命令行中运行pip install beautifulsoup4 import bs4, sys, webbrowser, requests #

谷歌搜索参数url参数详解

谷歌搜索表单参数url参数详解 q(Query):查询的关键词,搜索查询q是必需的URL参数之一,其他都是可选的. 当q的值包含多个单词时,用加号分隔每个单词.(text) hl(Interface Language):Google搜索的界面语言hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数.hl=zh-TW繁体中文语言界面,港台地区常使用hl=en-英文语言界面 lr(Language Restrict):搜索内容的语言限定限定只搜索某种语言的网页.如果lr参数为空,则

python爬取百度搜索结果ur汇总

写了两篇之后,我觉得关于爬虫,重点还是分析过程 分析些什么呢: 1)首先明确自己要爬取的目标 比如这次我们需要爬取的是使用百度搜索之后所有出来的url结果 2)分析手动进行的获取目标的过程,以便以程序实现 比如百度,我们先进行输入关键词搜索,然后百度反馈给我们搜索结果页,我们再一个个进行点击查询 3)思考程序如何实现,并克服实现中的具体困难 那么我们就先按上面的步骤来,我们首先认识到所搜引擎,提供一个搜索框,让用户进行输入,然后点击执行 我们可以先模拟进行搜索,发现点击搜索之后的完整url中有一

AJAX实现分页--模拟百度搜索分页

第一部分:效果与分析 1.百度分页组件: 2.自己实现的分页: 3.分析: 百度搜索分页,如果总页数大于10,用户最多只能看到10页内容,不足10页显示全部,当点击下一页时,数字页标向前移动一个单位,当点击上一页时向后移动一个单位. 第二部分:后台实现: 1.实现思路: 后台的处理思想是这样的,通过AJAX向后台发送请求,携带一个分页对象PageBean传过去,查询完毕后返回一个新的PageBean对象. 前台传入的PageBean对象参数: 属性 名称 是否必须 默认值 pageSize 每页

使用Java调用百度搜索

search托管于github 如何利用Java来调用百度搜索,更多细节请到github上查看search 自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索善加利用,以小搏大,站在巨人的肩膀上.有很多的应用场景可以很巧妙地借助百度搜索来实现,比如网站的新闻采集,比如技术.品牌的新闻跟踪,比如知识库的收集,比如人机问答系统等,我之前做的一个准确率达百分之九十几的人机问答系统的数据源,其中一部分就是充分利用了百度搜索.我们可以很容易地扩展到其他的搜索引擎,使用JSoup+CSSPath技

5月5日 百度搜索技巧

1.“”——精确匹配 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的.如果您对这种情况不满意,可以尝试让百度不拆分查询词.给查询词加上双引号,就可以达到这种效果.如:“上海大学”,搜索结果中的上海大学四个字就不会是分开的. 2.(-)——消除无关性 逻辑“非”的操作,用于排除无关信息,有利于缩小查询范围.百度支持"-"功能,用于有目的地删除某些无关网页,语法是"A -B".如:要搜寻关于"武侠小说",但不含&quo

Arcgis for Javascript API下类似于百度搜索A、B、C、D marker的实现方式

原文:Arcgis for Javascript API下类似于百度搜索A.B.C.D marker的实现方式 多说无益,首先贴两张图让大家看看具体的效果: 图1.百度地图搜索结果 图2.Arcgis for JavaScript实现的效果 看到了效果,是不是各位有点小鸡动,是不是也宠宠欲动,有木有?但是具体是怎么实现的呢?下面我来详细的给各位说说我的实现思路吧. 第一,数据. 其实搜索的对象从类型上来说,应该是点.线.面都支持的,但是在实际的操作过程中,不论是百度还是我自己做的时候,都会将所有

Mysql JDBC Url参数与异常问题

今天在写Java项目使用了 <select id="getPlans" parameterType="hashMap" resultType="hashMap">         SELECT             *         FROM             `plan`         WHERE             isDelete=#{isDelete} AND nestId in              &l