使用URL访问http服务器

一、概念定义

1、URI - 通用资源标识符

URI通常由三部分组成,

  • 资源访问机制
  • 存放资源的主机名
  • 资源自身名称

如: http://www.baidu.com/html

http://www.baidu.com/html/talk.html

file://www.xxx.com/xxx/dirA

file://www.xxx.com/xxx/xxx.txt

2、URL - 统一资源定位符

uri的子集,Internet上描述信息资源的字符串

二、使用url

1、方式一:使用URL类

通过创建URL对象来获得InputStream,像操作本地文件一样操作网络资源。

URL url = new URL("http://www.baidu.com/html/talk.html");

InputStream is = url.openStream();

用java.net包来模拟浏览器客户端,这种方式代码量大, 要处理的情况很多。

更简单的,一般采用开源软件 HttpClient 来访问 URL.

2、使用HttpClient的GetMethod

2.1、引入依赖

2.2、编写代码

2.3、执行结果

3、使用HttpClient的PostMethod

3.1、引入依赖

3.2、编写代码

3.3、执行结果

同上!

4、使用HttpClient的PostMethod

4.1、引入依赖

4.2、编写代码

4.3、执行结果

三、一个例子

1、抓取页面

1.1、编写代码

1.2、执行结果

2、处理http状态码

2.1、2xx

200 成功

204

2.2、3xx 通常进行转向

300 3xx的默认解释

301 重定向分配到的url

302 重定向到临时的url

304 请求的资源未更新,请求丢弃

2.3、4xx

400 非法请求,请求丢弃

401 未授权,请求丢弃

403 禁止,请求丢弃

404 没有找到,请求丢弃

2.4、5xx

5xx 状态码 表示 服务器发现自己出现错误,不能继续执行该请求

时间: 2024-10-13 23:27:34

使用URL访问http服务器的相关文章

ThinkPHP第二课 框架MVC目录和URL访问方式

第二课 框架MVC目录和URL访问方式 1.说明: ThinkPHP是基于MVC的框架,认识框架目录将更好的实现分层,掌握ThinkPHP.URL访问就是访问框架的控制器(MVC中的C),共有四种方式,框架中的C起到分模块的作用. url的4种访问方式: 1.PATHINFO 模式 -- 重点!!!!!! http://域名/项目名/入口文件/模块名/方法名/键1/值1/键2/值2 2.普通模式 http://域名/项目名/入口文件?m=模块名&a=方法名&键1=值1&键2=值2

ThinkPHP中URL访问模式详解

一.ThinkPHP中支持的四种URL访问模式                                                   所谓URL访问模式,指的是以哪种形式的URL地址访问网站. URL访问模式的意义在于:可以让网站中的所有链接有一个统一的格式. URL访问模式 URL模式 URL_MODEL设置 示例 普通模式 0 http://localhost/?m=home&c=user&a=login&var=value PATHINFO模式 1 http:/

Java 网络编程(三) 创建和使用URL访问网络上的资源

链接地址:http://www.cnblogs.com/mengdd/archive/2013/03/09/2951877.html 创建和使用URL访问网络上的资源 URL(Uniform Resource Locator)是统一资源定位符的简称,它表示Internet上某一资源的地址. 通过URL我们可以访问Internet上的各种网络资源,比如最常见的WWW, FTP站点.浏览器通过解析给定的URL可以在网络上查找相应的文件或其他资源. 在目前使用最为广泛的TCP/IP中对于URL中主机名

AFNetworking2.0 访问HTTPS服务器

在AFNetworking2.0下想要访问HTTPS服务器,需要做如下设置: AFSecurityPolicy *securityPolicy = [AFSecurityPolicy policyWithPinningMode:AFSSLPinningModeNone]; [securityPolicy setAllowInvalidCertificates:YES]; NSURL *URL = [NSURL URLWithString:url]; NSMutableURLRequest *re

Android通过get,post方式体访问http服务器

RT..我之前感觉Android网络通信很神奇,Magic...最近学习了网络知识,现在来总结一下怎么做 好了,就拿例子来说明原理. 说下这个Demo的用处: 1.用户可以访问一个网页 2.用户提交用户名和密码到Http服务器中,在Tomcat的控制台中显示出提交的内容. 先来介绍一下怎么访问网页 看代码 package com.hwb.service; import java.net.HttpURLConnection; import java.net.URL; import com.hwb.

hadoop中的hive查询cdn访问日志指定时间段内url访问次数最多的前10位(结合python语言)

hadoop环境描述: master节点:node1 slave节点:node2,node3,node4 远端服务器(python连接hive):node29 需求:通过hive查询到cdn日志中指定时间段内url访问次数最多的前10个url ps:用pig查询可以查询文章: http://shineforever.blog.51cto.com/1429204/1571124 说明:python操作远程操作需要使用Thrift接口: hive源码包下面自带Thrift插件: [[email pr

利用XMLHTTP检测URL及探测服务器信息

<html> <head> <title>利用XMLHTTP检测URL及探测服务器信息</title> <META http-equiv=Content-Type content="text/html; charset=gb2312"> <meta name="Generator" content="EditPlus"> <meta name="Author&

thinkPHP URL访问

ThinkPHP采用单一入口模式访问应用,对应用的所有请求都定向到应用的入口文件,系统会从URL参数中解析当前请求的模块.控制器和操作,下面是一个标准的URL访问格式: http://domainName/index.php/模块/控制器/操作 其中index.php就称之为应用的入口文件(注意入口文件可以被隐藏,后面会提到). 提示: 模块在ThinkPHP中的概念其实就是应用目录下面的子目录,而官方的规范是目录名小写,因此模块全部采用小写命名,无论URL是否开启大小写转换,模块名都会强制小写

[记录]解决vue项目当直接通过url访问中间页时nginx返回404的问题

应用为VUE单页应用,路由模式为history,web服务器为nginx,正常情况下如果直接通过url访问一个中间页(不是index.html)时,会看到nginx返回的404错误,这个问题目前我只能通过修改nginx站点配置文件来实现. 具体代码(只看红色加粗的部分就行): server { listen 80; server_name ……; index index.php index.html index.htm default.php default.htm default.html;