Browser Security-基本概念

URL格式：

scheme://[login[:password]@](host_name|host_address)[:port][/hierarchical/path/to/resource[?search_string][#fragment_id]]

下面详细解释一下各个部分：

scheme

scheme是协议名不区分大小写，以冒号结尾，表示需要使用的协议来检索资源。

URL协议是由IANA（The Internet Assigned Numbers Authority，互联网数字分配机构）与个标准化组织一同管理的。

下面的网址列举出目前有的scheme:

http://www.iana.org/assignments/uri-schemes.html

有一些大家很熟悉的例如：http:、https:、ftp:等。

在现实中，一些非正式的协议也会被支持，如javascript等，这可能会有一些安全隐患，将在后面进行讨论。

在RFC1738中定义scheme中只能包含字母、数字、+、- ，现实中浏览器没有严格的遵守。

IE中会忽略所有的非打印字符ASCII中的0x01到0x1F。

chrome中会跳过0x00即NULL字符。

为了符合RFC1738中的语法规范，每个URL中需要在认证信息前面加入“//”。

在省略“//”字符串的情况下，会造成解析错误。

但在个别情况下不会解析错误，如mailto:[email protected]?subject= Hello+world，由邮件客户端打开的时候不会出错。

但是由于浏览器的特性：

1 http:baidu.com/ 这个地址在最新版Chrome、Safari、Firefox、IE中都可以定向到http://baidu.com/ 。
2 javascript://example.com/%0Aalert(1)
<iframe src="javascript://baidu.com/%0Aalert(1)"> 最新版Chrome、Safari、Firefox、IE中都可以弹出1。

[login[:password]@]

访问资源的认证信息（可选），当没有提供认证信息时，浏览器将尝试匿名获取资源。

绝大部分浏览器在此部分接受几乎所有的字符，有两个例外：

Saferi拒绝 < > { } 字符，Firefox拒绝换行。

(host_name|host_address)

服务器地址，正常的URL是DNS指向的域名例如baidu.com，或者IPv4地址如127.0.0.1，或IPv6的地址如[0:0:0:0:0:0:0:1]。

虽然RFC中的IP地址只允许规范的符号，但是大多数应用程序调用的是标准的C库，导致会宽松很多。

http://127.0.0.1/ 这是一个典型的IPv4地址。

http://0x7f.1/ 这是用十六进制表示的127.0.0.1

http://017700000001/ 用八进制表示的127.0.0.1

[:port]

服务器端口（可选），他表示采用非默认的协议端口来访问服务，例如http的默认端口80，ftp的21等。

几乎所有的浏览器以及第三方应用使用TCP或UDP作为底层的传输方法。

并依靠TCP和UDP的16位端口号分开一台机器上运行不同服务的通信。

当用户将浏览器定向到http://mail.example.com:25/而25端口是SMTP服务，不是http服务，可能引起安全问题，后面会讨论。

[/hierarchical/path/to/resource[?search_string]

路径，用来定位服务器上的资源。

[#fragment_id]]

页面的某个位置，其功能是让用户打开某个网页时，自动定位到指定位置上。

在RFC 3986的文档中定义了一个URI的基本结构，定义了没有特殊意义的字符

0-9 A-Z a-z - . _ ~

以及一些在某些地方可能有特殊意义的字符

: / ? # [ ] @ ! $ " ( ) * + , ; =

还有一些字符，当他们直接放在Url中的时候，可能会引起解析程序的歧义。这些字符被视为不安全字符，原因有很多。

1 空格：Url在传输的过程，或者用户在排版的过程，或者文本处理程序在处理Url的过程，都有可能引入无关紧要的空格，或者将那些有意义的空格给去掉。
2 引号以及<>：引号和尖括号通常用于在普通文本中起到分隔Url的作用
3 %：百分号本身用作对不安全字符进行编码时使用的特殊字符，因此本身需要编码
4 {}|\^[]`~：某一些网关或者传输代理会篡改这些字符

其他的字符都可以用%加16进制字符串（%nn）来表示，包括%它本身。

由于服务器可能需要能够接受那些字符如用户搜索那些字符时，此时就采用%nn的方式来转码后请求。

导致下面三个URL是等效的：

1、http://example.com/
2、http://%65xample.%63om/
3、http://%65%78%61%6d%70%6c%65%2e%63%6f%6d/

非US-ASCII文本的处理：

对于非ASCII字符，需要使用ASCII字符集的超集进行编码得到相应的字节，然后对每个字节执行百分号编码。
对于Unicode字符，RFC文档建议使用utf-8对其进行编码得到相应的字节，然后对每个字节执行百分号编码。

如"中文"使用UTF-8字符集得到的字节为0xE4 0xB8 0xAD 0xE6 0x96 0x87，经过Url编码之后得到"%E4%B8%AD%E6%96%87"。

针对域名的编码：

Punycode是一个根据RFC 3492标准而制定的编码系统,主要用于把域名从地方语言所采用的Unicode编码转换成为可用於DNS系统的编码。

Punycode可以防止所谓的IDN欺骗。

目前，因为操作系统的核心都是英文组成，DNS服务器的解析也是由英文代码交换，所以DNS服务器上并不支持直接的中文域名解析。

所有中文域名的解析都需要转成punycode码，然后由DNS解析punycode码。

其实目前所说和各种浏览器完美支持中文域名，只是浏览器软件里面主动加入了中文域名自动转码，不需要原来的再次安装中文域名转码控件来完成整个流程。

例子：中国.cn，用Punycode转换后为：xn--fiqs8s.cn

同样其他语言也是如此。

例如下面的网址列出一个攻击方式，输入想要伪造的网址，选择相近的字符，可以帮你生成一个：

http://www.irongeek.com/homoglyph-attack-generator.php

浏览器本身支持的协议：http: https: ftp: file:(之前是local:，用来获取本地文件或者NFS与SMB共享)

第三方应用或者插件支持的协议： acrobat: callto sip: daap: itpc: itms: mailto: news: nntp: mmst: mmsu: msbd:rtsp: 等等。

伪协议：一些保留协议用来调用浏览器脚本引擎或者函数，没有真正取回任何远程内容，也没有建立一个独立的文件。

如：javascript: data:

data协议例子：data:text/html;base64,PGlmcmFtZS9vbmxvYWQ9YWxlcnQoMSk+

封装的伪协议：view-source:http://www.example.com/

view-source:是由Chrome与Firefox提出的用来查看当前页面源代码的协议。

其他的类似协议还有jar: wyciwyg: view-cache: feed: hcp: its: mhtml: mk: ms-help: ms-its: ms-itss:

时间： 2024-11-05 17:30:53

Browser Security-基本概念的相关文章

Browser security standards via access control

A computing system is operable to contain a security module within an operating system. This security module may then act to monitor?access?requests by a web browser and apply?mandatory?access?control?security policies to such requests. It will be ap

WCF Security基本概念（转载）

WCF Security 主要包括 "Transfer Security"."Access Control"."Auditing" 几个部分. 1. Transfer Security Transfer Security 主要包括三个方面: "消息完整性(Message Integrity)"."消息机密性 (Message Confidentiality)" 和 "交互验证(Mutual Aut

WCF basicHttpBinding之Message Security Mode

原创地址:http://www.cnblogs.com/jfzhu/p/4067873.html 转载请注明出处前面的文章<WCF Security基本概念>介绍了WCF的security mode,简单说Transport是transport级别上的加密,Message是message级别上的加密,参见下图: Transport Security Message Security (一)Demo代码 IDemoService.cs: using System.ServiceModel; n

Dynamics CRM 2015 New Feature (3): Hierarchical Security Model

Hierarchical Security Mode是个具有颠覆性的feature,它的出现完全颠覆了传统的Dynamics CRM Security管理概念.它为用户提供一个基于树形结构(组织管理图)来控制用户对记录的访问控制.使用这种权限控制机制,我们可以非常灵活的控制一些比较复杂场景的业务访问,比如:如果访问跨business unit的记录等.在这之前,如果我们想要访问跨BU的记录,我们需要借助于Team或Access Team.但是今天,我们只需要2布就能实现:1)开启Hierarch

前端开发手册

做前端有一段时间了,但是总觉得前端就是写写界面就行了,其实不然.一个合格的前端责任是很重大的.本文介绍重点介绍了前端人员需要掌握的一些技能.供大家参考.如果有一些对前端开发还有疑惑的童鞋,可以来看看. 本文来源:http://wiki.jikexueyuan.com/project/fedHandlebook/,建议阅读在线版本:https://dwqs.gitbooks.io/frontenddevhandbook/ 什么是前端开发者? 一个前端开发者, 要会使用Web技术(如:HTML,CS

网站开发人员应该知道的61件事

作者 Hoogle, 火龙果软件发布于:2014-01-23 有人在Stack Overflow上发问,动手开发网站之前,需要知道哪些事情? 不出意料地,他得到了一大堆回答. 通常情况下,你需要把所有人的发言从头到尾读一遍.但是,Stack Overflow有一个很贴心的设计,它允许在问题下方开设一个wiki区,让所有人共同编辑一个最佳答案.于是,就有了下面这篇文章,一共总结出六个方面共计61条"网站开发须知". 我发现,这种概述性的问题,最适合这种集合群智.头脑风暴式的

web之困：现代web应用安全指南

<web之困:现代web应用安全指南>在web安全领域有“圣经”的美誉,在世界范围内被安全工作者和web从业人员广为称道,由来自google chrome浏览器团队的世界顶级黑客.国际一流安全专家撰写,是目前唯一深度探索现代web浏览器安全技术的专著.本书从浏览器设计的角度切入,以探讨浏览器的各主要特性和由此衍生出来的各种安全相关问题为主线,深入剖析了现代web浏览器的技术原理.安全机制和设计上的安全缺陷,为web安全工作者和开发工程师们应对各种基于浏览器的安全隐患提供了应对措施. <w

[转载]网站开发人员应该知道的61件事

http://news.cnblogs.com/n/82363/ 网站开发人员应该知道的61件事原文网址:http://stackoverflow.com/questions/72394 译者:阮一峰一.界面和用户体验(Interface and User Experience) 1.1 知道各大浏览器执行Web标准的情况,保证你的站点在主要浏览器上都能正常运行.你至少要测试以下引擎:Gecko(用于Firefox).Webkit(用于Safari.Chrome和一些手机浏览器).IE(你可

各式 Web 前端開發工具整理

程式碼編寫工具 (Coding Tools) 工作流程/建置/組合 (Workflow/Builds/Assemblers) lumbar brunch grunt lineman yeoman Takeoff mimosa codeKit liveReload stealJS anvil.js modjs AUTOMATON Fire.app 瀏覽器套件管理員 (Browser Package Managers) (參見: Front-End Package Manager Compariso