前言
平时很少关注安全这块的技术,曾经也买过一本《Web前端黑客技术揭秘》但至今还没翻过,尴尬。今天的早读文章由腾讯优测@小吉带来的分享。
正文从这开始~
最近深入了解了一下XSS攻击。以前总浮浅的认为XSS防御仅仅只是输入过滤可能造成的XSS而已。然而这池子水深的很呐。
XSS的类型
总体来说,XSS分三类,存储型XSS、反射型XSS、DOM-XSS。
存储型XSS
数据库中存有的存在XSS攻击的数据,返回给客户端。若数据未经过任何转义。被浏览器渲染。就可能导致XSS攻击;
反射型XSS
将用户输入的存在XSS攻击的数据,发送给后台,后台并未对数据进行存储,也未经过任何过滤,直接返回给客户端。被浏览器渲染。就可能导致XSS攻击;
DOM-XSS
纯粹发生在客户端的XSS攻击,比如:http://www.some.site/page.html?default=French
页面代码:
该XSS攻击实现条件:
- 用户点击了如下连接:
http://www.some.site/page.html?default=<script>alert(document.cookie)</script>
- 后台对URL参数未做任何过滤处理,返回给客户端,前端直接从url上获取参数。
- 打开网址的浏览器是低版本浏览器,常见ie8以下
满足以上三者,就会导致URL上的js代码执行:alert(document.cookie),但是攻击者可以利用这个,做你无法想象的事情。在现代浏览器中,已经做了xss过滤,一旦检测到xss,会提示报错如下:
以上便是学术上的划分的XSS攻击类型,2、3类型其实都是反射型的攻击。了解了这些,意识到XSS攻击无处不在啊。那么如何对XSS进行防御?从输入到输出都需要过滤、转义。
XSS防御—输入输出的过滤和数据转义
输入
客户端求情参数:包括用户输入,url参数、post参数。
- 在产品形态上,针对不同输入类型,对输入做变量类型限制。
如,http://xss.qq.com?default=12,Default值强制限制为整形。
我们的后台是node,使用joi对于输入做类型限制:
- 字符串类型的数据,需要针对<、>、/、’、”、&五个字符进行实体化转义。
输出
即使在客户端对用户的输入做了过滤、转义,攻击者一样可能,通过截包,转发等手段,修改你的请求包体。最终还是要在数据输出的时候做数据转义。
好啦,到数据转义啦,不就是对<>,‘&"这些字符做实体化转义吗?如果你认为这么简单,NO NO NO…因为浏览器解析中html和js编码不一样,以及上下文场景多样,所以对于后台输出的变量,不同的上下文中渲染后端变量,转码不一样。
下面的HTML片段显示了如何安全地在多种不同的上下文中渲染不可信数据。
情况一
数据类型:String
上下文:HTML Body
示例代码:<span>UNTRUSTED DATA</span>
防御措施:HTML Entity编码
情况二
数据类型:String
上下文:安全HTML变量
示例代码:<input type="text" name="fname" value="UNTRUSTED DATA">
防御措施
1. HTML Attribute编码
2. 只把不可信数据放在安全白名单内的变量上(白名单在下文列出)
3. 严格地校验不安全变量,如background、id和name
情况三
数据类型:String
上下文:GET参数
示例代码:<a href="/site/search?value=UNTRUSTED DATA">clickme</a>
防御措施:URL编码
情况四
数据类型:String
上下文:使用在src或href变量上的不可信URLs
示例代码:
- <a href="UNTRUSTED URL">clickme</a>
- <iframe src="UNTRUSTED URL" />
防御措施:
1. 对输入进行规范化
2. URL校验
3. URL安全性认证
4. 只允许使用http和https协议(避免使用JavaScript协议去打开一个新窗口)
5. HTML Attribute编码
情况五
数据类型:String
上下文:CSS值
示例代码:<div style="width: UNTRUSTED DATA;">Selection</div>
防御措施:
1. 使用CSS编码
2. 使用CSS Hex编码
3. 良好的CSS设计
情况六
数据类型:String
上下文:JavaScript变量
示例代码:
- <script>var currentValue=‘UNTRUSTED DATA‘;</script>
- <script>someFunction(‘UNTRUSTED DATA‘);</script>
防御措施:
1. 确保所有变量值都被引号括起来
2. 使用JavaScript Hex编码
3. 使用JavaScript Unicode编码
4. 避免使用“反斜杠转译”(\"、\‘或者\)
情况七
数据类型:HTML
上下文:HTML Body
示例代码:<div>UNTRUSTED HTML</div>
防御措施:
[HTML校验 (JSoup, AntiSamy, HTML Sanitizer)]
(https://www.owasp.org/index.php/XSS_(Cross_Site_Scripting)_Prevention_Cheat_Sheet#RULE_.236_-_Use_an_HTML_Policy_engine_to_validate_or_clean_user-driven_HTML_in_an_outbound_way)
情况八
数据类型:String
上下文:DOM XSS
示例代码:<script>document.write("UNTRUSTED INPUT: " + document.location.hash);<script/>
防御措施:
基于DOM操作的XSS漏洞防御措施
所有输出的数据转义都应该遵守上表的规则,而针对同步数据和异步数据,有较大的使用区别做了区分:
同步数据
- React页面主动屏蔽掉XSS,非react则需要对不可信任数据,要进行输出转义。
- 对于html白名单需求,可以使用SanitizeHelper模块提供了一个方法集合来处理非预期的HTML元素。
- 不同的使用方式,编码方式不同,java现成的工具可以用——ESAPI,不同位置如何转义可参照ESAPI文档,比如属性值转义:
String safe = ESAPI.encoder().encodeForHTMLAttribute(
request.getParameter( "input" ) );
异步、后台直出给js使用的json数据
对于不可信任的json数据。因为json数据可能用到不同的地方,所以转义可以放在前端js去转义。
- 参与运算的动态变量,最好转化为对应类型后再运算。如number型.
- 如果是字符串操作,保证字符串被引号包裹。
- 不能使用eval ,new fuction,settimeout执行动态字符串,因为这个字符串很可能就是一个xss代码,如果无法避免,那么也要转义之后再参与运算。
- 输出到页面上的数据必须使用相应方法转义,前端可以考虑寻找js插件处理。目前jquery-encoder,可用于前端json转义。使用方式与ESAPI类似,在需要渲染的时候进行转义。
前端XSS防御方案大致如上,整理了这么多干货内容,作为小前端的我,表示要吸收好几天。
最后,再跟大家分享个实际工作中的案例吧
除了上面的XSS攻击,分享一个让你意想不到的安全漏洞。
在优测项目,早期研发环境中,我们的测试人员提出了如下的安全漏洞:
如下登录页面我们为了用户能在登录之后访问到之前浏览的页面,所以在url加入了一个service参数,但是未对它做任何校验,可能会被钓鱼网站利用。
该攻击实现条件:
- 用户点击了如下连接:
https://cas.utest.qq.com/qqlogin?service=http%3A%2F%2Fpianzi.com;
- 后端未对service参数做校验,这个连接可以正常跳转到上图的页面;
- 用户输入帐号登录后,跳转到http://pianzi.com;
- 这是个钓鱼网站,通过网站风格欺骗,对用户进行引导性操作;
- 用户输入一些有用的信息;
- 在不知不觉之间,用户泄漏了自己的信息。
好深的套路啊~~研发哥哥赶紧寻找解决办法,最终确认方案为:对登录后跳转地址采用白名单机制。
对于这个老生长谈的XSS攻击,WEB开发者,只是了解其一,前端出身的孩子,对这方面了解甚少,跟我一样几乎没这方面意识的同学怕是也有不少。
作为懒人一枚,做什么都想找一个一劳永逸的办法,但是对于XSS攻击,无处不在,没有一个很好的全局处理方案。前端小朋友多了解了解常规的XSS攻击,在码代码的时候有这个防攻击意识,也是极好的。
前端安全还有许多了解的方面,如何预防csrf攻击,启用现代浏览器安全防御等等,都需要去了解。
最后,如果你是前端开发,腾讯优测H5测试绝对是你的开发好助手,提升开发效率那是杠杠滴!有机会大家可以玩玩。