Chromium网页输入事件处理机制简要介绍和学习计划

用户在浏览网页的时候,需要与网页进行交互,常用的操作如滑动、捏合网页,以及点击网页中的链接等。这些交互操作也称为用户输入事件,浏览器需要对它们作出迅速的响应,例如及时更新网页内容或者打开新的网页等。浏览器能够对用户输入事件作出迅速的响应是至关重要的,因为这关乎到用户浏览网页时的体验,尤其是在用户滑动和捏合网页时。本文接下来就简要介绍Chromium对用户输入事件的处理机制,以及制定后续的学习计划。

老罗的新浪微博:http://weibo.com/shengyangluo,欢迎关注!

在任何一个平台上,用户输入事件都是由系统捕获和分发的,一般就是分给给当前激活的应用程序。应用程序接下来又会根据自身的UI结构找到产生输入事件的位置所对应的控件,然后将输入事件交给该控件处理。在Android平台上,用户输入事件的捕获和分发过程可以参考前面Android应用程序键盘(Keyboard)消息处理机制分析一文。

浏览器作为一个应用程序,它的用户输入事件同样也是系统捕获后分发给它处理的。从前面Chromium多进程架构简要介绍和学习计划这个系列的文章可以知道,基于Chromium的浏览器是多进程架构的,它主要有Browser、Render和GPU三种进程。其中,Browser进程负责创建浏览器的UI结构,Render负责加载网页内容,GPU进程负责将网页内容渲染在浏览器的UI上。这些知识点可以参考Chromium硬件加速渲染机制基础知识简要介绍和学习计划Chromium网页加载过程简要介绍和学习计划Chromium网页渲染机制简要介绍和学习计划这三个系列的文章。

以Chromium自带的Content Shell APK为例,它的Browser进程创建的UI结构如图1所示:

图1 Content Shell APK的UI结构

Browser进程创建的浏览器窗口由一个ContentShellActivity描述。这个ContentShellActivity包含了一个ShellManager。这个ShellManager又包含了一个Shell。注意,这里的ShellManager和Shell都是属于一个Layout元素。

一个Shell由一个Toolbar和一个ContentView组成。其中,Toolbar用来输入URL,ContentView用来展现URL对应的网页的内容。ContentView内部包含了一个SurfaceView,网页的内容实际上是渲染在这个SurfaceView上的。

用户与网页进行交互时,所产生的输入事件就会分发给ContentView处理。整体的处理过程如图2所示:

图2 用户输入事件处理过程

ContentView运行在Browser进程中,它接收到输入事件后首先会在Browser进程进行处理,主要就是检查手势操作,例如连续的输入事件是否产生了滑动和捏合事件。接着Browser进程再将发生的输入事件及其产生的手势操作通过一个类型为InputMsg_HandleInputEvent的IPC消息发送给Render进程处理。

Browser进程发送给Render进程的InputMsg_HandleInputEvent消息,首先会被Compositor线程截获。Compositor线程主要是检查消息里面是否包含了滑动和捏合手势操作。如果包含的话,那么就将它们应用在CC Active Layer Tree中。其它的输入事个将会转发给Main线程处理。Main线程主要将输入事件交给WebKit处理,也就是将它们应用在WebKit维护的DOM Tree中。关于Render进程中的Compositor线程和Main线程的详细介绍,可以参考前面Chromium网页渲染机制简要介绍和学习计划一文。

接下来我们以Touch事件为例,简要描述Browser进程和Render进程的Compositor线程、Main线程处理输入事件的过程。

Browser进程处理Touch事件的过程如图3所示:

图3 Browser进程处理Touch事件的过程

当发生Touch事件时,ContentView类的成员函数onTouchEvent就会被Android系统调用。从前面Chromium硬件加速渲染的OpenGL上下文绘图表面创建过程分析一文可以知道,Java层的每一个ContentView对象在C++层都对应有一个ContentViewCore对象。当Java层的每一个ContentView对象获得一个Touch事件之后,就会将该Touch事件分发给C++层与它对应的ContentViewCore对象处理。这是通过调用ContentViewCore类的成员函数OnTouchEvent实现的。

C++层的ContentViewCore对象获得从Java层传递过来的Touch事件之后,就会分别通过一个Gesture Dector和一个Scale Gesture Detector检查这个Touch事件是否产生了滑动(Scroll)和捏合(Pinch)手势操作。如果产生了,那么它们就会打包在一个Gesture Packet中。这个Gesture Packet又进一步通过一个InputRouter对象封装在一个InputMsg_HandleInputEvent消息中发送给Render进程处理。

注意,原始的Touch事件同时也会被上述InputRouter对象封装在另外一个InputMsg_HandleInputEvent消息中发送给Render进程处理。这意味一个Touch事件在产生了手势操作的情况下,Browser进程向Render进程发送了两个InputMsg_HandleInputEvent消息。其中一个描述的是一个手势操作,另外一个描述的是原始的输入事件。

Render进程在启动的时候,会注册一个类型为InputEvent的Filter,用来拦截Browser进程发送过来的输入事件消息,如图4所示:

图4 Compositor线程处理滑动和捏合手势操作的过程

Filter拦截IPC消息的过程,可以参考前面Chromium的IPC消息发送、接收和分发机制分析一文。

InputEvent Filter拦截到Browser进程发送过来的InputMsg_HandleInputEvent消息之后,会分给Compositor线程处理。Compositor线程进一步检查这个InputMsg_HandleInputEvent消息是否是一个滑动手势操作或者捏合手势操作。如果是的话,就将它们应用在CC Active Layer Tree中。否则的话,就将拦截到的InputMsg_HandleInputEvent消息转给给Main线程处理。

从前面Chromium网页渲染机制简要介绍和学习计划这个系列的文章可以知道,CC Active Layer Tree是通过激活CC Pending Layer Tree得到的,而CC Pending Layer Tree又是通过同步CC Layer Tree得到的。理论上说,Compositor线程应该将滑动和捏合手势操作应用在CC Layer Tree上,然后再同步到CC Pending Layer Tree中,最后再将CC Pending Layer Tree激活为CC Active Layer Tree。这样就可以保证这三个Tree的状态一致性。但是如果这样做的话,会涉及到以下四个操作:

1. 重新绘制CC Layer Tree。

2. 将重新绘制的CC Layer Tree同步到CC Pending Layer Tree中。

3. 将CC Pending Layer Tree激活为CC Active Layer Tree中。

4. 对CC Active Layer Tree进行渲染。

这个处理过程太漫长了,达不到快速响应用户输入的目的。CC Active Layer Tree描述的是用户当前在屏幕上看到的网页的内容,当用户滑动或者捏合网页的时候,网页的内容并没有发生实质的变化,只不过是位置或者缩放因子发生了变化,这完全可以通过当前使用的CC Active Layer Tree来处理。这样就可以省掉上述的前三个操作,于是就可以快速发响应用户输入了。从这里我们也可以看出,为什么Chromium要用三个Tree来描述同一个网页了,实际上就是为了能够快速地响应用户输入,提高网页浏览的用户体验。

但是,如果只将滑动和捏合手势操作应用在CC Active Layer Tree上,就会导致它的状态与CC Layer Tree不一致,这是不允许的。为了解决这个问题,Compsitor线程同时会请求调度器执行一个Commit操作。这个Commit操作将会触发Main线程重新绘制CC Layer Tree。Main线程在绘制CC Layer Tree之前,会收集之前应用在CC Active Layer Tree上的滑动和捏合操作,并且将它们应用在即将要绘制的CC Layer Tree之上。这样就可以保证它的状态与CC Active Layer Tree保证一致了。注意,将滑动和捏合手势操作应用在CC Active Layer Tree上和重新绘制CC Layer Tree分别发生在Compositor线程和Main线程中,它们是并发执行的。

对于那些不是描述手势操作的InputMsg_HandleInputEvent消息,Compositor线程将会转发给Main线程处理,如图5所示:

图5 Main线程处理Touch事件的过程

从前面Chromium网页Frame Tree创建过程分析一文可以知道,Main线程在加载网页的内容之前,会在WebKit里面创建一个WebViewImpl对象。我们可以将这个WebViewImpl对象理解为WebKit对外提供的一个接口。通过这个接口,Chromium可以操作WebKit为它所加载、解析和渲染的网页。

Main线程接收到Compositor发送过来的InputMsg_HandleInputEvent消息就会调用上述WebViewImpl对象的成员函数handleInputEvent,用来通知WebKit对该InputMsg_HandleInputEvent消息描述的输入事件进行处理。在我们这个情景中,这个输入事件即为一个Touch事件。

WebKit接收到Touch事件通知后,所做的第一件事情是做Hit Test,也就是检测Touch事件发生在哪一个网页元素上,然后再将接收到的Touch事件交给该网页元素处理。注意,这里说的网页元素,指的是网页DOM Tree中的节点,也就是DOM Node。一旦找到这个目标网页元素,那么WebKit就会调用它的成员函数dispatchTouchEvent,让它处理当前发生的Touch事件。

现在最重要的事情就是在DOM Tree中找到目标DOM Node。每一个输入事件都关联有一个位置,所有在该位置上的DOM Node都可能是目标DOM Node。如果输入事件发生的位置没有DOM Node,或者只有一个DOM Node,那么事情就好办。但是往往这个位置上有多个DOM Node,因此就需要将其中一个设置为目标DOM Node。一般来说,在Z轴上位置最高的DOM Node,就是要找的目标DOM Node。

DOM Tree记录了每一个DOM Node的Z-Index值。理论上说,通过这些Z-Index值,就可以确定一个输入事件的目标DOM Node,也就是仅仅通过DOM Tree就可以确定一个输入事件的目标DOM Node。但是从前面Chromium网页Graphics Layer Tree创建过程分析一文可以知道,一个DOM Node的Z-Index值并不能最终决定它在Z轴上的位置,还与这个DOM所在的Stacking Context的Z-Index值有关。例如,假设有两个Stacking Context,SC1和SC2。其中SC1的Z-Index值等于0,SC2的Z-Index值等于1。SC1包含了一个DOM Node,它的Z-Index值等于9,SC2包含了一个DOM Node,它的Z-Index值等于6。最终的效果是Z-Index值为6的DOM Node位于Z-Index值为9的DOM Node之上。这是因为前者所在的Stacking Context的Z-Index值比后者所在的Stacking Context的Z-Index值大的缘故。

WebKit维护的Render Layer Tree记录了网页所有的Stacking Context的信息,因此WebKit在做输入事件的Hit Test时,不能通过DOM Tree来确定目标DOM Node,而是要通过Render Layer Tree来确定。

以上就是Chromium处理输入事件的整体过程概述,它涉及到Browser进程,以及Render进程中的Compositor线程和Main线程。Browser进程负责手势操作检测,Compositor线程将手势操作应用在网页的CC Active Layer Tree中,Main线程负责将输入事件分发给WebKit处理。为了更好地理解Chromium的输入事件处理机制,接下来我们将按照以下三个情景进行详细分析:

1. Browser进程处理输入事件的过程分析;

2. Compositor线程处理输入事件的过程分析;

3. Main线程处理输入事件的过程分析。

敬请关注!更多的信息也可以关注老罗的新浪微博:http://weibo.com/shengyangluo

时间: 2024-09-29 01:52:25

Chromium网页输入事件处理机制简要介绍和学习计划的相关文章

Chromium网页渲染机制简要介绍和学习计划

作为一个浏览器,快速地将网页渲染出来是最重要的工作.Chromium为了做到这一点,费尽了心机,做了大量优化工作.这些优化工作是卓有成效的,代表了当今最先进的网页渲染技术.值得一提的是,这些渲染技术不仅适用于网页渲染,也可以应用在原生系统的UI渲染上.例如,在Android系统上,我们就可以看到两者在渲染技术上的相似之处.本文接下来就对Chromium的网页渲染机制进行简要介绍,并且制定学习计划. 老罗的新浪微博:http://weibo.com/shengyangluo,欢迎关注! Chrom

SEAndroid安全机制简要介绍和学习计划

与iOS相比,Android最被人诟病的是其流畅性和安全性.然而,从4.0开始,Android不遗余力地改善其流畅性.特别是在即将发布的L版本中,用ART替换了Dalvik,相信会越来越流畅.至于安全性,Android也没有遗忘.从4.3开始,Android引入了一套基于SELinux的安全机制,称为SEAndroid,来加强系统安全性.接下来我们就对SEAndroid进行简要介绍和制定学习计划. 老罗的新浪微博:http://weibo.com/shengyangluo,欢迎关注! 在介绍SE

Android系统中的广播(Broadcast)机制简要介绍和学习计划

在Android系统中,广播(Broadcast)是在组件之间传播数据(Intent)的一种机制:这些组件甚至是可以位于不同的进程中,这样它就像Binder机制一样,起到进程间通信的作用:本文通过一个简单的例子来学习Android系统的广播机制,为后续分析广播机制的源代码作准备. 在Android系统中,为什么需要广播机制呢?广播机制,本质上它就是一种组件间的通信方式,如果是两个组件位于不同的进程当中,那么可以用Binder机制来实现,如果两个组件是在同一个进程中,那么它们之间可以用来通信的方式

Android WebView简要介绍和学习计划

我们通常会在App的UI中嵌入WebView,用来实现某些功能的动态更新.在4.4版本之前,Android WebView基于WebKit实现.不过,在4.4版本之后,Android WebView就换成基于Chromium的实现了.基于Chromium实现,使得WebView可以更快更流畅地显示网页.本文接下来就介绍Android WebView基于Chromium的实现原理,以及制定学习计划. 通过前面几个系列文章的学习,我们知道,Chromium的实现是相当复杂的.这种复杂可以体现在编译出

Android运行时ART简要介绍和学习计划

Android在4.4就已推出新运行时ART,准备替代用了有些时日的Dalvik.不过当时尚属测试版,主角仍是Dalvik. 直到今年的Google I/O大会,ART才正式取代Dalvik.这个消息在科技界引起不小轰动,也吸引不少技术人员对它的"技术分析".可惜这些"技术分析"不过是引用了官方的数据和图表而已.这一系列文章将对ART进行真正的技术分析.老规矩,分析前先进行简要介绍和制定学习计划. 老罗的新浪微博:http://weibo.com/shengyang

Android应用程序UI硬件加速渲染技术简要介绍和学习计划

Android系统的流畅性一直被拿来与iOS比较,并且认为不如后者.这一方面与Android设备硬件质量参差不齐有关,另一方面也与Android系统的实现有关.例如在3.0前,Android应用程序UI绘制不支持硬件加速.不过从4.0开始,Android系统一直以"run fast, smooth, and responsively"为目标对UI进行优化.本文对这些优化进行简要介绍和制定学习计划. 老罗的新浪微博:http://weibo.com/shengyangluo,欢迎关注!

Android应用程序窗口(Activity)实现框架简要介绍和学习计划

文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/8170307 前面我们学习了SurfaceFlinger服务的实现原理.有了这个基础之后,从本文开始,我们就可以分析Android系统在Java层的UI实现了.我们知道,在Android应用程序的四大组件中,只有Activity组件与UI相关,它描述的是应用程序窗口,因此,我们就通过它的UI实现来分析Android系统在Java层的UI实现.本文

0-Android编译系统简要介绍和学习计划

Android编译系统简要介绍和学习计划 来源:http://blog.csdn.net/luoshengyang/article/details/18466779 导语: 在Android源码环境中,我们开发好一个模块后,再写一个Android.mk文件,就可通过m/mm/mmm/make等命令进行编译.此外,通过make命令还可制作各种系统镜像文件,例如system.img.boot.img和recovery.img等.这一切都得益于Android编译系统,它为我们处理了各种依赖关系,以及提

0-Android应用程序的Activity启动过程简要介绍和学习计划

源码分析 之 Activity启动过程简要介绍和学习计划 来源: http://blog.csdn.net/luoshengyang/article/details/6685853 声明: RTFSC(Read the fucking source code)是Linus的名言,也是学习IT技术一个重要手段.学习android最好手段就是对android进行系统分析,关于android系统的源码,CSDN的老罗分析分析是最系统一个.但是老罗的分析源码的blog,有几点不够好: 1.废话太多,可能