用JAVA编写浏览器内核之实现javascript的document对象与内置方法

原创文章。转载请注明。

阅读本文之前,您须要对浏览器怎样载入javascript有一定了解。

当然,对java与javascript本身也须要了解。

本文首先介绍浏览器载入并执行javascript的原理。

其次将介绍怎样用java与javascript互调用对象。

最后介绍怎样用java实现javascript的document对象与其他内置方法。

浏览器从server得到含有javascript代码的html文本后,将顺序运行javascript代码块。

看代码是最简单的方式:

package org.taoningyu.js;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;

import javax.script.Invocable;
import javax.script.ScriptEngine;
import javax.script.ScriptEngineManager;
import javax.script.ScriptException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class TaoDocument {

 Document mydoc = null;
	public TaoDocument(String url) throws MalformedURLException, IOException{
		mydoc = Jsoup.parse(new URL(url),30000);//利用Jsoup实现document树
	}

    public Element getElementById(String id){//实现document的getElementById方法
    	System.out.println("Java println:\t"+mydoc.getElementById(id));
    	return mydoc.getElementById(id);//返回的是Element对象
    }
	public static void main(String[] args) throws MalformedURLException, IOException {

	    ScriptEngineManager sem = new ScriptEngineManager();
	    ScriptEngine se = sem.getEngineByName("javascript"); //初始化Java内置的javascript引擎
	    try {

	    	 se.eval("function test() {"
	    		    + "id='areaDefault'; print('js print:'+document.getElementById(id));return document.getElementById(id);}");
                 //測试用javascript自己定义函数,功能为输出id为areaDefault的元素,并返回。
	    	 Invocable invocableEngine = (Invocable) se;//转换引擎类型为Invocable
	    	 se.put("document", new TaoDocument("http://www.ifeng.com/")); //关联对象,这一步非常重要,关联javascript的document对象为TaoDocument。亦即我自己实现的document对象
	    	 Element callbackvalue=(Element) invocableEngine.invokeFunction("test"); //直接执行函数。返回值为Element
	    	 System.out.println("callback return :"+callbackvalue); //打印输出返回内容
	    	 se.eval("test()");//第二种调用函数方式,我更偏爱此种方式
		} catch (ScriptException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (NoSuchMethodException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} 

	}

}

通过实现document对象,就能够动态解析html页面了。

在另外的文章。我将介绍怎样结合httpclient,使其成为headless浏览器的雏形。

时间: 2024-10-07 08:38:45

用JAVA编写浏览器内核之实现javascript的document对象与内置方法的相关文章

javascript中本地对象、内置对象和宿主对象(转)

ECMA-262 把本地对象(native object)定义为“独立于宿主环境的 ECMAScript 实现提供的对象”. 看定义有些不清楚,因为还未了解何为“宿主环境”的时候就引用了“宿主环境”这个概念,着实让人有些发晕. 不过,根据我强悍的文学功底,“宿主”一般是指寄生的生物选择的寄生体,这让我想起了“火影”里的“白”.简单说,就是用户的机器环境,包括操作系统和浏览器. 再来看一下,“本地对象”包含哪些内容: Object.Function.Array.String.Boolean.Num

JavaScript中本地对象、内置对象和宿主对象

链接:http://www.cnblogs.com/luckyXcc/p/5892896.html(Milk.╮的博客园提供) 其中内置对象只有两种:ECMA-262 只定义了两个内置对象,即 Global 和 Math (它们也是本地对象,根据定义,每个内置对象都是本地对象): Global对象是ECMAScript中最特别的对象,因为实际上它根本不存在,但大家要清楚,在ECMAScript中,不存在独立的函数,所有函数都必须是某个对象的方法.类似于isNaN().parseInt()和par

javascript的本地对象,内置对象和宿主对象

本地对象为array obj regexp等可以new实例化 内置对象为gload Math 等不可以实例化的 宿主为浏览器自带的document,window 等

js-DOM ~ 04. BOM:浏览器对象模型window. 、定时器、在线用户、祝愿墙、BOM的内置方法内置对象

multiple. select列表多选 触发事件后调用有参数的函数要先创建一个函数,然后在函数内调用执行函数 Array.from(伪数组):伪数组变为真数组 indexOf():查询字符的索引 a)  indexOf('abcde') i.      indexOf('a')的索引是0 ii.      indexOf('abc')的索引是0,按照第一个字符的索引 iii.      indexOf('ac')的索引是-1,查找不到ac连续的字符 iv.      indexOf('f')的

JavaScript 本地对象、内置对象、宿主对象

首先解释下宿主环境:一般宿主环境由外壳程序创建与维护,只要能提供js引擎执行的环境都可称之为外壳程序.如:web浏览器,一些桌面应用系统等.即由web浏览器或是这些桌面应用系统早就的环境即宿主环境. 1.本地对象 ECMA-262 把本地对象(native object)定义为“独立于宿主环境的 ECMAScript 实现提供的对象”. 再来看一下,“本地对象”包含哪些内容: Object.Function.Array.String.Boolean.Number.Date.RegExp.Erro

JavaScript基础:BOM的常见内置方法和内置对象

本文最初发表于博客园,并在GitHub上持续更新前端的系列文章.欢迎在GitHub上关注我,一起入门和进阶前端. 以下是正文. BOM的介绍 JavaScript的组成 JavaScript基础分为三个部分: ECMAScript:JavaScript的语法标准.包括变量.表达式.运算符.函数.if语句.for语句等. DOM:文档对象模型,操作网页上的元素的API.比如让盒子移动.变色.轮播图等. BOM:浏览器对象模型,操作浏览器部分功能的API.比如让浏览器自动滚动. 什么是BOM BOM

JavaScript 中关于Date的内置对象属性和方法的总结

Date 属性: 1.constructor    所建立对象的函数参考 2.prototype      能够为对象加入的属性和方法 方法: 1.getDay()    返回一周中的第几天(0-6) 2.getYear()    返回年份.2000年以前为2位,2000(包含)以后为4位 3.getFullYear()     返回完整的4位年份数 4.getMonth()      返回月份数(0-11) 5.getDate()       返回日(1-31) 6.getHours()  

(转)JavaScript中判断对象类型的种种方法

我们知道,JavaScript中检测对象类型的运算符有:typeof.instanceof,还有对象的constructor属性: 1) typeof 运算符 typeof 是一元运算符,返回结果是一个说明运算数类型的字符串.如:"number","string","boolean","object","function","undefined"(可用于判断变量是否存在). 但 type

Java程序员的JavaScript学习笔记(5——prototype和Object内置方法)

计划按如下顺序完成这篇笔记: 理念. 属性复制和继承. this/call/apply. 闭包/getter/setter. prototype. 面向对象模拟. jQuery基本机制. jQuery选择器. jQuery工具方法. jQuery-在"类"层面扩展. jQuery-在"对象"层面扩展. jQuery-扩展选择器. jQuery UI. 扩展jQuery UI. 这是笔记的第5篇,聊聊prototype.内置的Object对象和Object对象的属性和