cefsharp作为采集工具(学习笔记)

cefsharp(webkit内核)浏览器替代webbrowser用来采集页面数据。

需要在页面form加载完毕,用异步方式自动获取sourcecode。

由于国内cefsharp的资料相对比较少,在google英文资料后得到方法,这里做个笔记备忘:

IWebBrowser.cs 这个接口文件里面
36行: event EventHandler<FrameLoadEndEventArgs> FrameLoadEnd; 页面加载完的“事件”。

262行:GetSourceAsync() 会返回string 结果,可以用来返回html代码

 

只需要页面一加载完毕就GetSourceAsync() ,采用异步的方式进行。

时间: 2024-08-06 15:57:38

cefsharp作为采集工具(学习笔记)的相关文章

rsync同步工具学习笔记

个人学习笔记,整理总结自某培训班授课视频,如有侵权请站内信联系. RSYNC工具功能: 1. 主机本地间的数据传输,类似于CP/RM命令. 例: 常用选项avz,保持文件属性,类似cp -d -p -r / -a 例: rsync删除方法: 新建空目录,用rsync -r --delete /空目录 /目标目录 注意目录名后要加/ 例: rsync删除原理:复制(删除复制) 见图: 2. 借助SSH/rcp通道传输数据,类似于SCP命令.    例:推送文件     例:拉取文件     3.

讯搜全文检索工具学习笔记

学习使用全文检索工具后,做一个小结. 其实这个工具用起来非常简单,只需要花几个小时专心阅读完开发手册就可以进入开发阶段了. 讯搜全文检索工具(Xunsearch) 首先它是一款开源的工具,和其它的开源工具一样,简单易用而且功能强大,并且性能也非常卓越. 分词与索引,是全文检索工具的关键. 讯搜底层采用 C/C++ 编写,索引设计基于著名而悠久的 Xapian,分词采用 自主研发同样也是开源的 SCWS分词,两者完美结合,理论上单个搜索库支持 40 亿条 记录.可编译运行于 Linux/FreeB

Deltasql 数据库版本管理工具学习笔记

一.Deltasql 功能 二.Deltasql服务器端和客户端的安装 2.1 Deltasql服务器端的安装 2.2 Deltasql客户端的安装 三.Deltasql的使用 四.Deltasql 原理 五.还待研究的地方 一.Deltasql 功能 目前我们对数据库的管理是比较少的,尤其在对数据库版本的控制方面.比如说当我们想恢复到以前的数据库版本,当客户A需要X版本的数据库,客户B需要Y版 本的数据库,当发布项目的时候项目的数据库和开发人员的数据库是否一致,等等这些问题解决起来还是会有一定

linux基础网络工具学习笔记

1.ifconfig interface up/down/mtu/netmask/broadcast ifconfig eth0 192.168.1.1 #不加参数,按照标准A/B/C类自动添加掩码 ifconfig eth0 192.168.100.100 netmask 255.255.252.0 mtu 8000 ifconfig eth0:0 192.168.100.101 #给一张网卡添加多个ip ifconfig的设置在重启网络服务后会失效 ifconfig wl0 up #启动无线

xcode 工具学习笔记

1. 快速打开辅助界面 快捷键:使用Option + 单击文件 2. 辅助编辑器更多打开方式 快捷键: Option+shift +单击文件 3. tab页面快捷键 快捷键: Command+T 新建tab Command+W 关闭tab Command +}/{ 左右切换tab 4. 更改双击为打开一个新tab 5. Xcode快照功能snapshot 快照就是整个代码的存档拷贝.多数用于重构之前的保存操作. 创建快照:Command + Control + S 快照管理 (删除.导出 快照)

测试工具学习笔记 - JUnit4

1. StartUp 引入JUnit依赖, 用@Test标注需要被测试的方法,使用Assert进行测试结果是否通过 <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>${junit.version}</version> <scope>test</scope> </dependency>

代码管理工具 --- git的学习笔记四《重新整理git(1)》

1.创建版本库 mkdir  创建目录 cd  地址,到该地址下 pwd 显示当前目录 1.创建目录 $ mkdir startGit $ cd startGit $ pwd 显示当前目录 或者cd到桌面,然后再创建目录 2.初始化版本库 $ git init 初始化仓库 提示信息:Initialized empty Git repository in /Users/xingzai/Desktop/startGit/.git/ 建立一个空的git仓库在/Users/xingzai/Desktop

【Unity 3D】学习笔记二十八:unity工具类

unity为开发者提供了很多方便开发的工具,他们都是由系统封装的一些功能和方法.比如说:实现时间的time类,获取随机数的Random.Range( )方法等等. 时间类 time类,主要用来获取当前的系统时间. using UnityEngine; using System.Collections; public class Script_04_13 : MonoBehaviour { void OnGUI() { GUILayout.Label("当前游戏时间:" + Time.t

我的php学习笔记:php通用采集程序

php采集程序构建基本步骤: 采集程序是什么?获取远程数据(文字.图片.图片)并快速保存到本地或指定地址. 如天气预报(小偷程序): 远程获取-->替换内容-->展示给用户 如实时更新的新闻(采集内容): 远程获取-->提取内容-->分类存储-->读取内容--->展示内容 ************************* 设计PHP采集入库UML 列表正则: 终端正则: ************************** file_get_contents()获取远