[WinForm] 使用 WebBrowser 操作 HTML 頁面的 Element-摘自网络

前言



  在 Window Form 應用程式如果需要瀏覽網頁時可以崁入 WebBrowser 控制項,但如果需要操作崁入的 HTML 的網頁元素,就需要額外的操作,以下紀錄幾種操作 HTML 元素的方法以及會碰到的問題。

建立 WinForm 應用程式



  首先先建立一個 Window Form 應用程式,在 Form1 表單上拉入一個 Button 與 WebBrowser 控制項,如下

  在 Button1 事件中使用 WebBrowser.Navigate 方法載入指定的網頁,如下

view source

print?

1 private void button1_Click(object sender, EventArgs e)
2 {
3     webBrowser1.Navigate(Application.StartupPath + "\\Page.html");
4 }

  直接執行程式後點擊「前往網頁」按鈕就能夠看到網頁已經載入 WebBrowser 控制項中,如下

操作 HTML 網頁中的元素



  接下來如需要針對 HTML 網頁上的元素進行控制時,可以透過 WebBrowser 控制項提供的方法來處理,首先要在網頁載入完成後才進行操作,點選 WebBrowser 控制項加入 DocumentCompleted 事件,DocumentCompleted 事件是當網頁文件完全載入後即會觸發,就可以透過 Document、DocumentText、或 DocumentStream 屬性取得網頁內容,如下。

view source

print?

01 private void webBrowser1_DocumentCompleted
02     (object sender, WebBrowserDocumentCompletedEventArgs e)
03 {
04     if (webBrowser1.ReadyState == WebBrowserReadyState.Complete)
05     {
06         ThreadPool.QueueUserWorkItem(o =>
07         {
08             FormWork();
09         });
10     }
11 }
12  
13 private void FormWork()
14 {
15     // 進行操作
16 }

  透過 WebBrowser.ReadyState 屬性可以知道網頁使否已經載入完成,當載入完成後就使用 Thread 委派 FormWork 方法來處理網頁元素的操作,相關操作方法以下列出幾項。

操作文字框

view source

print?

1 webBrowser1.Document.GetElementById("name").SetAttribute("value", "Arvin");

操作下拉選單

view source

print?

1 HtmlElementCollection opts = webBrowser1.Document.
2     GetElementById("sex").GetElementsByTagName("option");
3 foreach (HtmlElement opt in opts)
4 {
5     if (opt.GetAttribute("value") == "男")
6         opt.SetAttribute("selected", "selected");
7 }

操作單選框

view source

print?

1 HtmlElementCollection opts = webBrowser1.Document.
2     GetElementsByTagName("input").GetElementsByName("skill");
3 foreach (HtmlElement opt in opts)
4 {
5     if (opt.GetAttribute("value") == "WebForm")
6         opt.InvokeMember("click");
7 }

執行 JavaScript 方法 (不需寫入左右括弧符號)

view source

print?

1 webBrowser1.Document.InvokeScript("ShowInfo");

取得網頁內崁 iFrame 網頁的內容方法

view source

print?

1 webBrowser1.Document.Window.Frames[0].Document

  以上列出幾種操作網頁元素的做法,不外乎就是取得元素物件再透過 SetAttribute 方法來取得或設定值,最後將幾種操作方式組合後來測試自動輸入表單的功能並且希望輸入表單時能夠一步一步輸入,所以加入 Sleep 方法停頓一秒鐘,如下

view source

print?

01 private void FormWork()
02 {
03     webBrowser1.Document.GetElementById("name").SetAttribute("value", "Arvin");
04     Thread.Sleep(1000);
05  
06     webBrowser1.Document.GetElementById("phone").SetAttribute("value", "0912345678");
07     Thread.Sleep(1000);
08  
09     HtmlElementCollection opts = webBrowser1.Document.
10         GetElementById("sex").GetElementsByTagName("option");
11     foreach (HtmlElement opt in opts)
12     {
13         if (opt.GetAttribute("value") == "男")
14             opt.SetAttribute("selected", "selected");
15     }
16     Thread.Sleep(1000);
17  
18     HtmlElementCollection opts2 = webBrowser1.Document.
19         GetElementsByTagName("input").GetElementsByName("skill");
20     foreach (HtmlElement opt in opts2)
21     {
22         if (opt.GetAttribute("value") == "WebForm")
23             opt.InvokeMember("click");
24     }
25     Thread.Sleep(1000);
26  
27     webBrowser1.Document.InvokeScript("ShowInfo");
28 }

  完成後執行程式碼上就會跳出 InvalidCastException 錯誤,如下

  其原因是因為執行緒安全的關係,無法在非主執行緒的線程下操作 UI 控制項,在以上的程式碼中直接在 Thread 方法中取得 webBrowser1 控制項進行操作因而導致了錯誤發生。

  調整程式碼先使用 Control.InvokeRequired 屬性來判斷是否在主執行緒下執行,若不是的話則呼叫 Invoke 方法指定委派,如下。

view source

print?

01 private delegate void FormWorkDelegate();
02  
03 private void FormWork()
04 {
05     if (webBrowser1.InvokeRequired)
06         webBrowser1.Invoke(new FormWorkDelegate(FormWork));
07     else
08     {
09         webBrowser1.Document.GetElementById("name").SetAttribute("value", "Arvin");
10         Thread.Sleep(1000);
11  
12         webBrowser1.Document.GetElementById("phone").SetAttribute("value", "0912345678");
13         Thread.Sleep(1000);
14  
15         HtmlElementCollection opts = webBrowser1.Document.
16             GetElementById("sex").GetElementsByTagName("option");
17         foreach (HtmlElement opt in opts)
18         {
19             if (opt.GetAttribute("value") == "男")
20                 opt.SetAttribute("selected", "selected");
21         }
22         Thread.Sleep(1000);
23  
24         HtmlElementCollection opts2 = webBrowser1.Document.
25             GetElementsByTagName("input").GetElementsByName("skill");
26         foreach (HtmlElement opt in opts2)
27         {
28             if (opt.GetAttribute("value") == "WebForm")
29                 opt.InvokeMember("click");
30         }
31         Thread.Sleep(1000);
32  
33         webBrowser1.Document.InvokeScript("ShowInfo");
34     }
35 }

  在次執行後發現不會跳出錯誤訊息了,但是卻發生另一個問題,就是當頁面載入後在填入表單值時程式會停頓一段時候才一次顯示所以欄位的值,這樣的結果並不符合當初所要一步一步的填入表單的需求,如下

  這種問題在我此篇MSDN發問中 ThankfulHeart 大有提到,Invoke 方法是使用 UI 的線程,而如果在 UI 線程中使用了 Sleep 方法將導致 UI 畫面被阻塞,因此才讓畫面陷入了停頓的狀態。

  而在 FormWork 方法中我將操作的方法都包含在 Invoke 的程式區塊中,所以在此如要避免長時間的畫面阻塞,應該要盡可能的切割使用到 Invoke 的區段,因此修改程式如下。

view source

print?

01 private void FormWork()
02 {
03     this.Invoke(new MethodInvoker(() =>
04     {
05         webBrowser1.Document.GetElementById("name").SetAttribute("value", "Arvin");
06     }));
07     Thread.Sleep(1000);
08  
09     this.Invoke(new MethodInvoker(() =>
10     {
11         webBrowser1.Document.GetElementById("phone").SetAttribute("value", "0912345678");
12     }));
13     Thread.Sleep(1000);
14  
15     this.Invoke(new MethodInvoker(() =>
16     {
17         HtmlElementCollection opts = webBrowser1.Document.
18             GetElementById("sex").GetElementsByTagName("option");
19         foreach (HtmlElement opt in opts)
20         {
21             if (opt.GetAttribute("value") == "男")
22                 opt.SetAttribute("selected", "selected");
23         }
24     }));
25     Thread.Sleep(1000);
26  
27     this.Invoke(new MethodInvoker(() =>
28     {
29         HtmlElementCollection opts2 = webBrowser1.Document.
30             GetElementsByTagName("input").GetElementsByName("skill");
31         foreach (HtmlElement opt in opts2)
32         {
33             if (opt.GetAttribute("value") == "WebForm")
34                 opt.InvokeMember("click");
35         }
36     }));
37     Thread.Sleep(1000);
38  
39     this.Invoke(new MethodInvoker(() =>
40     {
41         webBrowser1.Document.InvokeScript("ShowInfo");
42     }));
43 }

  透過切割每個動作呼叫對應的 Invoke 去執行後執行結果如下

  以上就是一個簡單使用 WinForm 的 WebBrowser 控制項控制網頁元素的方式,在此紀錄一下做法。

範例程式碼



WinWebBrowser.rar

时间: 2024-10-13 04:01:30

[WinForm] 使用 WebBrowser 操作 HTML 頁面的 Element-摘自网络的相关文章

HttpWebRequest post 提交 C#的WebBrowser操作frame如此简单 WebClient 提交

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 //<a href="http://www.cnblogs.com/cgli/archive/2011/04/09/2010497.html">http://www.cnblogs.com/cgli/archive/2011/04/09/2010497.html</a> <br>System.Net

[Winform]线程间操作无效,从不是创建控件的线程访问它的几个解决方案,async和await?

目录 概述 取消跨线程检查 使用委托异步调用 sync和await 总结 概述 最近在qq群里有一朋友,问起在winform中怎么通过开启线程的方式去处理耗时的操作,比如,查看某个目录下所有的文件,或者符合要求的文件.下班回来,也研究了一下.发现多线程这块有点薄弱,也算是补一补吧. 在winform开发,经常会遇到需要在控件上加载大量数据(也就是常说的耗时操作),这会导致程序出现假死状态,这个时候我们就会想到线程. 在智能客户端应用程序中,这样的线程创建并管理用户界面 (UI),因而称为 UI

winform中WebBrowser控件执行脚本

在实际应用中我们可能需要WebBrowser控件主动执行我们需要的脚本,执行脚本现在有两种方法. 1.WebBrowser控件加载脚本,简单方便,适用于简短的脚本,无法执行复杂操作. webBrowser.Navigate("javascript:editor.areaToFrame();document.getElementById('articlePostBtn').click();"); 相当于你在浏览器地址栏,直接输入脚本来执行. 2.使用微软提供的动态库,也就是Microso

C# winform调用WebBrowser经典怪问题总结

原文:C# winform调用WebBrowser经典怪问题总结 最近一直研究网页数据采集,单单采集数据,其实HtmlAgilityPack就足够了. 对HtmlAgilityPack感兴趣的可以到这里看看:C#采集代理服务器ip并设置IE代理--HtmlAgilityPack实战代码但是有个问题:要是想要模拟人工输入数据,进行表单提交HtmlAgilityPack就办不了,Skybound.Gecko(firfox的.net开源代码) 也办不了这个事情.Skybound.Gecko不支持点击,

Winform跨窗体操作控件(使用委托)

Winform跨窗体操作控件是winform开发中很常见的形式,最常见且简单有效的方式便是使用委托的方式来进行操作,下面我将通过一个小实例来说明如何使用委托跨窗体实现控件操作. 实例介绍:两个窗体,Form1按钮打开Form2,然后在Form2的TextBox输入值在Form1的TextBox中显示出来. 一.项目结构 Form1窗体设计: Form2窗体设计: 二.代码实现 在Form2的代码中声明一个委托(写在Form2类外)-> public delegate void ChangeFor

jquery的常用操作(操作html页面的Dom对象的元素)

一:页面加载完成时,会执行jquery的方法(不需要等待图片加载完成,只要dom结构加载完成,就执行该方法) //第一种写法: $(document).ready(function() { // 执行体 }); //第二种写法 $(function() { //执行体 }); 二:用jquery获取dom对象,判断该对象是否有内容的两种方法(有返回true,没有返回false) jqObj.text().trim() var jqObj = $(this); if(jqObj.text().tr

WinForm中WebBrowser的使用

最近由于工作需要,研究了下Winform的WebBrowser控件,在这里给大家分享下. 1.WebBrowser导航 WebBrowser在进行导航的时候需要用到Navigate(string urlString)方法 2.执行已有的JavaScript函数 使用WebBrowser.Document.InovkeScript(string scriptName) 3.执行自定义的Javascript函数 这里需要先将自定义的Javascript写入到WebBrowser.Document.B

Winform跨线程操作GUI

一直以来都是做Web开发,虽然乱七八糟什么都接触一些,但几乎不怎么接触Winform, WPF这些,也很少接触多线程开发. 在公司有时候没有事儿做,但又不能随意上网浏览新闻什么的,会被IT监控,看多了总归不好.QQ也被禁用.大家用的都是OC.OC的聊天记录也会被上传到服务器.所以闲着的时候就开始决定做一个Winform的聊天室.初步包括 登陆,群聊,私聊,查看在线列表 这些基本功能. 今天遇到一个问题,上网查了一下,答案虽然正确,但让初步接触的我看的稀里糊涂的,大部分都是复制粘贴,甚至还出现了中

C#的WebBrowser操作frame如此简单

刚学c#不久,也不太懂什么IHTMLDocument.IHTMLDocument2.IWebBrowser2等等.自己琢磨了好久,终于知道了怎么用WebBrowser操作frame和iframe. 1.获取frame的源文件 MessageBox.Show(webBrowser1.Document.Window.Frames["main"].Document.Body.InnerHtml); 2.获取frame的HTMLDocument接口 HTMLDocument doc = (HT