c#如何判断webbrowser已经加载完毕

最近有个小程序需要采集网页源代码,但有的网页中JS脚本又会生成额外的代码,比如http://www.cnblogs.com/lidabo/p/4169396.html

红框部分便是另外加载的代码。

此处可以看到web前端是有 "操作系统" 几个字的,但查看网页源代码之后却搜不到这几个字

C#有个webbrowser控件可以等网页加载完之后获取浏览器上所有的网页源代码(也包括额外被JS加载进来的代码)

【第一次】试验

WebBrowser webBrowser1 = new WebBrowser();

private void button1_Click(object sender, EventArgs e)
{

  webBrowser1.Navigate("http://www.cnblogs.com/lidabo/p/4169396.html");

  //加载完毕后触发事件webBrowser1_DocumentCompleted
  webBrowser1.DocumentCompleted += new WebBrowserDocumentCompletedEventHandler(webBrowser1_DocumentCompleted);

}

private void webBrowser1_DocumentCompleted(object sender, EventArgs e)//这个就是当网页载入完毕后要进行的操作
{

  //将webBrowser显示的代码传入richTextBox以便调试

  richTextBox1.Text = webBrowser1.DocumentText;

}

结果:webbrowser加载完这个页面之后,richTextBox1.Text获取的代码里面找不到  "操作系统"  几个字 , 获取的代码有1063行

网页在加载的过程中,webBrowser1_DocumentCompleted可能会触发一次以上,且相同网页可能触发次数不尽相同

有的网页会多次触发webBrowser1_DocumentCompleted,腾讯网http://www.qq.com触发了4次

【第二次】试验

public int i;//设置全局变量i

private void webBrowser1_DocumentCompleted(object sender, EventArgs e)
{

  i++;//以便观察这个事件被触发了多少次

  richTextBox1.Text = webBrowser1.DocumentText;

}

结果:最后  i  的值为 1,richTextBox1.Text获取的代码里面依然找不到  "操作系统"  几个字 , 获取的代码有1063行

按理来说不应该只触发一次、

【第三次】试验

private void webBrowser1_DocumentCompleted(object sender, EventArgs e)
{

  MessageBox.Show("111");//这个得迅速点掉确定才看到触发了多少次messagebox

  richTextBox1.Text = webBrowser1.DocumentText;

}

结果:迅速点掉messagebox的“确定”后又出现了一次messagebox,即一共两次触发了webBrowser1_DocumentCompleted事件

实验触发二次webBrowser1_DocumentCompleted事件,里面可以找到"操作系统"几个字,代码共有2095行,这次应该全部获取完毕了

加入没有迅速点掉messagebox,可能这个等待过程中,网页可能被webbrowser真的完全加载完毕从而不再触发webBrowser1_DocumentCompleted事件

为什么

【第二次】实验只触发一次webBrowser1_DocumentCompleted事件,而且获取的代码还不完全

【第三次】实验加入了messagebox(然后迅速点掉)能触发一次以上的webBrowser1_DocumentCompleted事件,获取代码完全

【第三次】实验加入了messagebox(没有迅速点掉)只能触发一次webBrowser1_DocumentCompleted事件,获取代码完全

我没弄明白

***********************************************************************************************************

那么换个思路。在第一次进入webBrowser1_DocumentCompleted事件之时开启一个timer时钟,间隔5秒,5秒之后获取一次webbrowser的代码

只触发一次时钟时间,由于时钟是另外的线程,要调用webbrowser需要用到委托

//实例化timer

System.Timers.Timer t = new System.Timers.Timer();

//定义委托变量
public happy updateTxt_ok;

public delegate void happy();

public Form1()
{
  InitializeComponent();

  //设定timer
  t.Interval = 5000; //定时,单位ms
  t.Enabled = true; //回调函数允许执行
  t.AutoReset = false; //回调函数循环执行
  t.Elapsed += new System.Timers.ElapsedEventHandler(theout); //到达时间的时候执行事件; 
  t.Stop();
}

private void Form1_Load(object sender, EventArgs e)
{
  updateTxt_ok = new happy(UpdateTxtMethod);
}

//委托执行函数

public void UpdateTxtMethod()
{

  //此处不用DocumentText是因为它获取中文可能产生乱码
  Encoding encoding = Encoding.GetEncoding(webBrowser1.Document.Encoding);
  StreamReader stream = new StreamReader(webBrowser1.DocumentStream, encoding);
  string aa = stream.ReadToEnd();

  richTextBox1.Text = aa;
  stream.Close();

}

//timer事件

public void theout(object source, System.Timers.ElapsedEventArgs e)
{
  this.BeginInvoke(updateTxt_ok);//委托执行updateTxt_ok
}

//按下按钮

private void button1_Click(object sender, EventArgs e)
{

  webBrowser1.Navigate(richTextBox1.Text);
  webBrowser1.DocumentCompleted += new WebBrowserDocumentCompletedEventHandler(webBrowser1_DocumentCompleted);

}

private void webBrowser1_DocumentCompleted(object sender, EventArgs e)//这个就是当网页载入完毕后要进行的操作
{
  t.start();//开启时钟
}

结果:获取完整源代码,共有2095行

但不能保证其他网页也是延迟5秒就能加载完,有的服务器很卡,需要调整时间

时间: 2024-12-29 23:17:28

c#如何判断webbrowser已经加载完毕的相关文章

VB判断webbrowser网页加载完毕

'====VB判断webbrowser网页加载完毕 Private Sub WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant) If (pDisp Is WebBrowser1.Object) Then Msgbox "网页下载完毕!" End If End Sub

jquery判断图片是否加载完毕

来源: <http://www.2cto.com/kf/201409/331234.html> 利用图片没有加载完成的时候,宽高为0.我们很容易判断图片的一个加载情况.如下: 思路:判断图片高度 --> 存在高度等于0 --> 定时500毫秒再次扫描 --> 直到全部不等于0 -->进行下一步处理 注意:引入jquery.js 1 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN&

javaScript &amp; jquery完美判断图片是否加载完毕

好久没写东西了,正好最近因为工作需要,写了一个瀑布流异步加载的程序. 今天就不谈瀑布流,来谈一下关于load的问题. ------------------------------------------------------------- 众所周知,常见瀑布流当鼠标滚动到浏览器底部的时候,就会发起一个ajax的请求.在服务端生成item列表后,通过 js append到相应的div里边. 看起来很简单的样子,关键问题就出在图片的加载问题上,图片一般都放在服务器上,通过http下载到客户端. 例

js判断网页是否加载完毕 包括图片

<script type="text/javascript" language="JavaScript"> //: 判断网页是否加载完成 document.onreadystatechange = function () { if(document.readyState=="complete") { document.getElementById('divprogressbar').style.display='none'; } }

window.onload 和 DOMContentLoaded区别及如何判断dom是否加载完毕

http://blog.allenm.me/2010/02/window-onload-和-domcontentloaded/ 其中使用IE不支持DOMContentLoaded,那么判断IE是否加载完DOM的一种方法:判断element的doScroll如果成功则说明DOM载入完成. http://www.cnblogs.com/haogj/archive/2013/01/15/2861950.html 见第4种方法

判断 iframe 是否加载完毕

方法一.jQuery load() var frm = document.getElementById('myiframe'); $(frm).load(function(){ // 等iframe加载完毕 dosomething(); }); 方法二.onreadystatechange var iframe = document.createElement("myiframe"); iframe.src = "http://www.baidu.com"; if

JS判断网站是否加载完毕

document.onreadystatechange = Onload;//当页面加载状态改变的时候执行这个方法.  function Onload()  {  if(document.readyState =='complete') //当页面加载状态  alert('加载完毕'); }  原文地址:https://www.cnblogs.com/xuxian001/p/12217707.html

C# webbrowser判断页面是否加载完毕

private void Form1_Load(object sender, EventArgs e) { webalipay.Url = new Uri("https://authzth.alipay.com/login/homeB.htm"); webalipay.DocumentCompleted += new WebBrowserDocumentCompletedEventHandler(wb_DocumentCompleted);//加载完成后的事件 } /// <su

jquery判断图像是否加载完毕【解决读取缓存不调用load方法的问题】

$("img").one("load", function() {  // do stuff}).each(function() {  if(this.complete) $(this).load();});