用IHTMLDocument2接口获取页面上想要的数据,代替正则表达式

原文:用IHTMLDocument2接口获取页面上想要的数据,代替正则表达式

原文发布时间为:2010-07-01 —— 来源于本人的百度文章 [由搬家工具导入]

1. 用 IHTMLDocument2::all 获得所有元素;
2. 用 IHTMLElementCollection::tags 获得标签为 span 的元素;
3. 用 IHTMLElement::className 获得 class 名为 EX 的元素;
4. 用 IHTMLElement::innerText 获得文本。

IHTMLDocument2 doc = new HTMLDocumentClass();
doc.write(new object[] { ie.OutString });
doc.close();
if (doc != null)
{
IHTMLElementCollection iec = (IHTMLElementCollection)doc.all.tags("dd");

foreach (IHTMLElement ii in iec)
{
if (ii.getAttribute("onmouseout", 0).ToString() != "")
{
Console.WriteLine(ii.innerText);
string str = ii.innerText;
}
}
}

原文地址:https://www.cnblogs.com/lonelyxmas/p/8609616.html

时间: 2024-08-06 07:54:53

用IHTMLDocument2接口获取页面上想要的数据,代替正则表达式的相关文章

用JavaScript获取页面上被选中的文字的技巧

这里介绍的一个小技巧是如何用JavaScript获取页面上被选中的文字的方法.最关键的JavaScript API是: event.selection = window.getSelection(); 这里的selection实际上是个对象,但如果我们使用 .toString()或强行转化成字符串,我们将得到被选中的文字. $(document).ready(function () { $(".contenttext").mouseup(function (e) { var txt;

如何获取页面上的所有的标签元素?排除重复的。

这个问题应该这样比较好:如何统计页面上用了多少HTML标签元素. 这是我在知乎live上看到的问题,后来讨论了这个https://www.zhihu.com/question/53175578 很多人给出了答案,but,我思来想去也觉得很简单啊,写代码的时候发现完全不知如何下笔,还是菜啊- -! 比如我看到了一个回答 new Set($$("*").map(e => e.tagName)).size;是在控制台输出.可以得到总过用了多少html标签元素的个数. 我心想很简单啊,试

点滴积累【C#】---抓取页面中想要的数据

效果: 描述:此功能是抓取外国的一个检测PM2.5的网站.实时读取网站的数据,然后保存到数据库里面.每隔一小时刷新一次. 地址为:http://beijing.usembassy-china.org.cn/070109air.html 筛选后的地址为:http://utils.usembassy.gov/feed2js/feed2js.php?src=http%3A%2F%2Fwww.stateair.net%2Fweb%2Frss%2F1%2F1.xml&desc=1&num=7&

JS获取页面上所有input

1 for (var i = 0; i < document.getElementsByTagName("input").length; i++) { 2 if (document.getElementsByTagName("input")[i].id.indexOf("tx_ID") > -1) { 3 document.getElementById("hid_SetValue").value += docume

jsonp跨域访问servlet接口获取json数组,并且渲染数据,前后端完整

啊哈哈哈哈哈哈哈哈哈哈哈我太激动了~ 其实这个工作我一直在拖延啊,就觉得哇,好难啊,不想做欸= = 然后硬着头皮研究了一整个下午+晚上终于搞清楚了~~~~哇哈哈哈哈~~~好神奇哈哈哈哈哈~~~(疯了吧!) json.jsonp.jQuery Ajax这些东西说定义我也不是特别研究,只懂个大概,就不去复制百科了,没意思. 一.先说我要做的事情的需求,上来就撸代码估计很多人懵逼(就像今天下午的我一样- -||) 意图:本地服务端servlet生成json数据,我想在前端获取json数据并渲染成列表显

Microsoft Dynamics CRM 解决数据大于5000时,页面上只能导出5000+数据。

select * from [MSCRM_CONFIG].[dbo].[DeploymentProperties] where ColumnName='TotalRecordCountLimit' and Id='D44F5B65-64FF-E411-AF19-000C29F8ABAE' update [MSCRM_CONFIG].[dbo].[DeploymentProperties] set IntColumn=10000 --调整成10000+

webdriver 获取页面response

在selenium webdriver实现自动化抓取数据过程中,发现无法从webdriver获取页面response 查来查去最终在 stackoverflow 上找到了这一篇文章 文章中说:webdriver是不可能提供页面response接口的,这件事是经过反复讨论的 连接如下: https://stackoverflow.com/questions/6509628/how-to-get-http-response-code-using-selenium-webdriver 有了这样明确的结

使用Selenium含蓄等待获取页面元素(附带实际业务需求情景)

Hello,大家好,又到了小猿分享技术的时间了.这回带来的是使用Selenium去网站上获取部分信息并且执行部分操作以及"含蓄"等待元素加载完成以及截取图片和网页刷新机制的技术点. 解释说明:Selenium用于自动化测试,web自动化测试工具集,即使用该模块去模拟手动去网页上点击获取信息,是一个很好的自动化测试模块. 关于selenium模块,其实它的主要目的是进行web自动化测试,获取信息是次要的,主要是为了测试web的性能,这里也只是针对关于在web页面上进行操作. 该模块适用范

webview 获取网页上的数据

最近做webview,遇到2种需求,一种是在自己服务器上的HTML中获取数据,另一种是通过自己服务器上的HTML中的超链接跳到另一个站点的HTML中,并获取数据. 于是,总结了2种通过webview获取网页上的数据的方式: 第一种:简单点的,直接通过js调java,在调用方法的过程中将数据通过方法的参数传递给Android端,(前提:服务端有对应的faxun对象,而且调用的方法是showImages(String[] imgUrls)). <span style="font-size:18