HTML文本载入HTMLDocument2进行解析

IHTMLDocument2 *pDoc;
IHTMLElementCollection *objAllElement;
HRESULT hr;
CoInitialize(NULL);
hr = CoCreateInstance(CLSID_HTMLDocument, NULL, CLSCTX_INPROC_SERVER,
IID_IHTMLDocument2, (void**)&pDoc);
SAFEARRAY* psa = SafeArrayCreateVector(VT_VARIANT, 0, 1);
VARIANT *param;
bstr_t bsData = (LPCTSTR)pBuffer;//wchar_t *pBuffer;页面源码
hr = SafeArrayAccessData(psa, (LPVOID*)¶m);
param->vt = VT_BSTR;
param->bstrVal = (BSTR)bsData;
hr = pDoc->write(psa);
hr = pDoc->close();
pDoc->get_all(&objAllElement);

至此html文件已经载入HTMLDocument2，解析代码参考上一篇：《利用WebBrowser控件实现百度自动搜索》

时间： 2024-08-02 07:48:46

HTML文本载入HTMLDocument2进行解析的相关文章

利用lucene和pdfBox对PDF文本进行内容的解析

/* * 这段代码的功能是利用PDFBox.zip的包 * 利用lucene对PDF文本进行内容的解析 * 读取pdf文件的内容.然后重新的写入到同名的.txt文件中 * */ 结果截图: package pdfbox; import java.io.File; import java.io.FileOut... songtaste.com/user/10335914/infosongtaste.com/user/10335923/infosongtaste.com/user/10335

Photoshop入门教程（一）：文本新建与概念解析

写在开头 <Photoshop实用入门>系列教程可能对于一点都没有接触过Photoshop的人来说不太容易接受,因为本教程并没有细致到教你如何使用画笔工具等一系列很基础的东西,有些地方的讲解可能还会有一点点跨越.所以建议会基本操作的初学者学习,通过对本教程的学习,真正步入Photoshop奇妙的世界,真正入门. Photoshop简介 Photoshop是大名鼎鼎的图像处理软件,是由Adobe开发的,主要处理以像素所构成的数字图像. Photoshop版本作为初学者,第一要面临的就是软件版本

利用lucene对PDF文本进行内容的解析

/* * 这段代码的功能是利用PDFBox.zip的包 * 利用lucene对PDF文本进行内容的解析 * 读取pdf文件的内容.然后重新的写入到同名的.txt文件中 * */ 结果截图: package pdfbox; import java.io.File; import java.io.FileOutputStream; import java.io.OutputStreamWriter; import java.io.Writer; import java.net.MalformedU

<html> <head> <scropt type = "text/javascript"> funcion parseXML() { try { xmlDoc = new ActiveXObject("Microsoft.XMLDOM"); }catch(e) { try { xmlDoc = document.impl

python cookbook第三版学习笔记四：文本以及字符串令牌解析

文本处理: 假设你存在一个目录,下面存在各种形式的文件,有txt,csv等等.如果你只想找到其中一种或多种格式的文件并打开该如何办呢.首先肯定是要找到满足条件的文件,然后进行路径合并在一一打开. path=r'D:\test_source' filenames=os.listdir(path) print filenames ret=[name for name in filenames if name.endswith('.txt')] print ret direct_path=[os.pa

在vue中后台返回的文本包含标签时候解析为html代码

1.数据格式: str=‘<p>11111</p>' 解析方式一: <p v-html="str">{{str}}</p> 解析方式二: <pre>{{str}}<pre> 如果需要换行,在相应样式表上加white-space: pre-line 原文地址:https://www.cnblogs.com/Ashley77/p/11332019.html

iOS富文本组件的实现—DTCoreText源码解析数据篇

本文转载 http://blog.cnbang.net/tech/2630/ DTCoreText是个开源的iOS富文本组件,它可以解析HTML与CSS最终用CoreText绘制出来,通常用于在一些需要显示富文本的场景下代替低性能的UIWebView,来看看它是怎样解析和渲染HTML+CSS的,总体上分成两步: 数据解析—把HTML+CSS转换成NSAttributeString 渲染—用CoreText把NSAttributeString内容渲染出来,再加上图片等元素本篇先介绍第一步,数据解

Boost解析json格式文本

Boost解析json格式文本 flyfish 2015-4-1 property_tree可以解析ini,xml,json,info等格式的文本以下示例是解析json格式的文本需要包含的头文件 #include <boost/property_tree/ptree.hpp> #include <boost/property_tree/json_parser.hpp> const std::string file_path="C:\\test.txt"; 生

HTML、XML 等 Dom 结点类解析库Jsoup

Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据. 特点: HTML.XML.自定义DOM格式文本解析: 可操作HTML元素.属性.文本: 适用于采集解析网站HTML: DOM解析功能强大. 开源库jsoup-1.8.1.jar,基本用法: 1 package com.zhang.jsoupdemo; 2 3 import android.os.Enviro