正则表达式获取TABLE里的内容

//过滤\n 转换成空
            String withoutNString=message.Replace("\n", "");
            //过滤\r 转换成空
            String withoutRString = withoutNString.Replace("\r", "");
            //过滤\t 转换成空
            String withoutTString = withoutRString.Replace("\t", "");
            //过滤\ 转换成空
            String newString = withoutTString.Replace("\\", "");
            //获取html中的body标签
            String result = Regex.Match(newString, @"<body.*>.*</body>").ToString();
            //过滤注释
            String result2 = Regex.Replace(result, @"<!--(?s).*?-->", "", RegexOptions.IgnoreCase);
            //过滤nbsp标签
            String result3 = Regex.Replace(result2, @"&nbsp;", "", RegexOptions.IgnoreCase);
            //获取body中的所有table
            Regex regex = new Regex(@"<table.*?>[\s\S]*?<\/table>");
            MatchCollection mc = regex.Matches(result3);
            //获取集合类中自己需要的某个table
            String newHtmlStr = mc[3].ToString();

时间: 2024-10-08 17:54:47

正则表达式获取TABLE里的内容的相关文章

正则表达式 获取括号内的内容

https://blog.csdn.net/genius_yym/article/details/79670035 JS 正则表达式 获取小括号 中括号 花括号内的内容 var str="123{xxxx}456[我的]789123[你的]456(1389090)789"; var regex1 = /\((.+?)\)/g; // () 小括号 var regex2 = /\[(.+?)\]/g; // [] 中括号 var regex3 = /\{(.+?)\}/g; // {}

python获取script里的内容

import requests from bs4 import BeautifulSoup url1 = "https://mip.keoaeic.org/journal_skills/6616.html" html = requests.get(url1).content html=html.decode('utf-8') # python3 soup = BeautifulSoup(html, "html.parser") a = soup.select('sc

php用正则表达式获取网站的标题内容

已知网站的网址,用php获取网站的内容. 编写正则表达式. 用preg_match_all函数获取标题内容. 1 $url='http://www.m-ivi.com'; 2 $content=file_get_contents($url); 3 $match='/<title>.*<\/title>/i'; 4 $ru=preg_match_all($match,$content,$ma); //获取 5 $title=$ma[0][0]; 以上是以www.m-ivi.com为例

iPhone开发--正则表达式获取字符串中的内容

缘起: 想获取字符串中指定的字符,考虑用正则表达式,遂写了如下的代码: [cpp] view plaincopy NSString *htmlStr = @"oauth_token=1a1de4ed4fca40599c5e5cfe0f4fba97&oauth_token_secret=3118a84ad910967990ba50f5649632fa&name=foolshit"; NSString *regexString = @"oauth_token=(\

Jquery 获取table当前行内容

$("a[name='checkOriginal']").click(function () { var parent = $(this).parent().parent().find("td"); var moduleEnum = parent.eq(7).text(); if(moduleEnum==""){ } alert(moduleEnmu);}); 原文地址:https://www.cnblogs.com/austinspark-je

分析html格式数据,根据正则表达式获取所需数据,并存入数据库

例子为获取<dl>中的<dt></dt><dd></dd>中的内容,由于在<dt></dt>标签中还存在<a>标签,所有会一同举例说明.第一次做不够优化,共同学习. <!DOCTYPE html> <html> <head> <title><title> </head> <body> <dl class="hel

获取Web.config的内容

web.config内容: 获取appSettings里的内容: //获取ip string ip = System.Configuration.ConfigurationManager.AppSettings["server"];

正则表达式获取body内容

最近项目需要,要弄个正则表达式获取body的内容. 用过angularjs就知道,很多时候要写指令时引用templateUrl的时候.template的内容root是不能包含多个节点的,否则就报错. 这样的规范很不好,很多时候还是想保留template的头,文档类型,css等信息. 所以在开发模式下,希望angularjs加载模板的时候,自动砍掉头部和尾部. 获取之前: <!DOCTYPE html> <html> <head lang="en">

获取WebView里的网页文本内容

获取WebView里的网页文本内容,能够採用例如以下方法: public class ComJSInterface { public void loadHtmlContent(String content) { Log.d("comJs", "html:" + content); } } mWebView.addJavascriptInterface(new ComJSInterface(), "comjs"); mWebView.loadUrl