1.得到网页上的链接地址:
string matchString = @"<a[^>]+href=\s*(?:‘(?<href>[^‘]+)‘|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2.得到网页的标题:
string matchString = @"<title>(?<title>.*)</title>";
string matchString = @"<title>([\S\s\t]*?)</title>";
3.去掉网页中的所有的html标记:
string temp = Regex.Replace(html, "<[^>]*>", "");
4.js去掉所有html标记的函数:
function delHtmlTag(str) { return str.replace(/<[^>]+>/g,"");//去掉所有的html标记 }
时间: 2024-10-11 10:33:24