js正则匹配html内容

1.得到网页上的链接地址:

string matchString = @"<a[^>]+href=\s*(?:‘(?<href>[^‘]+)‘|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";

2.得到网页的标题:

string matchString = @"<title>(?<title>.*)</title>";
string matchString = @"<title>([\S\s\t]*?)</title>";

3.去掉网页中的所有的html标记:

string temp = Regex.Replace(html, "<[^>]*>", ""); 

4.js去掉所有html标记的函数:

function delHtmlTag(str)
{
  return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}
时间: 2024-10-11 10:33:24

js正则匹配html内容的相关文章

常用JS正则匹配函数

//校验用户名:只能输入1-30个字母 function isTrueName(s) { var patrn=/^[a-zA-Z]{1,30}$/; if (!patrn.exec(s)) return false return true } //校验密码:只能输入6-20个字母.数字.下划线 function isPasswd(s) { var patrn=/^(/w){6,20}$/; if (!patrn.exec(s)) return false return true } //校验普通

js 正则匹配 域名【host】

如果直接在js中是可以直接取到hostname的,以下方式是通过正则匹配: var url = "http://www.cnblogs.com/cench" var reg = /^http(s)?:\/\/(.*?)\// // 必须是http开头或者https开头,结尾为'/' // 把host替换成指定数值 var ToReplace = 'Host/' url.replace(reg, ToReplace) // Host/cench //*******************

js正则匹配table,img及去除各种标签问题

//获取公示栏内容 s = "$row.detail$"; mainContent =s; //如果有多个table使用下面注释的正则只会匹配成一个table //var tabReg = /<table[^>]*>((?!table).)*<\/table>/gi; //匹配单个table var tabReg = /<table[^>]*>\s*(<tbody[^>]*>)?(\s*<tr[^>]*>

js正则匹配两位小数

今天写一个用js正则校验最多保留两位小数的格式. a = /^\d+|\d+\.\d{1,2}$/; 测试 a.test(1.222); 结果:true 一下蒙了,怎么可能,最后找了好久,原来需要把^和$中间的格式包起来 a = /^(\d+|\d+\.\d{1,2})$/; 测试a.test(1.222); 结果:false 分析:如果不用括号包起来,则匹配^\d+或\d+\.\d{1,2} 1.222一下就匹配了^\d,因为只要以数字开头就匹配嘛 最终从网上找到一个更好的匹配两位小数的正则:

探究js正则匹配方法:match和exec

match是字符串方法,写法为:str.match(reg) exec是正则表达式方法,写法为:reg.exec(str) match和exec在匹配成功时返回的都是数组,在没有匹配上时返回的都是null,故在没有深入了解两者的使用规则前,会误以为两者的使用效果是一样的,下面在几种情况中对match和exec进行区分. 1.全局匹配: 当不使用全局匹配时,两者的匹配效果是一样的,仅返回第一次匹配成功的结果: var s = "aaa bbb ccc"; var reg = /\b\w+

js正则匹配

var text = "testing: 1, 2, 3";var pattern = /\d+/g;pattern.test(text) //=>true :匹配成功text.search(pattern);//=> 9:首次匹配成功的位置(从0开始计数)text.match(pattern);//=>["1", "2", "3"]:所有匹配组成的数组text.replace(pattern, '#');/

js正则匹配的出链接地址

content为需要匹配的值 var b=/<a([\s]+|[\s]+[^<>]+[\s]+)href=(\"([^<>"\']*)\"|\'([^<>"\']*)\')[^<>]*>/gi;      var s=content.toLowerCase().match(b);      //得到链接地址      for(var i= 0;i<s.length;i++)      {       

JS正则匹配邮箱格式

观察一些邮箱格式,有些邮箱格式简单,有些复杂,在网上找了个邮箱的正则表达式,分析一下邮箱的规则.该表达式:/^\w+([\.\-]\w+)*\@\w+([\.\-]\w+)*\.\w+$/ 拆分:[1]/^\w+以英文,数字,下划线开头,(一个或多个.)[2]([\.\-]\w+)*跟着点或中线任意一个,然后再跟着的英文.数字.下划线(一个或多个).这个整个部分用圆括号括起来,可以零个一个或多个.(可有可无,可多个)[3]\@\w+跟着一个@符号,后面英文.数字.下划线(一个或多个)[4]([\

js 正则匹配(去掉html标签)

1,得到网页上的链接地址: string matchString = @"<a[^>]+href=\s*(?:'(?<href>^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>"; 2,得到网页的标题: string matchString = @"<title>(?<titl