Python 使用正则表达式匹配URL网址

使用正则表达式匹配以 .com 或 .cn 为域名后缀的URL地址

In [1]: import re

In [2]: str = "http://www.baidu.com/"

In [3]: regular = re.compile(r‘[a-zA-Z]+://[^\s]*[.com|.cn]‘)

In [4]: re.findall(regular, str)
Out[4]: [‘http://www.baidu.com‘]

原文地址:https://www.cnblogs.com/pzk7788/p/10498128.html

时间: 2024-10-10 07:20:01

Python 使用正则表达式匹配URL网址的相关文章

正则表达式匹配URL——给URL地址加上<a> 链接

<?php function replace_url ($content) { if (empty($content)) return; //给URL地址加上 <a> 链接 $preg = '/(?:http:\/\/)?([\w.]+[\w\/]*\.[\w.]+[\w\/]*\??[\w=\&\+\%]*)/is'; $content = preg_replace($preg, '<a href="http://\1" target="_b

Django基于正则表达式匹配URL

在Django1.X中,是这样匹配的. 在Django2.X中,是这样匹配的. Django2.X中开始需要用re_path模块进行正则表达式匹配了,太JB坑了,卡了好久这个问题,最后还是问群里面的高手解决的. 原文地址:https://www.cnblogs.com/replaceroot/p/9925708.html

正则表达式匹配URL

正则表达式: var match = /^((ht|f)tps?):\/\/([\w\-]+(\.[\w\-]+)*\/)*[\w\-]+(\.[\w\-]+)*\/?(\?([\w\-\.,@?^=%&:\/~\+#]*)+)?/; /* 注:(1).如需允许其他联接方式,可以修改"(ht|f)tps?"部分,在"?"后面跟上符号"|",然后加上您需要的联接方式,多个时用符号"|"分隔).(2).如需允许URL参数包

Python实现正则表达式匹配任意的邮箱

首先来个简单的例子,利用Python实现匹配163邮箱的代码: [python] view plain copy print? #-*- coding:utf-8 -*- __author__ = '杨鑫' import re text = input("Please input your Email address:\n"): if re.match(r'[0-9a-zA-Z_]{0,19}@163.com',text): print('Email address is Right!

【转载】Python使用中文正则表达式匹配指定中文字符串的方法示例

本文实例讲述了Python使用中文正则表达式匹配指定中文字符串的方法.分享给大家供大家参考,具体如下: 业务场景: 从中文字句中匹配出指定的中文子字符串 .这样的情况我在工作中遇到非常多, 特梳理总结如下. 难点: 处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的处理,使过程简洁和事半功倍,这往往是高手和菜鸟最显著的差别.

正则表达式匹配网址

一段字符中匹配出网址,可以将css里复制的url(blabla)匹配网址方便下图 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>match</title> <script type="text/javascript"> window.onload = function() { var str = "u

正确匹配URL的正则表达式

网上流传着多种匹配URL的正则表达式版本,但我经过试验,最好用的还是从stackoverflow上查到的: (https?|ftp|file)://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|] IP地址.前后有汉字.带参数的,都是OK的. 另外几个有问题的版本: 摘自微软MSDN: (ht|f)tp(s?)\:\/\/[0-9a-zA-Z]([-.\w]*[0-9a-zA-Z])*(:(0-9)*)*(\/?)([a-zA-Z0-9

Python: 正则表达式匹配反斜杠 &quot;\&quot;

Python正则表达式匹配反斜杠 "\" eg: >>>a='w\w\w' 'w\\w\\w' #  打印出来的 "\\" 被转义成 一个反斜杠 "\" 如果需要匹配字符串a,需要匹配一个反斜杠 "\" >>>re.split(r'\\',a) ['w','w','w',] 先对字符串转义,再进行正则表达式转义 由于原始字符串中所有字符直接按照字面意思来使用,不转义特殊字符,故不做字符串转义

【PYTHON】对整个文件进行正则表达式匹配

1 #coding:utf-8 2 import re 3 def IDXtoSCS(path):#IDX转换为开思的函数 4 IDXfile=open(path,'r') 5 fileread=IDXfile.readlines() 6 IDXfile.close() 7 p='"(\w)*",\s+(\d+\\.\d+),\s+(\d+\\.\d+),\s+(\d+\\.\d+),\s+"(\w*)",' 8 data=re.findall(p,fileread