背景是这样的,我手上有一份统计表,需要将IP地址里的省市提取出来,以便于处理。因此我首先想到了Python里的正则表达式,打算写一个自定义函数去批量提取。然而之前没学VBA里的正则表达式语法,因此就去网上搜了一下,结果发现根本不能运行。几经辗转,总算搞定,因此总结一下,供后来者参考。
编程目的:实现IP地址中省市信息的提取。
主要涉及的知识点:VBA函数、正则表达式
代码如下:
Function 提取省市(rng As Range, name) Application.Volatile Set regx = CreateObject("vbscript.regexp") With regx .Global = True .Pattern = "[\u4e00-\u9fa5]+" Set mat = .Execute(rng) End With Select Case name Case "省" 提取省市 = mat.Item(0).Value Case "市" 提取省市 = mat.Item(1).Value Case Else MsgBox ("输入有误") End Select End Function
代码解释:
1、rng As Range, name:传递两个参数,第一个参数为单元格参数。
2、Application.Volatile Set regx = CreateObject("vbscript.regexp"):创建正则表达式对象,固定语法。
3、With regx
.Global = True
.Pattern = "[\u4e00-\u9fa5]+"
Set mat = .Execute(rng)
End With
Global:表示是否进行全局检索,True表示将所有匹配的结果返回。False则是只返回第一个匹配结果。
Pattern = "[\u4e00-\u9fa5]+"就是正则表达式了,其中[\u4e00-\u9fa5]+表示匹配中文字符串。
4、Set mat = .Execute(rng):即执行正则表达式。返回一个matchcollection类型的集合,即匹配到的所有结果。
5、接下来是一个多条件判断语句,相当于If ...Elif... Else...End If 。
6、提取省市 = mat.Item(0).Value:前面我们提到mat是一个matchcollection类型的集合,mat.Item(0)表示读取第一个匹配结果,Value表示读取它的值。最后将这个值赋给函数。也可以不用后面的value。
原文地址:https://www.cnblogs.com/yimengtianya1/p/9200917.html