题目:
请实现一个函数用来匹配包含‘.’和‘*’的正则表达式。
模式中的字符’.’表示任意一个字符,而‘*’表示它前面的字符可以出现任意次(含0次)。
本题中,匹配是指字符串的所有字符匹配整个模式。
例如,字符串“aaa”与模式“a.a”和“ab*ac*a”匹配,但与“aa.a”及“ab*a”均不匹配。
解析:
字符串 str = “aaa”; 模式字符串 pattern = “.b*ac*a”
每次分别在str 和pattern中取一个字符进行匹配,如果匹配,则匹配下一个字符,否则,返回不匹配。
设匹配递归函数 match(str, pattern)。
如果模式匹配字符的下一个字符是‘*’:
- 如果pttern当前字符和str的当前字符匹配,:有以下三种可能情况
- pttern当前字符能匹配 str 中的 0 个字符:match(str, pattern+2)
- pttern当前字符能匹配 str 中的 1 个字符:match(str+1, pattern+2)
- pttern当前字符能匹配 str 中的 多 个字符:match(str+1, pattern)
- 如果pttern当前字符和和str的当前字符不匹配
- pttern当前字符能匹配 str 中的 0 个字符:(str, pattern+2)
如果模式匹配字符的下一个字符不是‘*’,进行逐字符匹配。
对于 ‘.’ 的情况比较简单,’.’ 和一个字符匹配 match(str+1, pattern+1)
另外需要注意的是:空字符串”” 和 “.*” 是匹配的
bool MatchCore(const char* str, const char* pattern) {
if (*str == ‘\0‘ && *pattern == ‘\0‘)
return true;
// if (*str == ‘\0‘ && *pattern != ‘\0‘) return false : 不成立,如str = "", pattern=".*"
if (*str != ‘\0‘ && *pattern == ‘\0‘ )
return false;
if (*(pattern+1) == ‘*‘) {
if (*pattern == *str || *pattern == ‘.‘ && *str != ‘\0‘) {
//三种情况:*之前的字符出现 0 次, 出现一次,出现多次. pattern+2表示跳过当前字符和‘*’
return MatchCore(str, pattern+2) || MatchCore(str+1, pattern+2) || MatchCore(str+1, pattern);
} else {
// 没有匹配,出现 0 次(包括str=“”,pattern=“.*”)
return MatchCore(str, pattern+2);
}
}
if (*str == *pattern || *pattern == ‘.‘ && *str != ‘\0‘)
return MatchCore(str+1, pattern+1);
return false;
}
bool Match(const char* str, const char* pattern) {
if (pattern == NULL || str == NULL)
return false;
return MatchCore(str, pattern);
}
测试案例:
From:剑指offer源码 GitHub
// ==================== Test Code ====================
void Test(char* testName, char* string, char* pattern, bool expected)
{
if(testName != NULL)
printf("%s begins: ", testName);
if(Match(string, pattern) == expected)
printf("Passed.\n");
else
printf("FAILED.\n");
}
int main(int argc, char* argv[])
{
Test("Test01", "", "", true);
Test("Test02", "", ".*", true);
Test("Test03", "", ".", false);
Test("Test04", "", "c*", true);
Test("Test05", "a", ".*", true);
Test("Test06", "a", "a.", false);
Test("Test07", "a", "", false);
Test("Test08", "a", ".", true);
Test("Test09", "a", "ab*", true);
Test("Test10", "a", "ab*a", false);
Test("Test11", "aa", "aa", true);
Test("Test12", "aa", "a*", true);
Test("Test13", "aa", ".*", true);
Test("Test14", "aa", ".", false);
Test("Test15", "ab", ".*", true);
Test("Test16", "ab", ".*", true);
Test("Test17", "aaa", "aa*", true);
Test("Test18", "aaa", "aa.a", false);
Test("Test19", "aaa", "a.a", true);
Test("Test20", "aaa", ".a", false);
Test("Test21", "aaa", "a*a", true);
Test("Test22", "aaa", "ab*a", false);
Test("Test23", "aaa", "ab*ac*a", true);
Test("Test24", "aaa", "ab*a*c*a", true);
Test("Test25", "aaa", ".*", true);
Test("Test26", "aab", "c*a*b", true);
Test("Test27", "aaca", "ab*a*c*a", true);
Test("Test28", "aaba", "ab*a*c*a", false);
Test("Test29", "bbbba", ".*a*a", true);
Test("Test30", "bcbbabab", ".*a*a", false);
return 0;
}
版权声明:本文为博主原创文章,未经博主允许不得转载。
时间: 2024-10-01 04:40:08