编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。 第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten sitting
Output示例
3解:具体介绍:https://www.51nod.com/tutorial/course.html#!courseId=3我们以矩阵形式实现了教程中的比较思想。以字符串dabcd和acdc为例,演示流程:(第二行与第二列预置,之后的数字由其对应行列字母与上,左,左上数字决定。 具体操作:首先比较对应行列字母,若一样则填入左上数据, 否则填入上,左,左上数字的最小值加一。)
1 #include<stdio.h> 2 3 4 char a[1005], b[1005]; 5 int dp[1005][1005]; 6 7 int min(int a, int b, int c) 8 { 9 b = b < a ? b : a; 10 return (c < b ? c : b); 11 } 12 13 int main() 14 { 15 while (scanf_s("%s%s", a, 1005, b, 1005) != EOF) 16 { 17 int i, j; 18 for (i = 0; i == 0 || a[i - 1] != 0; i++) 19 for (j = 0; j == 0 || b[j - 1] != 0; j++) 20 if (i == 0 || j == 0) dp[i][j] = i | j; 21 else if (a[i - 1] == b[j - 1]) dp[i][j] = dp[i - 1][j - 1]; 22 else dp[i][j] = min(dp[i - 1][j - 1], dp[i - 1][j], dp[i][j - 1]) + 1; 23 printf("%d\n", dp[i - 1][j - 1]); 24 } 25 return 0; 26 }
由于该方法顺序的检索顺序,我们可以优化空间消耗,减小数组dp的大小:
1 #include<stdio.h> 2 3 4 char a[1005], b[1005]; 5 int dp[2][1005]; 6 7 int min(int a, int b, int c) 8 { 9 b = b < a ? b : a; 10 return (c < b ? c : b); 11 } 12 13 int main() 14 { 15 while (scanf_s("%s%s", a, 1005, b, 1005) != EOF) 16 { 17 int i, j; 18 for (i = 0; 0 != a[i]; i++) dp[0][i + 1] = i + 1; 19 for (i = 1; 0 != a[i - 1]; i++) 20 { 21 dp[i & 1][0] = i; 22 for (j = 1; 0 != b[j - 1]; j++) 23 { 24 if (a[i - 1] == b[j - 1]) dp[i & 1][j] = dp[i + 1 & 1][j - 1]; 25 else dp[i & 1][j] = min(dp[i & 1][j - 1], dp[i + 1 & 1][j - 1], dp[i + 1 & 1][j]) + 1; 26 } 27 } 28 printf("%d\n", dp[i + 1 & 1][j - 1]); 29 } 30 return 0; 31 }
原文地址:https://www.cnblogs.com/Ekalos-blog/p/9863789.html
时间: 2024-10-10 06:47:55