【华为OJ】【078-计算字符串的距离】

【华为OJ】【算法总篇章】


【华为OJ】【078-计算字符串的距离】

【工程下载】


题目描述

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。

Ex:
    字符串A:abcdefg
    字符串B: abcdef
    通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
    给定任意两个字符串,写出一个算法计算它们的编辑距离。

请实现如下接口
/**
 * 功能:计算两个字符串的距离
 * 输入:字符串A和字符串B
 * 输出:无
 * 返回:如果成功计算出字符串的距离,否则返回-1
 */
public static int stringDistance (String charA, String  charB){
   return 0;
}

输入描述

输入两个字符串

输出描述

得到计算结果

输入例子

abcdefg
abcdef

输出例子

1

算法实现

import java.util.Scanner;

/**
 * Author: 王俊超
 * Date: 2016-01-03 19:58
 * Declaration: All Rights Reserved !!!
 */
public class Main {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
//        Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
        while (scanner.hasNext()) {
            String a = scanner.nextLine();
            String b = scanner.nextLine();
            System.out.println(stringDistance(a, b));

        }

        scanner.close();
    }

    private static int stringDistance(String a, String b) {
//        System.out.println(stringDistance(a.toCharArray(), 0, b.toCharArray(), 0));
        return stringDistance(a.toCharArray(), b.toCharArray());
    }

    /**
     * 方法一、计算量过大
     * <pre>
     * 两个字符串的距离肯定不超过它们的长度之和(我们可以通过删除操作把两个串都转化为空串)。
     * 虽然这个结论对结果没有帮助,但至少可以知道,任意两个字符串的距离都是有限的。
     * 我们还是应该集中考虑如何才能把这个问题转化成规模较小的同样的问题。
     * 如果有两个串A=xabcdae和B=xfdfa,它们的第一个字符是相同的,只要计算A[2,…,7]=abcdae
     * 和B[2,…,5]=fdfa的距离就可以了。但是如果两个串的第一个字符不相同,
     * 那么可以进行如下的操作(lenA和lenB分别是A串和B串的长度):
     * 1.删除A串的第一个字符,然后计算A[2,…,lenA]和B[1,…,lenB]的距离。
     * 2.删除B串的第一个字符,然后计算A[1,…,lenA]和B[2,…,lenB]的距离。
     * 3.修改A串的第一个字符为B串的第一个字符,然后计算A[2,…,lenA]和B[2,…,lenB]的距离。
     * 4.修改B串的第一个字符为A串的第一个字符,然后计算A[2,…,lenA]和B[2,…,lenB]的距离。
     * 5.增加B串的第一个字符到A串的第一个字符之前,然后计算A[1,…,lenA]和B[2,…,lenB]的距离。
     * 6.增加A串的第一个字符到B串的第一个字符之前,然后计算A[2,…,lenA]和B[1,…,lenB]的距离。
     *
     * 在这个题目中,我们并不在乎两个字符串变得相等之后的字符串是怎样的。所以,可以将上面6个操作合并为:
     * 1.一步操作之后,再将A[2,…,lenA]和B[1,…,lenB]变成相同字符串。
     * 2.一步操作之后,再将A[1,…,lenA]和B[2,…,lenB]变成相同字符串。
     * 3.一步操作之后,再将A[2,…,lenA]和B[2,…,lenB]变成相同字符串。
     * </pre>
     *
     * @param a
     * @param i
     * @param b
     * @param j
     * @return
     */
    private static int stringDistance(char[] a, int i, char[] b, int j) {

        if (i >= a.length || j >= b.length) {
            return Math.max(a.length - i, b.length - j);
        }

        // 字符相等
        if (a[i] == b[j]) {
            return stringDistance(a, i + 1, b, j + 1);
        } else {
            int d1 = stringDistance(a, i + 1, b, j);
            int d2 = stringDistance(a, i + 1, b, j + 1);
            int d3 = stringDistance(a, i, b, j + 1);

            return Math.min(Math.min(d1, d2), d3) + 1;
        }
    }

    /**
     * 方法二
     * <pre>
     * 很经典的可使用动态规划方法解决的题目,和计算两字符串的最长公共子序列相似。
     *
     * 设Ai为字符串A(a1a2a3 … am)的前i个字符(即为a1,a2,a3 … ai)
     * 设Bj为字符串B(b1b2b3 … bn)的前j个字符(即为b1,b2,b3 … bj)
     *
     * 设 L(i,j)为使两个字符串和Ai和Bj相等的最小操作次数。
     * 当ai==bj时 显然 L(i,j) = L(i-1,j-1)
     * 当ai!=bj时
     *
     *  若将它们修改为相等,则对两个字符串至少还要操作L(i-1,j-1)次
     *  若删除ai或在bj后添加ai,则对两个字符串至少还要操作L(i-1,j)次
     *  若删除bj或在ai后添加bj,则对两个字符串至少还要操作L(i,j-1)次
     *  此时L(i,j) = min( L(i-1,j-1), L(i-1,j), L(i,j-1) ) + 1
     *
     * 显然,L(i,0)=i,L(0,j)=j, 再利用上述的递推公式,可以直接计算出L(i,j)值。
     * </pre>
     *
     * @param a
     * @param b
     * @return
     */
    private static int stringDistance(char[] a, char[] b) {
        int[][] len = new int[a.length + 1][b.length + 1];

        for (int i = 0; i < len.length; i++) {
            len[i][0] = i;
        }

        for (int j = 0; j < len[0].length; j++) {
            len[0][j] = j;
        }

        for (int i = 1; i < len.length; i++) {
            for (int j = 1; j < len[0].length; j++) {
                if (a[i - 1] == b[j - 1]) {
                    len[i][j] = len[i - 1][j - 1];
                } else {
                    len[i][j] = Math.min(Math.min(len[i - 1][j], len[i - 1][j - 1]), len[i][j - 1]) + 1;
                }
            }
        }

        return len[len.length - 1][len[0].length - 1];
    }
}
时间: 2024-10-13 16:18:11

【华为OJ】【078-计算字符串的距离】的相关文章

华为OJ:找出字符串中第一个只出现一次的字符

可以稍微让代码写的好看,不用直接写双循环的话,就可以写成函数的调用,重用性也很高. import java.util.Scanner; public class findOnlyOnceChar { public static boolean FindChar(String pInputString, char pChar){ int count=0; for(int i=0;i<pInputString.length();i++){ if(pInputString.charAt(i)==pCh

Vijos1680距离/openjudge2988计算字符串的距离[DP]

描述 设有字符串X,我们称在X的头尾及中间插入任意多个空格后构成的新字符串为X的扩展串,如字符串X为”abcbcd”,则字符串“abcb_c_”,“_a_bcbcd_”和“abcb_c_”都是X的扩展串,这里“_”代表空格字符. 如果A1是字符串A的扩展串,B1是字符串B的扩展串,A1与B1具有相同的长度,那么我扪定义字符串A1与B1的距离为相应位置上的字符的距离总和,而两个非空格字符的距离定义为它们的ASCII码的差的绝对值,而空格字符与其他任意字符之间的距离为已知的定值K,空格字符与空格字符

华为机试-计算字符串的相似度

题目描述 对于不同的字符串,我们希望能有办法判断相似程度,我们定义了一套操作方法来把两个不相同的字符串变得相同,具体的操作方法如下: 1 修改一个字符,如把"a"替换为"b". 2 增加一个字符,如把"abdd"变为"aebdd". 3 删除一个字符,如把"travelling"变为"traveling". 比如,对于"abcdefg"和"abcdef&qu

华为OJ平台——统计字符串中的大写字母

题目描述: 统计字符串中的大写字母的个数 输入: 一行字符串 输出: 字符串中大写字母的个数(当空串时输出0) 思路: 这一题很简单,直接判断字符串中的每一个字符即可,唯一要注意的一点是输入的字符串可能包含空格,所以读入的时候要用nextLine()方法 1 import java.util.Scanner; 2 3 public class CountCaptial { 4 5 public static void main(String[] args) { 6 Scanner cin = n

计算字符串的距离——动态规划

#include<iostream> #include<string.h> using namespace std; int dp[100][100]; int min(int a, int b) { if(a<b) return a; else return b; } int main() { char str1[100]; char str2[100]; cin>>str1>>str2; int num1 = strlen(str1); int n

华为OJ平台试题 —— 字符串:名字的漂亮度

<span style="font-family: Arial, Helvetica, sans-serif; font-size: 12px; background-color: rgb(255, 255, 255);">1.名字的漂亮度</span> 代码: <pre name="code" class="cpp"> #include<stdio.h> /* * 对数组a 进行排序 */ voi

华为OJ平台试题 ——字符串:输出数组中重复的数组

<pre name="code" class="cpp">/* * 题目:输出数组中重复出现的数组(0-9) * * 输入:输入一串数字,中间以逗号隔开,如3,2,2,3,5,6,7,8,9 * 输出:输出数组中重复出现的数字(数字间以空格隔开),输出顺序按原数组中的先后顺序,输出3,2 */ #include<stdio.h> #include<string.h> #define N 256 /* * 定义一个结构体:数字和数字

华为OJ: 公共字串计算

有几个需要注意的地方,一个这道题是不区分大小写的,所以在计算之前对输入的字符串要做小写或者大写的转换. 第二个,思路一定要清晰,先将s1从[i]处开始与s2的[j]开始匹配,不相等则j++直到j等于s2.length()-1,相等,则i++,j++.注意,这里就是i++,即下次重新开始从s[i]开始匹配时,两次i之间的距离可能会超过1.再j那里设置一个计数器计数即可. import java.util.Scanner; public class findMaxSubStringLength {

【华为OJ】【083-计算字符串的相似度】

[华为OJ][算法总篇章] [华为OJ][083-计算字符串的相似度] [工程下载] 题目描述 对于不同的字符串,我们希望能有办法判断相似程度,我们定义了一套操作方法来把两个不相同的字符串变得相同,具体的操作方法如下: 1 修改一个字符,如把"a"替换为"b". 2 增加一个字符,如把"abdd"变为"aebdd". 3 删除一个字符,如把"travelling"变为"traveling"