#面试系列字符串处理算法

面试系列字符串处理算法

最大子序列和

动态规划法

思路：顺序遍历，判断sum是否大于等于0

时间复杂度：O(n)

空间复杂度：O(1)

#include <iostream>
#include <limits.h>

using namespace std;

int getMaxSum(int *arr, int size) {
    int maxSum = INT_MIN; //负的无穷大
    int sum = 0;
    int curstart = 0;
    int start = 0;
    int end = 0;

    for (int i=0; i<size; i++) {
        if (sum<0) {
            sum = arr[i];
            curstart = i; //记录起始位置
        } else {
            sum += arr[i];
        }

        if (sum > maxSum) {
            maxSum = sum;
            start = curstart; //保存起始位置
            end = i; //保存结束为止
        }
    }
    return maxSum;
}

int main(int argc, char *argv[]) {

    int arr[] = {0, -2, 3, 5, -1, 2};
    int maxSum = getMaxSum(arr, 6);
    printf("max sum is : %d", maxSum);
    return 0;
}

分治法

思路：左右分治比中间，递归返回取大小

时间复杂度：O(n)

空间复杂度：O(1)

#include <iostream>

using namespace std;

int getMax(int a, int b, int c) {
    int max = a;
    if (b > max){
        max = b;
    }
    if (c > max){
        max = c;
    }
    return max;
}

int getMaxSum(int *arr, int left, int right) {
    if (left == right){
        if (arr[left]>0)
            return arr[left];
        else
            return 0;
    }
    int mid = (left + right)/2;
    int maxLeftSum = getMaxSum(arr, left, mid);
    int maxRightSum = getMaxSum(arr, mid+1, right);

    int maxLeftBorderSum = 0, leftBorderSum = 0;
    for (int i= mid; i>=left; i--){
        leftBorderSum += arr[i];
        if(leftBorderSum > maxLeftBorderSum)
            maxLeftBorderSum = leftBorderSum;
    }
    int maxRightBorderSum = 0, rightBorderSum = 0;
    for (int j = mid+1; j<=right; j++){
        rightBorderSum += arr[j];
        if(rightBorderSum>maxRightBorderSum)
            maxRightBorderSum = rightBorderSum;
    }
    return getMax(maxLeftSum, maxRightSum, maxLeftBorderSum + maxRightBorderSum);

}

int main(int argc, char *argv[]) {
    int arr[] = {0, -2, 3, 5, -1, 2};
    int maxSum = getMaxSum(arr, 0, 5);
    printf("max sum is : %d", maxSum);
    return 0;
}

最长递增子序列 (LIS)

动态规划法

思路：i,j循环，存储每个位置的最长递增子序列的长度

时间复杂度：O(n^2)

空间复杂度：O(n)

#include <iostream>

using namespace std;

int len[101];
int maxLen;

int LIS(int *arr, int size) {
    for (int i=0; i<size; ++i) {
        len[i] = 1;
        for (int j=0; j<i; ++j) {
            if (arr[i]>arr[j] && len[i] < len[j]+1){
                len[i] = len[j]+1;
                if(len[i]>maxLen){
                    maxLen = len[i];
                }
            }
        }
    }
    return maxLen;
}

void outputLIS(int *arr, int index){
    bool isLIS = 0;
    if (index<0||maxLen==0)
        return;
    if (len[index]==maxLen){
        --maxLen;
        isLIS = 1;
    }
    outputLIS(arr, --index);

    if (isLIS)
        printf("%d ", arr[index+1]);
}

int main(int argc, char *argv[]) {
    int arr[] = {1,-1,2,-3,4,-5,6,-7};
    printf("%d\n",LIS(arr,sizeof(arr)/sizeof(int)));
    outputLIS(arr,sizeof(arr)/sizeof(int) - 1);
    printf("\n");
}

动归+二分查找

思路：i循环，存储递增元素至新的数组

时间复杂度：O(n)

空间复杂度：O(n)

#include <iostream>

using namespace std;

int maxArr[30];
int len;

int BinSearch(int *maxArr, int size, int x) {
    int left = 0, right = size -1;
    while(left<=right){
        int mid = (left+right)/2;
        if (maxArr[mid] <= x){
            left = mid +1;
        } else {
            // right < left maxArr[]覆盖
            right = mid -1;
        }
    }
    return left;
}

int LIS(int *arr, int size) {
    maxArr[0] = arr[0];
    len = 1;
    for (int i=1; i<size; ++i){
        if (arr[i] > maxArr[len-1]){
            maxArr[len] = arr[i];
            len++;
        } else {
            int pos = BinSearch(maxArr, len, arr[i]);
            maxArr[pos] = arr[i];
        }
    }
    return len;
}

int main(int argc, char *argv[]) {
    int arr[] = {1,-1,2,-3,4,-5,6,-7};
    printf("%d\n",LIS(arr,sizeof(arr)/sizeof(int)));
    return 0;
}

最长公共子串 (LCS)

矩阵法

思路：矩阵的对角线，右下依次加一

时间复杂度：O(n^2)

空间复杂度：O(n)

举个例子 bab 和 caba, 二维矩阵如下：

我们需要的是某一行和上一行，所以可以用一位数组来代替矩阵。

#include<iostream>
#include<cstring>
#include<vector>
using namespace std;
//str1为横向，str2这纵向
const string LCS(const string& str1,const string& str2){
    int xlen=str1.size();       //横向长度
    vector<int> tmp(xlen);      //保存矩阵的上一行
    vector<int> arr(xlen);      //当前行
    int ylen=str2.size();       //纵向长度
    int maxele=0;               //矩阵元素中的最大值
    int pos=0;                  //矩阵元素最大值出现在第几列
    for(int i=0;i<ylen;i++){
        string s=str2.substr(i,1);
        arr.assign(xlen,0);     //数组清0
        for(int j=0;j<xlen;j++){
            if(str1.compare(j,1,s)==0){
                //compare(a,b) //<0:  a < b
                //=0:  a == b  //>0:  a > b
                if(j==0)
                    arr[j]=1;
                else
                    arr[j]=tmp[j-1]+1;
                if(arr[j]>maxele){
                    maxele=arr[j];
                    pos=j;
                }
            }
        }
        tmp.assign(arr.begin(),arr.end());
    }
    string res=str1.substr(pos-maxele+1,maxele);
    //substr(a,b):从下标a开始，长度为b
    return res;
}
int main(){
    string str1("21232523311324");
    string str2("312123223445");
    string lcs=LCS(str1,str2);
    cout<<lcs<<endl;
    return 0;
}

最长公共子序列

递归法

思路: i,j标记，a[i]==b[j]分情况，向后递归

对于a[0…n],b[0..m],

如果a[i]==b[j], 1+ LCS(i+1,j+1);

如果a[i]!=b[j], max(LCS(i,j+1),LCS(i+1,j));

时间复杂度：O(n^2)

空间复杂度：O(n)

#include<stdio.h>
#include<string.h>
char a[100],b[100];
int lena,lenb;
int LCS(int,int);///两个参数分别表示数组a的下标和数组b的下标
int main()
{
    strcpy(a,"ABCBDAB");
    strcpy(b,"BDCABA");
    lena=strlen(a);
    lenb=strlen(b);
    printf("%d\n",LCS(0,0));
    return 0;
}
int LCS(int i,int j)
{
    if(i>=lena || j>=lenb)
        return 0;
    if(a[i]==b[j])
        return 1+LCS(i+1,j+1);
    else
        return LCS(i+1,j)>LCS(i,j+1)? LCS(i+1,j):LCS(i,j+1);
}

动态规划法

思路：矩阵标记，向右、向下、向右下传值

时间复杂度：O(n^2)

空间复杂度：O(n^2)

使用二维数组flag标记下标i和j的走向，数字‘1’表示：斜向下；数字‘2’表示：向右；数字‘3’表示：向下。

通过行进的路径，可以得到最长公共子序列。

#include<stdio.h>
#include<string.h>
char a[500],b[500];
char num[501][501]; ///记录中间结果的数组
char flag[501][501];    ///标记数组，用于标识下标的走向，构造出公共子序列
void LCS(); ///动态规划求解
void getLCS();    ///采用倒推方式求最长公共子序列
int main()
{
    int i;
    strcpy(a,"ABCBDAB");
    strcpy(b,"BDCABA");
    LCS();
    printf("%d\n",num[strlen(a)][strlen(b)]);
    getLCS();
    return 0;
}
void LCS()
{
    int i,j;
    for(i=1;i<=strlen(a);i++)
    {
        for(j=1;j<=strlen(b);j++)
        {
            if(a[i-1]==b[j-1])   ///注意这里的下标是i-1与j-1
            {
                num[i][j]=num[i-1][j-1]+1;
                flag[i][j]=1;  ///斜向下标记
            }
            else
            {
                if(num[i][j-1]>num[i-1][j])
                {
                    num[i][j]=num[i][j-1];
                    flag[i][j]=2;  ///向右标记
                }
                else
                {
                    num[i][j]=num[i-1][j];
                    flag[i][j]=3;  ///向下标记
                }
            }
        }
    }
}
void getLCS()
{
    char res[500];
    int i=strlen(a);
    int j=strlen(b);
    int k=0;    ///用于保存结果的数组标志位
    while(i>0 && j>0)
    {
        if(flag[i][j]==1)   ///如果是斜向下标记
        {
            res[k]=a[i-1];
            k++;
            i--;
            j--;
        }
        else if(flag[i][j]==2)  ///如果是斜向右标记
            j--;
        else if(flag[i][j]==3)  ///如果是斜向下标记
            i--;
    }
    for(i=k-1;i>=0;i--){
        printf("%c",res[i]);
    }

}

最长不重复子串

Hash法

思路：i循环，j=i+1向后循环，通过hash[256]判重

时间复杂度：O(n^2)

空间复杂度：O(l)

#include <iostream>

using namespace std;

int maxlen;
int maxindex;
char visit[256]; 

void output(char * arr){
    for(int i= maxindex; i< maxlen+maxindex; i++){
        printf("%c", arr[i]);
    }
}  

void LNRS_hash(char * arr, int size)
{
    for(int i = 0; i < size; ++i)
    {
        memset(visit,0,sizeof(visit)); //清空hash表，重要
        visit[arr[i]] = 1;
        for(int j = i+1; j < size; ++j)
        {
            if(visit[arr[j]] == 0)
            {
                visit[arr[j]] = 1;
            }
            else
            {
                if(j-i > maxlen)
                {
                    maxlen = j - i;
                    maxindex = i;
                }
                break;
            }
        }
    }
    output(arr);
}

int main(int argc, char *argv[]) {
    char arr[11] = "abcabcdcba"; //最后一个为‘/0‘
    LNRS_hash(arr, 10);
    return 0;
}

动态规划法

思路：i循环，j=i-1向前循环,判重

时间复杂度：O(n^2)

空间复杂度：O(n)

int dp[100];
void LNRS_dp(char * arr, int size)
{
    int i, j;
    maxlen = maxindex = 0;
    dp[0] = 1;
    for(i = 1; i < size; ++i)
    {
        for(j = i-1; j >= 0; --j)
        {
            if(arr[j] == arr[i])
            {
                dp[i] = i - j;
                break;
            }
        }
        if(j == -1)
        {
            dp[i] = dp[i-1] + 1;
        }
        if(dp[i] > maxlen)
        {
            maxlen = dp[i];
            maxindex = i + 1 - maxlen;
        }
    }
    output(arr);
}

动归+hash+空间优化

思路：一边遍历，hash记下标

时间复杂度：O(n)

空间复杂度：O(1)

void LNRS_dp_hash(char * arr, int size)
{
    memset(visit, -1, sizeof visit);
    maxlen = maxindex = 0;
    visit[arr[0]] = 0;
int curlen = 1;
    for(int i = 1; i < size; ++i)
    {
        if(visit[arr[i]] == -1)
        {
            ++curlen;
            visit[arr[i]] = i; /* 记录字符下标 */
        }
else
        {
            curlen = i - visit[arr[i]];
            visit[arr[i]] = i; /* 更新字符下标 */
        }
        if(curlen > maxlen)
        {
            maxlen = curlen;
            maxindex = i + 1 - maxlen;
        }
    }
    output(arr);
}

最长回文子串

思路：i遍历str,以i为中心，左右两端寻找

时间复杂度：O(n^2)

空间复杂度：O(1)

string findLPS(const string &str)
{
    int center = 0, max_len = 0;
    for(int i = 1; i < str.length()-1; ++i)
    {
        int j = 1;
        //以str[i]为中心，依次向两边扩展，寻找最长回文Pi
        while(i+j < str.length() && i-j >= 0 && str[i+j] == str[i-j])
            ++j;
        --j;
        if(j > 1 && j > max_len)
        {
            center = i;
            max_len = j;
        }
    }
    return str.substr(center-max_len, (max_len * 2) + 1);
}

写在后面的话：

本片博客主要参考寒小阳的博客找工作知识储备(2) 对作者表示。

另外，我会参考更多的资料，整理补充本篇博客。

时间： 2024-10-10 20:58:41

#面试系列字符串处理算法的相关文章

【数据结构&&算法系列】KMP算法介绍及实现（c++ && java）

KMP算法如果理解原理的话,其实很简单. KMP算法简介这里根据自己的理解简单介绍下. KMP算法的名称由三位发明者(Knuth.Morris.Pratt)的首字母组成,又称字符串查找算法. 个人觉得可以理解为最小回溯算法,即匹配失效的时候,尽量少回溯,从而缩短时间复杂度. KMP算法有两个关键的地方,1)求解next数组,2)利用next数组进行最小回溯. 1)求解next数组 next数组的取值只与模式串有关,next数组用于失配时回溯使用. 在简单版本的KMP算法中,每个位置 j 的 n

大公司面试经典数据结构与算法题C#解答

几个大公司(IBM.MicroSoft and so on)面试经典数据结构与算法题C#解答 1.链表反转我想到了两种比较简单的方法第一种是需要开一个新的链表,将原链表的元素从后到前的插入到新链表中(也就是原链表第一个元素被插入成新链表的最后一个元素). 第二种是不需要开新的链表,而是逐步反转原链表中元素的指向,例如: 原链表是 1->2->3->4->null 被逐步修改为 ①2->1->null.3->4->null ②3->2->

js面试中长见的算法题（转载）

js面试中长见的算法题 1.阐述下 JavaScript 中的变量提升所谓提升,顾名思义即是 JavaScript 会将所有的声明提升到当前作用域的顶部.这也就意味着我们可以在某个变量声明前就使用该变量,不过虽然 JavaScript 会将声明提升到顶部,但是并不会执行真的初始化过程.2.阐述下 use strict; 的作用 use strict; 顾名思义也就是 JavaScript 会在所谓严格模式下执行,其一个主要的优势在于能够强制开发者避免使用未声明的变量.对于老版本的浏览器或者执行

回文数系列题目(经典算法)

回文数时间限制:1000 ms | 内存限制:65535 KB 难度:0 描述请寻找并输出1至1000000之间的数m,它满足m.m^2和m^3均为回文数.回文数大家都知道吧,就是各位数字左右对称的整数,例如121.676.123321等.满足上述条件的数如m=11,m^2=121,m^3=1331皆为回文数. 输入没有输入输出输出1至1000000之间满足要求的全部回文数,每两个数之间用空格隔开,每行输出五个数解析:这道题直接模拟就好了,算是回文数中最简单的题了,直接写个判断回

【阿里面试系列】Java线程的应用及挑战

文章简介上一篇文章[「阿里面试系列」搞懂并发编程,轻松应对80%的面试场景]我们了解了进程和线程的发展历史.线程的生命周期.线程的优势和使用场景,这一篇,我们从Java层面更进一步了解线程的使用.关注我的技术公众号[架构师修炼宝典]一周出产1-2篇技术文章.Q群725219329分享并发编程,分布式,微服务架构,性能优化,源码,设计模式,高并发,高可用,Spring,Netty,tomcat,JVM等技术视频. 内容导航并发编程的挑战线程在Java中的使用并发编程的挑战引入多线程的目的

趣写算法系列之--匈牙利算法（真的很好理解）

[书本上的算法往往讲得非常复杂,我和我的朋友计划用一些简单通俗的例子来描述算法的流程] 匈牙利算法是由匈牙利数学家Edmonds于1965年提出,因而得名.匈牙利算法是基于Hall定理中充分性证明的思想,它是部图匹配最常见的算法,该算法的核心就是寻找增广路径,它是一种用增广路径求二分图最大匹配的算法. -------等等,看得头大?那么请看下面的版本: 通过数代人的努力,你终于赶上了剩男剩女的大潮,假设你是一位光荣的新世纪媒人,在你的手上有N个剩男,M个剩女,每个人都可能对多名异性有好感(-_-

Chapter 4. 字符串 KMP算法

Chapter 4. 字符串 KMP算法 Sylvia's I. 讲的比较好的博客1,博客2 表问窝,在窝翻遍全网的博客后,窝已经处于混乱状态-- Sylvia's II. 窝是贴代码的小能手-- //前方高能请注意//窝并不知道窝在说什么--#include<cstdio> #include<iostream> #include<algorithm> #include<cmath> #include<cstring> using namespa

Rabin-Karp字符串查找算法

1.简介暴力字符串匹配(brute force string matching)是子串匹配算法中最基本的一种,它确实有自己的优点,比如它并不需要对文本(text)或模式串(pattern)进行预处理.然而它最大的问题就是运行速度太慢,所以在很多场合下暴力字符串匹配算法并不是那么有用.我们需要一些更快的方法来完成模式匹配的工作,然而在此之前,我们还是回过头来再看一遍暴力法匹配,以便更好地理解其他子串匹配算法. 如下图所示,在暴力字符串匹配里,我们将文本中的每一个字符和模式串的第一个字符进行比对.

字符串查找算法-KMP

/** * KMP algorithm is a famous way to find a substring from a text. To understand its' capacity, we should acquaint onself with the normal algorithm. */ /** * simple algorithm * * workflow: * (say, @ct means for currently position o

#面试系列 字符串处理算法

面试系列 字符串处理算法

最大子序列和

动态规划法

分治法

最长递增子序列 (LIS)

动态规划法

动归+二分查找

最长公共子串 (LCS)

矩阵法

最长公共子序列

递归法

动态规划法

最长不重复子串

Hash法

动态规划法

动归+hash+空间优化

最长回文子串

写在后面的话：

#面试系列 字符串处理算法的相关文章

#面试系列字符串处理算法

面试系列字符串处理算法

#面试系列字符串处理算法的相关文章