#面试系列 字符串处理算法

面试系列 字符串处理算法

最大子序列和

动态规划法

思路:顺序遍历,判断sum是否大于等于0

时间复杂度:O(n)

空间复杂度:O(1)

#include <iostream>
#include <limits.h>

using namespace std;

int getMaxSum(int *arr, int size) {
    int maxSum = INT_MIN; //负的无穷大
    int sum = 0;
    int curstart = 0;
    int start = 0;
    int end = 0;

    for (int i=0; i<size; i++) {
        if (sum<0) {
            sum = arr[i];
            curstart = i; //记录起始位置
        } else {
            sum += arr[i];
        }

        if (sum > maxSum) {
            maxSum = sum;
            start = curstart; //保存起始位置
            end = i; //保存结束为止
        }
    }
    return maxSum;
}

int main(int argc, char *argv[]) {

    int arr[] = {0, -2, 3, 5, -1, 2};
    int maxSum = getMaxSum(arr, 6);
    printf("max sum is : %d", maxSum);
    return 0;
}

分治法

思路:左右分治比中间,递归返回取大小

时间复杂度:O(n)

空间复杂度:O(1)

#include <iostream>

using namespace std;

int getMax(int a, int b, int c) {
    int max = a;
    if (b > max){
        max = b;
    }
    if (c > max){
        max = c;
    }
    return max;
}

int getMaxSum(int *arr, int left, int right) {
    if (left == right){
        if (arr[left]>0)
            return arr[left];
        else
            return 0;
    }
    int mid = (left + right)/2;
    int maxLeftSum = getMaxSum(arr, left, mid);
    int maxRightSum = getMaxSum(arr, mid+1, right);

    int maxLeftBorderSum = 0, leftBorderSum = 0;
    for (int i= mid; i>=left; i--){
        leftBorderSum += arr[i];
        if(leftBorderSum > maxLeftBorderSum)
            maxLeftBorderSum = leftBorderSum;
    }
    int maxRightBorderSum = 0, rightBorderSum = 0;
    for (int j = mid+1; j<=right; j++){
        rightBorderSum += arr[j];
        if(rightBorderSum>maxRightBorderSum)
            maxRightBorderSum = rightBorderSum;
    }
    return getMax(maxLeftSum, maxRightSum, maxLeftBorderSum + maxRightBorderSum);

}

int main(int argc, char *argv[]) {
    int arr[] = {0, -2, 3, 5, -1, 2};
    int maxSum = getMaxSum(arr, 0, 5);
    printf("max sum is : %d", maxSum);
    return 0;
}

最长递增子序列 (LIS)

动态规划法

思路:i,j循环,存储每个位置的最长递增子序列的长度

时间复杂度:O(n^2)

空间复杂度:O(n)

#include <iostream>

using namespace std;

int len[101];
int maxLen;

int LIS(int *arr, int size) {
    for (int i=0; i<size; ++i) {
        len[i] = 1;
        for (int j=0; j<i; ++j) {
            if (arr[i]>arr[j] && len[i] < len[j]+1){
                len[i] = len[j]+1;
                if(len[i]>maxLen){
                    maxLen = len[i];
                }
            }
        }
    }
    return maxLen;
}

void outputLIS(int *arr, int index){
    bool isLIS = 0;
    if (index<0||maxLen==0)
        return;
    if (len[index]==maxLen){
        --maxLen;
        isLIS = 1;
    }
    outputLIS(arr, --index);

    if (isLIS)
        printf("%d ", arr[index+1]);
}

int main(int argc, char *argv[]) {
    int arr[] = {1,-1,2,-3,4,-5,6,-7};
    printf("%d\n",LIS(arr,sizeof(arr)/sizeof(int)));
    outputLIS(arr,sizeof(arr)/sizeof(int) - 1);
    printf("\n");
}

动归+二分查找

思路:i循环,存储递增元素至 新的数组

时间复杂度:O(n)

空间复杂度:O(n)

#include <iostream>

using namespace std;

int maxArr[30];
int len;

int BinSearch(int *maxArr, int size, int x) {
    int left = 0, right = size -1;
    while(left<=right){
        int mid = (left+right)/2;
        if (maxArr[mid] <= x){
            left = mid +1;
        } else {
            // right < left maxArr[]覆盖
            right = mid -1;
        }
    }
    return left;
}

int LIS(int *arr, int size) {
    maxArr[0] = arr[0];
    len = 1;
    for (int i=1; i<size; ++i){
        if (arr[i] > maxArr[len-1]){
            maxArr[len] = arr[i];
            len++;
        } else {
            int pos = BinSearch(maxArr, len, arr[i]);
            maxArr[pos] = arr[i];
        }
    }
    return len;
}

int main(int argc, char *argv[]) {
    int arr[] = {1,-1,2,-3,4,-5,6,-7};
    printf("%d\n",LIS(arr,sizeof(arr)/sizeof(int)));
    return 0;
}

最长公共子串 (LCS)

矩阵法

思路:矩阵的对角线,右下依次加一

时间复杂度:O(n^2)

空间复杂度:O(n)

举个例子 babcaba, 二维矩阵如下:

我们需要的是某一行和上一行,所以可以用一位数组来代替矩阵。

#include<iostream>
#include<cstring>
#include<vector>
using namespace std;
//str1为横向,str2这纵向
const string LCS(const string& str1,const string& str2){
    int xlen=str1.size();       //横向长度
    vector<int> tmp(xlen);      //保存矩阵的上一行
    vector<int> arr(xlen);      //当前行
    int ylen=str2.size();       //纵向长度
    int maxele=0;               //矩阵元素中的最大值
    int pos=0;                  //矩阵元素最大值出现在第几列
    for(int i=0;i<ylen;i++){
        string s=str2.substr(i,1);
        arr.assign(xlen,0);     //数组清0
        for(int j=0;j<xlen;j++){
            if(str1.compare(j,1,s)==0){
                //compare(a,b) //<0:  a < b
                //=0:  a == b  //>0:  a > b
                if(j==0)
                    arr[j]=1;
                else
                    arr[j]=tmp[j-1]+1;
                if(arr[j]>maxele){
                    maxele=arr[j];
                    pos=j;
                }
            }
        }
        tmp.assign(arr.begin(),arr.end());
    }
    string res=str1.substr(pos-maxele+1,maxele);
    //substr(a,b):从下标a开始,长度为b
    return res;
}
int main(){
    string str1("21232523311324");
    string str2("312123223445");
    string lcs=LCS(str1,str2);
    cout<<lcs<<endl;
    return 0;
}

最长公共子序列

递归法

思路: i,j标记,a[i]==b[j]分情况,向后递归

对于a[0…n],b[0..m],

如果a[i]==b[j], 1+ LCS(i+1,j+1);

如果a[i]!=b[j], max(LCS(i,j+1),LCS(i+1,j));

时间复杂度:O(n^2)

空间复杂度:O(n)

#include<stdio.h>
#include<string.h>
char a[100],b[100];
int lena,lenb;
int LCS(int,int);///两个参数分别表示数组a的下标和数组b的下标
int main()
{
    strcpy(a,"ABCBDAB");
    strcpy(b,"BDCABA");
    lena=strlen(a);
    lenb=strlen(b);
    printf("%d\n",LCS(0,0));
    return 0;
}
int LCS(int i,int j)
{
    if(i>=lena || j>=lenb)
        return 0;
    if(a[i]==b[j])
        return 1+LCS(i+1,j+1);
    else
        return LCS(i+1,j)>LCS(i,j+1)? LCS(i+1,j):LCS(i,j+1);
}

动态规划法

思路:矩阵标记,向右、向下、向右下传值

时间复杂度:O(n^2)

空间复杂度:O(n^2)

使用二维数组flag标记下标i和j的走向,数字‘1’表示:斜向下;数字‘2’表示:向右;数字‘3’表示:向下。

通过行进的路径,可以得到最长公共子序列。

#include<stdio.h>
#include<string.h>
char a[500],b[500];
char num[501][501]; ///记录中间结果的数组
char flag[501][501];    ///标记数组,用于标识下标的走向,构造出公共子序列
void LCS(); ///动态规划求解
void getLCS();    ///采用倒推方式求最长公共子序列
int main()
{
    int i;
    strcpy(a,"ABCBDAB");
    strcpy(b,"BDCABA");
    LCS();
    printf("%d\n",num[strlen(a)][strlen(b)]);
    getLCS();
    return 0;
}
void LCS()
{
    int i,j;
    for(i=1;i<=strlen(a);i++)
    {
        for(j=1;j<=strlen(b);j++)
        {
            if(a[i-1]==b[j-1])   ///注意这里的下标是i-1与j-1
            {
                num[i][j]=num[i-1][j-1]+1;
                flag[i][j]=1;  ///斜向下标记
            }
            else
            {
                if(num[i][j-1]>num[i-1][j])
                {
                    num[i][j]=num[i][j-1];
                    flag[i][j]=2;  ///向右标记
                }
                else
                {
                    num[i][j]=num[i-1][j];
                    flag[i][j]=3;  ///向下标记
                }
            }
        }
    }
}
void getLCS()
{
    char res[500];
    int i=strlen(a);
    int j=strlen(b);
    int k=0;    ///用于保存结果的数组标志位
    while(i>0 && j>0)
    {
        if(flag[i][j]==1)   ///如果是斜向下标记
        {
            res[k]=a[i-1];
            k++;
            i--;
            j--;
        }
        else if(flag[i][j]==2)  ///如果是斜向右标记
            j--;
        else if(flag[i][j]==3)  ///如果是斜向下标记
            i--;
    }
    for(i=k-1;i>=0;i--){
        printf("%c",res[i]);
    }

}  

最长不重复子串

Hash法

思路:i循环,j=i+1向后循环,通过hash[256]判重

时间复杂度:O(n^2)

空间复杂度:O(l)

#include <iostream>

using namespace std;

int maxlen;
int maxindex;
char visit[256]; 

void output(char * arr){
    for(int i= maxindex; i< maxlen+maxindex; i++){
        printf("%c", arr[i]);
    }
}  

void LNRS_hash(char * arr, int size)
{
    for(int i = 0; i < size; ++i)
    {
        memset(visit,0,sizeof(visit)); //清空hash表,重要
        visit[arr[i]] = 1;
        for(int j = i+1; j < size; ++j)
        {
            if(visit[arr[j]] == 0)
            {
                visit[arr[j]] = 1;
            }
            else
            {
                if(j-i > maxlen)
                {
                    maxlen = j - i;
                    maxindex = i;
                }
                break;
            }
        }
    }
    output(arr);
}

int main(int argc, char *argv[]) {
    char arr[11] = "abcabcdcba"; //最后一个为‘/0‘
    LNRS_hash(arr, 10);
    return 0;
}

动态规划法

思路:i循环,j=i-1向前循环,判重

时间复杂度:O(n^2)

空间复杂度:O(n)

int dp[100];
void LNRS_dp(char * arr, int size)
{
    int i, j;
    maxlen = maxindex = 0;
    dp[0] = 1;
    for(i = 1; i < size; ++i)
    {
        for(j = i-1; j >= 0; --j)
        {
            if(arr[j] == arr[i])
            {
                dp[i] = i - j;
                break;
            }
        }
        if(j == -1)
        {
            dp[i] = dp[i-1] + 1;
        }
        if(dp[i] > maxlen)
        {
            maxlen = dp[i];
            maxindex = i + 1 - maxlen;
        }
    }
    output(arr);
}

动归+hash+空间优化

思路:一边遍历,hash记下标

时间复杂度:O(n)

空间复杂度:O(1)

void LNRS_dp_hash(char * arr, int size)
{
    memset(visit, -1, sizeof visit);
    maxlen = maxindex = 0;
    visit[arr[0]] = 0;
int curlen = 1;
    for(int i = 1; i < size; ++i)
    {
        if(visit[arr[i]] == -1)
        {
            ++curlen;
            visit[arr[i]] = i; /* 记录字符下标 */
        }
else
        {
            curlen = i - visit[arr[i]];
            visit[arr[i]] = i; /* 更新字符下标 */
        }
        if(curlen > maxlen)
        {
            maxlen = curlen;
            maxindex = i + 1 - maxlen;
        }
    }
    output(arr);
}

最长回文子串

思路:i遍历str,以i为中心,左右两端寻找

时间复杂度:O(n^2)

空间复杂度:O(1)

string findLPS(const string &str)
{
    int center = 0, max_len = 0;
    for(int i = 1; i < str.length()-1; ++i)
    {
        int j = 1;
        //以str[i]为中心,依次向两边扩展,寻找最长回文Pi
        while(i+j < str.length() && i-j >= 0 && str[i+j] == str[i-j])
            ++j;
        --j;
        if(j > 1 && j > max_len)
        {
            center = i;
            max_len = j;
        }
    }
    return str.substr(center-max_len, (max_len * 2) + 1);
}
写在后面的话:

本片博客主要参考 寒小阳的博客 找工作知识储备(2) 对作者表示。

另外,我会参考更多的资料,整理补充本篇博客。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-08-11 09:48:55

#面试系列 字符串处理算法的相关文章

【数据结构&amp;&amp;算法系列】KMP算法介绍及实现(c++ &amp;&amp; java)

KMP算法如果理解原理的话,其实很简单. KMP算法简介 这里根据自己的理解简单介绍下. KMP算法的名称由三位发明者(Knuth.Morris.Pratt)的首字母组成,又称字符串查找算法. 个人觉得可以理解为最小回溯算法,即匹配失效的时候,尽量少回溯,从而缩短时间复杂度. KMP算法有两个关键的地方,1)求解next数组,2)利用next数组进行最小回溯. 1)求解next数组 next数组的取值只与模式串有关,next数组用于失配时回溯使用. 在简单版本的KMP算法中,每个位置 j 的 n

大公司面试经典数据结构与算法题C#解答

几个大公司(IBM.MicroSoft and so on)面试经典数据结构与算法题C#解答 1.链表反转 我想到了两种比较简单的方法 第一种是需要开一个新的链表,将原链表的元素从后到前的插入到新链表中(也就是原链表第一个元素被插入成新链表的最后一个元素). 第二种是不需要开新的链表,而是逐步反转原链表中元素的指向,例如: 原链表是 1->2->3->4->null  被  逐步修改为 ①2->1->null.3->4->null ②3->2->

js面试中长见的算法题(转载)

js面试中长见的算法题 1.阐述下 JavaScript 中的变量提升 所谓提升,顾名思义即是 JavaScript 会将所有的声明提升到当前作用域的顶部.这也就意味着我们可以在某个变量声明前就使用该变量,不过虽然 JavaScript 会将声明提升到顶部,但是并不会执行真的初始化过程.2.阐述下 use strict; 的作用 use strict; 顾名思义也就是 JavaScript 会在所谓严格模式下执行,其一个主要的优势在于能够强制开发者避免使用未声明的变量.对于老版本的浏览器或者执行

回文数系列题目(经典算法)

回文数 时间限制:1000 ms  |  内存限制:65535 KB 难度:0 描述 请寻找并输出1至1000000之间的数m,它满足m.m^2和m^3均为回文数.回文数大家都知道吧,就是各位数字左右对称的整数,例如121.676.123321等.满足上述条件的数如m=11,m^2=121,m^3=1331皆为回文数. 输入 没有输入 输出 输出1至1000000之间满足要求的全部回文数,每两个数之间用空格隔开,每行输出五个数 解析:这道题直接模拟就好了,算是回文数中最简单的题了,直接写个判断回

【阿里面试系列】Java线程的应用及挑战

文章简介 上一篇文章[「阿里面试系列」搞懂并发编程,轻松应对80%的面试场景]我们了解了进程和线程的发展历史.线程的生命周期.线程的优势和使用场景,这一篇,我们从Java层面更进一步了解线程的使用.关注我的技术公众号[架构师修炼宝典]一周出产1-2篇技术文章.Q群725219329分享并发编程,分布式,微服务架构,性能优化,源码,设计模式,高并发,高可用,Spring,Netty,tomcat,JVM等技术视频. 内容导航 并发编程的挑战 线程在Java中的使用 并发编程的挑战 引入多线程的目的

趣写算法系列之--匈牙利算法(真的很好理解)

[书本上的算法往往讲得非常复杂,我和我的朋友计划用一些简单通俗的例子来描述算法的流程] 匈牙利算法是由匈牙利数学家Edmonds于1965年提出,因而得名.匈牙利算法是基于Hall定理中充分性证明的思想,它是部图匹配最常见的算法,该算法的核心就是寻找增广路径,它是一种用增广路径求二分图最大匹配的算法. -------等等,看得头大?那么请看下面的版本: 通过数代人的努力,你终于赶上了剩男剩女的大潮,假设你是一位光荣的新世纪媒人,在你的手上有N个剩男,M个剩女,每个人都可能对多名异性有好感(-_-

Chapter 4. 字符串 KMP算法

Chapter 4. 字符串 KMP算法 Sylvia's I. 讲的比较好的博客1,博客2 表问窝,在窝翻遍全网的博客后,窝已经处于混乱状态-- Sylvia's II. 窝是贴代码的小能手-- //前方高能请注意//窝并不知道窝在说什么--#include<cstdio> #include<iostream> #include<algorithm> #include<cmath> #include<cstring> using namespa

Rabin-Karp字符串查找算法

1.简介 暴力字符串匹配(brute force string matching)是子串匹配算法中最基本的一种,它确实有自己的优点,比如它并不需要对文本(text)或模式串(pattern)进行预处理.然而它最大的问题就是运行速度太慢,所以在很多场合下暴力字符串匹配算法并不是那么有用.我们需要一些更快的方法来完成模式匹配的工作,然而在此之前,我们还是回过头来再看一遍暴力法匹配,以便更好地理解其他子串匹配算法. 如下图所示,在暴力字符串匹配里,我们将文本中的每一个字符和模式串的第一个字符进行比对.

字符串查找算法-KMP

/** *    KMP algorithm is a famous way to find a substring from a text. To understand its' capacity, we should acquaint onself with the normal algorithm. */ /** *    simple algorithm * *    workflow: *        (say,  @ct means for currently position o