[C++]LeetCode: 105 Longest Substring Without Repeating Characters


Given a string, find the length of the longest substring without repeating characters. For example,
the longest substring without repeating letters for "abcabcbb" is "abc", which the length is 3. For "bbbbb" the longest substring is "b", with the length of 1.


由于是字符存储,所以可以用特殊的数组来存储每一个字符在字符串中的位置。这个方法对字符串问题都通用,因为字符本质就是一个Unique的数字,建立一个数组,vector<int> bitmap(256, -1); 数组下标表示这个字符的ASCII码,元素表示这个字符串中的位置。比如,q的ASCII码是113,在字符串中坐标为0,
则存储在bitmap[112] = 0.

解决了查找的问题,现在需要考虑我们如何在遇到重复字符后,怎么操作。当我们遇到和之前重复的字符(前一次出现为Occur1,这一次为Occur 2), 这时我们需要做几件事,首先计算当前维护的不重复字符串的长度 = 当前位置 - start(start表示一个标志位,表示当前不重复的子串的起始位置。),
并且比较后维护一个全局最长的不重复子串长度ret; 第二步我们需要更新下一次扫描起点为刚才重复的字符Occur 1的后一位开始;同时我们还需要清空laststart到new start之间的字符在hash table中的坐标,重置-1. 继续扫描知道再次发现相同的字符,和前面一样的处理,注意全部处理完字符串后,还要判断一下末尾的不重复子串是否是最长【很容易忽略】。


Answer 1: 


1. 注意最后要判断末尾的不重复的子串是否是最长,因为在循环中不会判断。

        ret = max(ret, (int)s.size()-start);

2. string.size()类型std::basic_string<char>::size_type

ret = max(ret, s.size()-start);

28: no matching function for call to ‘max(int&, std::basic_string<char>::size_type)’

3. 用vector<256, -1>来维护一个ASCii查找数组,这个方法很好,也常用,需要记住。

vector<int> bitmap(256, -1);    //s的每一个char都可以表示ASC码,可以用数组模仿ASC码

AC Code:

class Solution {
    int lengthOfLongestSubstring(string s) {
        vector<int> bitmap(256, -1);    //s的每一个char都可以表示ASC码,可以用数组模仿ASC码
        int ret = 0;
        int start = 0;
        int laststart = 0;

        for(int i = 0; i < s.size(); i++)
            if(bitmap[s[i]] != -1)
                ret = max(ret, i-start);
                laststart = start;
                start = bitmap[s[i]] + 1; //新的start从上次重复的字母的下一个坐标开始
                for(int j = laststart; j < start; j++)
                    bitmap[s[j]] = -1;
            bitmap[s[i]] = i; //如果没有重复,将index添加到bitmap中

        ret = max(ret, (int)s.size()-start);
        return ret;

Answer 2: 更简练的方法

思路:解题的思路和上面一样,只不过通过巧妙的设计,避免了很多操作。我们维护两个变量,一个是最长子串的长度longest, 一个是当前子串的开始位置坐标m.

  • m = max(charIndex[s[i]]+1, m);  如果这个字符没有出现过,charIndex[s[i]]+1为0,不会影响m的取值;如果出现过,charIndex[s[i]]+1代表上一次出现的字符的位置坐标向后移动一位,更新了m.
    调整了下一次搜索子串的起始位置。这一步就避免了上面解法中将laststart到start重置-1的操作,假如字符串:q p x r j x p... 我们计算到x时,置m 为3,下次查表虽然charIndex[‘p‘]存在并且等于1,但是这个坐标一定会小于charIndex[‘x‘]+1(就是上一步更新的m=3),所以不需要担心后面的重复会影响子串的起始位置m. 也就是说后面出现的位置坐标一定在m之前。m取max则无影响。
  • charIndex[s[i]]
    = i;
  • longest
    =max(longest, i-m+1);  

AC Code:

class Solution {
    int lengthOfLongestSubstring(string s) {
        vector<int> charIndex(256, -1);
        int longest = 0;
        int m = 0;

        for(int i = 0; i < s.size(); i++)
            m = max(charIndex[s[i]]+1, m);
            charIndex[s[i]] = i;
            longest =max(longest, i-m+1);

        return longest;
时间: 2024-08-18 19:10:06

