算法学习笔记（九）有限状态机 FSM 的应用

一个问题：Beautiful
String

这是2014微软校招的编程题，题意大致如下：

如果一个字符串包括三组或者更多组的连续升序字母，每组长度相等，那么我们就称这个字符串是Beautiful String

符合Beautiful String举例：abc, cde, aabbcc, aaabbbccc
不符Beautiful String举例：abd，cba，aabbc，zab
输入一个只含有小写字母的字符串，如果它含有一个Beautiful的子串，就输出YES，否则输出NO
输入：第一行是案例个数，之后的每一行是一个数字，一个字符串，数字表示字符串长度，长度小于10MB
输出：YES 或 NO

有限状态机
FSM 定义

有限状态机（Finite-state machine）又称有限状态自动机，是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。常用与：正则表达式引擎，编译器的词法和语法分析，游戏设计，网络协议，企业应用中等方面。

有限状态机
FSM 要素

状态机可归纳为4个要素，即现态、条件、动作、次态。这样的归纳，主要是出于对状态机的内在因果关系的考虑。

“现态”和“条件”是因，“动作”和“次态”是果。

1. 现态：是指当前所处的状态。

2. 条件：又称为“事件”，当一个条件被满足，将会触发一个动作，或者执行一次状态的迁移。

3. 动作：条件满足后执行的动作。动作执行完毕后，可以迁移到新的状态，也可以仍旧保持原状态。动作不是必需的，当条件满足后，也可以不执行任何动作，直接迁移到新状态 4. 次态：条件满足后要迁往的新状态。“次态”是相对于“现态”而言的，“次态”一旦被激活，就转变成新的“现态”了。

有限状态机
FSM 实现

用switch/case 或 if/else 实现，简单粗暴，适合简单的小型状态机；
用设计模式中的 state pattern，把复杂判断的逻辑简化，利于组织代码；
用状态表设计，建立状态表和动作查询表，根据状态表、事件、动作表定位相应的动作处理函数，执行完成后再进行状态的切换；

Beautiful String问题的解法

分析

这个自动机规模小，直接用if/else简单的实现即可。每个状包含4个要素：

当前处理的字符 current
当前处理的字符数量 num_current
Beautiful String中上一个字符的数量 num_prev
当前元素是Beautiful String中第几个元素 pos_beauty

代码

#include<iostream>
using namespace std;

struct states {
	char current;      //  正在处理的字符
	int num_prev;      //  beautiful string中上一个元素的数量
	int num_current;   //  正在处理的字符累计的数量
	int pos_beauty;    //  正在处理的字符是 beautiful string中的第几个元素
} s = { 0, 0, 0, 0 };

int main() {
	int ncase, n;
	char c;
	cin >> ncase;
	while (ncase--) {
		cin >> n;
		bool result = false;
		while (n--) {
			cin >> c;
			if (result) {
				continue;
			}
			if (s.current == 0) {
				s.current = c;
				s.num_current = 1;
				s.pos_beauty = 1;
				continue;
			}
			if (s.current == c) {
				s.num_current++;
				if (s.num_prev != 0 && s.num_current > s.num_prev) {
					s.num_prev = 0;
					s.pos_beauty = 1;
				}
			}
			if (s.current == c - 1) {
				if (s.num_prev == 0 || s.num_current <= s.num_prev) {
					s.pos_beauty++;
				} else {
					s.pos_beauty = 2;
				}
				s.num_prev = s.num_current;
				s.num_current = 1;
			}
			if (s.current != c && s.current != c - 1) {
				s.pos_beauty = 1;
				s.num_current = 0;
				s.num_current = 1;
			}
			if (s.pos_beauty >= 3 && s.num_current == s.num_prev) {
				result = true;
			}
			s.current = c;
		}
		if (result) {
			cout << "YES" << endl;
		} else {
			cout << "NO" << endl;
		}
	}
	return 0;
}

/**  用例：
7
3
abc
4
aaab
6
abccde
3
abb
8
aaaabbcc
11
aaaabbbccde
6
aaabbc
 */

时间： 2025-01-10 08:51:04

算法学习笔记（九）有限状态机 FSM 的应用的相关文章

算法学习笔记递归之快速幂、斐波那契矩阵加速

递归的定义原文地址为:http://blog.csdn.net/thisinnocence 递归和迭代是编程中最为常用的基本技巧,而且递归常常比迭代更为简洁和强大.它的定义就是:直接或间接调用自身.经典问题有:幂运算.阶乘.组合数.斐波那契数列.汉诺塔等.其算法思想: 原问题可分解子问题(必要条件): 原与分解后的子问题相似(递归方程): 分解次数有限(子问题有穷): 最终问题可直接解决(递归边界): 对于递归的应用与优化,直接递归时要预估时空复杂度,以免出现用时过长或者栈溢出.优化递归就是以

APUE 学习笔记(九) 高级I/O

1. 非阻塞I/O 低速系统调用时可能会使进程永远阻塞的一类系统调用,包括以下调用: (1)某些文件类型你(网络socket套接字.终端设备.管道)暂无可使用数据,则读操作可能会使调用者永远阻塞 (2)如果数据不能立即被(1)中文件类型接受,则写操作会使调用者永远阻塞 (3)某些进程间通信函数非阻塞I/O使我们可以调用open.read.write这样的I/O操作,并使这些操作不会永远阻塞,如果这种操作不能完成,则调用立即出错返回对于一个给定的文件有两种方法对其指定非阻塞I/O: (1)调用

EM算法学习笔记2：深入理解

文章<EM算法学习笔记1:简介>中介绍了EM算法的主要思路和流程,我们知道EM算法通过迭代的方法,最后得到最大似然问题的一个局部最优解.本文介绍标准EM算法背后的原理. 我们有样本集X,隐变量Z,模型参数θ,注意他们3个都是向量,要求解的log似然函数是lnp(X|θ),而这个log似然函数难以求解,我们假设隐变量Z已知,发现lnp(X,Z|θ) 的最大似然容易求解. 有一天,人们发现引入任意一个关于隐变量的分布q(Z),对于这个log似然函数,存在这样一个分解: lnp(X|θ)=L(q,θ

python学习笔记九——文件与目录

1.python进行文件读写的函数是open或file类 mode:r 只读 r+ 读写 w 写入,先删除原文件,再重新写入,如果文件没有则创建 w+ 读写,先删除原文件,再重新写入,如果文件没有则创建(可写入和输出) a 写入,在文件末尾追加新的内容,文件不存在则创建 a+ 读写,在文件末尾追加新的内容,文件不存在则创建 b 打开二进制文件,可与r,w,a,+结合使用 U 支持所有的换行符号,"\r","\n","\r\n"

angular学习笔记(九)-css类和样式3

再来看一个选择li列表的例子: 点击li中的任意项,被点击的li高亮显示: <!DOCTYPE html> <html ng-app> <head> <title>6.3css类和样式</title> <meta charset="utf-8"> <script src="../angular.js"></script> <script src="scri

angular学习笔记(九)-css类和样式2

在上一个例子中,元素的类名使用拼接的方法,这样,类名中就不得不带有true或false,并且不易维护,所以,angular使用ng-class属性来控制元素的类名: 我们来看一个小例子,点击error按钮,顶部提示错误框,点击warning按钮,顶部提示警告框. 错误框的类名是.err,警告框的类名是.warn: <!DOCTYPE html> <html ng-app> <head> <title>6.2css类和样式</title> <

算法学习笔记 KMP算法之 next 数组详解

最近回顾了下字符串匹配 KMP 算法,相对于朴素匹配算法,KMP算法核心改进就在于:待匹配串指针 i 不发生回溯,模式串指针 j 跳转到 next[j],即变为了 j = next[j]. 由此时间复杂度由朴素匹配的 O(m*n) 降到了 O(m+n), 其中模式串长度 m, 待匹配文本串长 n. 其中,比较难理解的地方就是 next 数组的求法.next 数组的含义:代表当前字符之前的字符串中,有多大长度的相同前缀后缀,也可看作有限状态自动机的状态,而且从自动机的角度反而更容易推导一些. "前

Linux System Programming 学习笔记(九) 内存管理

1. 进程地址空间 Linux中,进程并不是直接操作物理内存地址,而是每个进程关联一个虚拟地址空间内存页是memory management unit (MMU) 可以管理的最小地址单元机器的体系结构决定了内存页大小,32位系统通常是 4KB, 64位系统通常是 8KB 内存页分为 valid or invalid: A valid page is associated with an actual page of data,例如RAM或者磁盘上的文件 An invalid page is

算法学习笔记最短路

图论中一个经典问题就是求最短路,最为基础和最为经典的算法莫过于 Dijkstra 和 Floyd 算法,一个是贪心算法,一个是动态规划,这也是算法中的两大经典代表.用一个简单图在纸上一步一步演算,也是很好理解的,理解透自己多默写几次即可记住,机试时主要的工作往往就是快速构造邻接矩阵了. 对于平时的练习,一个很厉害的 ACMer @BenLin_BLY 说:"刷水题可以加快我们编程的速度,做经典则可以让我们触类旁通,初期如果遇见很多编不出,不妨就写伪代码,理思路,在纸上进行整体分析和一步步的演算

[算法学习笔记]直接插入排序笔记

直接插入排序概念: 带排元素放在elem[0...n-1]中,初始化时,elem[0]自成1个有序区,无序区为elem[1...n-1],从i=1起,到i=n-1,依次将elem[i]插入有序区[0...n-1]中直接插入排序算法步骤: 1.在当前有序区域R[1,i-1]中查找R[i]的正确插入位置K(1<=K<=i-1) 2.将R[K,i-1]中的记录均向后移动 3.移动后腾出K位置,插入R[i] (最坏)时间复杂度:O(n^2) 空间复杂度:O(1) /// <summary>

算法学习笔记（九）有限状态机 FSM 的应用

一个问题：Beautiful String

有限状态机 FSM 定义

有限状态机 FSM 要素

有限状态机 FSM 实现