电子词典的内存分配方式改进

这两天敲的电子词典中涉及到电子词典打开以及为电子词典词条分配内存的问题,其中经过了三次的改进措施,下边对这三种方式的改进过程做如下总结:

第一种方法:

第一种方法对电子词典内存分配的方式是为其分配一个指定大小的空间,实现代码如下:

<pre class="cpp" name="code"><span style="font-family:KaiTi_GB2312;font-size:24px;">//声明虽大的记录条数
#define MAX 111111 

struct dict
{
	char *key;//词条
	char *content;//词条对应的翻译
};

//打开字典文件,并读取文件内容
int open_dict(struct dict **p, const char *dict_filename)
{
	FILE *pfile = fopen(dict_filename, "r");
	if (pfile == NULL)
		return 0;//打开文件失败,函数返回

	*p = (struct dict *)malloc(sizeof(struct dict) * MAX);//固定分配MAX大小内存
	memset(*p, 0, sizeof(struct dict) * MAX);//将分配内存初始化为0
	struct dict *pD = *p;//pD指向数组p的首地址

	char buf[1024] = { 0 };
	size_t len = 0;
	int i = 0;//计数器
	while (!feof(pfile))//循环读取文件,直到文件末尾
	{
		memset(buf, 0, sizeof(buf));
		fgets(buf, sizeof(buf), pfile);//读取文件一行
		len = strlen(buf);//得到读取到字符串长度
		if (len > 0)
		{
			pD[i].key = (char *)malloc(len);//根据字符串长度分配内存
			memset(pD[i].key, 0, len);
			strcpy(pD[i].key, &buf[1]);//将读取到的内容拷贝到key中
		}

		memset(buf, 0, sizeof(buf));
		fgets(buf, sizeof(buf), pfile);
		len = strlen(buf);
		if (len > 0)
		{
			pD[i].content = (char *)malloc(len);
			memset(pD[i].content, 0, len);
			strcpy(pD[i].content, &buf[6]);
		}

		i++;//计数器加1
	}
	fclose(pfile);//关闭字典文件

	return i;//返回读取到的字典词条数
}</span>

该方法是先分配一个固定大小的空间存放数据,然后再读取数据获得实际的词条数。该方法的问题是:当词典的词条数量很大时,指定的一个大小的空间可能会不够用而导致问题,因此就有了下边的方法。

第二种方法:

第二种方法弥补了第二种方法的问题:它是先获得词典中的词条数,然后再根据获得的词条数为词典分配对应的存储空间。如此一来既不会造成空间的浪费,也不会发生上边第一种方法造成分配空间不足的问题现象。其实现代码如下:

<pre class="cpp" name="code"><span style="font-family:KaiTi_GB2312;font-size:24px;">struct dict
{
	char *key;
	char *content;
};

int get_dict_size(FILE *pfile)//得到字典文件中词条总数
{
	if (pfile == NULL)
		return 0;

	int i = 0;
	char buf[2048];
	while (!feof(pfile))
	{
		fgets(buf, sizeof(buf), pfile);
		fgets(buf, sizeof(buf), pfile);
		i++;//读取两行后,计数器加1
	}
	return i;
}

//打开字典文件,并读取文件内容
int open_dict(struct dict **p, const char *dict_filename)
{
	FILE *pfile = fopen(dict_filename, "r");
	if (pfile == NULL)
		return 0;//打开文件失败,函数返回

	int size = get_dict_size(pfile);//得到字典文件中词条总数
	if (size == 0)
		return 0;

	*p = (struct dict *)malloc(sizeof(struct dict) * size);//根据字典文件词条总数分配内存
	memset(*p, 0, sizeof(struct dict) * size);//将分配内存初始化为0

	struct dict *pD = *p;//pD指向数组p的首地址

	char buf[2048] = { 0 };
	size_t len = 0;
	int i = 0;
	fseek(pfile, 0L, SEEK_SET);//设置读取位置为字典文件开始
	while (!feof(pfile))//循环读取文件,直到文件末尾
	{
		memset(buf, 0, sizeof(buf));
		fgets(buf, sizeof(buf), pfile);//读取文件一行
		len = strlen(buf);//得到读取到字符串长度
		if (len > 0)
		{
			pD[i].key = (char *)malloc(len);//根据字符串长度分配内存
			memset(pD[i].key, 0, len);
			strcpy(pD[i].key, &buf[1]);//将读取到的内容拷贝到key中
		}

		memset(buf, 0, sizeof(buf));
		fgets(buf, sizeof(buf), pfile);
		len = strlen(buf);
		if (len > 0)
		{
			pD[i].content = (char *)malloc(len);
			memset(pD[i].content, 0, len);
			strcpy(pD[i].content, &buf[6]);
		}
		i++;
	}
	fclose(pfile);//关闭字典文件

	return i;//返回读取到的字典词条数
}</span>

第三种方法:

其实第二种方法在运行上是不会出什么问题的,考虑到代码执行效率,我们可以借助链表的这种数据结构来处理这一内存分配问题,主要思想是我们可以一边读取词条,一边为其分配存储空间,该过程需要有一块存储空间来存放下一个词条的地址信息(指针),于是我们就需要在词条结构的字段中添加一个新的字段来存放下一个词条的指针。其实现代码如下:

<span style="font-family:KaiTi_GB2312;font-size:24px;">struct dict
{
	char *key;
	char *content;
	struct dict *next;//指向链表下一个节点的指针
};

//打开字典文件,并读取文件内容
int open_dict(struct dict **p, const char *dict_filename)//open dict.txt,and read dict
{
	FILE *pfile = fopen(dict_filename, "r");//只读方式打开文件
	if (pfile == NULL)
		return 0;//打开文件失败,函数返回

	char buf[2048] = { 0 };
	size_t len = 0;
	int i = 0;//计数器,记录读到到的词条总数

	*p = (struct dict *)malloc(sizeof(struct dict));//分配链表首节点内存
	memset(*p, 0, sizeof(struct dict));

	struct dict *pD = *p;//pD指向链表首地址
	while (!feof(pfile))//循环读取文件,直到文件末尾
	{
		memset(buf, 0, sizeof(buf));
		fgets(buf, sizeof(buf), pfile);//读取文件一行
		len = strlen(buf);//得到读取到字符串长度
		if (len > 0)
		{
			pD->key = (char *)malloc(len);//根据字符串长度分配内存
			memset(pD->key, 0, len);
			strcpy(pD->key, &buf[1]);//将读取到的内容拷贝到key中
		}

		memset(buf, 0, sizeof(buf));
		fgets(buf, sizeof(buf), pfile);
		len = strlen(buf);
		if (len > 0)
		{
			pD->content = (char *)malloc(len);
			memset(pD->content, 0, len);
			strcpy(pD->content, &buf[6]);
		}
		pD->next = (struct dict *)malloc(sizeof(struct dict));//为链表的下一个节点分配内存
		memset(pD->next, 0, sizeof(struct dict));

		pD = pD->next;//将pD指向下一个节点位置
		i++;
	}
	fclose(pfile);//关闭字典文件
	return i;//返回读取到的字典词条数
}</span>

这三次纠错和优化提高了代码的健壮性,和执行的效率,同时也从中学习了很多关于文件和内存分配以及有关数据结构链表的分配、访问以及释放的相关操作方法。在后面学习的过程中还会继续用到C语言的相关知识,以C语言为基础做一些相关任务。



时间: 2024-10-22 09:21:27

电子词典的内存分配方式改进的相关文章

内存分配方式及内存碎片

什么是内存碎片? 内部碎片的产生:因为所有的内存分配必须起始于可被 4.8 或 16 整除(视 处理器体系结构而定)的地址或者因为MMU的分页机制的限制,决定内存分配算法仅能把预定大小的内存块分配给客户.假设当某个客户请求一个 43 字节的内存块时,因为没有适合大小的内存,所以它可能会获得 44字节.48字节等稍大一点的字节,因此由所需大小四舍五入而产生的多余空间就叫内部碎片.外部碎片的产生: 频繁的分配与回收物理页面会导致大量的.连续且小的页面块夹杂在已分配的页面中间,就会产生外部碎片.假 设

内存分配方式和调试机制

内存分配方式和调试机制 M内存分配 内存分配函数 MFCWin32或者C语言的内存分配API,有四种内存分配API可供使用. Win32的堆分配函数 每一个进程都可以使用堆分配函数创建一个私有的堆──调用进程地址空间的一个或者多个页面.DLL创建的私有堆必定在调用DLL的进程的地址空间内,只能被调用进程访问. HeapCreate用来创建堆:HeapAlloc用来从堆中分配一定数量的空间,HeapAlloc分配的内存是不能移动的:HeapSize可以确定从堆中分配的空间的大小:HeapFree用

转:内存分配方式及常见错误

内存操作对于程序开发人员来说,永远是一块雷区.在这片区域,总是不断的埋雷.排雷,而且往往是排雷花了非常大的代价.记得在公司实习时,有大概2个星期的时间,team的几个人去排雷——有地方发生了memory leak! 而以我现在的认知来看,只有极少数的programer敢拍着胸脯说,非常熟悉内存操作,手到擒来不会排雷.针对这个情况,我要求自己在尽量去探索,以求少埋雷.甚至不埋雷(这是一个很大的挑战).以下内容摘自<高质量C++/C编程指南>(作者: 林锐 博士),以警醒自己.更多详细.深入的东西

C和C++内存分配方式记录

C. C++中内存分配方式可以分为三种: (1)从静态存储区域分配:内存在程序编译时就已经分配好,这块内存在程序的整个运行期间都存在.速度快.不容易出错,因为有系统会善后.例如全局变量,static变量等. (2)在栈上分配:在执行函数时,函数内局部变量的存储单元都在栈上创建,函数执行结束时这些存储单元自动被释放.栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限. (3)从堆上分配:即动态内存分配.程序在运行的时候用malloc 或new申请任意大小的内存,程序员自己负责在

内存分配方式

操作系统复习 内存的深入理解 内存构成 程序代码区-存放函数体的二进制代码. 全局区(静态区)(static):全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域.程序结束后由系统释放. 栈区(stack):由编译器自动分配释放,存放函数的参数值,局部变量的值等.其操作方式类似于数据结构中的栈. 堆区(heap): 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收.注意它与数据结构中的堆是两回事,分配

C++内存分配方式——小结

1 内存分配方式 内存分配方式有如下三种: 从静态存储区域分配.内存在程序编译的时候就分配好了,这些内存在整个程序运行期间都存在,如全局变量.static变量等等. 在堆栈上分配.在函数执行期间,函数形参.函数内局部变量的存储单元都置于堆栈上,函数调用结束后自动从堆栈上释放. 从堆(heap)或自由存储空间分配,也叫动态内存分配.程序运行期间使用malloc()或new申请内存,使用free()或delete释放内存. 一般的原则是:如果使用堆栈和静态存储就能够满足应用需求,就不要使用动态存储.

C++内存分配方式——(别人的博客)

http://www.cnblogs.com/easonpan/archive/2012/04/26/2471153.html http://blog.csdn.net/chen825919148/article/details/7955472 http://my.oschina.net/hnuweiwei/blog/224346 C++内存分配方式: 在C++中,内存分成5个区,他们分别是堆.栈.自由存储区.全局/静态存储区和常量存储区. (1) 栈,在执行函数时,函数内局部变量的存储单元都可

各编程语言的内存分配方式

C++的内存分配方式: 1.栈区(stack)——由编译器自动分配释放,在不需要的时候自动清除.用于存放函数的参数.局部变量等.在一个进程中,位于用户虚拟地址空间顶部的是用户栈,编译器用它来实现函数的调用.操作方式类似数据结构中的栈(后进先出). 2.堆区(heap)——就是那些由 new 分配的内存块,他们的释放编译器不去管,由我们的应用程序去控制,一般一个 new 就要对应一个 delete.如果程序员没有释放掉,那么在程序结束后,操作系统会自动回收.堆可以动态地扩展和收缩.不同于数据结构中

MYSQL,innodb_buffer_pool_size内存分配方式

以前一直以为MYSQL,innodb_buffer_pool_size=8G,MySQL一起动就会将占用掉8G内存(认为TOP可以看到内存被使用了8G),但是最近才仔细研究一下,原来不是这样的(可能自己对Linux malloc内存分配也只是知道了个皮毛吧),MySQL启动时实际只是在虚拟内存中分配了地址空间,而并没有真正的映射到物理内存上. 因为malloc分配内存是先在虚拟内存中分配地址的,到实际使用时才真正的映射到物理内存 因此这个地方,如果由于机器内存使用不当,到了MySQL真正要映射物