处理大数据, 编程实现示例

#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
#include <stdlib.h>
#include<string.h>
#include <time.h>
#include <process.h>//多线程

char g_path[200] = "I:\\BaiduYunDownload\\1亿QQ信封\\1E5-10位\\QQ信封.txt";
#define  N   84357584
char str[100] = { 0 };

char **g_pall = NULL;//二级指针存储一级指针数组的地址
int getN()
{
	FILE *pfr = fopen(g_path, "r");
	if (pfr == NULL)
	{
		return -1;
	}
	else
	{
		int i = 0;
		while (!feof(pfr))
		{
			char strbuffer[256] = { 0 };
			fgets(strbuffer, 256, pfr);//读取一行

			i++;

		}

		fclose(pfr);//关闭文件
		return i;

	}

}

void eatN(char *str)
{
	while (*str != '\0')
	{
		if (*str == '\n')
		{
			*str = '\0';
		}
		str++;
	}

}

void init()
{
	g_pall = (char **)malloc(sizeof(char *)*N);//动态分配一个指针数组
	memset(g_pall, '\0', sizeof(char *)*N);

	FILE *pfr = fopen(g_path, "r");
	if (pfr == NULL)
	{
		printf("初始化失败");
		return;
	}
	else
	{

		for (int i = 0; i < N ; i++)
		{
			char strbuffer[79] = { 0 };
			fgets(strbuffer, 79, pfr);//读取一行
			//printf("%s,%d", strbuffer,strlen(strbuffer));
			eatN(strbuffer);

			//printf("%s,%d", strbuffer, strlen(strbuffer));
			int length = strlen(strbuffer);//求获取长度
			if (length != 0)
			{
				g_pall[i] = malloc(sizeof(char)*(length + 1));//每个指针分配内存
				if (g_pall[i] == NULL)
				{
					printf("\nfail");
				}
				strcpy(g_pall[i], strbuffer);//拷贝字符串
				//printf("\n%s", g_pall[i]);//打印结果
			}

		}

		fclose(pfr);//关闭文件

	}

}
void search(char *str)
{
	int j = 0;
	for (int i = 0; i < N-1; i++)
	{

		if (g_pall[i] !=NULL)
		{
			char *p = strstr(g_pall[i], str);//查询

			if (p != NULL)
			{

				j++;
				printf("\n%s", g_pall[i]);//打印结果
			}

		}

	}
	printf("\nj=%d", j);//打印速度慢于查询
}

void main()
{
	//printf("%d", getN());
	init();
	printf("已经加载完成");
	while (1)
	{
		//
		time_t start, end;
		time(&start);
		//int i = 0;
		//scanf("%d", &i);
		//printf("\n%s", g_pall[i]);
		scanf("%s", str);
		search(str);
		time(&end);
		printf("\n一共%d S", (unsigned int)(end - start));
	}
	system("pause");
}

时间: 2024-11-05 16:04:17

处理大数据, 编程实现示例的相关文章

Python/Numpy大数据编程经验

Python/Numpy大数据编程经验 1.边处理边保存数据,不要处理完了一次性保存.不然程序跑了几小时甚至几天后挂了,就啥也没有了.即使部分结果不能实用,也可以分析程序流程的问题或者数据的特点. 2. 及时用 del 释放大块内存.Python缺省是在变量范围(variablescope)之外才释放一个变量,哪怕这个变量在后面的代码没有再被用到,所以需要手动释放大的array. 注意所有对数组的引用都del之后,数组才会被del.这些引用包括A[2:]这样的view,即使np.split也只是

零基础学大数据编程需要哪些基础?

零基础学大数据编程需要哪些基础?程序员薪酬高.工作环境好,是很多同学向往的职业,让很多非计算机专业的同学羡慕不已.非计算机专业难道就不能成为程序员了吗? 一.零基础学大数据编程需要基础: 1.数学基础 从计算机发展和应用的历史来看计算机的数学模型和体系结构等都是有数学家提出的,最早的计算机也是为数值计算而设计的.因此,要学好计算机就要有一定的数学基础,出学者有高中水平就差不多了. 2.逻辑思维能力的培养 学程序设计要有一定的逻辑思维能力,逻思力的培养要长时间的实践锻炼. 要想成为一名优秀的程序员

大数据学习方向,从入门到精通

推荐一个大数据学习群 119599574晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享,你愿意来学习吗 很多初学者在萌生向大数据方向发展的想法之后,不免产生一些疑问,应该怎样入门?应该学习哪些技术?学习路线又是什么? 所有萌生入行的想法与想要学习Java的同学的初衷是一样的.岗位非常火,就业薪资比较高,,前景非常可观.基本都是这个原因而向往大数据,但是对大数据却不甚了解. 如果你想学习,那么首先你需要学会编

大数据入门,到底要怎么学习大数据?

很多人都知道大数据很火,就业很好,薪资很高,想往大数据方向发展.但该学哪些技术,学习路线是什么样的呢? 其实就是想告诉你的大数据的三个发展方向,平台搭建/优化/运维/监控.大数据开发/设计/架构.数据分析/挖掘.请不要问我哪个好学,哪个钱多. 先说一下大数据的4V特征: 数据量大,TB->PB 数据类型繁多,结构化.非结构化文本.日志.视频.图片.地理位置等: 商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来: 处理时效性高,海量数据的处理需求不再局限在离线计算

下一代大数据系统和4S标准

大数据行业发展到今天,它创造的价值和带来的社会效应,大家已经看得很明白,同时很多问题和不足也暴露出来,特别是hadoop能够提供的数据处理能力,现在已经挖掘到极限,但是现在各行业对数据的存储和计算需求,似乎却没有停止的迹象.在最近的一次大数据论坛上,大家开始讨论下一代大数据系统和系统标准,借此机会,我们Laxcus大数据实验室表达了自己的看法,提出了4S标准,得到与会者的普遍赞同和肯定.回来后,觉得这个话题应该再说说,所以借着CSDN这个平台,和诸位谈谈我们眼中的下一代大数据系统和4S标准. 概

大数据时代—— 一个创造超级竞争力企业的时代

这是一个快速发展的时代,随着互联网的普及,数据成指数倍增长,相同类型的企业也如雨后春笋般越来越多!那么如何在这个快速发展的时代,脱颖而出,把握时代的脉搏呢?答案就是:建立自己企业的大数据!提高企业的生存和竞争力,大数据无疑是一把利剑,通过数据分析,不仅可以让你知己知彼,更可以让自己的企业决胜千里之外,使企业在与同行竞争中,更具竞争力的一大利器,用的好,甚至能碾压竞争对手.大数据近年的崛起和发展已经初现其巨大的作用,据分析拥有优秀大数据能力的企业,做出正确决策的可能性高出竞争对手3倍.决策速度比竞

学习大数据需要Java基础吗?

近几年,很多人都听到过一个名词"大数据"也有一部分人选择学习了解大数据,那么大数据到底是什么,学习大数据需要有Java基础吗? 推荐一个大数据学习交流群 119599574每天晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享, 如果要学习大数据,不管你是零基础,还是有一定的基础,都应该知道在学大数据之前一定要懂至少一种计算机编程语言,因为大数据的开发离不开编程语言,不仅要懂,还要精通! 大数据到底是

大数据入门小知识

之前写过大数据入门小知识和大数据入门小知识进阶篇,今天为大家带来大数据入门小知识高阶篇. 推荐一个大数据学习群 119599574晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享,你愿意来学习吗? 大数据入门小知识高阶篇,主要讲述的是因为大数据而衍生出来的一系列技术与科技创新. 说到因为大数据而衍生出来的一系列技术与科技创新,相信我们首先都会想到人工智能(Artificial Intelligence),英文

大数据与数据挖掘的相对绝对关系

数据不是信息,而是有待理解的原材料.但有一件事是确定无疑的:当NSA为了从其海量数据中"挖掘"出信息,耗资数十亿改善新手段时,它正受益于陡然降落的计算机存储和处理价格. 麻省理工学院的研究者约翰·古塔格(John Guttag)和柯林·斯塔尔兹(Collin Stultz)创建了一个计算机模型来分析之心脏病病患丢弃的心电图数据.他们利用数据挖掘和机器学习在海量的数据中筛选,发现心电图中出现三类异常者--一年内死于第二次心脏病发作的机率比未出现者高一至二倍.这种新方法能够识别出更多的,无

月薪30-50K的大数据开发工程师们,他们背后是如何学习的

推荐一个大数据学习群 119599574晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享, 这两天小编去了解了下大数据开发相关职位的薪资,主要有hadoop工程师,数据挖掘工程师.大数据算法工程师等,从平均薪资来看,目前大数据相关岗位的月薪均在2万以上,随着项目经验的增长工资会越来越高. 那么对于新手来说,应该如何开始学习,才能够早日的实现月薪2万多的目标.就小编了解的来说,新手一般需要一年以上的时间才能够达