有关大数据测试

测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能。当涉及到大数据测试时,性能和功能测试是关键。

在大数据测试中,QA工程师使用集群和其他组件来验证对TB级数据的成功处理。因为处理非常快,所以它需要高水平的测试技能。

大数据应用程序的测试更多的是去验证其数据处理而不是验证其单一的功能特色。当然在大数据测试时,功能测试和性能测试是同样很关键的。对于大数据测试工程师而言,如何高效正确的验证经过大数据工具/框架成功处理过的至少百万兆字节的数据将会是一个巨大的挑战。因为大数据高效的处理测试速度,它要求测软件工程师具备高水平的测试技术才能应对大数据测试。

大数据处理的三个特性:

1)大批量

2)实时性

3)可交互。

另外,数据质量也同样是大数据测试的一个重要维度。

因此在进行应用程序测试之前,必须确保数据质量,并且考虑把数据质量作为数据库测试的一部分。涉及数据的各种特性的检验,例如一致性、准确性、重复性、连贯性、有效性及完整性等等。

大数据应用测试大体可以分为三步骤:

步骤一:数据阶段验证

大数据测试的第一步,也称作pre-hadoop阶段该过程包括如下验证:

1)来自各方面的数据资源应该被验证,来确保正确的数据被加载进系统。

2)将源数据与推送到Hadoop系统中的数据进行比较,以确保它们匹配。

3)验证正确的数据被提取并被加载到HDFS正确的位置。

该阶段可以使用工具Talend或Datameer,进行数据阶段验证。

步骤二:"MapReduce"验证

大数据测试的第二步是MapReduce的验证。在这个阶段,测试者在每个节点上进行业务逻辑验证,然后在运行多个节点后验证它们,确保如下操作的正确性:

1)Map与Reduce进程正常工作。

2)在数据上实施数据聚合或隔离规则。

3)生成键值对。

4)在执行Map和Reduce进程后验证数据。

步骤三:输出阶段验证

大数据测试的最后或第三阶段是输出验证过程。生成输出数据文件,同时把文件移到一个EDW(Enterprise Data Warehouse:企业数据仓库)中或着把文件移动到任何其他基于需求的系统中。在第三阶段的活动包括:

1)检查转换(Transformation)规则被正确应用。

2)检查数据完整性和成功的数据加载到目标系统中。

3)通过将目标数据与HDFS文件系统数据进行比较来检查没有数据损坏。

总结:

1)大数据测试不同于传统的测试,不仅仅是类型、策略的不同,工具等具体技术都会有区别。

2)大数据因其复杂性,其测试所面临的挑战也会不同于传统的测试。

3)大数据性能测试将会是软件测试工程师进一步艰难攻克的目标之一。

原文地址:https://www.cnblogs.com/cyumo/p/11458355.html

时间: 2024-10-04 18:12:45

有关大数据测试的相关文章

大数据测试笔记(1)-测试的3条建议

大数据,咋一听起来都觉得很神秘,很高大上,从2013年开始听得越来越多,什么数据挖掘,数据分析.机器学习.算法,让我等听起来天马行空,雾里看花,有幸接触到了大数据项目,让我拨开云雾,原来大数据其实简单,真的简单,大量数据嘛,就是我们说的大数据,基于数据分析,获得有价值的信息. 目前我理解大数据,有数据采集.数据存储.数据分析.数据应用,前两者是基础,后两者是价值,采集存储数据不是目的,利用数据分析有价值的信息,才是我们选择的. 我们不展开聊,作为测试,我关心的是我要测试什么,如何测试,怎么衡量产

每天4亿行SQLite订单大数据测试(源码)

SQLite单表4亿订单,大数据测试 SQLite作为嵌入式数据库的翘楚,广受欢迎!新生命团队自2010年以来,投入大量精力对SQLite进行学习研究,成功应用于各系统非致命数据场合. SQLite极致性能 关闭同步,Synchronous=Off,提升性能.添删改操作时不必同步等待写入磁盘,操作系统会延迟若干毫秒批量写入 设置WAL模式,Journal Mode=WAL,减少锁定.写入向前日志模式,避免多线程访问时锁定数据库,写入时不必使用排它锁影响其它线程读取,而是把事务操作写入到WAL文件

modelsim中的文件操作—— 大数据测试

在modelsim中不可避免的需要进行文件操作,在窗口中查看代码的操作情况,下面是我自己M序列实验中的一段测试代码 1 integer i,j ,k,m; 2 3 integer m_dataFILE , 4 indataFILE , 5 oudataFILE ; 6 7 reg [3:0] i_data[0:9999] ; 8 9 10 initial 11 begin 12 m_dataFILE = $fopen ("./m_data.dat"); // m序列存储文件 13 in

从功能测试角度谈大数据测试

大数据,已经成为了一个时代的代名词,当今的互联网属于大数据时代,大数据时代的到来,颠覆了以往对数据的惯性思考方式,要保证数据执行,软件质量,测试质量,数据使用场景等,都需要重新变换一个新的角度,对软件进行更全方面的思考. 之前大数据很少有测试,开发会觉得:测试环境又没有那么多数据,你怎么测?抛开大数据的数据量大的特点,究其根本,他也是为业务服务的,有一句话我非常赞同: 一切技术都是为业务服务,脱离业务的技术一文不值,这句话在大数据时代的今天,依然适用,并且会一直适用下去.测试的工作就是要保证数据

【若泽大数据实战第一天】大数据测试平台搭建

若泽大数据测试平台环境搭建 一.介质需求: 虚拟机:VMwareWorkstation  14.1.1.28517 大小:465.2MB 操作系统:CentOS-6.5-x86_64-bin-DVD1.iso 大小:4.16GB 二.测试环境搭建: 1.虚拟机安装: 打开VMware Workstation Pro 点击 :''下一步 '' 勾选''我接受许可协议中的条款(A)'' 点击 :''下一步 '' 我E盘是SSD 点击: ''下一步 '' 取消''√''选项 点击 ''下一步 '' 点

大数据测试类型&大数据测试步骤

大数据是一个大的数据集合,通过传统的计算技术无法进行处理.这些数据集的测试需要使用各种工具.技术和框架进行处理.大数据涉及数据创建.存储.检索.分析,而且它在数量.多样性.速度方法都很出色. 什么是大数据? 大数据是一个大的数据集合,通过传统的计算技术无法进行处理.这些数据集的测试需要使用各种工具.技术和框架进行处理.大数据涉及数据创建.存储.检索.分析,而且它在数量.多样性.速度方法都很出色. 大数据测试类型 测试大数据应用程序更多的是验证其数据处理,而不是测试软件产品的个别功能.当涉及到大数

大数据测试技术研究

大数据的特征: 数据体量巨大(volume) 数据类型繁多(variety) 价值密度低(value) 处理速度快(velocity) 大数据测试的挑战: 平台软件的复杂性和发布节奏之间的矛盾 通用平台支持多种不同应用带来测试用例数的爆炸 对于大规模集群上的问题如何用小规模测试集群暴露 处理流程的5个阶段: 大数据采集 大数据导入/预处理 大数据统计分析 大数据挖掘 大数据分析 大数据测试——功能性测试方法: 数据导入/预处理验证阶段 MapReduce数据输出验证阶段 验证大数据ETL(数据提

大数据测试

什么是大数据 大数据是指无法在一定时间范围内用传统的计算机技术进行处理的海量数据集. 对于大数据的测试则需要不同的工具.技术.框架来进行处理. 大数据的体量大.多样化和高速处理所涉及的数据生成.存储.检索和分析使得大数据工程师需要掌握极其高的技术功底. 需要你学习掌握更多的大数据技术.Hadoop.Mapreduce等等技术. 大数据测试策略 大数据应用程序的测试更多的是去验证其数据处理而不是验证其单一的功能特色. 当然在大数据测试时,功能测试和性能测试是同样很关键的. 对于大数据测试工程师而言

老李分享:大数据测试中java和hadoop关系

Hadoop的创始人是Doug Cutting, 同时也是著名的基于Java的检索引擎库Apache Lucene的创始人.Hadoop本来是用于著名的开源搜索引擎Apache Nutch,而Nutch本身是基于Lucene的,而且也是Lucene的一个子项目.因此Hadoop基于Java就很理所当然了,所以,Hadoop是由Java编写的. Hadoop采用Java编写,因而Hadoop天生支持Java语言编写作业,但在实际应用中,有时候,因要用到非Java的第三方库或者其他原因,要采用C/C