团队作业 & alpha最终测试报告

  本次ALPHA版本测试是依据Daily Scrum11.16(http://www.cnblogs.com/newbe/p/4101339.html)分配的任务有序进行的,从11.16~11.23。为期一周。测试中期报告在Daily Scrum11.19(http://www.cnblogs.com/newbe/p/4109441.html)有所记录,这篇博客发布的是alpha版本最终测试报告。

一、功能测试部分(负责人:黄伟龙)

1  bug记录与描述

bug1:无法爬取出错页面

  bug发现时间:11.18  发现人:黄伟龙

  bug描述:当爬取到含有“错误404”信息的页面时,程序会出错并抛出异常:Exception in thread "Thread-11" java.lang.IllegalArgumentException: Invalid uri ‘http://tieba.baidu.com/home/main?un=?????1‘: Invalid query
at org.apache.commons.httpclient.HttpMethodBase.<init>(HttpMethodBase.java:222)
at org.apache.commons.httpclient.methods.GetMethod.<init>(GetMethod.java:89)
at DownLoadFile.run(DownLoadFile.java:59)

  bug现状:已解决

  解决时间:11.20

  解决人:王骜

bug2:无法爬取URL带汉字的页面

  bug发现时间:11.18   发现人:黄伟龙

  bug描述:如百度搜索中的URL常常包括汉字的keywords,我们的程序未进行转码从而抛出异常:Exception in thread "Thread-13" java.lang.IllegalArgumentException: Invalid uri ‘http://tieba.baidu.com/f/index/forumpark?cn=??????&ci=0&pcn=???&pci=0&ct=1&rn=20&pn=1‘: Invalid query
at org.apache.commons.httpclient.HttpMethodBase.<init>(HttpMethodBase.java:222)
at org.apache.commons.httpclient.methods.GetMethod.<init>(GetMethod.java:89)
at DownLoadFile.run(DownLoadFile.java:59)

  bug现状:已解决

  解决时间:11.20

  解决人:刘垚鹏

bug3:爬取到一些特殊网页时仍会爬取终止

  bug发现时间:11.20~11.22   发现人:黄伟龙

  bug描述:当爬取到一些特殊的网页时,会出现不同的错误从而导致程序终止,目前未查明终止原因。

  网页a):http://www.baidu.com/tools?url=http%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DNskdEksJ6QQkpJtnmtSyPbNzqGauYttowpsasJ50aLyff47pVWOD7j811WDN6kDjtDU21-1vWuv4KEUvWbhQd_&jump=http%3A%2F%2Fkoubei.baidu.com%2Fwomc%2Fp%2Fsentry%3Ftitle%3D%02lyp%03_%02lyp%03%E4%BB%B7%E6%A0%BC%01_%01%E4%BC%98%E8%B4%A8%02lyp%03%E6%89%B9%E5%8F%91%01%2F%01%E9%87%87%E8%B4%AD%01%20%01-%01%20%01%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%01%26q%3Dlyp&key=surl  (阿里巴巴-百度口碑)

异常记录为(异常可以复现):

[email protected]
Please check your provided http address!
org.apache.commons.httpclient.InvalidRedirectLocationException: Invalid redirect location: http://koubei.baidu.com/womc/p/sentry?surl=http%3A//www%2E1688%2Ecom/chanpin/%2D6C7970%2Ehtml&token=A3CDD44B05BE20D3477B699A3B4F1A07&title=lyp_lyp??????_??????lyp??????/??????+-+????????????&q=lyp
at org.apache.commons.httpclient.HttpMethodDirector.processRedirectResponse(HttpMethodDirector.java:619)
at org.apache.commons.httpclient.HttpMethodDirector.executeMethod(HttpMethodDirector.java:179)
at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:397)
at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:323)
at DownLoadFile.run(DownLoadFile.java:71)
Caused by: org.apache.commons.httpclient.URIException: Invalid query
at org.apache.commons.httpclient.URI.parseUriReference(URI.java:2049)
at org.apache.commons.httpclient.URI.<init>(URI.java:147)
at org.apache.commons.httpclient.HttpMethodDirector.processRedirectResponse(HttpMethodDirector.java:601)
... 4 more

  网页b):http://image.baidu.com/channel?c=摄影&t=全部&s=0?fm=index&c=%E6%91%84%E5%BD%B1&t=%E4%BA%BA%E5%83%8F

异常记录为(异常可以复现):

Exception in thread "Thread-532" java.lang.IllegalArgumentException: Invalid uri ‘http://image.baidu.com/channel?c=摄影&t=全部&s=0?fm=index&c=%E6%91%84%E5%BD%B1&t=%E4%BA%BA%E5%83%8F‘: Invalid query
at org.apache.commons.httpclient.HttpMethodBase.<init>(HttpMethodBase.java:222)
at org.apache.commons.httpclient.methods.GetMethod.<init>(GetMethod.java:89)
at DownLoadFile.run(DownLoadFile.java:59)

  网页c):http://tieba.baidu.com/f/index/forumpark?cn=???????&ci=0&pcn=???&pci=0&ct=1&rn=20&pn=1‘

异常记录(异常可以复现):

nvalid query
at org.apache.commons.httpclient.HttpMethodBase.<init>(HttpMethodBase.java:222)
at org.apache.commons.httpclient.methods.GetMethod.<init>(GetMethod.java:89)
at DownLoadFile.run(DownLoadFile.java:59)

bug现状:待解决

bug解决计划:在beta版本修改这个bug

2 程序性能报告

网址:http://ask.csdn.net
爬取页面数:100
远航所有时间:22898(毫秒,下面的数字都用毫秒计算)
newbe所用时间:24318
cpu占有率:34.3%-44.7%
所占内存:161.6MB
爬取页面数:1000
远航所用时间:596204
newbe所用时间:855707
cpu占有率:29.6%-43.8%
所占内存:199.1-228.6MB
极限情况:
尝试爬取10000个页面,但是由于爬取速度随着爬取页面数的增加明显减慢,导致爬取过程缓慢,而且中途经常出现异常,最终最高达到4571个页面,时间:8378920(毫秒),花费了2小时以上,感觉这种极限极限测下去意义不是很大,所以就停止了。爬虫速度越爬越慢感觉非常明显,而且测试的时候偶然性很大,和电脑运行时的情况也有很大关系,而且测试人黄伟龙测试的时候爬取失败率较高,失败率达到20-%-30%,这方面在beta版本可以改进。

3 功能报告

a)关键字搜索功能:

  测试了50组关键字搜索,包括中文英文字符,到目前为止,关键字搜索功能目前未测出bug,可以正确支持中文英文字符等各种输入,出现的异常都与关键字搜索功能无关

b) 多网址搜索功能:

  测试了20组多网址搜索功能,爬取页面数量从1到20,目前未测出bug,都可以正常进行搜索爬取,出现的异常都与
多网址搜索功能无关

二、UI测试部分(负责人:马佐霖)

1 bug记录与描述

  未发现UI交互、图表显示中有任何bug

2 UI改进建议

a.单词错误:how much pages 改为how many pages

b.how to use 按钮的位置不合理,目前是处于how much pages后面,逻辑性不强。改善建议是将其放在整个界面的顶部,并且将其长度拉长,使用户第一眼看到的的就是我们的how to use

重新编写"how to use"button如下:

1.输入网址:在URL Seed中输入爬取的网址,可以输入多个网址(缺省为百度搜索);或者选择yes按钮后用Select File按钮选择包含多个URL地址的txt文件
2.输入关键词:在Keyword中输入即可(缺省为通常爬取)
3.输入爬取数:在How Many Pages中输入即可(无缺省,必须爬取)
4.爬取:点击Start按钮;爬取开始后可以暂停Pause和继续Continue
5.分析:点击Analyze按钮呈现网页分布饼状图
PS:
1.运行本爬虫软件需要连接指定服务器,服务器不是全天开启的,不连接服务器本软件无法正确运行。
2.本爬虫软件具有关键字搜索功能,并且可以展示爬取过程。
3.Keyword关键字搜索,可以通过输入关键字对爬取的网页进行过滤处理,只爬取带有关键字的网页(并进行排序,得到根据热度排列的相对最优结果);
4.由于爬取速度有限,建议爬取网页的数量不要输入太多。
5.当爬取成功网页数达到How Many Pages中输入的网页数量时,爬取过程将会停止。
6.analyze中的饼状图是对服务器中存有的所有网页进行分类分析;条形图是本次爬取中根据热度排列的结果。

c.or you can select the file按钮应放在第二模块的位置,即放在URL seed 下面,同时改名为or select the URL file(txt)。改动理由是这个模块与URL seed模块功能是一致的,同时其名字也应直接显示其功能

d.应统一所有按钮说明的单词写法,全部改为每个单词首字母大写。URL seed-> URL Seed,keyword->Keyword,how many pages->How Many Pages等

三、可靠性与安全性测试(测试人:李桐)

1、bug记录与描述:无

2 可靠性与安全性测试结果记录:

测试内容 要求 测试结果
爬取内容实时下载 在爬虫程序意外或者人为中断时,已经爬取到的HTML内容已经保存 实现
掉电 客户机掉电或强行关机后重启机器,不丢失数据。 实现
爬取内容找回 在意外删除或者人为删除爬取到的HTML内容时,能通过某些途径实时找回 未实现

安全性:

测试内容 要求 测试结果
数据库安全性 数据库对于用户而言仅有查询的权限而没有修改、删除等权限 实现
爬取到的信息的安全性 所爬取到的信息放在特定的路径内,只有指定用户可以提取 实现

综述与一些话:

  我们没有进行bug bash。因为已经明确了分工与流程,我们“测试---反馈---修正”执行的也比较好,bug在不断地被发现并被更正,所以PM李桐认为并没有组织bug bash的必要。而且周末和最近一段时间我们在与C705组在解决数据库的连接问题,比较忙,所以没有进行bug bash,希望老师理解。  

  我们没有"Scenario testing",因为我们用户只有c705一组。。

  我们也没做矩阵测试,因为只有这一个服务器一个数据库。。

  总之,我们的alpha版本项目圆满完成,等待老师的验收。

  还有bug仍然存在,我们会在beta版本中继续完善我们的项目。

时间: 2024-10-10 18:09:02

团队作业 & alpha最终测试报告的相关文章

团队作业——Alpha冲刺 11/12

团队作业--Alpha冲刺 冲刺任务安排 杨光海天 今日任务:预览界面布局实现,并留下交互接口 明日任务:预览界面中自定义保存的实现 郭剑南 今日任务:尝试解决Python编写程序无法在Android运行的问题 赖志平 今日任务: 明日任务: 吴伟根 今日任务: 明日任务: 郑珍发 今日任务:今天的任务是优化代码,美化布局,完善功能,修改个人技术博客. 明日任务:明天的任务是要实现功能和界面对接,完成alpha阶段. 周琪文 今日任务:尝试失败,继续配置gpu加速以及服务器代码 朱晓健 今日任务

团队作业——Alpha冲刺 12/12

团队作业--Alpha冲刺 冲刺任务安排 杨光海天 今日任务:自定义保存界面布局以及交互接口函数的实现 明日任务:总结项目中的问题,为什么没能按照预期推进项目 郭剑南 今日任务:继续解决Python编写程序无法在Android运行的问题 赖志平 今日任务: 明日任务: 吴伟根 今日任务: 明日任务: 郑珍发 今日任务:今天的任务是将个人完成的界面和功能部分通过git上传,并辅助进行整合的队友完成整合形成完整的app 明日任务:进行下一阶段的计划和必要学习. 周琪文 今日任务:尝试失败,继续配置g

2016福州大学软件工程第五、六次团队作业-Alpha阶段成绩汇总

1.本次作业成绩统计结果: 本次Alpha阶段团队作业公布如下: 表格说明: PE:贡献百分比 YS:演示评分(满分15分) BK:博客评分(满分15分) SH:事后诸葛亮环节(满分5分) P:个人分数 个人分数=0.7*团队分数+0.3*贡献比*团队分数*团队人数 学号 组别 PE YS BK SH 个人分数 031402606 606notconnected 16.00 13.50 14.00 4.00 31.122 031402631 18.00 13.50 14.00 4.00 32.2

团队作业9--beta版本测试报告及发布说明

Beta版本测试报告 1.bug的分类 a.修复的bug 部分用户无法获取位置 e. 这个bug的确应该修复,但是没有时间在这个版本修复,延迟到下一个版本修复. 前端无法查看用户签到信息 2.场景测试 a. 预期不同的用户如何使用我们的软件: 管理:进入后台查看签到情况成员:进入微信公众号签到 b. 用户的需求和目标: 快速签到 c. 软件提供的功能满足用户的需求: 满足基本的定位签到功能 3.测试矩阵(test matrix) 4.出口条件(exit criteria) 目前只能适用范围过小,

团队作业5——测试与发布(Alpha版本)

Alpha版本测试报告 报告要求 请根据团队项目中软件的需求文档.功能说明.系统设计和测试计划,写出软件的测试过程和测试结果,并回答下述问题. 测试过程 1.运行app,界面显示正常,没有卡顿情况. 2.点击搜索框,出现26字母键盘,正常. 3.输入英文单词,按图示中红框部分均能实现搜索,键盘不会自动收回,需要点击主界面.能正确显示单词释义 4.点击主界面之后键盘收起,显示的内容有单词的音标,基本释义,以及例句.基本释义前有词性,例句的白色框可以向下滑动查看更多例句,期间其他部分保持不动.点击发

团队作业6——展示博客(Alpha版本)

Deadline: 2017-12-3  23:00PM,以博客发表日期为准 评分基准 按时交 - 有分,检查的项目包括后文的两个方面 团队成员介绍 Alpha阶段进展 团队合作,各成员分工 Beta阶段展望 晚交 - 0分 迟交一周以上 - 倒扣本次作业分数 抄袭 - 倒扣本次作业分数 展示博客 1. 团队成员的简介和个人博客地址,团队的源码仓库地址. 2. 我们要做软件工程,那就要有一点工程的样子: a. 团队项目的目标,预期的典型用户,预期的功能描述,预期的用户数量在哪里? b. 团队的产

团队作业4——第一次项目冲刺(Alpha版本)

1.团队作业4--第一次项目冲刺(Alpha版本)-第一篇 2.团队作业4--第一次项目冲刺(Alpha版本)-第二篇 3.团队作业4--第一次项目冲刺(Alpha版本)-第三篇 原文地址:https://www.cnblogs.com/daleag/p/8284758.html

软工网络15团队作业4——Alpha阶段敏捷冲刺3.0

软工网络15团队作业4--Alpha阶段敏捷冲刺3.0 1.每天举行站立式会议,提供当天站立式会议照片一张. 2.项目每个成员的昨天进展.存在问题.今天安排. 昨天已完成的工作: (1)完成服务器的搭建: (2)完成部分数据库的搭建: (3)完成入口界面的设计: (4)完成我的打卡动态界面. 今天计划完成的工作: (1)完成部分新建话题页面的设计: (2)完成部分我的设置页面的设计: (3)完成部分我的话题记录的设计: (4)完成了数据库的搭建. 工作中遇到的困难: (1)今天的任务主要是一个缓

软工网络15团队作业4——Alpha阶段敏捷冲刺4.0

软工网络15团队作业4--Alpha阶段敏捷冲刺4.0 1.每天举行站立式会议,提供当天站立式会议照片一张. 2.项目每个成员的昨天进展.存在问题.今天安排. 昨天已完成的工作: (1)完成部分新建话题页面的设计: (2)完成部分我的设置页面的设计: (3)完成部分我的话题记录的设计: (4)完成了数据库的搭建. 今天计划完成的工作: (1)完成首页的页面设计: (2)完成新建动态页面的设计: (3)完成总新建页面的设计: 工作中遇到的困难: (1)前端的页面设计都还不够美观. (2)可能因为都