201671010416 焦少梅 实验二 词频统计项目

实验二 软件工程个人项目

实验目的与要求

  • 掌握软件项目开发流程
  • 掌握Github上发布软件项目的操作方法。

实验内容和步骤

任务1:

需求分析:

  • 尝试按照《构建之法》第2章中2.3所述PSP流程,使用JAVA编程语言,独立完成一个英文文本词频统计的软件开发
  • 程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
  • 程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
  • 指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
  • 高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
  • 统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

    功能设计:

  • 基本功能:能够按照需求分析满足对英文文本的查询,基本实现文本中单词查询。
  • 扩展功能:生成result.txt文件,可以统计10万以上的单词

    设计实现:

    测试运行:

满意代码:

PSP:

PSP2.1 任务内容 计划共完成需要的时间(min) 实际完成需要的时间(min)
Planning 计划 5 6
Estimate 估计这个任务需要多少时间,并规划大致工作步骤 16 5
Development 开发 14 15
Analysis 需求分析 (包括学习新技术) 2 5
Design Spec 生成设计文档 34 24
Design Review 设计复审 (和同事审核设计文档) 4 6
Coding Standard 代码规范 (为目前的开发制定合适的规范) 3 3
Design 具体设计 18 26
Coding 具体编码 46 25
Code Review 代码复审 7 4
Test 测试(自我测试,修改代码,提交修改) 13 31
Reporting 报告 6 4
Test Report 测试报告 4 2
Size Measurement 计算工作量 4 2
Postmortem & ProcessImprovement Plan 事后总结 ,并提出过程改进计划 3 3

源码地址:(https://github.com/Athena-SM/homework/blob/master/Cp.java)

原文地址:https://www.cnblogs.com/jiaoshaomei/p/10555407.html

时间: 2024-08-15 03:13:41

201671010416 焦少梅 实验二 词频统计项目的相关文章

分析“词频统计“项目进程

目录 功能需求 代码实现 psp 功能需求 1.小文件输入 2.支持命令行输入英文作品的文件名 3.支持命令行输入存储有英文作品文件的目录名,批量统计 4从控制台读入英文单篇作品 代码实现 本次代码实现了功能3. 类名 功能 void main(String[]) 主函数,调用其他函数实现基本功能 void SortMap(Map<String ,Integer>) 对Map进行排序 void Outputlist(Scanner) 对所给目录下文档进行统计并输出 void wordcont(

201671010454词频统计软件项目报告

一.课程名称:2016级计算机科学与工程学院软件工程(西北师范大学) 二.课程要求:实验二 软件工程个人项目 三.实验目标: (1)掌握软件项目个人开发流程. (2)掌握Github上发布软件项目的操作方法. 四.实验内容: (一)需求分析 程序可读入任意英文文本文件,改文件中英文词数大于等于1个,且能读取容纳英文原版<哈利波特>10万词以上的文章. 指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图. 高

201671010441徐浩杰 词频统计软件项目报告

实验二.软件工程个人项目 一.需求分析 尝试按照<构建之法>第2章中2.3所述PSP流程,使用JAVA编程语言,独立完成一个英文文本词频统计的软件开发.软件基本功能要求如下: •程序可读入任意英文文本文件,该文件中英文词数大于等于1个. •程序需要很壮健,能读取容纳英文原版<哈利波特>10万词以上的文章. •指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图. •高频词统计功能:用户从键盘输入高

(第二周)新英文词频统计

需求分析 1.两种读取文件的方法(建立两个类):  小文本输入.命令行输入文件名 2.进行词频统计 3.对结果进行排序并输出 https:https://git.coding.net/yanzouzhe/ywcptj.git SSH:[email protected]:yanzouzhe/ywcptj.git 功能实现 1.小文本输入读取文件 public class Article { /** * @param args */ String content;// 保存文章的内容 String[

实验二-3 Hadoop&amp;Paoding 中文词频统计

  参考教程 在Hadoop上使用庖丁解牛(较复杂,并未采用,可以之后试试) http://zhaolinjnu.blog.sohu.com/264905210.html Lucene3.3.Lucene3.4中文分词——庖丁解牛分词实例(屈:注意版本) http://www.360doc.com/content/13/0217/13/11619026_266124504.shtml 庖丁分词在hadoop上运行时的配置问题(采纳了一半,没有按照其所写配置dic属性文件) http://f.da

Hadoop之词频统计小实验(基于单节点伪分布)

声明:1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0. 3)统计词频工作在单节点的伪分布上,至于真正实际集群的配置操作还没有达到,希望能够由本文抛砖引玉. (一)Hadoop的配置修正 网上有很多Hadoop的配置教程,可自行寻找,这一部分主要是根据自身实际情况,结合自身特点,设置Hadoop.因为有时候根据别人的教程,设置总是不成功,因为别人的教程依赖于别人的软件或操作环境特点. 本部分也

Hadoop的改进实验(中文分词词频统计及英文词频统计)(4/4)

声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不清楚配置可看<Hadoop之词频统计小实验初步配置> 3)本文由于过长,无法一次性上传.其相邻相关的博文,可参见<Hadoop的改进实验(中文分词词频统计及英文词频统计) 博文目录结构>,以阅览其余三篇剩余内容文档. (五)单机伪分布的英文词频统计Python&Streamin

词频统计-功能二

一.完成一个小程序 今天的任务是处理一本英文小说.我处理的英文小说是<war and peace> 本想着用多线程来解决的,发现看书还不是太懂,并不能真正动手编程. 我在编程的过程中主要遇到了以下两个问题: 1.在对整个英文小说进行单词总数统计遇见困难. 2.字符串数组的空字符串处理问题.因为我开始用空格来代替标点等不是英文单词来进行对单词分割,其中用到了正则表达式,后来统计对单词出现频数时,发现空格竟然排第一名,有4万多空格. 最终我的处理方式是使用List泛型集合的ForEach方法循环获

实验二 统计压缩方法的具体实现

实验二  统计压缩方法的具体实现 一.实验要求对给定的数据文件,完成以下操作:1. 编写一段程序,计算其中一些图像和语音文件的一阶熵.2. 选择一个图像文件,并计算其二阶熵.试解释一阶熵和二阶熵之间的差别. (一阶熵.二阶熵的计算,使用到的VC工程分别为:entropy.dsw.sec_entropy.dsw ) 二.实验内容(这里具体描述相对实验要求的内容细节)1.实验基本思路/实验平台,含软硬件(如:你使用的是何种工具等内容)2.实验准备知识(该实验中涉及到的知识点)3.实验的具体实现(针对