1.Git地址:
https://github.com/Hare-Lucius/WordCountPro
2.PSP表格
|
3.接口实现:
输入模块会以String形式传入待处理的文件名,本模块将文件内的单词进行词频统计,并按照词频进行升序排列,对于频率相同的单词,按照字母顺序进行二次排列,并将单词和频率分别存入两个数组中。本模块的输出为两个数组的数组名,将传入输出模块进行后续处理。在实际代码编 写过程中,对文件进行行处理。规定a-z、A-Z和“-”为单词字符,对每一行进行扫描,遇到非单词字符则跳过,遇到单词字符则进行标记直至遇到非单词字符,再向前扫描至非“-”字符,所得子串为一个单词。判断该单词是否已录入数组,若是则频率自增,否则录入该单词并设频率为1。对 文章统计完毕后,将频率数组进行排序,考虑到时间开销 ,此处采用快速排序,交换频率次序的同时也要交换单词的次序。之后,对于同频率的单词,利用Arrays.sort()函数进行单词排序,由于频率相同,故只需交换单词次序。
4.测试用例:
5.单元测试:
5.小组得分
0.1
(小组情况:17044:核心模块,0.38;17062:输入模块,0.2;17065:输出模块,图形界面,0.32;17064:其他模块,0.1)
参考地址:
https://blog.csdn.net/jav_zhangwei/article/details/76546226
https://www.zhihu.com/question/21682976
原文地址:https://www.cnblogs.com/StrangeT/p/8747934.html
时间: 2024-10-29 16:01:11