由于我的pair并没有做第一次的个人项目,所以我这次复审的是我舍友刘翔宇的代码。
刘翔宇的代码有以下的优点:
1、结构很鲜明,为mode1、2、3编辑了几乎相同的方法。对mode1、2、3的整合思路很清晰。用同样的方法解决了有一定区别的问题。
2、将用到的不同功能细化在不同的方法内。
缺点如下:
1、注释较少,不利于维护以及改写。
2、mode1、2、3所对应的handleline、handleline2、handleline3所实现的功能基本一样。使得代码行数成倍增加,并且有可能因为细微的区别导致看似一致的方法有的能够成功实现功能,有的不能。
可以考虑将作用重复的部分创立一个独立的方法,然后在mode1、2、3中重复调用这个方法,再在不同mode中细分区别。
3、算法效率较低,在二字词组与三字词组的词频统计时遍历了全部的二字词组和三字词组。
对于多字词组,可以考虑按照已经统计了的少一个字的词组(或者单词)的频率,从高到低选择一定数量的词组(或词),结合后面的单个单词进行遍历。
时间: 2024-10-15 05:10:38