学霸网站之NABCD

1.需求(Need)

随着社会的发展,互联网产业得到了飞速的发展,如今,互联网在各个领域都取得了至关重要的作用,随之而来的数量庞大的数据也让我们每个人在学习生活中倍感压力,如何才能在这些数据中找到自己需要的,如何才能更快捷的,更方便的在大海般的数据中找到自己需要的那一部分。这一切的一切,都是在考验IT工作者对于数据处理的能力。

必须需求:

为了使用户使用更加简单,理解更加容易,为此发展出来关键词抽取以及Tagging这些技术。

  • 所谓关键词,百度百科上这么说:特指单个媒体在制作使用索引时,所用到的词汇。是图书馆学中的词汇。关键词搜索是网络搜索索引主要方法之一,就是希望访问者了解的产品、服务和公司等的具体名称用语。而在我们的学霸网站上,就是是为了文献标引工作, 从报告、论文中选取出来用以表示全文主题内容信息的单词或术语。关键词自动抽取是依靠计算机从文档中选择出反映主题内容的词, 也称作关键词自动标引, 在文献检索、自动文摘、文本聚类/分类等方面有着重要的应用。关键词可以为文档提供一个简短的概括, 使读者能够在短时间内了解文档的大概内容。关键词还是信息检索系统中对文档进行索引、聚类等操作的基础。
  • 所谓Tag,百度百科上这么定义:Tag在中国并没有统一的中文名称,有的称之为“分类”,也有的称之为“开放分类”或“大众分类”,还有的称之为“标签”。Tag(标签)是一种更为灵活、有趣的日志分类方式,可以为每篇日志添加一个或多个Tag(标签),然后可以看到BlogBus上所有和您使用了相同Tag的日志,并且由此和其他用户产生更多的联系和沟通。由此可见,Tag是一种由用户自定义的、用于描述信息的关键词。Tagging是用户为信息赋予Tag的行为。

杀手功能:

  • 从我们小组对目前项目的了解来看,整个网站中登陆,上传文件,翻译文件等显示界面均由wpf设计编写而成,也就是所谓的客户端,而我们要实现网站的全面网页化。

外围功能:

  • 良好的UI设计
  • 可扩展性:可以无需破坏底层的结构而增强功能

辅助功能

  • 提供一系列皮肤,以便用户更加喜欢
  • 提供背景音乐,以便用户在听觉上得到放松。

2.做法 (Approach)

一、 良好的关键词抽取&Tagging算法有利于提高用户体验

  • 为了使得实现算法尽肯能简单而且效果又好,也就是性价比高。我们沿用去年的算法,采用TF-IDF的方法。
  • TFIDF 的主要思想是:如果某个词或短语在一篇文章中出现的频率 TF 高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF

    实际上是:TF×IDF,TF 词频(Term Frequency),IDF 反文档频率(Inverse Document Frequency)。TF 表示词条 t 在文档 d中出现的频率。

  • IDF一般为log(N/n),其中, N 为全部文档数, n 表示包含词条 t 的文档数量。为了使反文档频率更加平滑, 我们做了一些优化, 让IDF=log(N/n+0.01) , 其中某一类中包含词条 t 的文档数为 m。
  • IDF 的主要思想是:如果包含词条 t 的文档越少,也就是 n 越小,IDF 越大,则说明词条 t 具有很好的类别区分能力。如果某一类
    Ci中包含词条 t 的文档数为 m,而其它类包含 t 的文档总数为 k,显然所有包含 t 的文档数 n=m+k,当 m大的时候,n 也大,按照
    IDF 公式得到的 IDF 的值会小,就说明该词条 t
    类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是
    IDF 的不足之处。
  • Tagging的主要思想是:我们有两种算法,一种是相关信息加权的自适应多标签分类算法,一种是基于TF-IDF关键词抽取后的标签算法。如果时间不是特别紧迫,我们会采用第一种算法,以得到最佳效果。

二、良好的交互是用户极致体验的基础

  • 界面设计是网站带给用户的第一体验,良好的用户设计,会使我们的网站形成无形的价值,用户界面设计的三大原则是:置界面于用户的控制之下;减少用户的记忆负担;保持界面的一致性。因此,我们将遵循这三大原则,设计出好的,便于用户使用的界面。
  • 通过对产品的界面和行为进行交互设计,让产品和它的使用者之间建立一种有机关系,从而可以有效达到使用者的目标,这就是交互设计的目的。无论是个性化界面、音乐版块的设置、问题的分类、问题的反馈等等,都是为了创造更加舒适的用户体验。

3.好处 (Benefit)

  我们的产品受众用户以在校学习的学生为主,为学生群体提供查询相关问题信息的服务,不同于其他面向普通大众的搜索网站,将大量关联性较低的信息简单的铺张给用户,我们的产品会将爬好的文本进行数据处理,获取到有效的关键词和标签Tag,除此之外我们还提供中英对照翻译,这些功能对于学生群体来说更具有现实意义。

  对于我们,我们计划在产品成熟后与教育机构间进行合作,一方面我们可以从教育机构初获得更大量、更有价值的教学资料,一方面我们帮助教育机构在学习网站进行商业推广,基于我们的用户中学生群体占据的高百分比,推广的有效性和成功率将会大大的提高。在于教育结构的合作中形成互利双赢的商业运用模式。

4.竞争 (Competitor)

  当前类似本平台的产品种类繁多,各大主流搜索引擎也都推出了相关的产品,例如比较有名的“百度知道”、“360搜索问答”等等。除了这些搜索巨头,一些主流论坛也推出了相关的搜索服务,相比之下我们的产品技术远不够他们成熟,但是我们也有着自己的竞争优势,使我们有理由相信在另据竞争激烈的市场中分一杯羹。

  一、面向用户群体专一,领域针对性强,专业程度高。

  网站采用会员制,通过账户绑定用户,成为会员的用户多为在校人员或者相关领域的专业人员,在问答和丰富网站内容上将会更有专业参考性和学术严谨性,同时系统内部收录相关的专业信息,为问题的解答提供专业的解答。

  二、产品规模小,易于修改,可塑性高,灵活性强

  相比于目前的搜索引擎巨头,我们的服务群体规模小,针对性强,我们得到的用户反馈反应时间短,反馈速度快,能够快速的对网站的功能和结构存在的问题提供及时有效的解决办法。

  三、辅助功能和个性化设计

  本产品附加辅助功能,例如音乐版块、用户自定义主页背景、个性化皮肤等功能,让用户在网站学习知识的同时,在视觉和听觉上得到放松。

5 . 交付 (Delivery)

  宣传途径依靠学生间宣传为主,以网络宣传为辅。

  首先是打开市场,将网站通过QQ群、微信群、微博等主流网络社交软件上发布出去,先从周围同学开始,推荐尝试使用我们的产品,对于每个注册过的用户,将会根据ID生成专属的邀请码,通过传播邀请码而注册的用户,可以获得一些专属的奖励,而成功发布出邀请信息的用户也会获得正向的奖励反馈机制。学生间通过互相推荐来获得用户量,根据社会计算学的理论,学生的社交圈群体成分比较单一,以其他学生为主,所以这种同学间的相互推荐有效性强,成功率高,传播速度快,发展形式丰富。

  其次是通过和其他网站合作,获取其页面上的广告位,相互宣传达到增大彼此用户量的互利共赢的合作模式。

发布位置:

  我们所做的产品,初步打算先发布在北航内部,以同学为主要成员的QQ群、微信群、微博等社交网络软件上发布,然后发到好友学校的同学群中,将我们的产品推广到其他高校中,扩展用户群体,加快用户量发展速度,再之后计划在CSDN、Github等重要的IT平台上,多多益善,进一步推广我们的产品。

  预计用户:

  通过小组成员的宣传,预计用户人数在500左右。

时间: 2024-08-09 14:14:54

学霸网站之NABCD的相关文章

关于学霸网站发布

最近考试扎堆,实在没时间写发布报告,7号考完试之后我们会认真写好发布报告,并对存在的小BUG进行修复,可能对UI进行修改.恳请谅解... 学霸网站的网址:请点我

学霸网站---Alpha+版本测试报告

说明:由于老师前几天要求交测试报告,本测试报告只针对当时完成的功能进行测试,并不是几天之后要发布的BETA版本,不会有很多差别,但是BETA版本会包含对其中BUG的修复. 学霸网站测试报告 一.引言 1.1 编写目的 本测试旨在测试ourteam小组在beta阶段发布的学霸网站,主要是分析我们小组第二阶段的预期目标以及达成情况,针对现有版本进行全面而细致的测试,总结网站现行版本是否符合用户基本需求 1.2 项目背景 网站名称 学霸网站 开发团队 ourteam 面向用户 所有与计算机有关的用户

学霸网站之NABC

1.Need 本次学霸系统的设计是基于学长的版本,在此基础上,我们准备进一步完善已有版块,在用户信息管理.提问.搜索.分类.评论.个性化界面.用户反馈.娱乐.积分获取等方面加入新的功能. 一.用户信息管理: 1,  用户头像设置 2,  网站记住密码功能 3,  忘记密码,通过邮箱找回密码功能 4,  异地账号登录提示(防盗) 5,  还可以添加个人信息,比如擅长的方面.兴趣爱好等,便于结交更多志同道合的人 6,  添加个人关注(关注的问题,有关于C还是Python等)和收藏(收藏自己认为好的回

学霸网站-Alpha版本发布说明

项目名称 学霸网站 项目版本 Alpha 项目团队 ourteam 发布日期 2014-11-23 一.版本的新功能 1.匿名提问 用户提问的时候可以选择匿名提问,这样在问题的详细信息不会显示提出者的相关信息. 选中匿名CheckBox: 点击提交,得到“提交成功”的反馈信息: 在待解决问题可以看见刚刚匿名的提问: 问题详细信息显示页面不会显示提问者的信息: 2.匿名回答 用户在回答问题时可以选择匿名提交,这样在回答列表中不会显示回答者的相关信息. 首先选中“匿名”,弹出提示对话框: 回答列表中

2017软件工程作业---第一次

首先自我介绍一下,我叫李传康,江苏徐州人,毕业于吉林建筑大学,专业是计算机科学与技术,为人还算友善,欢迎随时来扰. 一.下面,让我来回答一些问题: (1)回想一下你曾经对计算机专业的畅想 当初你是如何做出选择计算机专业的决定的?你认为过去接触到的课程是否符合你对计算机专业的期待,为什么?你觉得计算机是你喜欢的领域吗,它是你擅长的领域吗?(注:不可以回答 "不是","是".请把这当成以后工作时面试题,需要回答足够长度,提供足够信息,让对方了解你.比如,给出为什么.)

软件工程课后总结与反思

早就听说罗杰老师的软件工程课是实用性与理论性相结合的课,在这门课上不单单只是简单的编写代码,调试程序,还要做到迭代开发,撰写文档等实际软件工程中所必须要完成的工作.为了锻炼自己的能力,学到一些不一样的知识,这学期我选择了罗杰老师的软件工程课. 课程大概可以分为三个部分,个人项目,双人组队项目,团队项目(五人). 个人项目强调个人能力,包括编写代码的能力,创造力,想象力等等,罗杰老师说过:在实际开发软件的过程中,很少是"单兵作战",但个人能力是团队的基石,只能个人能力出众,团队水准才能不

历年作品点评

1. 团队名:Sevens 作品:北航学堂android客户端 地址:http://www.cnblogs.com/sevens/p/4224618.html 点评:虽然北航现在网上的课程数量较少,导致用户选找不到自己喜欢的课,用户量少,但是在这个信息化的时代,网上授课这一方式一定会越来越热,软件方便了学生及社会各界人士的学习,很有前途.可以联合其他高校,将各学校授课视频整合到一起,加大课程量. 团队名:ourteam 作品:学霸网站 地址:http://www.cnblogs.com/ourt

成员总结

在M1和M2交接之际,我们与学霸客户端以及学霸网站的PM进行了初步的交流,他们两组决定互派代表常驻对方团队,以加强团队之间的交流,进而提高M2阶段的开发效率,而我们团队作为整个学霸项目的中间环节,承担着对于数据格式的定义任务,并且需要将规范化的数据提供给他们两组,但是由于他们两组对于数据格式的要求不尽相同,这就对于我们格式定义造成了极大地困难,经过我们的共同探讨,决定由学霸客户端以及学霸网站两组协商决定统一的数据格式,向我们提出数据需求,然后我们根据他们提出的数据需求来规范化数据,进而为他们提供

Daily Scrum 1 --团队项目所需时间估计以及任务分配

考虑到所有的任务不可能逐一细化分配给成员,我们将需要完成的任务进行了大致的分配.任务所需要的具体实现可以参看<学霸网站NABC> 所需要的总时间一共为44h. 我们会在以后的每日任务中进行细化任务,在细化的过程中可能会导致任务所需时间的增长. -------------------------------------------------------------------------------------------------------------- 在TFS中创建任务并将任务分配给