第一次毕业设计任务书

一.毕业设计安排进度


计划安排时间


计划完成内容


是否完成


2017.3.1---2017.3.7


了解系统需求



2017.3.8—2017.3.21


了解算法、数据库以及相关概念


待完成


2017.3.23-2017.5.9


初步毕设,以及完成毕业论文初稿


待完成


2017.5.10-5.28


完善毕业论文和毕业设计,准备答辩


待完成

二.本周研究内容

  关联规则

  关联规则是由 Agrawal 等人在 1993 年首次提出的,是挖掘数据之间关联知识最常用的方法。关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basket analysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名的例子就是"尿布和啤酒"的故事了。

关联规则一般可描述如下: 假设 I = { i1,i2,i3,. . . ,in} 是项目的集合,给定一个事务数据库 D,其中T 是 I 中一些项目的集合,表示 D 中的一个具体事务,TI,每个 T 都有唯一的标志符 TID。假设 X 是一个项目集,当且仅当 X 中的所有项目都在 T 的范围内时表示事务 T 包含 X。

  所以关联规则 X→Y 定义如下:其中,XI,YI,X∩Y = Φ,X 是关联规则的前提,Y是结果,通过支持度和置信度 2 个指标来确定。

  支持度( Support) S 表示 D 中有 S% 的事务同时包含 X 和 Y,即事务集中同时包含 X 和 Y 的事务数在所有事务数中的百分比。

                support = P(A并B)

  置信度( Confidence) C 表示 D 中包含 X 的事务中有 C% 包含 Y,即事务集中同时包含 X 和 Y 的事务数在包含 X 的事务数中的百分比。

                confidence = support(A并B)/suport(A)

  所以支持度表示了此关联规则在事务中的发生频率,而置信度表示了此关联规则的强度。如果存在一条关联规则,它的支持度和置信度都大于预先定义好的最小支持度与置信度,我们就称它为强关联规则。关联规则挖掘就是为了找到所有的强关联规则,因此挖掘的主要步骤也分为 2 步,第一步是找到所有的频繁项集( 即超过最小支持度的所有项集) ,第二步则在这些频繁项集中找出超过最小置信度的关联规则。

    Apriori 算法

  在众多的关联规则算法中,Apriori 算法是最有影响的挖掘频繁项集的算法。该算法的基本思想是: 首先找出所有的频繁项集,这些项集出现的频繁性至少和预定义的最小支持度一样,然后由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小置信度。然后使用第一步找到的频繁项集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是关联规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小置信度的规则才被留下来。为了生成所有频繁项集,使用递归的方法,在频繁 1-项集中连接产生对应的候选2-项集,然后计算得到频繁 2-项集,继而产生候选 3-项集和频繁 3-项集,直到没有频繁 k-项集的产生。其算法描述如下:

  1) L1= find_frequent_1-itemsets( D) ;

  2) for( k = 2; Lk - 1≠Φ; k ++ ) {

  3) Ck= apriori_gen( Lk - 1,min_sup) ;

  4) for each transaction t∈D { / / scan D for counts

  5) Ct= subset( Ck,t) ; / /get the subsets of t they are candi-dates

  6) for each candidate c∈Ct

  7) c. count + + ;

  8) }

  9) Lk= { c∈Ck| c. count≥min_sup}

  10) }

  11) Return L = ∪kLk;

三、周实现代码及结果截图展示。

  无

四、本周的体会及需要改进地方。

  关联规则主要关于可信度或置信度(confidence),要继续关于apriori的学习,同时,还得继续深入学习python

五、本周参考的文献。

  1. 杨秀萍.大数据下关联规则算法的改进及应用[J].计算机与现代化,2014,12:23-24
  2. http://www.cnblogs.com/junyuhuang/p/5572364.html
时间: 2024-10-19 04:12:02

第一次毕业设计任务书的相关文章

第二周毕业设计任务书(3.8--3.15)

1.周计划表 时间 计划进度 是否完成 3.8--3.15 了解KDDUP99数据集,以及所包含的属性,数据预处理思想   3.16--3.23  代码实现数据预处理   3.24--3.30  与算法的融合   等等     1.本周内容: 1)KDDCUP99数据集 一个网络连接定义为在某个时间内从开始到结束的TCP数据包序列,并且在这段时间内,数据在预定义的协议下(如TCP.UDP)从源IP地址到目的IP地址的传递.每个网络连接被标记为正常(normal)或异常(attack),异常类型被

第一次毕业设计任务

一. 毕业设计安排进度 计划安排时间 计划完成内容 是否完成 2017.3.1---2017.3.7 了解系统需求 是 2017.3.8---2017.4.1 整理项目需要制作的细节 2017.4.2-2017.5.1 具体代码实现到最后完工 2017.5.2---2017.5.22 完成论文部分内容,并且为答辩做好准备 二.本周研究内容. 1.理清思路,整理出项目的需求,包括确定游戏的类型决定做横版ARPG游戏(参考游戏<冒险岛>).游戏中涉及到的场景设想等. 2.对unity中需要使用的C

第五次毕业设计任务书(4.2--4.9)

一.计划进度 时间 内容 4.9-4.15 开始写毕业论文,继续编写毕设代码. 4.16-4.22 大致程序可以运行. 4.23-4.29 继续编写毕设程序,修改细节部分,完成毕业论文初稿. 4.30-4.29 完善毕业论文和毕业设计 4.30-5.6 完善毕业设计和论文 5.6-5.12 毕业论文定稿和准备答辩 二.本周研究内容. Apriori算法 def createC1( dataSet ): ''''' 构建初始候选项集的列表,即所有候选项集只包含一个元素, C1是大小为1的所有候选项

第七次毕业设计任务书

一.计划进度 时间 内容 4.23-4.29 继续编写毕设程序,修改细节部分,完成毕业论文初稿. 4.30-4.29 完善毕业论文和毕业设计 4.30-5.6 完善毕业设计和论文 5.6-5.12 毕业论文定稿和准备答辩 二.本周研究内容.  from PyQt5 import QtCore, QtGui, QtWidgets class Ui_MainWindow(object):     def setupUi(self, MainWindow):         MainWindow.se

第二次毕业设计任务书(KDD数据研究)

1.周计划表 时间 计划任务 完成情况 3.9-3.16 初步分析了KDD数据,并用程序实现初步处理 50% 3.17-3.24 了解matlab下的神经网络编程,尝试使用工具包完成简单的功能实现 3.24-3.31 对数据进行再次分析处理,根据输出结果筛选出有用的属性值,并对matlab做架构思考   2.本周完成情况 研究KDD数据: 参考网址KDD CUP 99网页,了解41个属性值,并下载源文件决定使用其中的10%样本数据37万条数据作为训练数据(后期可能会思考删除某些属性和对文件条目进

第四次毕业设计任务书

1.进度表 时间 计划进度 是否完成 3.8--3.23  重新进行需求分析并且思考系统的功能模块,并画出用例图.  已完成 3.24--3.30  设计数据库,网页页面设计  未完成 3.31--4.7  网页页面设计,部分功能实现  未完成 等等   2.数据库设计 2.1顾客表customer 顾客编号:customer_id  唯一,主键,非空 顾客名称:customer_name 非空 顾客密码:customer_passwd 非空 顾客邮箱:customer_email 非空 2.2

哪里有基于SSM的毕业进存销管理系统代做

代做基于ssh毕业设计,代写基于ssm毕业设计,哪里有基于java毕业设计,找人做基于javaweb毕业设计,买基于web毕业设计,哪里可以买java毕业设计,哪里有卖java,毕业论文,代做,找人做java,毕业设计成品,代写java,程序加论文,java毕业设计全套,代做java开题报告,java毕业设计任务书 客服:加扣扣(幺零三贰三七幺贰幺) 一,代做介绍我们是计算机专业毕业设计定制平台.我们长期为毕业季的同学定做专属题目的毕业设计论文.之所以是私人订制毕设,那是根据我们长期的接触发现,

毕业设计第二次任务书

1.毕业设计规划 请按照如下表格格式设计毕业设计规划安排. 计划时间 完成内容 备注 2018.2.27--2018.3.9 完成需求分析   2018.3.10 开始毕业设计   2.这2周计划完成内容 完成了主页面的前端显示,包括分类.导航.商品显示,登录,注册页面. 利用django完成models创建,基本的url与setting配置,还有分类,商品,登录,注册的views. 3.用例图 第一次任务书大家已经画好功能模块图,本次任务书可以继续完善功能模块图,并详细描述用例图,如: 可以争

毕业设计第三次任务书

1.这2周毕设完成内容 请把做的内容及核心代码贴图展示.按模块贴,并加上适当文字说明怎么实现的?遇到过什么问题,如何解决. 普通用户登录界面: 主要代码: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>登陆页面</title> <link rel="stylesheet" type="text/css&qu