第五次毕业设计任务书(4.2--4.9)

一、计划进度


时间


内容


4.9-4.15


开始写毕业论文,继续编写毕设代码。


4.16-4.22


大致程序可以运行。


4.23-4.29


继续编写毕设程序,修改细节部分,完成毕业论文初稿。


4.30-4.29


完善毕业论文和毕业设计


4.30-5.6


完善毕业设计和论文


5.6-5.12


毕业论文定稿和准备答辩

二、本周研究内容。

Apriori算法

def createC1( dataSet ):

‘‘‘‘‘

构建初始候选项集的列表,即所有候选项集只包含一个元素,

C1是大小为1的所有候选项集的集合

‘‘‘

C1 = []

for transaction in dataSet:

for item in transaction:

if [ item ] not in C1:

C1.append( [ item ] )

C1.sort()

#return map( frozenset, C1 )

#return [var for var in map(frozenset,C1)]

return [frozenset(var) for var in C1]

def scanD( D, Ck, minSupport ):

‘‘‘‘‘

计算Ck中的项集在数据集合D(记录或者transactions)中的支持度,

返回满足最小支持度的项集的集合,和所有项集支持度信息的字典。

‘‘‘

ssCnt = {}

for tid in D:                  # 对于每一条transaction

for can in Ck:             # 对于每一个候选项集can,检查是否是transaction的一部分 # 即该候选can是否得到transaction的支持

if can.issubset( tid ):

ssCnt[ can ] = ssCnt.get( can, 0) + 1

numItems = float( len( D ) )

retList = []

supportData = {}

for key in ssCnt:

support = ssCnt[ key ] / numItems                   # 每个项集的支持度

if support >= minSupport:                           # 将满足最小支持度的项集,加入retList

retList.insert( 0, key )

supportData[ key ] = support                        # 汇总支持度数据

return retList, supportData

def aprioriGen( Lk, k ): # Aprior算法

‘‘‘‘‘

由初始候选项集的集合Lk生成新的生成候选项集,

k表示生成的新项集中所含有的元素个数

‘‘‘

retList = []

lenLk = len( Lk )

for i in range( lenLk ):

for j in range( i + 1, lenLk ):

L1 = list( Lk[ i ] )[ : k - 2 ];

L2 = list( Lk[ j ] )[ : k - 2 ];

L1.sort();L2.sort()

if L1 == L2:

retList.append( Lk[ i ] | Lk[ j ] )

return retList

def apriori( dataSet, minSupport = 0.5 ):

C1 = createC1( dataSet )                                # 构建初始候选项集C1

#D = map( set, dataSet )                                 # 将dataSet集合化,以满足scanD的格式要求

#D=[var for var in map(set,dataSet)]

D=[set(var) for var in dataSet]

L1, suppData = scanD( D, C1, minSupport )               # 构建初始的频繁项集,即所有项集只有一个元素

L = [ L1 ]                                              # 最初的L1中的每个项集含有一个元素,新生成的

k = 2                                                   # 项集应该含有2个元素,所以 k=2

while ( len( L[ k - 2 ] ) > 0 ):

Ck = aprioriGen( L[ k - 2 ], k )

Lk, supK = scanD( D, Ck, minSupport )

suppData.update( supK )                             # 将新的项集的支持度数据加入原来的总支持度字典中

L.append( Lk )                                      # 将符合最小支持度要求的项集加入L

k += 1                                              # 新生成的项集中的元素个数应不断增加

return L, suppData                                      # 返回所有满足条件的频繁项集的列表,和所有候选项集的支持度信息

def calcConf( freqSet, H, supportData, brl, minConf=0.7 ):  # 规则生成与评价

‘‘‘‘‘

计算规则的可信度,返回满足最小可信度的规则。

freqSet(frozenset):频繁项集

H(frozenset):频繁项集中所有的元素

supportData(dic):频繁项集中所有元素的支持度

brl(tuple):满足可信度条件的关联规则

minConf(float):最小可信度

‘‘‘

prunedH = []

for conseq in H:

conf = supportData[ freqSet ] / supportData[ freqSet - conseq ]

if conf >= minConf:

print(freqSet - conseq, ‘-->‘, conseq, ‘conf:‘, conf)

brl.append( ( freqSet - conseq, conseq, conf ) )

prunedH.append( conseq )

return prunedH

def rulesFromConseq( freqSet, H, supportData, brl, minConf=0.7 ):

‘‘‘‘‘

对频繁项集中元素超过2的项集进行合并。

freqSet(frozenset):频繁项集

H(frozenset):频繁项集中的所有元素,即可以出现在规则右部的元素

supportData(dict):所有项集的支持度信息

brl(tuple):生成的规则

‘‘‘

m = len( H[ 0 ] )

if len( freqSet ) > m + 1: # 查看频繁项集是否足够大,以到于移除大小为 m的子集,否则继续生成m+1大小的频繁项集

Hmp1 = aprioriGen( H, m + 1 )

Hmp1 = calcConf( freqSet, Hmp1, supportData, brl, minConf ) #对于新生成的m+1大小的频繁项集,计算新生成的关联规则的右则的集合

if len( Hmp1 ) > 1: # 如果不止一条规则满足要求(新生成的关联规则的右则的集合的大小大于1),进一步递归合并,

#这样做的结果就是会有“[1|多]->多”(右边只会是“多”,因为合并的本质是频繁子项集变大,

#而calcConf函数的关联结果的右侧就是频繁子项集)的关联结果

rulesFromConseq( freqSet, Hmp1, supportData, brl, minConf )

def generateRules( L, supportData, minConf=0.7 ):

‘‘‘‘‘

根据频繁项集和最小可信度生成规则。

L(list):存储频繁项集

supportData(dict):存储着所有项集(不仅仅是频繁项集)的支持度

minConf(float):最小可信度

‘‘‘

bigRuleList = []

for i in range( 1, len( L ) ):

for freqSet in L[ i ]:                                                      # 对于每一个频繁项集的集合freqSet

H1 = [ frozenset( [ item ] ) for item in freqSet ]

if i > 1:# 如果频繁项集中的元素个数大于2,需要进一步合并,这样做的结果就是会有“[1|多]->多”(右边只会是“多”,

#因为合并的本质是频繁子项集变大,而calcConf函数的关联结果的右侧就是频繁子项集),的关联结果

rulesFromConseq( freqSet, H1, supportData, bigRuleList, minConf )

else:

calcConf( freqSet, H1, supportData, bigRuleList, minConf )

return bigRuleList

三、你本周的体会及需要改进地方。

在数据处理中遇到一些bug和问题,有些部分思路有些混乱,正在解决,所以没有代码。

参考文献:

https://github.com/asaini/Apriori

http://www.jianshu.com/p/00103435ef89

时间: 2024-08-05 03:12:57

第五次毕业设计任务书(4.2--4.9)的相关文章

第一次毕业设计任务书

一.毕业设计安排进度 计划安排时间 计划完成内容 是否完成 2017.3.1---2017.3.7 了解系统需求 是 2017.3.8-2017.3.21 了解算法.数据库以及相关概念 待完成 2017.3.23-2017.5.9 初步毕设,以及完成毕业论文初稿 待完成 2017.5.10-5.28 完善毕业论文和毕业设计,准备答辩 待完成 二.本周研究内容 关联规则 关联规则是由 Agrawal 等人在 1993 年首次提出的,是挖掘数据之间关联知识最常用的方法.关联规则的目的在于在一个数据集

第二周毕业设计任务书(3.8--3.15)

1.周计划表 时间 计划进度 是否完成 3.8--3.15 了解KDDUP99数据集,以及所包含的属性,数据预处理思想   3.16--3.23  代码实现数据预处理   3.24--3.30  与算法的融合   等等     1.本周内容: 1)KDDCUP99数据集 一个网络连接定义为在某个时间内从开始到结束的TCP数据包序列,并且在这段时间内,数据在预定义的协议下(如TCP.UDP)从源IP地址到目的IP地址的传递.每个网络连接被标记为正常(normal)或异常(attack),异常类型被

第七次毕业设计任务书

一.计划进度 时间 内容 4.23-4.29 继续编写毕设程序,修改细节部分,完成毕业论文初稿. 4.30-4.29 完善毕业论文和毕业设计 4.30-5.6 完善毕业设计和论文 5.6-5.12 毕业论文定稿和准备答辩 二.本周研究内容.  from PyQt5 import QtCore, QtGui, QtWidgets class Ui_MainWindow(object):     def setupUi(self, MainWindow):         MainWindow.se

第五次毕业设计

一.计划进度 计划安排时间 计划完成内容 是否完成 2017.4.2-4.10 完成数据集参数的整理挑选.完成matlab下的神经网络程序编写 完成 2017.4.11-4.17 研究怎么不使用工具箱,自己实现神经网络的核心算法   2017.4.18-4.25 基本能够完成核心算法的内容   2017.4.26-5.1 实现基本的数据训练   二.本周完成情况: 下面是matlab的程序和实验截图 代码难点分析: [~, ~, raw] = xlsread('finaltrain.xlsx',

第二次毕业设计任务书(KDD数据研究)

1.周计划表 时间 计划任务 完成情况 3.9-3.16 初步分析了KDD数据,并用程序实现初步处理 50% 3.17-3.24 了解matlab下的神经网络编程,尝试使用工具包完成简单的功能实现 3.24-3.31 对数据进行再次分析处理,根据输出结果筛选出有用的属性值,并对matlab做架构思考   2.本周完成情况 研究KDD数据: 参考网址KDD CUP 99网页,了解41个属性值,并下载源文件决定使用其中的10%样本数据37万条数据作为训练数据(后期可能会思考删除某些属性和对文件条目进

第四次毕业设计任务书

1.进度表 时间 计划进度 是否完成 3.8--3.23  重新进行需求分析并且思考系统的功能模块,并画出用例图.  已完成 3.24--3.30  设计数据库,网页页面设计  未完成 3.31--4.7  网页页面设计,部分功能实现  未完成 等等   2.数据库设计 2.1顾客表customer 顾客编号:customer_id  唯一,主键,非空 顾客名称:customer_name 非空 顾客密码:customer_passwd 非空 顾客邮箱:customer_email 非空 2.2

高级UI交互设计师就业班(签约就业)

联系人:杨老师联系手机:15618824377 联系电话:021-60907382联系QQ:1253379395一.第一阶段(美学设计与软件技能)1.商务办公:windows.word.excel.ppt办公应用:办公软件在专业中的应用2.美术设计基础:设计素描.水粉.速写的原理及实践,投影.视图.透视,灯光表现,户外写生3.美术设计提高:设计素描.水粉提高课程.光和影的写实手法.审美观念的提高.色彩搭配的提高,配色原理的提高.4.手绘图标:二维剪影图标.三维写实图标案例实训,了解创意在设计中的

哪里有基于SSM的毕业进存销管理系统代做

代做基于ssh毕业设计,代写基于ssm毕业设计,哪里有基于java毕业设计,找人做基于javaweb毕业设计,买基于web毕业设计,哪里可以买java毕业设计,哪里有卖java,毕业论文,代做,找人做java,毕业设计成品,代写java,程序加论文,java毕业设计全套,代做java开题报告,java毕业设计任务书 客服:加扣扣(幺零三贰三七幺贰幺) 一,代做介绍我们是计算机专业毕业设计定制平台.我们长期为毕业季的同学定做专属题目的毕业设计论文.之所以是私人订制毕设,那是根据我们长期的接触发现,

毕业设计第二次任务书

1.毕业设计规划 请按照如下表格格式设计毕业设计规划安排. 计划时间 完成内容 备注 2018.2.27--2018.3.9 完成需求分析   2018.3.10 开始毕业设计   2.这2周计划完成内容 完成了主页面的前端显示,包括分类.导航.商品显示,登录,注册页面. 利用django完成models创建,基本的url与setting配置,还有分类,商品,登录,注册的views. 3.用例图 第一次任务书大家已经画好功能模块图,本次任务书可以继续完善功能模块图,并详细描述用例图,如: 可以争