顶尖数据挖掘教学案例库(TipDM-C10)产品白皮书

 

 

 

顶尖数据挖掘教学案例库

(TipDM-C10)

 

 

 

 

 

产  品  说  明  书

广州泰迪智能科技有限公司 版权所有

地址: 广州市经济技术开发区科学城232号

网址: http://www.tipdm.com

邮箱: [email protected]

热线: 40068-40020

企业QQ:40068-40020

邮编: 510663

电话: (020)82039399

目  录

1                     概述............................................................................................................... 3

2                     产品构成........................................................................................................ 5

2.1             案例技术方案书.......................................................................................... 5

2.2             配套数据文件.............................................................................................. 5

2.3             配套用例程序.............................................................................................. 6

3                     联系我们........................................................................................................ 8

1  
概述

顶尖数据挖掘教学案例库(又称10个精选数据挖掘案例及实践演练,TipDM-C10,简称C10)是泰迪科技在数据挖掘领域探索10余年和高校资深讲师联合经验总结之作,内容涵盖电信、电力、制造、互联网、银行、水产、税务等诸多行业,特别适合有数据挖掘相关课程教学的高校、研究所和培训机构,也可作为个人学习数据挖掘技术的最佳素材。

10个精选数据挖掘案例包括为:

1)  
电力窃漏电用户自动识别

案例描述:通过采集电力计量自动化系统的电流、电压、功率因数等用电负荷数据,用电异常等终端报警信息以及电力营销系统提供的历史窃漏电用例,归纳出窃漏电用户的关键特征,构建出窃漏电用户的识别模型,最终通过监测用户用电数据,实现窃漏电用户的实时在线诊断。

实践演练环境:MATLAB、SAS、SPSS、R

2)  
航空公司客户价值分析

案例描述:激烈的市场竞争,各个航空公司都推出了更优惠的营销方式来吸引更多的客户,国内航空公司大多都面临着常旅客流失、竞争力下降、航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的客户服务。

实践演练环境:MATLAB、SAS、SPSS、R

3)  
中医证型的关联规则挖掘

案例描述:借助三阴乳腺癌患者的病理信息,发现中医症状间的关联关系和诸多症状间的规律性,挖掘潜性证素,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。这样患者在治疗过程中,医生可以有效的减少西医以及化疗治疗的毒副作用,为后续治疗打下基础。

实践演练环境:MATLAB、SAS、SPSS、R

4)  
基于水色图像的水质评价

案例描述:由于水色能反映水中浮游植物的种类和多少,因此可通过观察水色变化来调控水质,维持养殖水体生态系统中浮游植物、微生物类、浮游动物等合理的动态平衡。通过历史水产专家经验判断结果以及用数码相机按照标准进行水色采集的数据,利用图像处理技术,实现基于水色图像的水质自动评价。

实践演练环境:MATLAB、SAS、SPSS、R

5)  
应用系统负载分析与磁盘容量预测

案例描述:与应用系统关联的任何一种资源负载过大,都可能会引起系统性能下降甚至瘫痪。通过分析磁盘容量相关数据,预测应用系统服务器磁盘空间是否满足系统健康运行的要求。根据用户需求设置不同的预警等级,将预测值与容量值进行比较,对其结果进行预警判断,为系统管理员提供定制化的预警提示。

实践演练环境:MATLAB、SAS、SPSS、R

6)  
面向网络舆情的关联度分析

案例描述:网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。通过从社区网站上采集到网络舆情信息和分析对象信息,建立分析对象与舆情资源之间关联度的计算规则,寻找出与给定舆情资源联系最紧密的分析对象。

实践演练环境:MATLAB、SAS、SPSS、R

7)  
家用电器用户行为分析及事件识别

案例描述:家用电器在使用过程中,因地区气候、区域不同、用户年龄性别差异,形成不同的机组使用行为,称之为用户的使用习惯。根据用户使用热水器的使用行为构建出洗浴事件识别模型,进而深入了解热水器在用户所在区域的真实使用习惯,优化新产品的设计和布局营销。

实践演练环境:MATLAB、SAS、SPSS、R

8)  
基于基站定位数据的商圈分析

案例描述:商圈是现代市场中企业市场活动的空间,也是商品和服务享用者的区域。商圈划分的目的之一是为了研究潜在的顾客的分布以制定适宜的商业对策。从通信运营商提供的基站定位数据,利用基站小区的覆盖范围作为商圈区域的划分,归纳出商圈的人流特征和规律,识别出不同类别的商圈,实现营销指导。

实践演练环境:MATLAB、SAS、SPSS、R

9)  
气象与电力输电线路缺陷关联分析

案例描述:由于输电线路的组成部件大都暴露在外,极端恶劣的气候对输电线路造成非常大的危害。通过分析鸟害、接地装置受损、保护区安全隐患、部件发热异常、锈蚀损伤等缺陷与气象因子的关联关系,构建出气象因子与缺陷关联关系的预警模型。实现在极端气象条件下缺陷在高发区发生的概率并进行预警。

实践演练环境:MATLAB、SAS、SPSS、R

10) 
基于关联规则的电子商务智能推荐服务

案例描述:根据电子商务网站采集到的用户访问数据,对用户的访问内容作关联规则分析,探寻用户访问网站的业务逻辑关系,为用户推荐精确的知识内容与服务,从而建立稳定的网站忠实顾客群,实现客户链式反应增值,为企业实现更为人性化的客户定位,提高消费者满意度。

实践演练环境:MATLAB、SAS、SPSS、R

更多项目案例详见:www.tipdm.org

2     案例产品构成

  1. 1.     
     
  2. 2.     
     
  3. 3.     
     

3.1.     
 

2.1 
案例技术方案书

案例技术说明书经泰迪科技和多所高校教师联合整理提炼而成,深入浅出的介绍了一个数据挖掘应用从提出需求到最后实现的整个过程,案例技术书按如下结构组织材料:

1、背景与挖掘目标

2、分析方法与过程

1)数据抽取

2)数据探索

3)数据预处理

4)模型构建

5)模型评价

6)模型应用

3、上机实验

4、拓展思考

示例:

2.2 
配套数据文件

配套数据文件主要包括源文件、过程文件及结果文件等,分别存放在示例程序、上机实验、上机实验拓展及拓展思考等文件夹。

以下为示例程序中的数据文件:

以下为上机实验中的数据文件:

2.3 
配套用例程序

用例程序主要包括案例过程示例程序、上机实验程序(MATLAB环境)、上机实验拓展程序(SPSS、SAS和R语言)。

以下为示例程序中的MATLAB程序:

以下为上机实验中的MATLAB程序:

以下为上机实验拓展中的SAS程序:

以下为上机实验拓展中的SPSS模型:


3     联系我们

感谢您选择广州泰迪科技公司的数据挖掘产品,在系统的使用过程中如果遇到问题,请通过如下的方式与我们联系,我们将为用户提供周到满意的服务。

主页http://www.tipdm.com

电话:020-82039399

传真:020-28871586

热线:40068-40020

地址:广州经济技术开发区科学城科珠路232号

邮编:510663

邮箱:[email protected]

时间: 2024-10-16 17:08:27

顶尖数据挖掘教学案例库(TipDM-C10)产品白皮书的相关文章

顶尖数据挖掘辅助教学套件(TipDM-T6)产品白皮书

      顶尖数据挖掘辅助教学套件 (TipDM-T6)           产  品  说  明  书 广州泰迪智能科技有限公司 版权所有 地址: 广州市经济技术开发区科学城232号 网址: http://www.tipdm.com 邮箱: [email protected] 热线: 40068-40020 企业QQ:40068-40020 邮编: 510663 电话: (020)82039399 目  录 1                     引言..................

顶尖大数据挖掘实战平台(TipDM-H8)产品白皮书

    顶尖大数据挖掘实战平台 (TipDM-H8)           产  品  说  明  书 广州泰迪智能科技有限公司 版权所有 地址: 广州市经济技术开发区科学城232号 网址: http://www.tipdm.com 邮箱: [email protected] 热线: 40068-40020 企业QQ:40068-40020 邮编: 510663 电话: (020)82039399 目  录 1                     引言.....................

顶尖数据挖掘开发平台(TipDM-D2)产品白皮书

      顶尖数据挖掘开发平台 (TipDM-D2)           产  品  白  皮  书 广州泰迪智能科技有限公司 版权所有 地址: 广州市经济技术开发区科学城232号 网址: http://www.tipdm.com 邮箱: [email protected] 热线: 40068-40020 邮编: 510663 电话: (020)82039399 目  录 第1章 引言.......................................................

大数据分析, 数据挖掘, 机器学习,找到产品改进的爆点。

为了避免不必要的麻烦. 一些数据讲的不太清楚, 关键看爆点的思路. 通过大数据统计分析, 我发现可以用一个线性公式完美的拟合一个用户转化环节.并依据此公式对近期没有发生的数据做出预测. 这就是大数据的魅力所在吧. 依据以上发现, 我觉得至少我们这个产品,套用互联网的漏斗模型,在每两个环节之间的转化模型应该都是线性模型.依次, 继续用数据探究一下另外一个转化环节. 结果发现很悲催. 完全无法用线性公式拟合. 甚至杂乱无章. wait  a moment. 是不是哪里出了问题呢?那我继续探究, 推荐

R语言数据挖掘实战系列(1)

R语言数据挖掘实战(1) 一.数据挖掘基础 数据挖掘:从数据中"淘金",从大量数据(包括文本)中挖掘出隐含的.未知的.对决策有潜在价值的关系.模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法.工具和过程. 数据挖掘的任务 利用分类与预测.聚类分析.关联规则.时序模式.偏差检测.智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力. 数据挖掘建模过程 定义挖掘目标,即决定到底想干什么? 数据取样.抽取一个与挖掘目标相关的样本数据子集.抽取数据的

如何成为顶尖的数据分析师

什么是数据分析? 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总.理解并消化,以求最大化地开发数据的功能,发挥数据的作用. 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律.在实际 工作当中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动. 数据分析师指的是不同行业中,专门从事行业数据搜集.整理.分析,并依据数据做出行业研究.评估和预测的专业人员. 数据分析师成长路线介绍: 路线主要是包括数据分析基础知识

互联网产品经理的工作职责

这几天我梳理了1年以来的工作内容,并将产品经理的工作职责整理出来.按照产品阶段划分,可分为5个方面: 一.市场及用户研究 1.1.市场分析: 发现并掌握目标市场和用户需求的变化趋势,对未来几年市场上需要什么样的产品和服务做出预测: 1.2.竞品分析: 收集竞争对手的资料.试用竞争对手的产品,从而了解竞争对手产品: 1.3.用户研究: 通过定性(用户访谈).定量(调查问卷)等分析方法对用户需求进行挖掘和分析: 二.产品规划及设计 2.1.产品规划: 确定目标市场.产品定位.发展规划及路线图: 2.

这七类产品,医院临床最爱!

在两票制和备案制的政策法规下,药代生存空间受到挤压.选择好代理产品非常重要,如果品种没选好,以后的路将更难走.小编通过收集2017年7-10月数据,统计出以下热点品种,为各位代理商参考. 胶囊剂型需求量最大 根据下图的2017年三季度药热点需求品种数据可视化(字体越大表示越火热,字体越小表示权重越低),图中"临床"."颗粒"."胶囊"."注射液"."保健品"."基药"."中标&

当教育教学“撞见”大数据,会带来怎样的可能?

立的大数据实验室中,绝大多数采用产学研结合模式--高校与企业共建,在此浪潮中高校成为了国家大数据实验室的重要参与者,同时很多高校开设了大数据专业,大数据平台成为高校教育和科研的重要手段. 那么,什么样的大数据平台能够满足高校建立大数据实验室,满足专业师生的教学.科研.实验等相关需求? 具备快速交付大数据基础硬件环境的能力: 面对教学实战中的多种大数据环境要求,具备按需部署.构建交付组合多样的大数据软件环境能力,同时具备大数据教学算法库及成熟的配套教程: 针对学生实训实验过程中的极限使用,具备随时