数据挖掘之算法---常用挖掘算法

http://www.cnblogs.com/jerrylead/archive/2011/03/09/1978280.html 最小倒数,梯度,极值

http://blog.csdn.net/zouxy09/article/details/8195017  联合概率分类

http://www.cnblogs.com/jerrylead/archive/2011/03/05/1971903.html 判别和生成模型

http://blog.csdn.net/zc55803903/article/details/7953862 常用算法

http://blog.csdn.net/maopig/article/category/877158

http://wenku.baidu.com/link?url=q_hIT6ZehJLbZkrfuMxpUSgNHksIhM2X3zfm-hZ1vSsZrUhL-Hs4xE9OPFF3UNKHbXaTIwNzjFsEXhicK5ucbKOZh8bu2ztjDBkqLBAaOjK

http://blog.csdn.net/aladdina/article/category/516072

http://blog.csdn.net/shanghaiqianlun/article/details/17001567 无线光电处理系统

http://wenku.baidu.com/link?url=iwnqUilGfP1nmbMy-s6zKTxD0TXE3uOvtXoqnvCKqks-s5QozRDFUhTs_9z7kkLc9uBVMV2fdWF_lVELMxluCyWXtUzAhUgaszvE6Pp8ktW 文本上的算法

http://www.cnblogs.com/kaituorensheng/category/576792.html 爬虫

http://wenku.baidu.com/view/d6a312a189eb172ded63b7f5.html?re=view 6678算法

http://blog.csdn.net/pennyliang/article/details/5941452 包子算法之我见

http://blog.sina.com.cn/s/blog_6af663940100n7pr.html 图解

http://blog.csdn.net/maopig/article/details/6745271 45

本书涉及到的45个习惯是:

1 做事
2 欲诉则不达
3 对事不对人
4 排除万难,奋勇前进
5 跟踪变化
6 对团队投资
7 懂得丢弃
8 打破砂锅问到底
9 把握开发节奏
10 让客户做决定
11 让设计指导而不是操纵开发
12 合理地使用技术
13 保持可发布
14 提早集成,频繁集成
15 提早实现自动化部署
16 使用演示获得频繁反馈
17 使用短迭代,增量发布
18 固定的价格就意味着背叛承诺
19 守护天使
20 先用它再实现它
21 不同环境,就有不同问题
22 自动验收测试
23 度量真正的进度
24 倾听用户的声音
25 代码要清晰地表达意图
26 用代码沟通
27 动态评估取舍
28 增量式编程
29 保持简单
30 编写内聚的代码
31 告知,不要询问
32 根据契约进行替换
33 记录问题解决日志
34 警告就是错误
35 对问题各个击破
36 报告所有的异常
37 提供有用的错误信息
38 定期安排会面时间
39 架构师必须写代码
40 实行代码集体所有制
41 成为指导者
42 允许大家自己想办法
43 准备好后再共享代码
44 做代码复查
45 及时通报进展和问题

时间: 2024-10-12 13:29:55

数据挖掘之算法---常用挖掘算法的相关文章

微软数据挖掘算法:Microsoft 时序算法(5)

前言 本篇文章同样是继续微软系列挖掘算法总结,前几篇主要是基于状态离散值或连续值进行推测和预测,所用的算法主要是三种:Microsoft决策树分析算法.Microsoft聚类分析算法.Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇,所涉及的应用场景在前几篇文章中也有介绍,有兴趣的同学可以点击查看,本篇我们将总结的算法为Microsoft时序算法,此算法也是数据挖掘算法中比较重要的一款,因为所有的推算和预测都将利用于未来,而这所有的一切都将有一条时间线贯穿始终,而

PrefixSpan序列模式挖掘算法

更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 与GSP一样,PrefixSpan算法也是序列模式分析算法的一种,不过与前者不同的是PrefixSpan算法不产生任何的侯选集,在这点上可以说已经比GSP好很多了.PrefixSpan算法可以挖掘出满足阈值的所有序列模式,可以说是非常经典的算法.序列的格式就是上文中提到过的类似于<a, b, (de)>这种的. 算法原理 PrefixSpan算法的原理是采用后缀序列转前缀序列

Apriori算法--关联规则挖掘

我的数据挖掘算法代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 Apriori算法是一个经典的数据挖掘算法,Apriori的单词的意思是"先验的",说明这个算法是具有先验性质的,就是说要通过上一次的结果推导出下一次的结果,这个如何体现将会在下面的分析中会慢慢的体现出来.Apriori算法的用处是挖掘频繁项集的,频繁项集粗俗的理解就是找出经常出现的组合,然后根据这些组合最终推出我们的关联规则. Apriori算法原理 Aprio

数据挖掘领域十大经典算法初探

译者:July   二零一一年一月十五日 ----------------------------------------- 参考文献:国际权威的学术组织ICDM,于06年12月年评选出的数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.==============博主说明:1.原文献非最新文章,只是本人向来对算法比较敏感.感兴趣,便把原文细看了下,翻译过程中

常用推荐系统算法总结

一,常用推荐系统算法总结 1.Itemcf (基于商品的协同过滤) 这个算法是cf中的一种,也是当今很多大型网站都在采用的核心算法之一.对于商城网站(以Amazon为代表,当然也包括京东那种具有搞笑特色的推荐系统在内),影视类推荐,图书类推荐,音乐类推荐系统来说,item的增长速度远不如user的增长速度,而且item之间的相似性远不如user之间的相似性那么敏感,所以可以在离线系统中将item的相似度矩阵计算好,以供线上可以近乎即时地进行推荐.因为这种方法靠的是item之间的相关性进行推荐,所

数据挖掘领域十大经典算法

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的18种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响. 1.C4.5 C4.5算法是机

数据挖掘算法之k-means算法

系列文章:数据挖掘算法之决策树算法 [QQ群: 189191838,对算法和C++感兴趣可以进来]       k-means算法可以说是数据挖掘中十大经典算法之一了,属于无监督的学习.该算法由此衍生出了很多类k-means算法,比如k中心点等等,在数据挖掘领域,很多地方都会用到该算法,他能够把相似的一类很好的聚在一起.一类指的是,他们之间的相似度较高,计算相似度的常用度量有欧氏距离.余弦定理等.本算法采用的是欧式距离度量.这个对理解k-means算法不会造成任何实质性的影响. 为了更好的说明k

数据挖掘经典算法——最大期望算法

算法定义 最大期望算法(Exception Maximization Algorithm,后文简称EM算法)是一种启发式的迭代算法,用于实现用样本对含有隐变量的模型的参数做极大似然估计.已知的概率模型内部存在隐含的变量,导致了不能直接用极大似然法来估计参数,EM算法就是通过迭代逼近的方式用实际的值带入求解模型内部参数的算法. 算法描述 算法的形式如下: 随机对参数赋予初值: While(求解参数不稳定){ E步骤:求在当前参数值和样本下的期望函数Q: M步骤:利用期望函数重新计算模型中新的估计值

静态频繁子图挖掘算法用于动态网络——gSpan算法研究

摘要 随着信息技术的不断发展,人类可以很容易地收集和储存大量的数据,然而,如何在海量的数据中提取对用户有用的信息逐渐地成为巨大挑战.为了应对这种挑战,数据挖掘技术应运而生,成为了最近一段时期数据科学的和人工智能领域内的研究热点.数据集中的频繁模式作为一种有价值的信息,受到了人们的广泛关注,成为了数据挖掘技术研究领域内的热门话题和研究重点. 传统的频繁模式挖掘技术被用来在事务数据集中发现频繁项集,然而随着数据挖掘技术应用到非传统领域,单纯的事务数据结构很难对新的领域的数据进行有效的建模.因此,频繁