数据科学家应该掌握的12种机器学习算法

算法已经成为我们日常生活的一个重要组成部分,它们几乎出现在商业的任何领域。调查公司 Gartner 称这种现象为「算法化商业」,算法化商业正在改变我们经营和管理公司(应有的)的方式。现在,你可以在「算法市场」上买到这些适用于各个商业领域的多种算法。算法市场为开发者提供了包括声音和视觉处理、机器学习以及计算机视觉等领域在内的超过800种算法,这些成熟的算法帮助开发者节省宝贵的时间与金钱。

然而,算法市场上可用的算法可能并不符合你的特定需求。毕竟,你需要不同的算法来应付不同的情况,而相同的算法在不同环境也会产生不同的结果。事实上,可用的算法类型和它的执行方式是由很多不同的变量决定的。这些变量包括数据的规模和类别、应用算法的行业、用来执行的功能等多种情况。

因此,有时购买一个现成的算法并稍作修改可能不是最佳选择。数据科学家还是应该学习最重要的算法;学习如何开发这些算法,又如何根据意图选取最合适的算法?「Think Big Data」发布的信息图展示了 12 种实现不同应用目的的最重要的算法,想必这肯定是每个数据科学家都喜闻乐见的。

注:汉化信息图中的中文翻译参考了网络以及周志华老师《机器学习》一书中的名词翻译。为了不影响读者的阅读,中文、英文版信息图都附于文中。

中文版信息图:

原英文信息图

时间: 2024-11-01 14:24:21

数据科学家应该掌握的12种机器学习算法的相关文章

【LINK】程序员想玩转大数据:需要知晓的12种工具

http://www.csdn.net/article/2012-12-20/2813054-Database http://blog.csdn.net/qjfpjie/article/details/8439119 [LINK]程序员想玩转大数据:需要知晓的12种工具

12种排序算法:原理、图解、动画视频演示、代码以及笔试面试题目中的应用

出处:http://blog.csdn.net/han_xiaoyang/article/details/12163251. 声明:版权所有,转载请注明出处,谢谢. 0.前言 从这一部分开始直接切入我们计算机互联网笔试面试中的重头戏算法了,初始的想法是找一条主线,比如数据结构或者解题思路方法,将博主见过做过整理过的算法题逐个分析一遍(博主当年自己学算法就是用这种比较笨的刷题学的,囧),不过又想了想,算法这东西,博主自己学的过程中一直深感,基础还是非常重要的,很多难题是基础类数据结构和题目的思想综

程序员想玩转大数据:需要知晓的12种工具

转自 :http://www.csdn.net/article/2012-12-20/2813054-Database 无论是在构建大数据的应用程序,还是仅仅只想从开发的移动应用中得到一点点启发,程序员现在比以往任何时候都需要数据分析工具.这绝对是一个好东西,所以很多公司从程序员的需求和技能出发,构建了一些数据分析工具.GigaOm的记者Derrick Harris列举了十二个工具,CSDN进行了编译整理: 在过去的几年里,Derrick看到了很多初创公司,各类项目以及开发工具等等,它们都旨在为

收藏 | 数据分析师最常用的10个机器学习算法!

在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要. 举个例子来说,你不能说神经网络永远比决策树好,反之亦然.模型运行被许多因素左右,例如数据集的大小和结构. 因此,你应该根据你的问题尝试许多不同的算法,同时使用数据测试集来评估性能并选出最优项. 当然,你尝试的算法必须和你的问题相切合,其中的门道便是机器学习的主要任务.打个比方,如果你想打扫房子,你可能会用到吸尘器.扫帚或者拖把,但你肯定不会拿

java实现12种排序算法

Java实现的12种排序 2019-01-05 一.冒泡排序及其实现 二.希尔排序及其实现 三.插入排序及其实现 四.插入排序及其实现 五.快速排序及其实现 六.合并排序及其实现 七.计数排序及其实现 八.基数排序及其实现 九.   桶排序及其实现 十.    堆排序及其实现 十一.二叉树排序及有序集合 十二.利用集合的4种排序排序方式 一.冒泡排序及其实现 一.home→包 BubbleSort→类 main→主函数 bubbleSort1()→冒泡排序1 bubbleSort2()→冒泡排序

为什么数据科学家们总是在离职的路上

相信在这个时代的当下,大家或多或少都有看到过类似"数据科学是21世纪最性感工作"的故事,以及数据科学家在这个时代显得是一份十分理想且具有超强吸金能力的工作.因为这个领域需要大量高技能人才,他们需要寻求解决复杂问题的办法(这对于"极客"来说是一件很有吸引力的好事).总之,大家的描述都让这份工作在技术人的眼中显得十分梦幻.可爱. 但事实是,正如英国<金融时报>在这篇文章中所说,数据科学家通常"每周花1-2小时寻找新工作".此外,文章还指出

机器学习:基本概念、五大流派与九种常见算法

机器学习正在进步,我们正在不断接近创造人工智能的目标.语音识别.图像检测.机器翻译.风格迁移等技术已经在生活中开始得到了应用,但机器学习的发展仍还在继续,有人认为这场变革有可能会彻底改变人类文明的发展方向乃至人类自身.但你了解现在正在发生的这场变革吗?四大会计师事务所之一的普华永道(PwC)近日发布了多份解读机器学习基础的图表,其中介绍了机器学习的基本概念.原理.历史.未来趋势和一些常见的算法. 一.机器学习概览 1. 什么是机器学习? 机器通过分析大量数据来进行学习.比如说,不需要通过编程来识

数据科学家:神话 &amp;amp; 超能力持有者

一个打破神话的季节,正在降临. 我将坦诚地揭穿人们关于数据科学家所持有的惯有看法.在下文中,我将一个一个展示这些观点,宛如将一个又一个的玻璃瓶子摔碎在墙壁上一样. 关于数据科学家的神话主要是这些:        神话#1: 数据科学家们本身就是一种神奇生物,就像独角兽一样神奇叵測. 数据科学家实际上是很真实的.从人们開始进行多元统计分析.时间序列分析和运用其它核心分析方法时,他们就已经存在了.在某种程度上,假设你建立模型,并使用各种分析工具来找寻那些不显著的数据模型,那么你也许也是一位数据科学家

数据科学家:神话 &amp; 超能力持有者

一个打破神话的季节,正在降临. 我将坦诚地揭穿人们关于数据科学家所持有的惯有看法.在下文中,我将一个一个展示这些观点,犹如将一个又一个的玻璃瓶子摔碎在墙壁上一样. 关于数据科学家的神话主要是这些:        神话#1: 数据科学家们本身就是一种神秘生物,就像独角兽一样神秘叵测. 数据科学家实际上是非常真实的.从人们开始进行多元统计分析.时间序列分析和运用其他核心分析方法时,他们就已经存在了.在某种程度上,如果你建立模型,并使用各种分析工具来找寻那些不显著的数据模型,那么你或许也是一位数据科学