机器学习------精心总结

1.数学

  1. 偏差与方差
  2. 拉格朗日
  3. 核函数
  4. 凸优化
  5. 协方差矩阵
  6. Hessian矩阵
  7. CDF(累计分布函数)
  8. 高斯概率密度函数
  9. 中心极限定理

2.机器学习

Java 机器学习 工具 & 库



1.处理小数据效果好
2.深度学习—大数据,超过500w;图像,语言方面效果奇好


  • SVD
  • 最小二乘法
  • 梯度下降法
  • 局部加权回归

    1.最大似然估计
    2.logistic回归
    3.感知器的初步—logistic的简化情节

  • 牛顿法

    1.介绍了牛顿方法
    2.广义线性模型
    3.多项式分布,softmax回归

  • 高斯判别分析

    1.高斯判别
    2.朴素贝叶斯

  • EM
  • 隐马尔可夫模型
  • 决策树向量机

决策树算法介绍及应用

  • K近邻
  • 支持向量机
  • PageRank
  • 强化学习
  • LDA
  • PCA
  • pLSA
  • LSI
  • ICA
  • 最大熵模型
  • 条件随机场
  • 最大熵隐马尔可夫模型
  • Gradient Boosting
  • K-Means
  • 贝叶斯逻辑斯蒂克回归
  • 关联规则挖掘
  • 随机森林

3.信息论

  1. 压缩率很高的数据结构
  2. 信息熵与信息增益
  3. 数据压缩原理
  4. 香农游戏
  5. 二维码原理

4.深度学习

机器学习的一个分支
各种编程语言的深度学习库整理
深度学习如何入门(知乎)
Elephas:Apache Spark上的Keras深度学习框架


  1. 感知器
  2. 反向传播算法
  3. 自动编码器
  4. 栈式自编码器
  5. 微调多层自编码算法
  6. 深度信息网络
  7. softmax回归
  8. 白化
  9. 池化
  10. 受限玻尔兹曼机
  11. 稀疏编码
  12. 递归神经网络
  13. 卷积神经网络—图像识别,语音识别,,.
  14. 前馈神经网络

5.全文检索

  1. 搜索建索引过程
  2. 搜索评分过程
  3. 搜索查询分析器
  4. Rocchio相关反馈算法
  5. 向量空间模型
  6. BM25基于概率的搜索评分
  7. Lucene源码分析
  8. solrcloud
  9. Solr空间搜索原理
  10. GeoHash算法
  11. 地理空间距离计算原理
  12. WAND检索算法
  13. 智能化信息检索模型
  14. Kullback-Leibler距离/相关熵
  15. 交叉熵

6.计算广告

  1. 正文广告
  2. 上下文广告
  3. 显示广告
  4. 合约广告
  5. 竞价广告
  6. 搜索广告
  7. 受众定向
  8. 竞价广告的定价机制
  9. eCPM估计
  10. 广义第二高价
  11. 精准人群定向
  12. 实时竞价
  13. 广告交易平台
  14. 需求方平台(DSP)程序购买
  15. 广告有效性原理
  16. 二部图匹配算法
  17. HWM算法
  18. 点击流挖掘
  19. 广告系统的一些商业模式
  20. 实时反作弊
  21. CTR点击预测
  22. 架构

7.自然语言处理



  1. N-gram语言模型
  2. 词共现/TFIDF
  3. 噪声信道模型
  4. 统计分类模型
  5. 语义相关性
  6. 基于HMM的词性标注
  7. 统计语言模型的评价方法
  8. 扩充转移网络
  9. 动态规划算法
  10. 最小编辑距离
  11. 浅层句法分析技术
  12. 知识库的构建
  13. 命名实体识别
  14. 未登陆词识别
  15. 语言模型结构设计
  16. 树邻近语法
  17. 文本建模
  18. 随机上下文无关文法
  19. 概率上下文文法
  20. 同义词自动构建(词共现,基于浅层语法分析)
  21. 文本分类技术

8.架构

  1. OOP
  2. 聊天系统/实时高效信息系统架构与源码
  3. Bloom Filter 过滤器
  4. 分布式时钟(逻辑时钟) 同步技术
  5. SCALA
  6. Netty
  7. Jetty
  8. 一致性Hash
  9. 分布式基本组建
  10. 原子广播

9.爬虫

  1. 爬虫原理
  2. 分布式架构
  3. 通用爬虫
  4. 主题爬虫
  5. Nutch
  6. Xpath
  7. 网页去重
  8. URL去重

10.应用

  1. 人脸识别
  2. 垃圾邮件分类
  3. 文本聚类
  4. 语音合成(分解)
  5. 语音识别
  6. 手写识别
  7. 推荐系统
  8. 文档主题分析
  9. 二进制权限系统
  10. 搜索引擎关键字智能提示
  11. 最小敏感局部hash算法
  12. Simrank
  13. 手写输入法
  14. 为文本生成关键词和摘要
  15. 拼音缩写提取
  16. 汉字转拼音/拼音转汉字
  17. 机器翻译
  18. 自动提取标签
  19. 图片提取标题
  20. 文字生成图像
  21. 问答系统

11.Github中的开源项目

值得mark的11个开源机器学习项目



1.scikit-learn Github:scikit-learn
2.Shogun
Github:shogun
3.Accord Framework/AForge.net
Github:Accord Framework/AForge.net
4.Mahout
5.MLlib
6.H2O
Github:H2O
7.Cloudera Oryx
8.GoLearn
9.Weka
10.CUDA-convnet
11.ConvNetJS
Github:ConvNetJS

12.个人收集网址

13.机器学习需要了解的人物

1.吴恩达

2.中国大牛组



《中国大牛组》资源来源于小木虫
小木虫


14.会议论文收集

15.书籍

1.PRML—Pattern Recognition And Machine Learning
豆瓣

时间: 2024-10-18 22:22:09

机器学习------精心总结的相关文章

人工智能、机器学习和认知计算入门指南

几千年来,人们就已经有了思考如何构建智能机器的想法.从那时开始,人工智能 (AI) 经历了起起落落,这证明了它的成功以及还未实现的潜能.如今,随时都能听到应用机器学习算法来解决新问题的新闻.从癌症检测和预测到图像理解和总结以及自然语言处理,AI 正在增强人们的能力和改变我们的世界. 现代 AI 的历史包含一部伟大的戏剧应具有的所有要素.上世纪 50 年代,随着对思维机器及阿兰·图灵和约翰·冯·诺依曼等著名人物的关注,AI 开始崭露头角.尽管随后经历了数十年的繁荣与萧条,并被寄予了难以实现的厚望,

机器学习知识图谱

引言:人类的未来就是失控,就是人与机器共生.共存.机器越来越人性化, 人越来越机器化.<失控>这本书,主要就体现了这一思想.本文选自<全栈数据之门>一书. 琅琊榜首,江左梅郎,得之可得数据科学之天下. 电视剧<琅琊榜>是一部良心好剧,精心制作的剧情,外加画面精美和台词的古典韵味,说其是一部男人的宫斗剧也不假,但更是一部数据分析的作品.其中,最让人感到神奇的是琅琊阁中神奇的情报分析中心,简直就是 一整套完整的数据分析流程,采集江湖与朝廷上重要人物.事件的信息,放到一个大的

机器学习和数据挖掘推荐书单

有了这些书,再也不愁下了班没妹纸该咋办了.慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧! <机器学习实战>:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法.朴素贝叶斯算法.Logistic回归算法.支持向量机.AdaBoost集成方法.基于树的回归算法和分类回归树(CART)算法等.第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法.Apriori算法.FP-Growth算法.第四部分介绍了机器学习算法的一些附属

从零实现来理解机器学习算法:书籍推荐及障碍的克服

前部为英文原文,原文链接:http://machinelearningmastery.com/understand-machine-learning-algorithms-by-implementing-them-from-scratch/ 后部为中文翻译,本文中文部分转自:http://www.csdn.net/article/2015-09-08/2825646 Understand Machine Learning Algorithms By Implementing Them From

【机器学习基础】理解为什么机器可以学习1——PAC学习模型

引言 自从下定决心认真学习机器学习理论开始,接触到很多基本问题,但其实都不是很理解,比如损失函数.风险函数.经验结构最小化.结构风险最小化.学习方法的泛化能力.VC维等,这些概念在学习中都纯属空泛的概念存在,我都不理解这些概念存在的意义. 为什么会存在这样的问题呢?我自己想了一下,有几个原因:首先,很多相关的书籍在讲授这些概念的时候,很少说这些为什么会有这样的概念问题,为解决什么问题引入的这些概念:然后,还有一些书,在简单表述了这些概念之后就立马挨个介绍算法了,遇到这样的书也会忽视这些基础问题的

电子书 机器学习实战.pdf

机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存.谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目. <机器学习实战>主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法.朴素贝叶斯算法.Logistic回归算法.支持向量机.AdaBoost集成方法.基于树的回归算法和分类回归树(CART)算法等.第三部分则重点介绍无监督学习及其一

这10本由浅入深的好书,或让你成为机器学习领域的专家

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译. 以下为译文: 机器学习是个跨领域的学科,而且在实际应用中有巨大作用,但是没有一本书能让你成为机器学习的专家. 在这篇文章中,我挑选了10本书,这些书有不同的风格,主题也不尽相同,出版时间也不一样.因此,无论你是新手还是领域专家,一定能找到适合你的. 新手的最佳读物 这本书绝对是初学者非常期待的入门书.这本书条理清晰,学习成本低,因此我把它列为新手的最佳读物. 下面让我们深入讨论一些关于人工智能程序的话题. 人工智能编程范例 如果您想

机器学习和数据挖掘

机器学习和数据挖掘推荐书单 机器学习和数据挖掘推荐书单 有了这些书,再也不愁下了班没妹纸该咋办了.慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧! <机器学习实战>:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法.朴素贝叶斯算法.Logistic回归算法.支持向量机.AdaBoost集成方法.基于树的回归算法和分类回归树(CART)算法等.第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法.Apriori算法.FP

机器学习实战pdf

下载地址:网盘下载 内容简介  · · · · · · 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存.谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目. 本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法.朴素贝叶斯算法.Logistic回归算法.支持向量机.AdaBoost集成方法.基于树的回归算法和分类回归树(C