机器学习讨论组纪要1

机器学习分类

精确学习  符号学习: 例子: 爸爸*爸爸=爷爷。 80 90 年代研究热点。现在基本已经不再研究。

模糊学习 归纳,基于数据做统计。因为大数据技术的发展而变得火热。

模糊学习的分类

数据-归纳,训练-模型-对新的数据,得出结论

督导学习 无督导学习

督导学习 标记

无督导 聚类

常见的机器学习的方法

线性回归是最基本的机器学习算法

房屋面积 房价  一组数据。 给出新的房屋面积,预测房价

回归与分类

Regression Classification

逻辑回归(分类) 置信度

线性回归可以通过sigmoid与逻辑回归统一起来。

神经元:每一个神经元就是一个线性回归函数。

神经网络:神经元连在一起就是神经网络

深度学习: 神经网络的层数,一般的机器学习的神经网络的层数大概在3 4 层,而深度学习的深度神经元网络可以达到70 80 层,仅模型本身,就可以达到几个G的大小。

神经网络,根基还是线性回归

决策树

概率方法 : 贝叶斯网络?

简单的机器学习case

email 优先级判断问题:

线性可分问题,也就是说很多问题可能不是一个线性回归可以解决的问题:

feature维度越高,越大可能线性可分。

可以采用online逻辑回归算法(PA2),判断email是否是高优先级的。

一个common的问题:如何针对不同的场景(输入数据的特点),选择不同的机器学习的算法?

feature生成 选取 ,目前还是依赖于人的直观选择

但是这些选取的feature维度可以使用一些方法进行处理,比如:升维度 降维度(防止过度拟合,把相近的feature cluster) 离散化(年龄划分为青年中年老年等)

模型的调优

训练集 验证集 测试集

调优的指标:

查准率 查全率 误分类代价

有了模型,才可以真正进行code层级的机器学习,从而涉及到下面的问题:

编程语言?机器学习平台

常见的平台:Spark MLlib

常见的语言:Scala Java python R

时间: 2024-10-10 09:59:23

机器学习讨论组纪要1的相关文章

手机如何解散QQ讨论组

手机如何解散QQ讨论组 讨论组可以方便一群人的聊天,一般都是一段时间的问题.过了这一段时间,大家都是不需要再在讨论组里面发言了,那么手机如何解散QQ讨论组呢? 1 我们登录自己的 QQ之后,我们找到"群组",如图示. 2 群组里面分为QQ群与讨论组,我们这里选择"讨论组",如图示. 3 在讨论组中,我们选择自己想要解散的讨论组,如图示. 4 进入讨论组之后,我们点击右上角的菜单. 5 这里我们进入了讨论组的聊天设置,然后我们点击"删除成员",如图

讨论组——下班之余讨论DotA的游戏发烧友好去处

下班了,码农们忙了一天,也该换换口味了,组队打DotA吧.在HiWork中创建个讨论组,说说各自的经验,谈谈秘籍想法,岂不快哉.生活总是要充满乐趣的不是么. 讨论组是私密的话题组,只有参与者能看到.成员无法主动加入讨论组,只能由讨论组中的组员邀请加入.另外,讨论组中的消息具有私密性,只有讨论组中的组员能看到. 首先通过www.hiwork.cc登录到HiWork聊天页面 1.创建新的讨论组在HiWork的聊天页面,页面左侧"讨论组"右边,点击'+'按钮进行新讨论组创建,出现如下图所示弹

模拟微信讨论组的头像集合

效果 1. 数据 vm.picUrl = []; var items = ['pic1', 'pic2', 'pic3', 'pic4', 'pic5', ......]; //1-9 and more angular.forEach(items, function(item) { vm.picUrl.push(item.url);// 图片的url }); 2. 调用显示, 大小不同 <div mult-picture pictures="picUrl" pic-height=

机器学习与人工智能学习资源导引

机器学习与人工智能学习资源导引 TopLanguage(https://groups.google.com/group/pongba/) 我经常在 TopLanguage 讨论组上推荐一些书籍,也经常问里面的牛人们搜罗一些有关的资料,人工智能.机器学习.自然语言处理.知识发现(特别地,数据挖掘).信息检索 这些无疑是 CS 领域最好玩的分支了(也是互相紧密联系的),这里将最近有关机器学习和人工智能相关的一些学习资源归一个类: 首先是两个非常棒的 Wikipedia 条目,我也算是 wikiped

机器学习&amp;人工智能书籍

Introduction to Machine Learning https://www.amazon.cn/Introduction-to-Machine-Learning-Alpaydin-Ethem/dp/0262028182/ref=sr_1_3?s=books&ie=UTF8&qid=1464677979&sr=1-3&keywords=Introduction+to+Machine+Learning atificial Intelligence: A Moder

机器学习入门资源--汇总

机器学习入门资源--汇总 基本概念 机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法.机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法.因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论.算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法. 下面从微观到宏观试着梳理一下机器学习的范畴:

组播的应用和实现

一.引言 1.1. 问题的引出 近年来,随着网络技术的发展,使得各种单一媒体相继成为网络传输中的数据,进而各种媒体的融合使得网络多媒体运用层出不穷.目前,在Internet上产生了许多新的应用,其中不少是高带宽的多媒体应用,譬如网络视频会议 (可视化IP电话会议系统).网络音频/视频广播.多媒体远程教育.远程会诊,而传统网络最初是为数据传输而设计的,是典型的点点通信模式,是为保证数据可靠传输而设计的,所用的传输协议多为点到点的协议.其所具有的特点将增加网络发送负载,带来网络延时.这就带来了带宽的

机器学习的三要素

机器学习算法原理.实现与实践——机器学习的三要素 1 模型 在监督学习中,模型就是所要学习的条件概率分布或决策函数.模型的假设空间包含所有可能的条件概率分布或决策函数.例如,假设决策函数是输入变量的线性函数,那么模型的假设空间就是这些线性函数构成的函数的集合. 假设空间用$\mathcal{F}$表示.假设空间可以定义为决策函数的集合 $$\mathcal{F}=\{f|Y=f(X)\}$$ 其中,$X$和$Y$是定义在输入空间$\mathcal{X}$和输出空间$\mathcal{Y}$上的变

现代软件工程讨论第一章-第四章

第一章 1.代码如下 #include <iostream> #include <cstdio> #include <time.h> using namespace std; int main(){ srand(time(0)); while(1){ printf("随机生成的一个小学四则运算题目,除法省去余数\n"); int num1 = rand() % 10; int num2 = rand() % 10; int index = rand(