AI Boot Camp 分享之 ML.NET 机器学习指南

今天在中国七城联动,全球134场的AI BootCamp胜利落幕,广州由卢建晖老师组织,我参与分享了一个主题《ML.NET 机器学习指南和Azure Kinect .NET SDK概要》,活动虽然只有短短的2天时间的宣传,报名70人,到场40多人。

下面我和你分享一下我对ML.NET 机器学习的一些内容。

作为一个.NET开发者的你,可能很难立即进入机器学习。主要原因之一就是我们无法启动Visual Studio 使用我们所精通的.NET技术尝试这个新事物,这个领域被认为更适合该工作的编程语言,例如Python和R所占据,这个更准确的来说是机器学习的前期数据分析阶段。一年多以前,微软为我们的.NET技术带来一个新功能ML.NET, 现在已经是1.4,最新发布的.NET Core 3.1之上七龙珠已经聚齐。

首先我们为什么我们应该使用ML.NET 技术而不是Python和TensorFlow? 通常来说 除技术栈外,没有其他特殊原因。如果您将ASP.NET应用程序与机器学习模块一起使用,无疑是将ML.NET集成起来要容易得多。此外,现在您可以将使用TensorFlow构建的模块加载到ML.NET中。不知道各位有没有思考一下为什么 Microsoft 现在要在.NET 平台上引入机器学习以及我们为什么要关心机器学习

首先是机器学习这项技术正在跨越鸿沟。事实上这个鸿沟是非常难以跨越的,之所以那么多的高科技产品只是在小众范围内流传,而并没有被主流市场接受,原因就是这些公司没有能够跨越这个鸿沟。成功跨越鸿沟的典型是小米手机,而被鸿沟挡住的典型当属锤子手机,大家可以想想这两家的区别,小米早期定义「为发烧而生」,而锤子手机则是「情怀」,都是针对某个特定群体,但是你看现在小米已经不再说发烧这类的词了,因为它早已经进入主流市场。

最早的机器学习算法可以追溯到20世纪初,到今天为止,已经过去了100多年。从1980年机器学习称为一个独立的方向开始算起,到现在也已经过去了近40年。在这100多年中,经过一代又一代人的努力,最近这几年终于跨越了鸿沟。 跨越鸿沟意味着机器学习正在从仅有少数人掌握的时代过渡到民主化、平民化。微软的CEO 萨提亚·纳德拉在他的书《刷新:重新发现商业与未来》 之中就有提出“民主化”的人工智能,ML.NET正是要完成这项使命的载体之一。如何实现人工智能全民化,让它惠及每个人?如何让每个人打造自己的人工智能和AI?在医疗、教育和零售机构当中,如何打造一个相适应的AI是至关重要的。当我们谈AI的时候,不能空谈任何一个AI公司,而是要“民主化”AI,让AI真正落地应用到个人。为了达到这样的一个目的,我们有一系列的解决方案。Azure 云上在AI领域的GPU和FPGA等等一些基础架构方面的合作都已准备就绪了,可以提供更多的可能性,确保业务的运行和效率。除此之外,我们的架构提供对TensorFlow的支持,这样一来我们就有了一个非常开放的环境来支持所有的开发框架。

您应该开始探索这个机器学习领域的另一个原因是,作为一个人类,我们会产生大量数据。单独地,我们无法处理那么多的数据,甚至无法处理全部数据。从技术上讲,我们面临着无法从数据中提取信息的问题。但是,机器学习模型却可以帮助我们处理海量的数据。

机器学习是计算机科学的一个分支,它使用统计技术使计算机能够学习如何解决某些问题而无需对其进行显式编程。如上所述,所有重要的机器学习概念都可以追溯到1950年代。但是,主要思想是开发一个数学模型,该模型将能够做出一些预测。通常会事先对一些数据进行训练。简而言之,数学模型使用对旧数据的见解对新数据进行预测。这整个过程称为预测建模。如果从数学上讲,我们正在尝试近似一个映射函数  –  f  从输入变量  X  到输出变量  y。 我们正在尝试使用这种方法解决两大类问题:回归和分类。回归问题需要预测数量。这意味着我们的输出是连续的实值,通常是整数或浮点值。例如,我们要根据过去几个月的数据预测公司股票的价格。分类问题有点不同。他们正在尝试将输入划分为某些类别。这意味着此任务的输出是离散的。

ML.NET 是什么 给我们介绍了 ML.NET在几乎每种情况下都遵循相同的基本步骤。它结合了数据加载,转换和模型训练,使您轻松创建机器学习模型。

机器学习使用已知数据(例如训练数据)来找到模式,以便对新的未知数据进行预测。机器学习的输入称为 特征,这是用于进行预测的属性。机器学习的输出称为Label,它是实际的预测。 ML.NET中的数据表示为IDataView,这是一种描述表格数据(例如行和列)的灵活,高效的方法。IDataView对象可以包含数字,文本,布尔值,向量等。您可以将数据从文件或实时流源加载到IDataView。具体参考 从文件和其他源加载数据

在大多数情况下,您可用的数据不适合直接用于训练机器学习模型。原始数据需要使用数据转换进行预处理。Transformers 获取数据,对其进行一些处理,然后返回经过转换的新数据。ML.NET内置了一组数据转换,用于替换缺失值,数据转换,使文本特征化等等。参考准备建模的数据

Estimator从数据中学习以创建Transformer 。现在,将输入要素转换为输出预测的模型是Transformer

ML.NET 基础知识

概述
VIDEO
概念

10 分钟入门

快速入门

教程

操作指南

参考

原文地址:https://www.cnblogs.com/shanyou/p/12041198.html

时间: 2024-10-09 06:52:56

AI Boot Camp 分享之 ML.NET 机器学习指南的相关文章

修改Boot Camp引导信息info.plist

针对老款Mac book无法创建Win7安装盘分区的问题... 首先右键Boot Camp助理选择显示包内容,将Contents/info.plist备份一下,再编辑. 1. 在<key>DARequiredROMVersions</key>字段添加Boot ROM版本号: 2. 在<key>PreUSBBootSupportedModels</key>字段添加型号标识符: 3.修改<key>PreUSBBootSupportedModels&l

Boot Camp根据mac机型选择

Boot Camp 支持软件 5.1.5621,支持mac mini 下载 此下载包含在 Mac 上支持 64 位版本的 Windows 7.Windows 8 和 Windows 8.1 所需的 Windows 支持软件(Windows 驱动程序). 有关不同的 Mac 系统上所支持的操作系统的更多信息,请点按此处:http://support.apple.com/kb/HT5634?viewlocale=zh_CN ? 下载的文件是一个 .zip 文件.如果该文件没有自动解压缩,请连按该文件

M-2 Boot Camp解决苹果电脑安装Windows硬件不兼容问题

要知道很多人喜欢苹果电脑,但是买来后发现苹果自带的系统使用不习惯.某些功能不能实现.所以才安装了Windows,但是装完Windows后才发现,电脑出了一些问题. 问题描述:Mac笔记本在使用传统的Ghost安装操作系统方法后,安装完的系统与苹果本身的硬件不兼容.导致很多设备无法使用.可能出现的问题:摄像头不能使用.苹果的键盘上某些功能键不能使用,导致不能调节声音与屏幕亮度.触摸板功能运作不正常,无法使用右键. 解决方法:Boot Camp是苹果是出的一种软件.它可以实现苹果设备上的双系统.而它

如何在 Mac 上通过 Boot Camp 安装 Windows?

如何在 Mac 上通过 Boot Camp 安装 Windows? The following contents are chosen from the apple website, thanks for your visit~~ Good time! Boot Camp 可帮助您在 Mac 上安装 Microsoft Windows.安装后,请重新启动 Mac,以在 macOS 和 Windows 之间切换. 开始之前,确保您已备齐所有必需物品: 基于 Intel 的 Mac 包含 64 位

AWS举行AI大会re:MARS 焦点ML、自动化、机器人和太空科学

AWS最近宣布即将举办新的AI大会re:MARS,邀请科学.学界和业界优秀的领导者来参与这场盛会,共同探索创新的应用.科学发展和AI可行的应用,这场AI大会将聚焦于机器学习.自动化.机器人和太空科学,AWS即是用这4项领域的第一个字母,组成MARS这个名称,re:MARS大会将在拉斯韦加斯,于今年6月4日展开为期3天的议程,活动将于3月开始开放注册,近期会陆续更新演讲人.议程细节和价格等信息,其中较特别的是,航天人员可以免费参加.AWS表示,机器学习和AI是Amazon产品背后的核心技术,有些产

腾讯AI主管带你深度实践Spark机器学习

前言 大数据.人工智能正在改变或颠覆各行各业,包括我们的生活.大数据.人工智能方面的人才已经供不应求,但作为人工智能的核心一机器学习, 因涉及的知识和技能比较多,除了需要具备一定的数学基础.相关业务知识外,还要求有比较全面的技术储备,如操作系统.数据库.开发语言.数据分析工具.大数据计算平台等,无形中提高了机器学习的门槛. 如何降低机器学习的门槛,让更多有志于机器学习.人工智能的人能更方便或顺畅地使用.驾驭机器学习? 如何使原本复杂.专业性强的工作或操作简单化? 封装是一个有效方法.封装降低了我

AI - MLCC - 01 - 问题构建 (Framing):机器学习主要术语

什么是(监督式)机器学习?简单来说,它的定义:机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测. 问题构建 (Framing):机器学习主要术语 标签 标签是要预测的事物,即简单线性回归中的 y 变量. 标签可以是小麦未来的价格.图片中显示的动物品种.音频剪辑的含义或任何事物. 特征 特征是输入变量,即简单线性回归中的 x 变量. 简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征,按如下方式指定: 在垃圾邮件检测器示例中,特征可能包括: 电

最详细的 Spring Boot 多模块开发与排坑指南

创建项目 创建一个 SpringBoot 项目非常的简单,简单到这里根本不用再提.你可以在使用 IDEA 新建项目时直接选择 Spring Initlalize 创建一个 Spring Boot 项目,也可以使用 Spring 官方提供的 Spring Boot 项目生成页面得到一个项目. 下面介绍一下使用 Spring 官方生成的方式,如果你已经有了一个 Spring Boot 项目,这部分可以直接跳过. 打开 https://start.spring.io/ 填写 group 和 Artif

分享《人工智能:智能系统指南》+PDF+顾力栩

下载:https://pan.baidu.com/s/1gLmGMKvjabYJTfDadKsKSg 更多资料学习:http://blog.51cto.com/14087171 版权说明:本人无版权,请您在体验电子版书籍的同时,支持正版,购买正版书籍!!! 首页如下图 原文地址:http://blog.51cto.com/14087171/2325611