本文演示如何使用azure studio基于云测试数据创建第一个machine learning的experiment,算法选择是线性回归。
首先要有一个azure studio账号,登录后进入dashboard。
创建一个BLANK的Experiment
添加测试数据 , 搜索Price, 选择Automibile price data(Raw)
把这个模块拖到右边的data item位置
搜索Project column模块,拖到右边,在Project columns中点击 ‘Launch column selector‘
希望以所有列作为映射的输入,过滤掉normalized-losses列,如下配置
现在要过滤掉一些无效数据所在的行,搜索clean missing data->选择模块拖到右边->点击模块->将cleaning mode选择为remove entire row
点击Launch Column selector,选择一些列
再次搜索并添加Project columns 模块,拖到右边,点击launch columns selector ,
选择price即可,因为接下来只是对price列进行预测,其他列只作为算法的培训数据。
添加一个split模块,目的是将测试数据分开使用,本例中以80%作为培训数据,20%的数据作为测试数据,计算验证结果的准确程度。在本模块中,设置作为学习数据的百分比以及随机种子。
接下来添加算法模块,搜索‘regression‘,在回归算法中选择线性回归,拖到右边
添加train model,使用测试数据进行学习
点击’Launch Column Selector‘,选择输出的列,这里依然为‘price‘
现在可以点击下面的‘run‘进行运行。
最后,添加score module,链接上面train model和之前的split module输出的第二个dataset,用于误差分析
添加evaluate module,进行结果评估
点击‘run‘进行运行。
右键 Evaluate Module -> Evaluate Results -> visualize ,可以看到本次Experiment的精确程度