优酷更新地址:http://list.youku.com/albumlist/show?id=26979872&ascending=1&page=1
官方使用的是python的scikit-learn
一 Hello World
一个简单的水果分类器 用的决策树
from sklearn import tree features = [[140, 1], [130, 1], [150, 0], [170, 0]] labels = [0,0,1,1] clf = tree.DecisionTreeClassifier() clf = clf.fit(features,labels) print clf.predict([[150,0]])
二 Visualizing a Decision Tree
many types of classifiers
- artificial neural network
- support vector machine
- ....
为什么选择决策树 (Decision Tree)
- 容易理解
- 为数不多的可以解释的方法
Iris(水仙花数)sklearn里带有该数据集 可以直接导入
三 What Makes a Good Feature?
区分狗
眼睛的颜色差不多,所以作为特征没有用,降低准确性
身高有用,但是并不完美
身高的柱状图 在中间部分 概率是对半的
好的feature 应该相互独立,好的feature之间有好的组合
四 Let’s Write a Pipeline
从sklearn 可以import各种分类器 类似的过程 接口类似
function从input output中学习 调整参数 得到我们想要的结果
时间: 2024-10-09 01:10:46