a simple machine learning system demo, for ML study.

Machine Learning System

introduction

This project is a full stack Django/React/Redux app that uses token based authentication with Knox.

Then I add Machine Learning features for demostrate the full workflow of the data mining, including the four stage corresponding to four pages:

  1. data management
  2. data explore
  3. model train
  4. prediction

The data set is the classic iris data, which is only for demo, and this project is from my interest. so you can reference, but the quality is not assured.

features

  • authentication functions

login from login page register your account logout from inner page

  • data management

input iris items edit iris items delete iris items

  • data explore

inspect attribute distribution through histogram inspect sepal distribution through scatter graph inspect petal distribution through scatter graph

  • model train

input cluster number train a cluster model using sklearn-kmeans library inspect cluster result through sepal and petal scatter

  • prediction

input iris sepal and petal attributes predict iris cluster

technology stack

category name comment
frontend reactjs frontend framework
frontend redux state management
frontend react-C3JS D3 based graph tool
frontend react-bootstrap style component library
frontend data-ui react data visualization tool
backend django backend framework
backend django-rest-knox authentication library
backend djangorestframework restful framework
backend sklearn machine learning tool

Quick Start

# Install dependencies
cd ./frontend
npm install

# Build for production
npm run build

# Install dependencies
cd ../backend
pipenv install

# Serve API on localhost:8000
pipenv run python manage.py runserver

snapshot

login page

model train page

prediction page

原文地址:https://www.cnblogs.com/lightsong/p/10800931.html

时间: 2024-11-07 02:14:20

a simple machine learning system demo, for ML study.的相关文章

Lessons learned developing a practical large scale machine learning system

原文:http://googleresearch.blogspot.jp/2010/04/lessons-learned-developing-practical.html Lessons learned developing a practical large scale machine learning system Tuesday, April 06, 2010 Posted by Simon Tong, Google Research When faced with a hard pre

Stanford机器学习笔记-7. Machine Learning System Design

7 Machine Learning System Design Content 7 Machine Learning System Design 7.1 Prioritizing What to Work On 7.2 Error Analysis 7.3 Error Metrics for Skewed Classed 7.3.1 Precision/Recall 7.3.2 Trading off precision and recall: F1 Score 7.4 Data for ma

Advice for Applying Machine Learning & Machine Learning System Design----- Stanford Machine Learning(by Andrew NG)Course Notes

Adviceforapplyingmachinelearning Deciding what to try next 现在我们已学习了线性回归.逻辑回归.神经网络等机器学习算法,接下来我们要做的是高效地利用这些算法去解决实际问题,尽量不要把时间浪费在没有多大意义的尝试上,Advice for applying machine learning & Machinelearning system design 这两课介绍的就是在设计机器学习系统的时候,我们该怎么做? 假设我们实现了一个正则化的线性回

Machine Learning - XI. Machine Learning System Design

http://blog.csdn.net/pipisorry/article/details/44119187 机器学习Machine Learning - Andrew NG courses学习笔记 Machine Learning System Design机器学习系统设计 Prioritizing What to Work On优先考虑做什么 Error Analysis 错误分析 Error Metrics for Skewed Classes有偏类的错误度量 Trading Off P

Machine learning system design---Error metrics for skewed(偏斜的) classes

skewed classes skewed classes: 一种类里面的数量远远高于(或低于)另一个类,即两个极端的情况. 预测cancer的分类模型,如果在test set上只有1%的分类误差的话,乍一看是一个很好的结果,实际上如果我们将所有的y都预测为0的话(即都不为cancer),分类误差为0.5%(因为cancer的比率为0.5%).error降低了,那这是对算法的一种改进吗?显然不是的.因为后面一种方法实际上什么也没有做(将所有的y=0),不是一种好的机器学习算法.所以这种error

斯坦福第十一课:机器学习系统的设计(Machine Learning System Design)

11.1  首先要做什么 11.2  误差分析 11.3  类偏斜的误差度量 11.4  查全率和查准率之间的权衡 11.5  机器学习的数据 11.1  首先要做什么 在接下来的视频中,我将谈到机器学习系统的设计.这些视频将谈及在设计复杂的机器 学习系统时,你将遇到的主要问题.同时我们会试着给出一些关于如何巧妙构建一个复杂的机器学习系统的建议.下面的课程的的数学性可能不是那么强,但是我认为我们将要讲到的 这些东西是非常有用的,可能在构建大型的机器学习系统时,节省大量的时间. 本周以一个垃圾邮件

机器学习系统设计 ---- Machine Learning System Design

构建一个机器学习算法的过程: 快速构建一个简单的算法,并用交叉验证集来测试这个算法的性能. 画出学习曲线,检查算法是否有高方差或高偏差的问题,从而选择相应的应对方法. 误差分析,查看使算法出现误差的实例,分析这些实例是否有某种系统化的趋势. 评估算法性能 偏斜类(skewed classes):训练集中的大多数实例属于一类,其他类占得很少或没有. 类偏斜的情况下我们就不能单纯使用误差来评判算法的效果.应使用新的评估度量值. TP:预测为真,实际为真 FP:预测为真,实际为假 FN:预测为假,实际

Ng第十一课:机器学习系统的设计(Machine Learning System Design)

11.1  首先要做什么 11.2  误差分析 11.3  类偏斜的误差度量 11.4  查全率和查准率之间的权衡 11.5  机器学习的数据 11.1  首先要做什么 在接下来的视频将谈到机器学习系统的设计.这些视频将谈及在设计复杂的机器学习系统时,将遇到的主要问题.同时会试着给出一些关于如何巧妙构建一个复杂的机器学习系统的建议.下面的课程讲的东西数学性不强,但是非常有用的,可能在构建大型的机器学习系统时,节省大量的时间. 本周以一个垃圾邮件分类器算法为例进行讨论. 为了解决这样一个问题,首先

斯坦福大学公开课机器学习:machine learning system design | error metrics for skewed classes(偏斜类问题的定义以及针对偏斜类问题的评估度量值:查准率(precision)和召回率(recall))

上篇文章提到了误差分析以及设定误差度量值的重要性.那就是设定某个实数来评估学习算法并衡量它的表现.有了算法的评估和误差度量值,有一件重要的事情要注意,就是使用一个合适的误差度量值,有时会对学习算法造成非常微妙的影响.这类问题就是偏斜类(skewed classes)的问题.什么意思呢.以癌症分类为例,我们拥有内科病人的特征变量,并希望知道他们是否患有癌症,这就像恶性与良性肿瘤的分类问题.假设y=1表示患者患有癌症,假设y=0表示没有得癌症,然后训练逻辑回归模型.假设用测试集检验了这个分类模型,并