python机器学习-sklearn挖掘乳腺癌细胞

python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制)

https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share

课程概述

Toby,持牌照金融公司担任模型验证专家,国内最大医药数据中心数据挖掘部门负责人!此课程讲述如何运用python的sklearn快速建立机器学习模型。课程结合美国威斯康辛乳腺癌细胞临床数据,实操演练,建立癌细胞预测分类器。

本视频系列通俗易懂,课程针对学生和科研机构,python爱好者。
本视频教程系列有完整python代码,观众看后可以下载实际操作。

了解癌症肿瘤基本常识,建立健康生活方式,预防癌症,减轻癌症治疗成本。

课程中十大经典机器学习算法震撼登场:逻辑回归,支持向量,KNN,神经网络,随机森林,xgboost,lightGBM,catboost。课程提供视频里讲解脚本,这些模型脚本可以应用于各个领域数据,包括金融反欺诈模型,信用评分模型,收入预测模型等等,为中小企业提供现成解决方案。

随机森林变量权重可视化

课程耗费三年时间,360度无死角的讲述整个模型开发周期,非市场上快餐教学。教程包括数据获取,数据预处理,变量筛选,模型筛选,模型评估,模型调参。

本视频系列通俗易懂,课程针对学生和科研机构,python爱好者。本视频教程系列有完整python代码,观众看后可以下载实际操作。这些模型代码可为中小型企业提供解决方案。

Anaconda+KNN+网格调参+交叉验证

目录

章节1:癌症常识

课时1警钟长鸣!癌症就在你身边11:00

课时2癌症科普介绍23:05

课时3病毒细菌诱发的癌症20:43

课时4祸从口入-致癌食物大揭秘08:37

课时5Python机器学习挖掘癌细胞概述13:11

章节2:sklearn编程环境搭建

课时6Python非官方扩展包下载地址02:21

课时7python第三方包安装(pip和conda install) 02:48

课时8Anaconda下载安装07:02

课时9Canopy下载和安装03:47

章节3:sklearn机器学习基础知识

课时10机器学习数据库介绍02:19

课时11机器学习书籍推荐02:59

课时12Python数据科学常用的包13:14

课时13如何选择模型03:57

课时14sklearn算法速查表02:29

课时15sklearn建模基础代码18:19

课时16python数据科学入门介绍(选修)55:15

章节4:获取乳腺癌临床数据

课时17数据获取-乳腺癌细胞临床数据07:06

章节5:变量筛选和描述性统计

课时18因子分析-解释癌细胞特征33:24

课时19变量筛选1-模型法11:50

课时20变量筛选2-比例法percentile07:04

课时21变量筛选3-方差法(推荐)06:36

课时22变量筛选4-KBest01:59

章节6:十大经典机器学习算法-建立乳腺癌细胞分类器

课时23逻辑回归logistic regression27:17

课时24支持向量SVM13:48

课时25KNN最近邻算法13:38

课时26决策树-decision tree21:59

课时27随机森林-random forest14:02

课时28神经网络neural network17:07

课时29xgboost12:27

课时30lightGBM03:51

课时31catboost07:08

课时32算法优劣对比10:52

课时33bagging VS boosting05:51

章节7:数据预处理

课时34pandasl数据处理基础知识15:50

课时35哑变量处理-hotcode热编码06:14

课时36imputer-缺失数据处理04:49

课时37scale-数据标准化处理12:13

章节8:模型调参

课时38遍历调参法05:15

课时39网格调参106:10

课时40网格调参204:26

课时41随机网格调参02:29

章节9:模型验证

课时42交叉验证cross validation03:45

课时43模型验证前言12:15

课时44混淆矩阵14:16

课时45ROC曲线11:57

课时46PSI(population stability index)10:20

课时47基尼系数GINI index25:16

课时48KS(kolmogorov-smirnoff)06:51

章节10:附录

课时49视频教程python脚本下载网址需购买观看

课时50显微镜下癌细胞

原文地址:https://www.cnblogs.com/webRobot/p/9517644.html

时间: 2024-11-05 19:00:24

python机器学习-sklearn挖掘乳腺癌细胞的相关文章

python机器学习-sklearn挖掘乳腺癌细胞(三)

python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 乳腺癌细胞和正常细胞是有显著区别的 癌细胞半径更大,形状更加不规则,凹凸不平.我们可以用科学手段来区分正常细胞和癌细胞吗?答案

python机器学习-sklearn挖掘乳腺癌细胞(五)

python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share  模型验证 分类器好坏验证,模型建立好后,不是万事大吉,需要进行crossvalidation, AUC,GINi,KS,Ga

Python机器学习库资料汇总

声明:以下内容转载自平行宇宙. Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy.其中Numpy是一个用python实现的科学计算包.包括: 一个强大的N维数组对象Array: 比较成熟的(广播)函数库: 用于整合C/C++和Fortran代码的工具包: 实用的线性代数.傅里叶变换和随机数生成函数. SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化.线性代数.积分.插值.特殊函数.快速傅里叶变换.信号处理和图像处理.常微分方程求解和其他科

《Python机器学习及实践:从零开始通往Kaggle竞赛之路》

<Python 机器学习及实践–从零开始通往kaggle竞赛之路>很基础 主要介绍了Scikit-learn,顺带介绍了pandas.numpy.matplotlib.scipy. 本书代码基于python2.x.不过大部分可以通过修改print()来适应python3.5.x. 提供的代码默认使用 Jupyter Notebook,建议安装Anaconda3. 最好是到https://www.kaggle.com注册账号后,运行下第四章的代码,感受下. 监督学习: 2.1.1分类学习(Cla

2016年GitHub排名前20的Python机器学习开源项目(转)

当今时代,开源是创新和技术快速发展的核心.本文来自 KDnuggets 的年度盘点,介绍了 2016 年排名前 20 的 Python 机器学习开源项目,在介绍的同时也会做一些有趣的分析以及谈一谈它们的发展趋势.和去年一样,KDnuggets 介绍了 GitHub 上最新的并且排名前 20 的 Python 机器学习开源项目.令人吃惊的是,去年一些最活跃的项目已经停滞不前了,也有一些项目跌出了前 20 名(在 contribution 和 commit 方面),当然,也有 13 个新项目进入了前

[转]Python机器学习工具箱

原文在这里 Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy.其中Numpy是一个用python实现的科学计算包.包括: 一个强大的N维数组对象Array: 比较成熟的(广播)函数库: 用于整合C/C++和Fortran代码的工具包: 实用的线性代数.傅里叶变换和随机数生成函数. SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化.线性代数.积分.插值.特殊函数.快速傅里叶变换.信号处理和图像处理.常微分方程求解和其他科学与工程中常用的计算

[resource]Python机器学习库

reference: http://qxde01.blog.163.com/blog/static/67335744201368101922991/ Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy.其中Numpy是一个用python实现的科学计算包.包括: 一个强大的N维数组对象Array: 比较成熟的(广播)函数库: 用于整合C/C++和Fortran代码的工具包: 实用的线性代数.傅里叶变换和随机数生成函数. SciPy是一个开源的Python算法库和数学工具包,S

Python机器学习--聚类

K-means聚类算法 测试: # -*- coding: utf-8 -*- """ Created on Thu Aug 31 10:59:20 2017 @author: Administrator """ ''' 现有1999年全国31个省份城镇居民家庭平均每人全年消费性支出的八个主 要变量数据,这八个变量分别是:食品. 衣着. 家庭设备用品及服务. 医疗 保健. 交通和通讯. 娱乐教育文化服务. 居住以及杂项商品和服务. 利用已 有数据

python机器学习工具包scikit-learn

scikit-learn这个非常强大的python机器学习工具包 http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html S1. 导入数据 大多数数据的格式都是M个N维向量,分为训练集和测试集.所以,知道如何导入向量(矩阵)数据是最为关键的一点.这里要用到numpy来协助.假设数据格式是: Stock prices    indicator1    indicator2 2.0             123