numpy数据集练习——鸢尾花数据集

#导包
import numpy as np

# 从sklearn包自带的数据集中读出鸢尾花数据集data
from sklearn.datasets import load_iris
data = load_iris()

# 查看data类型,包含哪些数据
print("数据类型:",type(data))
print("数据类目:",data.keys())

# 取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
iris_feature = data.feature_names,data.data
print("鸢尾花特征:",iris_feature)
print("iris_feature数据类型",type(iris_feature))
iris_target = data.target
print("鸢尾花数据类别:",iris_target)
print("iris_target数据类型:",type(iris_target))

# 取出所有花的花萼长度(cm)的数据
sepal_len = np.array(list(len[0] for len in data.data))
print("花萼长度:",sepal_len)

# 取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
pental_len = np.array(list(len[2] for len in data.data))
pental_len.resize(3,50)   #重新分配花瓣长度内存
pental_wid = np.array(list(len[3] for len in data.data))
pental_wid.resize(3,50)   #重新分配花瓣宽度内存
iris_lens = (pental_len,pental_wid)
print("花瓣长宽:",iris_lens)

# 取出某朵花的四个特征及其类别
print("特征:",data.data[1])
print("类别:",data.target[1])

# 将所有花的特征和类别分成三组,每组50个
#建立3个相应列表存放数据
iris_set = []
iris_ver = []
iris_vir = []

for i in range(0,150):
    if  data.target[i] == 0:
        Data = data.data[i].tolist()
        Data.append(‘setosa‘)
        iris_set.append(Data)
    elif data.target[i] ==1:
        Data = data.data[i].tolist()
        Data.append(‘versicolor‘)
        iris_ver.append(Data)
    else:
        Data = data.data[i].tolist()
        Data.append(‘virginica‘)
        iris_vir.append(Data)

# 生成新的数组,每个元素包含四个特征+类别
datas = (iris_set,iris_ver,iris_vir)
print("新的数组:",datas)

原文地址:https://www.cnblogs.com/hodafu/p/9787032.html

时间: 2024-08-30 14:58:10

numpy数据集练习——鸢尾花数据集的相关文章

探索sklearn|鸢尾花数据集

1 鸢尾花数据集背景 鸢尾花数据集是原则20世纪30年代的经典数据集.它是用统计进行分类的鼻祖. sklearn包不仅囊括很多机器学习的算法,也自带了许多经典的数据集,鸢尾花数据集就是其中之一. 导入的方法很简单,不过我比较好奇它是如何来存储这些数据的,于是我决定去背后看一看 from sklearn.datasets import load_iris data = load_iris() 找到sklearn包的路径,发现包可不少,不过现在扔在一边,以后再来探索,我现在要找到是datasets文

鸢尾花数据集

1.2.3 #加载numpy包 import numpy #加载sklearn包 from sklearn.datasets import load_iris #读出鸢尾花数据集data data=load_iris() #查看data类型 print(type(data)) #查看数据内容 print(data.keys()) 4. #鸢尾花的四个特征 data_feature= data.feature_names iris_data=data.data print(data_feature

做一个logitic分类之鸢尾花数据集的分类

做一个logitic分类之鸢尾花数据集的分类 Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例.数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度.花萼宽度.花瓣长度.花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种. 首先我们来加载一下数据集.同时大概的展示下数据结构和数据摘要. import numpy as np

鸢尾花数据集可视化

数据集描述:其包含120条训练集和30条测试集 对鸢尾花的属性和标签之间的可视化操作: 1 import tensorflow as tf 2 import pandas as pd 3 import numpy as np 4 import matplotlib.pyplot as plt 5 6 #鸢尾花数据集 7 8 TRAIN_URL = 'http://download.tensorflow.org/data/iris_training.csv' #数据下载地址 9 train_pat

numpy利用下标打乱数据集

利用下标打乱数据集 import numpy as np #导入numpy库 def shuffleData(data): index=np.arange(len(data)) #生成一个数据集行数大小的顺序数组[0,1,...,len(data)](顺序下标) np.random.shuffle(index) #打乱顺序下标 data=data[index] #按照乱序下标重新排列数据集 return data data=np.arange(18) data.resize((6,3)) #生成

R语言重要数据集分析研究——  数据集本身的分析技巧

数据集本身的分析技巧           作者:王立敏           文章来源:网络 1.数据集 数据集,又称为资料集.数据集合或资料集合,是一种由数据所组成的集合. Data set(或dataset)是一个数据的集合,通常以表格形式出现.每一列代表一个特定变量.每一行都对应于某一成员的数据集的问题.它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数.每个数值被称为数据资料.对应于行数,该数据集的数据可能包括一个或多个成员. 2.数据分析 数据结构 创建向量和矩阵 函数c(

caffe中train过程的train数据集、val数据集、test时候的test数据集区别

val是validation的简称.training dataset 和 validation dataset都是在训练的时候起作用.而因为validation的数据集和training没有交集,所以这部分数据对最终训练出的模型没有贡献.validation的主要作用是来验证是否过拟合.以及用来调节训练参数等. 比如你训练0-10000次迭代过程中,train和validation的loss都是不断降低,但是从10000-20000过程中train loss不断降低, validation的lo

[机器学习系统设计(二)]如何对真实样本分类(上)

1. Iris数据集 Iris数据集(鸢尾花数据集):包含不同种类Iris花朵的数据,可以通过花的形态来识别花的种类.数据集包含花的四个属性(特征):花萼长度,花萼宽度,花瓣长度,花瓣宽度. sklearn中的iris数据集有5个key:  ['target_names', 'data', 'target', 'DESCR', 'feature_names'] (1)其中target_names 是分类名称 :['setosa' 'versicolor' 'virginica'],即分别为山鸢尾

【Python数据挖掘课程】五.线性回归知识及预测糖尿病实例

今天主要讲述的内容是关于一元线性回归的知识,Python实现,包括以下内容:        1.机器学习常用数据集介绍        2.什么是线性回顾        3.LinearRegression使用方法        4.线性回归判断糖尿病        前文推荐:       [Python数据挖掘课程]一.安装Python及爬虫入门介绍       [Python数据挖掘课程]二.Kmeans聚类数据分析及Anaconda介绍       [Python数据挖掘课程]三.Kmean