numpy利用下标打乱数据集

利用下标打乱数据集

import numpy as np
#导入numpy库
def shuffleData(data):
    index=np.arange(len(data))
    #生成一个数据集行数大小的顺序数组[0,1,...,len(data)](顺序下标)
    np.random.shuffle(index)
    #打乱顺序下标
    data=data[index]
    #按照乱序下标重新排列数据集
    return data
data=np.arange(18)
data.resize((6,3))
#生成一个4*2的数据集
print("orign:\n",data)
data=shuffleData(data)
print("Shuffled:\n",data)
#输出:
# orign:
#  [[ 0  1  2]
#  [ 3  4  5]
#  [ 6  7  8]
#  [ 9 10 11]
#  [12 13 14]
#  [15 16 17]]
# Shuffled:
#  [[ 0  1  2]
#  [15 16 17]
#  [ 3  4  5]
#  [ 9 10 11]
#  [ 6  7  8]
#  [12 13 14]]

原文地址：https://www.cnblogs.com/redo19990701/p/11452369.html

时间： 2024-08-30 18:05:06

numpy利用下标打乱数据集的相关文章

苹果电脑利用curl下载数据集

在看tensorflow书上迁徙学习的这一部分的时候,书上说利用 curl http://download.tensorflow.org/example_images/flower_photos.tgz 下载数据集的时候,照着书上的指令在终端上做,结果出现的是一堆乱码,一直在屏幕上开始跑,刚开始以为是正在进行下载数据什么的,跑了几次都是同一种情况,最终按回车键会显示错误. 通过查阅资料后发现,curl直接跟网址的时候,其会直接在终端屏幕上显示,所以说显示出来的是乱码,为了将数据集下载到具体的文件

主题模型利用gibbslda做数据集主题抽样

Gibbslda有很多版本,我所用的版本为C++版(下载地址http://gibbslda.sourceforge.net/),平台是linux,博主试过windows上运行,有两个主要问题很烦-,一个是path,一个是平台太大.最后还是投入了ubuntu的怀抱,感觉配置好g++环境后速度还不错.由于系统版本等原因,不同的情况下可能会出现或多或少的问题,在做lda抽取的过程中,参考了几个博客,地址如下,我在这里做了一个总结,基本上应该避免了网上教程从来都不能使用的毛病.所以如果按照博主的过程出现

从零到一：caffe-windows(CPU)配置与利用mnist数据集训练第一个caffemodel

一.前言本文会详细地阐述caffe-windows的配置教程.由于博主自己也只是个在校学生,目前也写不了太深入的东西,所以准备从最基础的开始一步步来.个人的计划是分成配置和运行官方教程,利用自己的数据集进行训练和利用caffe来实现别人论文中的模型(目前在尝试的是轻量级的SqueezeNet)三步走.不求深度,但求详细.因为说实话caffe-windows的配置当初花了挺多时间的,目前貌似还真没有从头开始一步步讲起的教程,所以博主就争取试着每一步都讲清楚吧. 这里说些题外话:之所以选择Sque

Caffe3——ImageNet数据集创建lmdb类型的数据

Caffe3——ImageNet数据集创建lmdb类型的数据 ImageNet数据集和cifar,mnist数据集最大的不同,就是数据量特别大:单张图片尺寸大,训练样本个数多:面对如此大的数据集,在转换成lmdb文件时:使用了很多新的类型对象. 1,动态扩容的数组“vector”,动态地添加新元素 2,pair类型数据对,用于存储成对的对象,例如存储文件名和对应标签 3,利用opencv中的图像处理函数,来读取和处理大尺寸图像一:程序开始由于要向imageNet数据集中设置resize和是否

利用PHP内置函数制作一个简单的验证码

因为这两天学习了一些PHP的内置函数,所以今天就用一些内置函数配合数组来简单的制作一个随机验证码的效果. 例如:2dT5 T22c.... 分析:首先分析验证码的组成: 1.验证码是由数字1-9,大写字母A-Z,小写字母a-z 中随机生成的. 2.我先创建一个包含指定范围单元的数组.(这里应该是三个:数字,大写字母,小写字母). 3.我可以将这些数组合并成一个大的数组 4.随机打乱该函数.ps:其实觉得在这里再做一步将数组随机打乱,感觉也没有什么必要啊!因为后面我们做的不也是随机抽取吗?

面向小数据集构建图像分类模型Keras

文章信息本文地址:http://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html 本文作者:Francois Chollet 概述在本文中,我们将提供一些面向小数据集(几百张到几千张图片)构造高效.实用的图像分类器的方法. 本文将探讨如下几种方法: 从图片中直接训练一个小网络(作为基准方法) 利用预训练网络的bottleneck(瓶颈)特征 fine-tune预训练网

R-创建数据集-ch2

1.数据集的概念 R的数据结构:包括标量.向量.矩阵.数组.数据框和列表: R的数据类型:包括数值型.字符型.逻辑型(TRUE/FALSE).复数型(虚数)和原生型(字节): 不同的行业对于数据集的行和列叫法不同.统计学家称它们为观测(observation)和变量(variable),数据库分析师称记录和字段,数据挖掘和机器学习叫示例和属性. 2.数据的结构对象(object)是指可以赋值给变量的任何事物,包括常量.数据结构.函数,甚至图形. 名义型变量或有序型变量称为因子(factor),

Swift入门（十二）——利用Extension添加逆序输出字符串方法

Swift好像没有自带逆序输出字符串的方法,于是决定通过拓展(Extension)给String类添加一个逆序输出字符串的reverse方法. 首先新建一个Swift文件,命名规则不太清楚,于是暂且模仿OC叫做String+Operation吧,然后实现我们需要拓展的方法.下面先贴上代码,然后解释一下这段代码. //String+Operation.swifft import Foundation //逆序输出swift中的字符串 extension String{ func Reverse()

因为数组的地址是连续的所以呢可以利用指针来输出数组

//声明数组.变量和指针变量 int a[2][3],i,j; int* ip; //从键盘上为数组a赋值 for (i=0;i<2;i++) //为数组a赋值 for (j=0;j<3;j++) { cout<<"a["<<i<<"]["<<j<<"]="; cin>>a[i][j]; } //利用下标变量显示数组a for (i=0;i<2;i++) {