科研数据集下载

个人收集了一些网上开放的免费科研数据集,这里提供数据集列表以及下载地址,供高校和科研机构免费查询、下载和使用。

金融

交通

推荐系统

医疗健康

图像数据

自然语言处理

时间: 2024-10-26 23:03:23

科研数据集下载的相关文章

scikit-learn数据集下载太慢的问题

有时候用scikit-learn在线下载数据时太慢,因为网络或者其他原因,这时候我们可以先把数据集下载到本地,然后再把这个数据集放到scikit-learn的data中,首先我们需要找到 scikit-learn在线下载的数据集放到哪里了: 然后拿我们本地的数据集去替换在线下载的数据集,不然会报错. 原文地址:https://www.cnblogs.com/xinmomoyan/p/10698782.html

Kaggle数据集下载

Kaggle数据集下载步骤: 安装Kaggle库: 注册Kaggle账户: 找到数据集,接受rules: 在My Account>>API中,点击Create New API Token,即可下载json文件: 将json文件剪切至kaggle文件夹中(或者覆盖旧的json文件): 下载数据. 踩坑点: 第3步中需要手机验证码,手机号前面要加上+860,否则收不到验证码: 每次下载数据,或者被403 – Forbidden时,都要走一遍步骤3.4.5: 第6步下载数据前,在cmd中输入kagg

[Pytorch数据集下载] 下载MNIST数据缓慢的方案

步骤一 首先访问下面的网站,手工下载数据集.http://yann.lecun.com/exdb/mnist/ 把四个压缩包下载到任意文件夹,以便之后使用. 步骤二 把自己电脑上已经下载好的数据集的文件路径放到浏览器的窗口. 直接输入 file:/// 会自行跳转 步骤三 command + MNIST 跳转至mnist.py,把源代码中的resource的网址替换成自己文件 resources = [ 'http://yann.lecun.com/exdb/mnist/train-images

数据集下载 MNIST

The Street View House Numbers (SVHN) Dataset SVHN is a real-world image dataset for developing machine learning and object recognition algorithms with minimal requirement on data preprocessing and formatting. It can be seen as similar in flavor to MN

mnist数据集下载

http://yann.lecun.com/exdb/mnist/ THE MNIST DATABASE of handwritten digitsYann LeCun, Courant Institute, NYUCorinna Cortes, Google Labs, New YorkChristopher J.C. Burges, Microsoft Research, Redmond The MNIST database of handwritten digits, available

苹果电脑利用curl下载数据集

在看tensorflow书上迁徙学习的这一部分的时候,书上说利用 curl http://download.tensorflow.org/example_images/flower_photos.tgz 下载数据集的时候,照着书上的指令在终端上做,结果出现的是一堆乱码,一直在屏幕上开始跑,刚开始以为是正在进行下载数据什么的,跑了几次都是同一种情况,最终按回车键会显示错误. 通过查阅资料后发现,curl直接跟网址的时候,其会直接在终端屏幕上显示,所以说显示出来的是乱码,为了将数据集下载到具体的文件

Tensorflow2.0默认下载数据集到C盘的修改方法

jupyter(Win版本)下载数据集会默认到C盘下,Linux会默认到root下,修改方式如下· tf1.x: import os import tensorflow as tftf.disable_v2_behavior()tf.enable_eager_execution() train_dataset_url = "http://download.tensorflow.org/data/iris_training.csv" train_dataset_fp = tf.keras

[数据集]新浪微博数据集MicroblogPCU

数据集下载地址:下载 摘要:MicroblogPCU是从新浪微博採集到的.它能够被用于研究机器学习方法和社会关系研究. 这个数据集被原作者用于探索微博中的spammers(发送垃圾信息的人).他们的demo在这里 数据集的属性信息: weibo_user.csv   -user_id: 用户ID -user_name: 用户昵称 -gender:性别,male,female.other -class:账户级别 -message:账户注冊位置或其它个人信息 -post_num: 邮政编码 -fol

最流行的4个机器学习数据集【转】

机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度.所以会研究数据,会分析数据很重要.本文作为学习研究数据系列博文的开篇,列举了4个最流行的机器学习数据集. Iris Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集.通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类. 数据集特征: 多变量 记录数: 150 领域: 生活 属性特征: