NCBI下载SRA数据

从NCBI下载数据本来是一件很简单的事情,但是今天碰到几个坑:

1、paper里没有提供SRA数据号、也没有提供路径;

2、不知道文件在ftp的地址,不能直接用wget下载

所以通过在NCBI官网,直接在SRA搜索栏里:

输入paper的title关键词NIFTY BGI

搜索结果:

选一个文件点击进去

进去之后,再点击SRP

然后:

出现如下内容:

然后选择所有SRR文件:

下载Accession list之后得到文件列表:

SRR354208
SRR357358
SRR357397
SRR357398
SRR357666
SRR357667
SRR357668
SRR357669
SRR357670
SRR357671
SRR357672
SRR357673
SRR357674
SRR357675
SRR357676

然后根据这个列表在linux下载:

[[email protected] NIFTY_BGI_samp]$ cat /data1/Medicine/WZD/SRR_Acc_List.txt | while read line
> do
> echo $line
> /home/wuzengding/biosoftware/sratoolkit.2.8.2-1-centos_linux64/bin/fastq-dump.2.8.2 ${line}
> done

 下载成功!!

注:另外一种更简单方法

在找到这个界面时

点击send to

最后得到SraRunInfo.csv文件,文件内容是各个samp sequence的列表信息,包括FTP上的下载地址:

然后在linux中下载,

完毕!

原文地址:https://www.cnblogs.com/zdwu/p/8473986.html

时间: 2024-10-11 16:20:37

NCBI下载SRA数据的相关文章

使用GEOquery下载GEO数据--转载

最近需要下载一大批GEO上的数据,问题是我要下载的Methylation数据根本就没有sra文件,换言之不能使用Aspera之类的数据进行下载.但是后来我发现了GEOquery这个不错的R包,不知道是网络问题还是怎么,GEOquery有时候运行也不太稳定,但是总体来说,很好地解决了我的问题. 首先假设我们想要下载的数据是GSE77445,这是一批DNA甲基化数据,我们可以在R语言中安装GEOquery之后,载入R包,然后直接输入: Data <- getGEO("GSE77445"

利用QGIS下载地图数据

这段时间做了一些利用地理信息进行定位导航的系列工作,其中很重要的一部分是如何获取到地图数据,比如道路的矢量图.某一区域的栅格图,我用到的主要工具是QGIS.QGIS是一个跨平台的免费应用,其中集成了对矢量图.栅格图处理的很多功能,同时也集成了很多开放地图数据网站的接口,比如OpenStreetMap等,因此,在获取数据,并处理成我们需要的格式方面非常便利.本篇博文主要介绍如何使用QGIS下载数据,并处理成特定的格式. 一. 指定区域指定地物矢量图获取 我们经常会遇到这样一种需求:获取某一区域的指

下载行政区划数据

目录 抓取行政区划数据 天地图接口 接口信息 代码 民政部数据 获取全国县级行政区信息 全国县级行政区边界 政府驻地地理位置 代码 抓取行政区划数据 天地图接口 天地图官网都有相关介绍,这里只是简单的搬运一下. 接口说明地址:http://lbs.tianditu.gov.cn/server/administrative.html 接口信息 天地图行政区划API是一类简单的HTTP/HTTPS接口,提供由行政区划地名.行政区划编码查询中心点.轮廓.所属上级行政区划的功能. 请求: http://

NCBI sra数据下载软件安装

引用网址: http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=prefetch http://blog.csdn.net/likelet/article/details/8226368 http://liuwei441005.blog.163.com/blog/static/13570581120144935013905 1.SRA Toolkit 的安装 cd /opt/ wget ftp-trace.ncb

DisGeNET 数据库 数据的下载以及数据的应用

DisGeNET数据库 整合了多个数据库的gene-disease associations (GDAs)和大量的文献,并且采用文本挖掘技术对孟德尔疾病.复杂疾病和环境性疾病进行了相关性分析.具体技术包括对基因-疾病词汇的mapping.DisGeNET本体分析. 使用的数据源如下: Curated Data: UNIPROT.CTD.CLINVAR.ORPHANET.GWAS CATALOG Predicted Data: CTD.MGD.RGD Literature Data: GAD.LH

下载大数据实战课程第一季Python基础和网络爬虫数据分析

python语言近年来越来越被程序相关人员喜欢和使用,因为其不仅简单容易学习和掌握,而且还有丰富的第三方程序库和相应完善的管理工具:从命令行脚本程序到gui程序,从B/S到C/S,从图形技术到科学计算,软件开发到自动化测试,从云计算到虚拟化,所有这些领域都有python的身影:python已经深入到程序开发的各个领域,并且会越来越多的人学习和使用. 大数据实战课程第一季Python基础和网络爬虫数据分析,刚刚入手,转一注册文件,视频的确不错,可以先下载看看:链接:http://pan.baidu

SilverLight学习笔记--使用WebClient实现通讯(一)(上传和下载字符串数据)

一.什么是WebClient类   1.基本知识    WebClient类是Mircsoft在.NET框架下提供的向 URI 标识的资源发送数据和从 URI 标识的资源接收数据的公共方法.通过这个类,大家可以在脱离浏览器的基础上模拟浏览器对互联网上的资源的访问和发送信息.它使人们使用起来更加简单方便,然而它也有先天不足的地方.那就是缺少对cookies/session的支持.    WebClient类为Silverlight插件提供了一整套的HTTP客户端功能,可以下载应用程序数据,比如XA

冰点下载:数据解析错误

问题描述:数据解析错误 解决方案: 上图网址:https://tieba.baidu.com/p/5630852260?red_tag=0698642778 下载软件网址:http://www.bingdian001.com/?p=30 解压运行,效果如下:正常使用 原文地址:https://www.cnblogs.com/thebreakofdawn/p/9131628.html

python scrapy爬取皇冠体育源码下载网站数据二(scrapy使用详细介绍)

1.scrapy工程创建皇冠体育源码下载论坛:haozbbs.com Q1446595067 在命令行输入如下命令,创建一个使用scrapy框架的工程 scrapy startproject scrapyDemo 1 命令创建好后的工程结构如下图scrapy工程结构 输入如下命令,在工程目录中创建示例代码 PS C:\ProjectPycharm> cd scrapyDemoPS C:\ProjectPycharm\scrapyDemo> scrapy genspider example ex