NCBI sra数据下载软件安装

引用网址:

http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=prefetch

http://blog.csdn.net/likelet/article/details/8226368

http://liuwei441005.blog.163.com/blog/static/13570581120144935013905

1.SRA Toolkit 的安装

cd /opt/

wget ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz

tar -xzf sratoolkit.current-centos_linux64.tar.gz

mv sra.. sratoolkit

cd sratoolkot

#配置sra toolkit

./vdb-config -i

上下可以选择,按回车键选择指定项,当[x]时代表已选中

主要修改存储路径选择[Change] 回车

按TAB键选中【Goto】回车输入指定路径,然后保存退出。注意:所指定的路径大小必须大于100G,不然会出错。

按6键保存 ,按7键退出

下载命令 :./fastq-dump.2.5.6 SRR167669 -i 输出的为fasq格式

使用sratool下载速度比ftp 快但是没有asprea 快

2.aspre 的安装

安装包在scp [email protected]:/opt/aspera-connect-3.6.1.110647-linux-64.tar.gz  .

passwd:123.bmk

tar -zxvf aspera-connect-3.6.1.110647-linux-64.tar.gz

sh aspera-connect-3.6.1.110647-linux-64.sh

安装好以后,会在HOME目录下新建一个叫.aspera的目录,有两个文件比较重要:

一个是ascp的可执行文件:

~/.aspera/connect/bin/ascp

另一个ascp的密钥文件:

~/.aspera/connect/etc/asperaweb_id_dsa.putty

建议将密钥备份到HOME目录下方便使用:

安装好以后,会在HOME目录下新建一个叫.aspera的目录,有两个文件比较重要:

一个是ascp的可执行文件:

~/.aspera/connect/bin/ascp

另一个ascp的密钥文件:

~/.aspera/connect/etc/asperaweb_id_dsa.putty

建议将密钥备份到HOME目录下方便使用:

$ cp ~/.aspera/connect/etc/asperaweb_id_dsa.openssh ~/

或者是.putty结尾的文件(试下吧 哪个能下用哪个)

再把aspera-license复制到系统目录

$ sudo cp ~/.aspera/connect/etc/aspera-license /usr/local/bin/

再把ascp可执行文件的路径加入PATH变量中,或者将其拷贝到当前目录

或者是.putty结尾的文件(试下吧 哪个能下用哪个)

再把aspera-license复制到系统目录

~/.aspera/connect/etc$ sudo cp aspera-license /usr/local/bin/

再把ascp可执行文件的路径加入PATH变量中,或者将其拷贝到当前目录

export PAHT="/root/.aspera/connect/bin:$PATH

source /etc/profile

测试代码,注意最后有个点,代表下载到当前目录下:

ascp -i /your-path-to/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -QT -l 200m biomarker@ftp-trace.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR102/SRR1025665/SRR1025665.sra  .

passwd:BMK.123.BMK

2、参考《Viewing and downloading tabular metadata with the SRA Run Selector》下载宏基因组数据对应的下载链接

打开这个网址:http://www.ncbi.nlm.nih.gov/Traces/study/ , 搜索SRA号

http://trace.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA192977

下载后得到的链接地址如下:

做些修改,把ftp://ftp-trace.ncbi.nlm.nih.gov部分都去掉,只剩下文件路径,如下:

3、开始下载:

ascp  -i /your-path-to/.aspera/connect/etc/asperaweb_id_dsa.putty --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp   --file-list  SRR_Download_List.txt  .

4、用SRA tools把SRA格式转换成fastq

下载toolshttps://www.ncbi.nlm.nih.gov/books/NBK158900/,linux版本,下载解压后可以直接使用,添加个环境变量即可。

命令: fastq-dump.2.3.5.2 -A SRR*.sra

ascp  -i /your-path-to/.aspera/connect/etc/asperaweb_id_dsa.putty --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp   --file-list  SRR_Download_List.txt  .

每次都输入密码太麻烦,可以在命令行或.profile中设置ASPERA_SCP_PASS这个环境变量:

export ASPERA_SCP_PASS=你的aspera密码

时间: 2024-12-24 14:43:23

NCBI sra数据下载软件安装的相关文章

PC端数据下载软件开发(Python)

存储工具:阿里云->对象存储 需要将数据从云端下载到本地后再进行后续分析处理. 手动下载 需要下载的文件不多时,可以用这个方式. 依次点击:阿里云->控制台->对象存储->Bucket列表->XX Bucket->文件管理 该界面下,选中数据文件后,点击 批量操作->下载 脚本下载(Python) 按照阿里云的SDK文档(有各种语言的版本,这里选的是Python),可以很快地编写下载脚本: https://help.aliyun.com/document_deta

linux中proz下载软件安装部署

W系统里有迅雷这个下载工具,L系统里也一样有prozilla下面说一下CENTOS 5 系统里安装prozilla的过程1.首先在下面的链接下载最新稳定版本的prozilla 记得下tar包版本的[url]http://prozilla.genesys.ro/?p=download[/url]2.然后进行解压tar -xjvf prozilla-2.0.4.tar.bz2 3.配置之前先修改一个文件(如果未改make时会出现extra qualification ‘DL_Window::’ on

NCBI SRA数据库

简介 SRA数据库是美国国立卫生研究院(NIH)的高通量测序数据的主要归档,是国际核苷酸序列数据库协作(INSDC)的一部分,其中包括NCBI序列读取存档(SRA),欧洲生物信息学研究所(EBI)和DNA数据库 日本(DDBJ). 提交给三个组织中的任何一个的数据都是共享的. SRA数据库数据来自高通量测序平台(Roche 454 GSSystem®,Illumina GenomeAnalyzer®,Applied Biosystems SOLiDSystem®,HelicosHeliscope

Linux 基础入门----Linux 下软件安装

介绍 介绍 Ubuntu 下软件安装的几种方式,及 apt,dpkg 工具的使用. 一.Linux 上的软件安装 通常 Linux 上的软件安装主要有三种方式: 在线安装 从磁盘安装deb软件包 从二进制软件包安装 从源代码编译安装 这几种安装方式各有优劣,而大多数软件包会采用多种方式发布软件,所以我们常常需要全部掌握这几种软件安装方式,以便适应各种环境.下面将介绍前三种安装方式,从源码编译安装你将在 Linux 程序设计中学习到. 二.在线安装 试想一下,平时我们在使用 Windows 的时候

linux下软件安装

一.Linux 上的软件安装 通常 Linux 上的软件安装主要有四种方式: 在线安装 从磁盘安装de软件包 从二进制软件包安装 从源代码编译安装 二.在线安装 在不同的linux发行版上面在线安装方式会有一些差异包括使用的命令及它们的包管理工具, 本文以ubuntu为例. 1. 先体验一下 比如我们想安装一个软件,名字叫做 w3m(w3m是一个命令行的简易网页浏览器),那么输入如下命令: $ sudo apt-get install w3m $ w3m www.shiyanlou.com/fa

实验楼 Linux 下软件安装

通常 Linux 上的软件安装主要有四种方式: 在线安装 从磁盘安装deb软件包 从二进制软件包安装 从源代码编译安装 apt 包管理工具介绍 APT是Advance Packaging Tool(高级包装工具)的缩写,是Debian及其派生发行版的软件包管理器,APT可以自动下载,配置,安装二进制或者源代码格式的软件包,因此简化了Unix系统上管理软件的过程.APT最早被设计成dpkg的前端,用来处理deb格式的软件包.现在经过APT-RPM组织修改,APT已经可以安装在支持RPM的系统管理R

Linux 下软件安装

Linux 下软件安装 实验介绍 介绍 Ubuntu 下软件安装的几种方式,及 apt,dpkg 工具的使用. 一.Linux 上的软件安装 通常 Linux 上的软件安装主要有三种方式: 在线安装 从磁盘安装deb软件包 从二进制软件包安装 从源代码编译安装 这几种安装方式各有优劣,而大多数软件包会采用多种方式发布软件,所以我们常常需要全部掌握这几种软件安装方式,以便适应各种环境.下面将介绍前三种安装方式,从源码编译安装你将在 Linux 程序设计中学习到. 二.在线安装 试想一下,平时我们在

NCBI下载SRA数据

从NCBI下载数据本来是一件很简单的事情,但是今天碰到几个坑: 1.paper里没有提供SRA数据号.也没有提供路径: 2.不知道文件在ftp的地址,不能直接用wget下载 所以通过在NCBI官网,直接在SRA搜索栏里: 输入paper的title关键词NIFTY BGI 搜索结果: 选一个文件点击进去 进去之后,再点击SRP 然后: 出现如下内容: 然后选择所有SRR文件: 下载Accession list之后得到文件列表: SRR354208 SRR357358 SRR357397 SRR3

GEO数据下载分析(SRA、SRR、GEM、SRX、SAMN、SRS、SRP、PRJNA全面解析)

很多时候我们需要从GEO(https://www.ncbi.nlm.nih.gov/geo/)下载RNA-seq数据,一个典型的下载页面是https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE76381(搜 GSE76381). 这里你会看到数据的总览: GSM2268339 1772067089_A01 GSM2268340 1772067089_A02 GSM2268341 1772067089_A03 -- Supplementary