Espritz web地址
http://protein.bio.unipd.it/espritz/work/pid_1009562233/espritz.html
Espritz安装失败
下载好Espritz ,输入example时报如下错误!
好吧,人家需要的是‘GLIBC_2.14‘,先查看一下当前系统glibc的情况:
[[email protected] build]$ strings /lib64/libc.so.6 |grep GLIBC
GLIBC_2.2.5
GLIBC_2.2.6
GLIBC_2.3
GLIBC_2.3.2
GLIBC_2.3.3
GLIBC_2.3.4
GLIBC_2.4
GLIBC_2.5
GLIBC_PRIVATE
好吧,确实没有,安装一下。
1. glibc下载
从http://www.gnu.org/software/libc/ 下载源代码。我下载的版本是2.14,
链接地址是http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz。
2. 安装
因为glibc库使用广泛,为了避免污染当前系统环境,最好自定义安装目录,使用时定义一下环境变量就行了。具体步骤如下:
[[email protected] ~]$ wget http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz
[[email protected] ~]$ tar xvf glibc-2.14.tar.gz
[[email protected] ~]$ cd glibc-2.14
[[email protected] glibc-2.14]$ mkdir build
[[email protected] glibc-2.14]$ cd ./build
[[email protected] build]$ ../configure --prefix=/home/ssw/bin/glibc-2.14
[[email protected] build]$ make -j4
[[email protected] build]$ make install
当我们执行
[[email protected] build]$ ../configure --prefix=/home/ssw/bin/glibc-2.14
报如下错误。
GLIBC_2.14版本以上的基本上都试了一遍,都报以上错误。目前最新版本的是GLIBC_2.24
能安装成功的只有GLIBC_2.10,但是安装GLIBC_2.10没用,软件依赖的至少是GLIBC_2.14的。
参考:
https://my.oschina.net/zhangxu0512/blog/262275
http://blog.sina.com.cn/s/blog_54d63a8b0100um60.html
http://blog.sina.com.cn/s/blog_75acbe0b0101596n.html
错误原因:服务器linux系统内核版本太低无法编译高版本的GLIBC_2.14
使用web端
填入E-Mail然后上传fasta序列等候邮件即可,而且web端并没有限制序列的数量。
使用网页得到结果。
获得数据
等一段时间,我们会收到一封邮件如下。
打开连接我们可以获得6721个蛋白的disorder的5个特征。如下图。
计算我们自己数据的disorder
准备文件
yeast_gold_protein_pair.csv
disorder.csv
代码如下:
# -*- coding: utf-8 -*-
"""
Created on Wed Nov 16 12:46:27 2016
@author: sun
"""
import pandas as pd
yeast_gold_protein_pair=pd.read_csv(‘yeast_gold_protein_pair.csv‘,usecols=[‘idA‘,‘idB‘])
disorder=pd.read_csv(‘disorder.csv‘,index_col=0)
#注loc通过标签选择数据,iloc通过位置选择数据
idA=disorder.loc[‘sp‘ + yeast_gold_protein_pair.idA,:]
idB=disorder.loc[‘sp‘ + yeast_gold_protein_pair.idB,:]
idA.index=range(len(idA))
idB.index=range(len(idB))
data=pd.concat([yeast_gold_protein_pair,idA,idB],axis=1)
data.to_csv(‘gold_protein_disorder.csv‘,index=False)
gold_protein_disorder.csv