【BioCode】Elm格式中提取位点信息

说明:

①Elm格式:

PLMD ID    Uniprot Accession    Position        Type        Sequence         Species          PMIDs
PlMD编号 Uniprot数据库编号         位点    翻译后修饰类型    序列信息        物种          PMID

PLMD-1      O00115        52        Ubiquitination    MIPLLLAALLCVPAGALTC Homo sapiens    21963094;23266961

②代码说明:从上述格式中提取Position信息,当 Uniprot Accession相同时,Position位于同一行。不相同时,回车换行。每个位点之间用空格隔开。

代码:

package single;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileReader;
import java.io.FileWriter;

public class Elm_site {
    // 从Elm中获得位点 每一行是一个蛋白质的的位点
    public void get_site(String path) {
        try {
            FileReader reader = new FileReader(path);
            BufferedReader br = new BufferedReader(reader);
            String str=null;
            String now="O00115";
            FileWriter fileWritter = new FileWriter("E:\\experiment--help\\linglingbao\\site.txt");
            BufferedWriter bufferWritter = new BufferedWriter(fileWritter);

            while((str=br.readLine())!=null){
                String[] temp =str.split("    ");//每一列之间使用TAB隔开的,需要用TAB来截取
                String uni_id=temp[1];
                if(uni_id.equals(now)){
                    System.out.print(temp[2]+" ");//输出
                    bufferWritter.write(temp[2]+" ");//写入文件
                    bufferWritter.flush();
                }else{
                    now=uni_id;
                    System.out.print("\n"+temp[2]+" ");
                    bufferWritter.write("\n"+temp[2]+" ");
                    bufferWritter.flush();
                }
            }
            br.close();
            reader.close();
        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
    public static void main(String[] args) {
        Elm_site site = new Elm_site();
        String path = "E:\\experiment--help\\linglingbao\\ubiquitination.txt";
        site.get_site(path);
    }
}

输出结果格式:

时间: 2024-08-08 19:11:44

【BioCode】Elm格式中提取位点信息的相关文章

python中提取位图信息(AttributeError: module 'struct' has no attribute 'unstack')

前言 今天这篇博文有点意思,它是从一个例子出发,从而体现出在编程中的种种细节和一些知识点的运用.和从前一样,我是人,离成神还有几十万里,所以无可避免的出现不严谨的地方甚至错误,请酌情阅读. 0x00 首先,题目是:读取一个位图文件(xxx.bmp),然后读取前30个字节,从这前三十个字节中提取一些信息. 这里有一些知识要先知道:一个位图的前30位有什么? BMP格式采用小端方式存储数据,文件头的结构按顺序如下: 前两个字节:'BM'表示Windows位图,'BA'表示OS/2位图: 一个4字节整

从MP3中提取歌曲信息

一首MP3歌曲除了音乐信息外,还包含了如歌名.演唱者等信息,当我们用winamp软件听音乐时,播放清单就自动将这些信息读出来.大部分人都喜欢从网上下载音乐,但下载下来的MP3文件名都是文件上传系统自动取名的,和歌曲本身根本不相符,所以,给用户带来了很大的麻烦.但是,懒人有懒人的做法,我们何不自己写一个程序,将歌曲信息自动读出来并为MP3文件自动更名呢? 下面我就以C#为工具,把开发过程写出来. 一首MP3的额外信息存放在文件的最后面,共占128个字节,其中包括以下的内容(我们定义一个结构说明):

在Scrapy中如何利用Xpath选择器从HTML中提取目标信息(两种方式)

前一阵子我们介绍了如何启动Scrapy项目以及关于Scrapy爬虫的一些小技巧介绍,没来得及上车的小伙伴可以戳这些文章: 手把手教你如何新建scrapy爬虫框架的第一个项目(上) 手把手教你如何新建scrapy爬虫框架的第一个项目(下) 关于Scrapy爬虫项目运行和调试的小技巧(上篇) 关于Scrapy爬虫项目运行和调试的小技巧(下篇) 今天我们将介绍在Scrapy中如何利用Xpath选择器从HTML中提取目标信息.在Scrapy中,其提供了两种数据提取的方式,一种是Xpath选择器,一种是C

从身份证中提取个人信息

15位身份证号码各位的含义: 1-2位省.自治区.直辖市代码: 3-4位地级市.盟.自治州代码: 5-6位县.县级市.区代码:7-8位为出生年(默认19xx年出生):9-10位为出生月:11-12位为出生日: 13-15位为顺序号,其中第15位男为单数,女为双数: 18位身份证号码各位的含义: 1-2位省.自治区.直辖市代码: 3-4位地级市.盟.自治州代码: 5-6位县.县级市.区代码:7-10位为出生年(默认19xx年出生):11-12位为出生月:13-14位为出生日: 15-17位为顺序号

【BioCode】根据seq与位点信息截取窗口

代码说明 sequence24371.txt 以上为所有氨基酸的编号,序列,与位点标记.根据标记为"1"的位点,截取窗口:如下(实验结果): 图示为一个窗口为12的蛋白质片段 2N+1=25: 实现代码: #include<stdio.h> #include<stdlib.h> #include<string.h> #include<algorithm> #include<iostream> #define N 12 usin

[转]【流媒體】H264—MP4格式及在MP4文件中提取H264的SPS、PPS及码流

[流媒體]H264—MP4格式及在MP4文件中提取H264的SPS.PPS及码流 SkySeraph Apr 1st 2012  Email:[email protected].com 一.MP4格式基本概念 MP4格式对应标准MPEG-4标准(ISO/IEC14496) 二.MP4封装格式核心概念 1  MP4封装格式对应标准为 ISO/IEC 14496-12(信息技术 视听对象编码的第12部分: ISO 基本媒体文件格式/Information technology Coding of a

在excel单元格中提取信息

平时在excel中处理数据的时候,肯定会遇到在单元格提取信息的情况,比如在地址中提取省.市.地区等,如果数据源内容规整的话,可以直接使用left().right().mid()等函数直接提取,但是大多数情况下,数据源的内容比较混乱,这时的就提取需要一些函数的组合,比如下面这种: 上图中是一些地址,我们看到大部分还是按照省.市.区来排列的,但是其中有一些格式并不统一,比如第6行,如何解决,首先我们需要一个辅助列,这个辅助列表就是你希望提取出来的内容,比如我想提取城市,我就弄一个存储城市名的辅助列,

使用crash提取vmcore中预分析信息

一.介绍 在linux系统内核发生崩溃或者服务器hang住时,Kdump(kernel crash dump:内核崩溃转储设备)生成vmcore文件,通过分析vmcore信息判断原因,而 crash是一个被广泛应用的内核奔溃转储文件分析工具,前提系统必须安装crash工具和内核调试工具kernel-debuginfo. 二.工具的安装与调试 1.安装包的版本,要与linux内核一致,查看linux内核版本: #uname -a 2.安装.配置.启动kdump:       安装kdump:  

使用NPOI从Excel中提取图片及图片位置信息

原文:使用NPOI从Excel中提取图片及图片位置信息 问题背景: 话说,在ExcelReport的开发过程中,有一个比较棘手的问题:怎么复制图片呢? 当然,解决这个问题的第一步是:能使用NPOI提取到图片及图片的位置信息.到这里,一切想法都很顺利.但NPOI到底怎么提取图片及图片的位置信息呢?NPOI能不能提取到图片的位置信息呢? 这是两个问题.是两个让BaiGoogleDu几近沉默的问题.但官方教程的评论中还是流露出了答案的蛛丝马迹. 哇咔咔,这是我去看源码寻答案的的动力. 此处省去(N多字