Interproscan, xml文件转化为tsv

将interproscan的结果转化格式

很奇怪 tsv格式里没有go, kegg, inter-domain信息,但是xml文件里面却有,tsv文件比较好处理,所以先将xml文件转化为tsv。用软件自带的工具:

The convert mode is designed to work only for XML documents created with the same version. This makes sure we can introduce new schema updates in the future. However the XML schema is stable and will only change, if we need to add new features for instance.

You can use InterProScan 5‘s CONVERT mode to reformat your XML result file into any other possible output format (TSV, GFF3, SVG and HTML). For compatibility reasons you can also convert XML results into InterProScan 4.8 raw format. This will give our users enough time to migrate their pipeline to InterProScan 5.

Please note it is NOT possible to reformat any non-XML format. XML is the richest data type and is therefore the only format which allows us to produce any other format of interest.

To enable InterProScan 5 to run in CONVERT mode you need to set the mode option to ‘CONVERT‘.

Usage instructions

./interproscan.sh -mode convert

You will see the following usage instructions:

Welcome to InterProScan v5 CONVERT mode.usage: java -XX:+UseParallelGC -XX:+AggressiveOpts            -XX:+UseFastAccessorMethods -Xms512M -Xmx2048M -jar            interproscan-5.jar

Please give us your feedback by sending an email to[email protected].ac.uk -b,--output-file-base <OUTPUT-FILE-BASE>   Optional, base output                                            filename.  Note that this                                            option and the --outfile (-o)                                            option are mutually exclusive.                                            The appropriate file extension                                            for the output format(s) will                                            be appended automatically. By                                            default the input file                                            path/name will be used.

 -d,--output-dir <OUTPUT-DIR>               Optional, output directory.                                            Note that this option and the                                            --outfile (-o) option or the                                            --output-file-base (-b) option                                            are mutually exclusive. The                                            appropriate file extension for                                            the output format(s) will be                                            appended automatically. By                                            default the input file                                            path/name will be used.

 -f,--formats <OUTPUT-FORMATS>              Optional, case-insensitive,                                            comma separated list of output                                            formats. Available formats are                                            TSV, GFF3 (default set) and                                            RAW (InterProScan 4 TSV),                                            HTML, SVG.

 -i,--xml <XML-FILE-PATH>                   Mandatory, path to the IMPACT                                            XML file that should be loaded                                            and converted.

 -o,--outfile <EXPLICIT_OUTPUT_FILENAME>    Optional explicit output file                                            name.  Note that this option                                            and the --output-file-base                                            (-b) option are mutually                                            exclusive. If this option is                                            given, you MUST specify a                                            single output format using the                                            -f option.  The output file                                            name will not be modified.                                            Note that specifying an output                                            file name using this option                                            OVERWRITES ANY EXISTING FILE.

 -T,--tempdir <TEMP-DIR>                    Optional, specify temporary                                            file directory. The default                                            location is /temp.

具体使用:

/share/bioinfo/miaochenyong/interproscan-software/tars/interproscan-5.7-48.0/interproscan.sh -mode convert -f tsv -i your_xml_file
如果输入文件为test.xml

默认输出文件为:test.xml.tsv

by freemao

FAFU

 
时间: 2024-08-11 03:32:54

Interproscan, xml文件转化为tsv的相关文章

怎么使用XSLT将 XML文件转化为HTML5的网页

怎么使用XSLT将 XML文件转化为HTML5的网页 在这篇文章中,我将展示怎么使用XSLT语言将 一个 XML 文件输出成HTML5 格式的网络页面. 让我们先看一下如下一个XML格式的文件 (movies.xml) ,文件包含了一些关于影片的相关信息: <?xml version="1.0" encoding="UTF-8"?> <movies>   <movie>     <title>Aliens</ti

xml文件转化为View的几种方法

在Android中,我们常常需要将一个布局文件转化为View对象,然后再在这个View对象中查找子控件,以下是几种常见的转化方式,主要是通过打气筒实现转化,Infalte方法的使用 http://bbs.itcast.cn/thread-77838-1-1.html

R处理xml文件

最近处理数据的时候需要处理一些xml文件,但是xml文件的格式之前并不是很熟悉.幸好R有一些函数可以帮助快速处理xml文件.其中的xmlToList函数尤其方便,可以使你从陌生的XML迅速回到熟悉的R的数据结构. library(XML) url_experiment = "ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA001//DRA001860/DRA001860.experiment.xml" xml_experiment

XML文件与实体类之间的互相转换

二 序列化 XML文件与实体类的互相转换 一.将XML文件反序列化为实体类对象 1. 通常程序的配置信息都保存在程序或者网站的专门的配置文件中(App.config/web.config).但是现在为了演示XML序列化和反序列化,将配置信息保存在一个XML文件(config.xml)中,通过反序列化将配置信息读取出来保存到一个单独的类(Config.cs)中.这样如果需要用到配置信息,没必要每次都读写XML文件,只需要调用Config这个类就可以获取对应节点的信息. config.xml: <?

Android中将xml布局文件转化为View树的过程分析(上)

有好几周没写东西了,一方面是因为前几个周末都有些事情,另外也是因为没能找到好的写作方向,或者说有些话题 值得分享.写作,可是自己积累还不够,没办法只好闷头继续研究了.这段时间一边在写代码,一边也在想Android中 究竟是如何将R.layout.xxx_view.xml这样的布局文件加载到Android系统的view层次结构中的(即我们常说的view树). 这期间一方面自己研究了下源码,另一方面也在网上搜索了下相关文章,发现了2篇很不错的同主题文章,推荐给大家: http://blog.csdn

Android中将xml布局文件转化为View树的过程分析(下)-- LayoutInflater源码分析

在Android开发中为了inflate一个布局文件,大体有2种方式,如下所示: // 1. get a instance of LayoutInflater, then do whatever you want LayoutInflater inflater = (LayoutInflater) context.getSystemService(Context.LAYOUT_INFLATER_SERVICE); // 2. you're in some View class, then jus

Xml文件转化为对象,对象转化为Xml

Stream用来将xml转化为对象,或则将对象转化为xml,xml与Json的转化也可以借助它 首先下载jar包: xstream-XXX.jar xpp3-XXX.jar 可以点击这里下载http://download.csdn.net/detail/mejustdoit/8901831 关于转换最主要的就是两个 新建Stream对象 XStream xstream = new XStream();或 XStream xstream = new XStream(new DomDriver())

C++ 利用 libxl 将 Excel 文件转化为 Xml 文件

在游戏开发工作中,策划和运营一般会用Excel来编写配置文件,但是程序读取配置,最方便的还是xml文件.所以最好约定一个格式,然后在二者之间做一个转化. 本文利用libxl来读取Excel文件,利用 timyxml2 来写入xml文件 libxl3.65破解版 : http://pan.baidu.com/s/1boYaeRl  提取码:3xbe tinyxml2 源码: https://github.com/leethomason/tinyxml2 #include <stdio.h> #i

利用oxygen编辑并生成xml文件,并使用JAVA的JAXB技术完成xml的解析

首先下载oxygen软件(Oxygen XML Editor),目前使用的是试用版(可以安装好软件以后get trial licence,获得免费使用30天的权限,当然这里鼓励大家用正版软件!!!) 1 首先建立一个空白XML文件,直接点击下图所示即可: 2 可以使用xml文本编辑界面,或者使用xml树状图编辑界面 切换到xml树状图编辑界面的方法为: 即可调出当前xml文件所对应的xml树状图编辑界面 3 设计并编辑xml文件 根据自己的需要可以利用xml树状图操作界面来方便的设计自己的xml