circso 对数据进行可视化

circos可以用来绘制圈图,能够对染色体上的数据进行可视化,首先需要一个染色体的文件

染色体的文件如下,每列之间空格分隔

chr - chr1 1 0 227556264 chr1
chr - chr2 2 0 192460366 chr2
chr - chr3 3 0 192294377 chr3
chr - chr4 4 0 170955103 chr4
chr - chr5 5 0 189454096 chr5
chr - chr6 6 0 181584905 chr6
chr - chr7 7 0 171882078 chr7
chr - chr8 8 0 146850525 chr8
chr - chr9 9 0 133195287 chr9

第一列 : 表名这行数据是染色体的数据

第二列: -

第三列: 染色体的名称,会显示在图上

第四列: 染色体编号

第五列:染色体的起始位置

第六列: 染色体的终止位置

第七列:染色体的颜色

在circos中有一些默认的颜色设置,用rgb设置一些默认的颜色名, 可以在circos的安装目录的etc/colors.conf 文件中查看,比如chr1 的颜色设置保存在colors.ucsc.conf 中,内容如下

chr1  = 153,102,0
chr2  = 102,102,0
chr3  = 153,153,30
chr4  = 204,0,0
chr5  = 255,0,0
chr6  = 255,0,204
chr7  = 255,204,204
chr8  = 255,153,0
chr9  = 255,204,0
chr10 = 255,255,0
chr11 = 204,255,0
chr12 = 0,255,0
chr13 = 53,128,0
chr14 = 0,0,204
chr15 = 102,153,255
chr16 = 153,204,255
chr17 = 0,255,255
chr18 = 204,255,255
chr19 = 153,0,204
chr20 = 204,51,255
chr21 = 204,153,255
chr22 = 102,102,102
chr23 = 153,153,153
chrX  = 153,153,153
chr24 = 204,204,204
chrY  = 204,204,204
chrM  = 204,204,153
chr0  = 204,204,153
chrUn = 121,204,61
chrNA = 255,255,255

我们也可以自定义一些颜色的名称,将其添加到colors.conf 文件中保存即可,比如自定义颜色

sample1 = 255,99,71

然后就可以使用sample1 作为颜色名了,在circos中还有很多颜色的名字,都是有规律的,比如

vvlred  : very very light red

vlred    : very light red

lred      : light red

red      :  red

dred    : dark red

vdred  : very dark red

vvdred : very very dark red

常用的颜色red, green, blue, yellow 都支持上面的颜色定义, 除此之外,还有其他很多的内置颜色, 详细信息可以查看circos安装目录下的/etc/colors.conf 文件查看, 里面的注释部分详细说明了颜色的定义方式。

接下来定义想要展示的数据,这里展示基因在染色体上的区间信息,通过 tile 的方式进行展示

chr1 8825 17551
chr1 31200 36882
chr1 44089 61948
chr1 91317 91388
chr1 91669 91774
chr1 105969 115431
chr1 115880 126341
chr1 137263 152263
chr1 185470 192339
chr1 200946 216412
chr1 246699 257364
chr1 302816 308640
chr1 326354 327127
chr1 346836 363346
chr1 351339 352292
chr1 373325 374824
chr1 469751 470980

第一列: 染色体名称

第二列:基因的起始位置

第三列:基因的终止位置

在下来准备突变位点的信息,用scatter 的方式进行展示

chr1 13400340 13400340 glyph_size=20,fill_color=red

第一列: 染色体名称

第二列: 突变的起始位置

第三列: 突变的终止位置

前三列的数据是必须的,第四列用来设置每个店的大小和颜色

最后是cir<<include colors_fonts_patt<ideogram>


<spacing>
default = 10u
break   = 2u
</spacing>

radius           = 0.9r
thickness        = 40p
fill             = yes
fill_color       = black
stroke_thickness = 2
stroke_color     = black
show_label       = yes
label_font       = default
label_radius     = dims(ideogram,radius) + 0.05r
label_with_tag   = yes
label_size       = 50
label_parallel   = yes
label_case       = lower
label_format     = eval(sprintf("%s",var(label)))
</ideogram>

<image>
<<include etc/image.conf>>
</image>

karyotype   = monkey_karyotype.txt
chromosomes_units = 1000000<plots>
<plot>
type            = tilefile        = genes.txt
r1          = 1.0r
r0          = 0.88r
orientation = out
layers      = 4
margin      = 0.02u
thickness   = 30
padding     = 5
layers_overflow       = hide
stroke_thickness = 1
stroke_color     = blue
color            = blue
</plot>

<plot>
type             = scatter
file             = scatter.txt
stroke_thickness = 0
glyph            = circle
max   = 47000
min   = 100
r1    = 0.8r
r0    = 0.3r<rules>
<rule>
condition = var(value) < 1000
glyph_size = 20
</rule>
<rule>
condition  = var(value) > 1000 && var(value) < 10000
glyph_size = 30
</rule>
<rule>
condition = var(value) > 10000
gplyph_size = 50
</rule>
</rules>
<backgrounds>
<background>
color     = vvlgrey
y0        = 100
</background>
</backgrounds>
</plot>
</plots>

<<include etc/housekeeping.conf>>

直接在circos.conf的目录运行circos,就会生成circos.png 和circos.svg;

因为circos中没有添加图例的方法,只能手工添加,利用R绘制图列,再用windows自带的画图工具对图片进行剪裁,

最终效果如下:

时间: 2024-10-07 15:53:47

circso 对数据进行可视化的相关文章

11,SFDC 管理员篇 - 报表和数据的可视化

1,Report Builder 1,每一个report type 都有一个 primay object 和多个相关的object 2,Primary object with related object— 返回所有primary object 字段 和每个字段至少一个related object字段相对应 3,Primary object with or without related object - 返回所有primary object字段 和 已有related object 字段,但是

瑞柏匡丞:数据科学可视化之要途

大数据的概念越来越多的被人们提及的今天,数据可视化也同样被提上了日程. 可视化已经成为了解数据的最佳方式(或唯一的方法),而且如果我们不可视化的话,我们就会落伍. 人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来.随着计算机硬件的 发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备.同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集.随 着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果.用

利用 t-SNE 高维数据的可视化

利用 t-SNE 高维数据的可视化  具体软件和教程见: http://lvdmaaten.github.io/tsne/  简要介绍下用法: % Load data load ’mnist_train.mat’ ind = randperm(size(train_X, 1)); train_X = train_X(ind(1:5000),:); train_labels = train_labels(ind(1:5000)); % Set parameters no_dims = 2; ini

MetricGraphics.js – 时间序列数据的可视化

MetricsGraphics.js 是建立在D3的基础上,被用于可视化和布局的时间序列数据进行了优化.它提供以产生一个原则性的,一致的和响应式的方式的图形常见类型的简单方法.该库目前支持折线图,散点图和直方图,以及地毯地块和基本线性回归功能. 在线演示      源码下载 您可能感兴趣的相关文章 网站开发中很有用的 jQuery 效果[附源码] 分享35个让人惊讶的 CSS3 动画效果演示 十分惊艳的8个 HTML5 & JavaScript 特效 Web 开发中很实用的10个效果[源码下载]

数据科学可视化之要途

大数据的概念越来越多的被人们提及的今天,数据可视化也同样被提上了日程. 可视化已经成为了解数据的最佳方式(或唯一的方法),而且如果我们不可视化的话,我们就会落伍. 人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来.随着计算机硬件的 发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备.同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集.随 着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果.用

OneAPM大讲堂 | 监控数据的可视化分析神器 Grafana 的告警实践

文章系国内领先的 ITOM 管理平台供应商 OneAPM 编译呈现. 概览 Grafana 是一个开源的监控数据分析和可视化套件.最常用于对基础设施和应用数据分析的时间序列数据进行可视化分析,也可以用于其他需要数据可视化分析的领域.Grafana 可以帮助你查询.可视化.告警.分析你所在意的指标和数据.可以与整个团队共享,有助于培养团队的数据驱动文化. Grafana 有强大的社区支持,有丰富的模板插件,足够满足需要的功能特性.几乎可以集成任何数据源.监控工具和告警平台.可谓是不可多得的神器.也

BI大数据智能可视化大屏分析系统建设软件开发

要建设企业级大数据可视化分析系统,需要构建企业统一的数据库体系或者直接将已有数据库对接.进行数据建模,为数据分析可视化呈现奠定基础.通过数据分析管理系统,有了数据基础,就可以构建BI大数据智能可视化大屏分析,满足企业的业务需求,提升数据价值. BI大数据智能可视化大屏分析系统建设软件开发的技术实现: 1.Hadoop:使用 hadoop作为系统的基础框架,对数据进行分布式的存储和分析.HDFS是 hadoop提供的分布式存储系统,它对体积巨大的数据切分成多个小块存储的不同的节点,每个块又做了多个

数据3D可视化简述!

3D可视化趋势,3D可视化这个词语应该不陌生了.近几年,人们把一些繁琐的信息通过可视化的图表视觉化展现出来的例子,涌现的越来越多!在其它领域中3D可视化技术带来的震撼和冲击,带来全新的"用户体验". 一.简述什么是数据3D可视化? 3D可视化,就是把复杂抽象的数据信息,以合适的视觉元素及视角去呈现,方便大家理解.记忆.传递! 数据3D可视化分为"科学可视化"与"信息可视化"两个方向: 1)科学3D可视化主要关注的是三维现象的可视化,如建筑学.气象

广州楼盘数据柱状图可视化

广州楼盘数据柱状图可视化 楼盘的价格评估在房地产中发挥着至关重要的作用.楼盘数据的可视化,则可使数据一目了然. 需要准备的数据有: 广州楼盘.xls. 国道.shp. 省道.shp. 河流.shp. 广东省.shp. 广州市.shp 1加载数据 (1)打开ArcMap,[添加数据],选择“国道.shp.省道.shp.河流.shp.广东省.shp.广州市.shp”,单击添加. (2)[添加数据],选择楼盘数据,如图1.2. 图1.2 添加数据 (3)进行简单的符号化,结果如图1.3. 图1.2 简