09、RNA降解图的计算过程

  RNA降解是影响芯片质量的一个很重要的因素,因为RNA是从5’开始降解的,所以理论5’的荧光强度要低于3’。RNA降解曲线可以表现这种趋势。

以样品GSM286756.CEL和GSM286757.CEL为例:

library(affy)

rawData<-ReadAffy("GSM286756.CEL","GSM286757.CEL")

deg<-AffyRNAdeg(rawData)

plotAffyRNAdeg(deg)

结果:

RNA降解图是只用PM探针进行计算。从图中可以看出,探针的相对位置从0~10即从1号~11号,但是其实很多探针组并不是11个PM。运行下面的代码:

pmdata <- pm(rawData, LIST = TRUE)

probe.set.size <- function(x) {

size <- dim(x)[1]

return(size)

}

max.num <- sapply(pmdata, probe.set.size)

tab <- (table(max.num))

> tab

max.num

8     9    10    11    13    14    15    16    20    69

5     1     6 54130     4     4     2   482    40     1

5个探针组只有8个PM,1个探针组有9个PM,……,54130个探针组有11个PM……

频数最大的54130对应11个PM,意思是大多数的探针组拥有11个PM,那么就选取包含11个PM的探针组来进行计算。原本共有5+1+6+54130+……+1=54675个探针组,筛选过后,用于计算的探针组数目变为了54130。

下面是RNA讲解曲线的计算方法:

样品1=GSM286756.CEL

样品2=GSM286757.CEL

n_K=11

N=54130

    1号探针   2号探针 …… n_K号探针

    探针组1 8.308339 9.710806 …… 10.521600

    探针组2 8.761551 8.791163 …… 10.514714

样品1   …… …… …… …… ……

    探针组N 13.07129 13.88054 …… 13.09902

    平均值 6.872147 6.887466 …… 7.031115

    方差 1.207499 1.226234 …… 1.444140

    探针组1 8.459432 9.590587 …… 10.567005

    探针组2 8.479780 8.942515 …… 10.340963

样品2   …… …… …… …… ……

    探针组N 13.29735 14.10411 …… 13.44837

    平均值 6.818737 6.835684 …… 6.993071

    方差 1.255631 1.275068 …… 1.505525

平均值:

[,1]     [,2] ……     [,11]

[1,] 6.872147 6.887466 …… 7.031115

[2,] 6.818737 6.835684 …… 6.993071

方差:

[,1]     [,2] ……     [,11]

[1,] 1.207499 1.226234 …… 1.444140

[2,] 1.255631 1.275068 …… 1.505525

平均值在原来的基础上减去第一列的值作为 A:

[,1]       [,2] …… [,11]

[1,]    0 0.01531892 …… 0.1589683

[2,]    0 0.01694627 …… 0.1743337

方差在原来的基础上除以N的开方作为 B:

[,1]        [,2] …… [,11]

[1,] 0.005190005 0.005270531 …… 0.006207122

[2,] 0.005396884 0.005480424 …… 0.006470962

A除以B的结果:

[,1]     [,2] ……     [,11]

[1,]    0 2.906522 …… 25.61063

[2,]    0 3.092145 …… 26.94093

第一个样品的数据即第一行加上1,第二个样品的数据即第二行加上2,……,第n个样品的数据即第n行加上n ……,以此类推(这是为了拉开折线的距离):

[,1]     [,2] ……      [,11]

[1,]    1 3.906522 …… 26.61063

[2,]    2 5.092145 …… 28.94093

把这些数据绘制成折线就是RNA折线图了

时间: 2024-10-09 12:45:16

09、RNA降解图的计算过程的相关文章

12、MA图的计算过程

为了简化问题,假设有3张芯片,每组数有9个探针: Data: 2,4,6,7,9,10,4,7,8,3 9,5,3,2,5,7,9,10,3,12 6,4,3,2,7,8,1,2,6,9 一.给3组数取2的对数 Log2Data: 1.0,2.0,2.5849626,2.807355,3.169925,3.321928,2.0,2.807355,3.0 3.169925,2.321928,1.5849625,1.0,2.321928,2.807355,3.169925,3.321928,1.58

润乾报表教程-集算报表优化计算过程

报表作为数据统计分析软件,当它出现性能问题需要对数据源计算进行优化时,执行路径难以控制是阻碍报表优化的难题之一.这是由于数据库执行路径不透明,程序员很难甚至无法干预执行路径,也就难以提高数据库的性能.而一般报表工具不具备强计算能力,大部分计算仍然要依靠数据库进行,这就导致很多报表优化效果不理想. 不同于一般报表工具,润乾集算报表内置了专门用于数据计算的集算引擎,开发人员可以通过编写集算脚本完成报表数据源准备.与数据库执行SQL路径不可控相比,集算脚本的执行过程是可控的,开发人员可根据实际情况编写

rhgb Red Hat 图形化启动过程

rhgb:Red Hat 图形化启动过程 HEL系列的跟Ubuntu不一样,需要加参数vga=0x317. rhgb Red Hat 图形化启动过程

10、探针组检测值的计算过程

一组探针是否能被检测到,可以用检测值来表示.simpleaffy包的detection.p.val方法默认alpha1=0.05,alpha2=0.065.检测值小于alpha1为A(无,Absent),介于alpha1和alpha2之间为M(不确定,Marginal Present),大于alpha2为P(有,Present). 以样品GSM286756.CEL为例,计算它的231211_s_at探针组的检测值: library(affy) library(simpleaffy) rawDat

随机森林之oob的计算过程

随机森林有一个重要的优点就是,没有必要对它进行交叉验证或者用一个独立的测试集来获得误差的一个无偏估计.它可以在内部进行评估,也就是说在生成的过程中就可以对误差建立一个无偏估计. 随机森铃在生成每颗决策树时,会随机且有放回的抽取样本,每棵决策树会有大概1/3的样本未抽取到,这些样本就是每棵树的oob样本.具体计算过程如下: 根据这种特点,我们可以对其进行oob估计,步骤如下: 1.计算决策树对其对应的oob样本的分类情况(约有1/3棵树参与oob估计) 2.以投票的方式确定该样本的分类 3.计算o

ES6中reduce的计算过程

reduce计算过程如下 原文地址:https://www.cnblogs.com/malong1992/p/12128672.html

gantt甘特图的制作过程

甘特图主要是用来做项目管理的,可以清楚的看到任务间的逻辑关系,任务与时间关系和任务间并行关系. 在甘特图中,横轴方向表示时间,纵轴方向并列着活动列表.图表内可以用线条.数字.文字代号等来表示计划(实际)所需时间,计划(实际)输出,计划(实际)开工或完工时间等. 1.根据计划列出所有任务 对于每一个任务,不管这项任务是并行任务或者是线性任务,列出任务的启动时间,估算完成该任务所需要花费的时间.如果本项任务是线性任务,同时也列出这项任务所依赖的任务,最后使用表格的方式将所有的任务按先后顺序列出.下面

TensorFlow的初次使用+Python画3D图和计算KL散度

ython计算KL散度import numpy as np import scipy.stats x = [np.random.randint(1,11) for i in range(10)] print(x) print(np.sum(x)) px = x/np.sum(x)#归一化 print(px) y = [np.random.randint(1, 11) for i in range(10)] print(y) print(np.sum(y)) py = y / np.sum(y)#

图解后缀表达式的计算过程

为了解释后缀表达式的好处,我们先来看看,计算机如何应用后缀表达式计算出最终的结果20的. 后缀表达式:9 3 1-3*+ 10 2/+ 规则:从左到右遍历表达式的每个数字和符号,遇到是数字就进栈,遇到是符号,就将处于栈顶两个数字出栈,进行运算,运算结果进栈,一直到最终获得结果. 下面是详细的步骤: 1. 初始化一个空栈.此桟用来对要运算的数字进出使用. 2. 后缀表达式中前三个都是数字,所以9.3.1进栈. 3. 接下来是减号“-”,所以将栈中的1出栈作为减数,3出栈作为被减数,并运算3-1得到