长链非编码RNA(lncRNA)

长链非编码RNA(lncRNA)

转自:http://blog.sina.com.cn/s/blog_909da11301010bkz.html

   

长链非编码RNA(lncRNA)是一类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。

lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,近年来的研究表明,lncRNA参与了X染色体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等多种重要的调控过程,lncRNA的这些调控作用也开始引起人们广泛的关注。哺乳动物基因组序列中4%~9%的序列产生的转录本是lncRNA(相应的蛋白编码RNA的比例是1%),虽然近年来关于lncRNA的研究进展迅猛,但是绝大部分的lncRNA的功能仍然是不清楚的。

目前并不能仅根据序列或者结构来推测它们的功能,根据它们在基因组上相对于蛋白编码基因的位置,可以将其分为正义链(sense)、反义链(antisense)、双向(bidirectional)、内含子间(intronic)、基因间(intergenic)这5种类型。这种位置关系对于推测lncRNA的功能有很大帮助。

根据lncRNA在基因组上的位置,可将其分为5种类型:1. sense, 2.
antisense, 3. bidirectional, 4. intronic,
5.intergenic。图中编码RNA和非编码RNA外显子分本别用蓝色和红色表示。

近年来通过对已发现的lncRNA的研究表明,lncRNA能够在多种层面调控基因的表达水平,其调控机制开始为人们所揭示

lncRNA的作用机制。根据进年来所发现的lncRNA的作用机制,lncRNA主要可能具有以下几个方面的功能:

1)通过在蛋白编码基因上游启动子区(桔)发生转录,干扰下游基因(蓝)的表达(如酵母中的SER3基因)。

2)通过抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝)表达(如小鼠中的p15AS)。

3)通过与蛋白编码基因的转录本形成互补双链(紫),进而干扰mRNA的剪切,从而产生不同的剪切形式。

4)通过与蛋白编码基因的转录本形成互补双链(紫),进一步在Dicer酶作用下产生内源性的siRNA,调控基因的表达水平。

5)通过结合到特定蛋白质上,lncRNA转录本(绿)能够调节相应蛋白的活性。

6)作为结构组分与蛋白质形成核酸蛋白质复合体。

7)通过结合到特定蛋白上,改变该蛋白的胞质定位。

8)作为小分子RNA,如miRNA,piRNA的前体分子转录。

一般来说,lncRNA主要从以下三种层面实现对基因表达的调控:

1.
表观遗传学调控

lncRNA招募染色质重构复合体到特定位点进而介导相关基因的表达沉默。例如来源于HOXC基因座的lncRNA
HOTAIR,它能够招募染色质重构复合体PRC2并将其定位到HOXD位点,进而诱导HOXD位点的表观遗传学沉默。同样,Xist,Air,Kcnq1ot1这些lncRNA都能够通过招募相应的重构复合体,利用其中的甲基转移酶如Ezh2或者G9a等实现表观遗传学沉默。

2.
转录调控

lncRNA能够通过多种机制在转录水平实现对基因表达的沉默,表现在如下几个方面:1.lncRNA的转录能够干扰临近基因的表达。例如在酵母中,SER3基因会受到其上游lncRNA
SRG1的转录的干扰;2.lncRNA能够通过封阻启动子区域来干扰基因的表达。例如,DHFR上游的一个lncRNA能够和DHFR的启动子区域形成RNA-DNA3螺旋结构,进而抑制转录因子TFIID的结合,从而抑制DHFR的基因表达;3.lncRNA能够与RNA结合蛋白作用,并将其定位到基因启动子区从而调控基因的表达。例如,CCND1启动子上游一个lncRNA能够调节RNA结合蛋白TLS的活性,进而调控CCND1的表达;4.lncRNA能够调节转录因子的活性,里例如lncRNA
Evf2能够与转录因子Dlx2形成转录复合体从而激活Dlx6的表达;5.lncRNA也能够通过调节基本转录因子来实现调控基因的表达。例如,Alu
RNA能够通过抑制RNA聚合酶II来实现广谱的基因抑制。

3.
转录后调控

lncRNA能够在转录后水平通过与mRNA形成双链的形式调控基因的表达。例如,Zeb2 antisense
RNA能够和Zeb2
mRNA内含子5’剪切位点区域形成双链,从而抑制该内含子的剪切。而该区域含有对于Zeb2蛋白表达所必须的核糖体结合位点,Zeb2 antisense
RNA通过这种方式,能够提高Zeb2蛋白的表达量

LncRNA与疾病
大量的研究表明,在肿瘤细胞中,某些特定的lncRNA的表达水平会发生改变。这种表达水平的变化能够作为癌症诊断的标志物(有时是非常灵敏的诊断标志物,如前列腺癌中的DD3)和潜在的药物靶点.

时间: 2024-10-10 00:30:24

长链非编码RNA(lncRNA)的相关文章

权威发布:长链非编码RNA命名规则

转自:http://blog.sina.com.cn/s/blog_8088f3700101pab7.html 权威发布:长链非编码RNA命名规则 对于人类基因命名标准的制定而言,雨果基因命名委员会(HGNC)是唯一官方授权的机构.HGNC的数据库中有38000个基因名称,其中大部分是编码蛋 白基因:但HGNC也命名了8500多个人类非编码基因及假非编码基因,通过与各层次专家们的合作,他们命名了大多数的小非编码RNA. 小非编码RNA一般可根据它们的同源性及相同功能来分类.相比而言,长链非编码R

一文读懂长非编码RNA(lncRNA)的分类、功能及测序鉴定方法

RNA的重要调控功能发现历程(Rinn et al. Annu Rev Biochem, 2013) 长非编码RNA,英文名为long noncoding RNAs,缩写为lncRNA,是指长度大于200 核苷酸的非编码RNA.LncRNA因具有非常重要的调控功能,且几乎参与到了各种生物学过程和通路,与各种疾病的发生发展紧密关联,从而成为过去几年和将来的研究热点和重点.对于人类基因组来说,产生的lncRNA数量比编码RNA的数量要多得多,目前除了少数lncRNA的功能比较明确外,大部分lncRN

长链剖分随想

之前写了那么长一篇Blog-现在不如写篇小短文-说一下另一种树链剖分方法--长链剖分的事情.它可以比重链剖分更快地完成一些东西. 树链剖分的原始版本重链剖分非常经典,这里就不从头介绍了. 原本的剖分方法是按照子树大小剖分,与子树点数最多的儿子连成链,所以叫做重链剖分-然后显然就有一个点到根的路径上至多$O(\log n)$条轻边这个性质(因为沿着轻边走,每次子树大小一定小于父亲的一半).有了这个性质就可以做各种路径相关的查询,暴力每次跳到重链开头就好- 而在一些问题里,有这么一种奇妙的剖分方式可

[算法学习] 长链剖分

简介 长链剖分是跟dsu on tree类似的小\(trick\),可以资瓷维护子树中只与深度有关的信息. 并能达到线性的时间复杂度. 算法流程 对于每个点,记录重儿子\(heavy[u]\)表示深度最大的儿子,其余作为轻儿子. 这样我们可以得到若干条互不相交的长链. 在维护信息的过程中,我们先\(O(1)\)继承重儿子的信息,再暴力合并其余轻儿子的信息. 因为每一个点仅属于一条长链,且一条长链只会在链顶位置作为轻儿子暴力合并一次,所以复杂度是线性的. 但是我们发现,这个数组仿佛开不下(大雾),

最长链

最长链 题目描述 现给出一棵N个结点二叉树,问这棵二叉树中最长链的长度为多少,保证了1号结点为二叉树的根. 输入描述 输入的第1行为包含了一个正整数N,为这棵二叉树的结点数,结点标号由1至N. 接下来N行,这N行中的第i行包含两个正整数l[i], r[i],表示了结点i的左儿子与右儿子编号.如果l[i]为0,表示结点i没有左儿子,同样地,如果r[i]为0则表示没有右儿子. 输出描述 输出包括1个正整数,为这棵二叉树的最长链长度. 样例输入 5 2 3 4 5 0 6 0 0 0 0 样例输出 4

SPOJ LIS2 Another Longest Increasing Subsequence Problem 三维偏序最长链 CDQ分治

Another Longest Increasing Subsequence Problem Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://acm.hust.edu.cn/vjudge/problem/visitOriginUrl.action?id=19929 Description Given a sequence of N pairs of integers, find the length of the longest incre

codevs 1814 最长链

二次联通门 : codevs 1814 最长链 /* codevs 1814 最长链 树形DP 当前点(LQZ)的最大价值由他的 左儿子(HKD) 和 右儿子(SYL)的最大价值转移而来 其余细节乱搞一下就可 我还是水的很开心啦.. */ #include <cstdio> #define Max 100080 inline int max (int a, int b) { return a > b ? a : b; } void read (int &now) { now =

树形DP codevs 1814 最长链

codevs 1814 最长链 时间限制: 1 s 空间限制: 256000 KB 题目等级 : 钻石 Diamond 题目描述 Description 现给出一棵N个结点二叉树,问这棵二叉树中最长链的长度为多少,保证了1号结点为二叉树的根. 输入描述 Input Description 输入的第1行为包含了一个正整数N,为这棵二叉树的结点数,结点标号由1至N. 接下来N行,这N行中的第i行包含两个正整数l[i], r[i],表示了结点i的左儿子与右儿子编号.如果l[i]为0,表示结点i没有左儿

VIJOS1107 求树的最长链

vijos1107环游大同80天 学习了一下求树的最长链的方法 最简单的思路就是两次dfs 两次dfs分别有什么用呢? 第一次dfs,求出某个任意的点能到达的最远的点 第二次dfs,从所搜到的最远的点倒搜回去. 为什么需要两次呢? 其实很容易想通第一遍dfs的起始点或许并不是最长链的起点 从最远的点倒搜到的最长的链就是所求的解 (因为最长链一定经过这个最远的点啊... 这里注意题目表述: 假设任意的两个风景点都有且仅有一条路径(无回路)相连.显然,任意一个风景点都可以作为游览路线的起点或者终点.