综述CLINTRANSLMED:⾮编码RNA(ncRNA)调控轴在动脉粥样硬化进展中
的作⽤
编译:KT!,编辑:景⾏、江舜尧。
原创微⽂,欢迎转发转载。
导读
⼈类基因组测序项⽬发现了细胞RNA世界的丰富多彩,并打开了具有调控或结构潜
能的短或长⾮编码RNA(潜藏的转录组学)的⼤门,同时也转变了对病理性基因从编码
RNA到⾮编码RNA的认知。因此,⽬前疾病风险评估增加了对新RNA表达的评估,如
⼩microRNA(miRNA),长⾮编码RNA(lncRNA),环状RNA(circRNA),竞
争性内源RNA(ceRNA),逆向因⼦,mRNA的3¢⾮编码区等。本综述中,作者将阐
述⾮编码RNA在慢性肾脏病的患者动脉粥样硬化(ATH)中的作⽤进展。重点介绍
miRNA和它的mRNA靶标以及作为miRNA海绵或miRNA活性竞争性抑制剂的lncRNA
所共同形成的调控轴或调控⽹络,即lncRNA-miRNA-mRNA。此外,还将介绍逆向基
因组元件,例如经过加⼯的假基因和Alu重复元件,这些元件最近也因为具有miRNA海
绵或者miRNA的衍⽣物的功能⽽在抗动脉粥样化硬化中发挥基因沉默作⽤。顺便
将讨论与lncRNA研究相关的技术发展,从测序技术到数据库,miRNA靶标的预测,以
及miRNA功能富集,如整合或富集分析等,揭⽰其潜在的调控⽹络。
论⽂ID
原名:Unveiling ncRNA regulatory axes in atherosclerosis progression
译名:⾮编码RNA(ncRNA)调控轴在动脉粥样硬化进展中的作⽤
期刊:Clinical and Translational Medicine
IF:7.919
发表时间:2020年2⽉
通讯作者:Estanislao Navarro
通讯作者单位:西班⽛Bellvitge⽣物医学研究所,肾病医院
DOI号:10.1186/s40169-020-0256-3
研究进展
1    动脉粥样硬化进展和⾮编码RNA
动脉粥样硬化(ATH)是⼀种复杂的⾎管壁炎性疾病,基因组学,表观遗传修饰和环境条
件等多种因素参与其中,给⽼龄⼈⼝带来了沉重负担。其病因和机制相当复杂,主要依赖⽣活
⽅式的改善。因此,迫切需要开发⼀种更加个性化的药物,通过有效的⼲预措施来提⾼患者的
诊疗⽔平。基于这个层⾯,ATH基因组学的研究为⽣物医学界提供了与基因相关的ATH危险因
素,如SNP,基因和基因变异,DNA甲基化改变,基因表达变化等。近⼏年,⼀个新的因素:
⾼度异质的⾮编码RNA组,正逐渐成为动脉粥样硬化(和其他疾病)研究的重要因素,⽆论是
疾病进展的⽣物标志物还是病理⽣理学中间产物,它们的相互作⽤都突出了⼈类基因组结构和
功能的复杂性。
从⽆到有,⾮编码RNA是转录组的功能性组成部分。⼈类基因组测序
分析发现超过80%的基因组具有⽣化活性,⼤多数是以DNA聚合酶I可及
位点或候选调控序列的形式出现。⽽最近估计⼈类基因组中蛋⽩质编码基因的数量为20–25000,但活跃基因组位点的总数接近10^5,其中就存在⼤量⾮蛋⽩质⾮均质RNA,这种RNA最初被认为是“the dark转录
组”或“基因组dark物质”的⼀部分,即功能不确定或未知的基因组序列。⾮编码RNA最初按其长度分为短(<200个核苷酸长)和长(lncRNA> 200个核苷酸长)RNA。短ncRNA包括已知的snRNA,snoRNA和tRNA,与PIWI相关的RNA(它们抑制种系中转座⼦和重复元件的表达以维持基因组稳定性)以及调控翻译的microRNA(miRNA)家族。另⼀⽅
⾯,lncRNAs在⼤⼩和功能上是属于⾼度异质的体,其在发育、分化和疾病进展中具有调节作⽤,并且其表达经常发⽣变化。
⾮编码RNA表达的数据是⼈类基因组功能的新模型,除了核转录外甚⾄在内含⼦和基因间位点都普遍实现了转录,从⽽产⽣了复杂的具有假定调节功能的长或短⾮编码RNA体。在哺乳动物基因组中,有⼀个数量级以上的基因组序列转录为⾮编码RNA⽽不是编码RNA。这使得遗传信息流由原始的线性“ DNA产⽣RNA产⽣蛋⽩质”转变为由许多结构性或调节性RNA建⽴起来的不同层次的相互作⽤⽹络(图1)。这种改变也使得与疾病相关的⾮编码RNA的数量呈指数增长、使得表观遗传控制更加具有可塑性。本综述中,作者将对ATH进程中ncRNA、microRNA、mRNA的相互作⽤⽹络进⾏⼀⼀阐述。此外,还将包括其他少见报道的转录本,如假基因和Alu元素与miRNA之间的相互作⽤的揭⽰。
图1.遗传信息流的变化。⽅框内是线性遗传信息流红⾊:RNA之间的功能关系。⿊⾊箭头:转录或翻译;双头红⾊箭头:相互交互;红⾊单向箭头:功能交互;虚线:组蛋⽩编码和染⾊质
修饰
2    DNA测序以及转录组学与个体化药物的整合
随着DNA测序技术的飞速成熟,医学研究从⼈类基因组测序发展⾄个体化基因组测序。如今,在整个医学领域中,整个基因组或外显⼦组的DNA测序已然成为⼀种疾病的诊疗⼯具。此外,单细胞RNA测序(scRNA-seq)⽅法可实现对单个细胞进⾏全基因组分析,以鉴定基因突变并表征和量化细胞异质性及其在疾病中的变异。
序列存储,是测序⾰命成功的关键因素之⼀。三个镜像序列存储库(NCBI的GenBank,⽇本DNA数据库和欧洲核苷酸档案库表1)与国际核苷酸序列数据库合作,注释并提供了对所有DNA和RNA序列公开且不受限制的访问权限。这些存储库不仅赋予DNA/RNA序列唯⼀的序列标识符,还创建了“参考基因组”数据库,包含参考基因组,转录组和蛋⽩质序列的集合,旨在⽤作基因组研究中的主要序列参考。此外,数据库还为序列提供了各种注释,从功能域到基因组位点。最后,所有这些信息都已集成到“基因组浏览器”中(Ensembl和NCBI的基因组查看器),允许⽤户查看从染⾊体区域到任何转录单位及其可变体的序列。
表1. 序列数据库和存储库
测序技术的⾰命。DNA测序技术经历了超薄PAGE凝胶、荧光标记、热稳定Taq DNA聚合酶的引⼊等⾰命性进展,但这些⽅法都⽆法实现临床⾼通量测序。此后,⼈类基因组测序向着更快,更便宜的测序仪的竞
赛,俗称“1000美元基因组“。除了孔测序(Oxford Nanopore)⽅法通过使⽤蛋⽩质纳⽶孔直接测序⽽⽆需DNA合成或扩增,⼤多数测序平台使
⽤⾼通量⽅法,即原始样本(⽤于基因组测序的DNA或⽤于外显⼦组测序的RNA复制为cDNA)被⽚段化并固定在扩增的单个细胞中,然后循环复制标记的核苷酸,每个反应都被单独检测荧光或H+(离⼦激
流平台),最后,将每个序列与参考基因组或外显⼦组进⾏⽐较以进⾏鉴
定。
测序ncRNA的技术挑战。ncRNA长度异质性和外显⼦组成给测序带
来巨⼤挑战,其⼤⼩范围跨越22-22.7kb。短序列读取如表达序列标签(EST),即单个cDNA克隆仅在其3'端进⾏测序,由此产⽣数百个核苷酸的读取,这些核苷酸作为完整序列的“标签”转录本。这种⽅法适⽤于
构建表达序列的遗传图谱和物理图谱,但它不能检测出CDS突变的所有
丰度(⽤于癌症研究)或显⽰lncRNA的复杂剪接模式,如相对“短”的3.8 kb ANRIL却被表⽰为50多个线性或圆形的剪接同⼯型。采⽤经典的分⼦⽣物学⽅法,即使⽤随机引物进⾏RT反应,然后通过5'/ 3'RACE(cDNA 末端的快速扩增)技术进⾏序列的扩增可以避免上⾯这些问题,但是在这个情况下要想覆盖绝⼤多数lncRNA基因组信息,不仅需要开发能够提供更长和更准确读数的新型测序硬件,⽽且还需要提⾼逆转录酶(RT)尽可能复制全长序列的能⼒。另⼀⽅⾯,对于⼩miRNA,可以通过凝胶纯化⼩RNA的⼀部分,⽤T4 RNA连接酶将它们添加到5'和3'衔接⼦,然后进⾏逆转录和PCR来对整个组织体进⾏测序。这样,即使对于低表达
dna多态性
的miRNA,也可以获得代表性的结果。此外,因为读取次数与初始miRNA拷贝数成正⽐,在处理miRNA时,新的⾼通量测序技术可以提供miRNA物种的单核苷酸分辨率,有助于⼆次miRNA的识别并提供miRNA 定量的动态范围。
3    MicroRNAS(miRNA),多效翻译调控家族
MiRNA是长度不超过22个核苷酸的⼩RNA,在转录后基因调控中起重要作⽤。MiRNA基因在转录控制之下,由RNA聚合酶II转录并经历由pri-miRNA初级转录本到功能齐全的成熟miRNA 过程,包括RNase III内切核糖核酸酶DROSHA和DICER。近年来,Alles等⼈估计全⼈类miRNA组由2300个miRNA组成,miRbase数据库第22版本中则注释了1115个成熟miRNA。MiRNA通过与mRNA的3'UTR处进⾏碱基配对来靶向mRNA,从⽽通过RISC复合物(RNA诱导的沉默复合物)降解mRNA或实现翻译阻遏。据报道,超过60%的mRNA在其3'UTR处带有miRNA结合位点,说明这种相互作⽤对于精细调节翻译⼗分重要。由于miRNA /mRNA互补只需要6个碱基配对形成双链体,因此单个miRNA可以靶向数⼗种不同的mRNA,⽽这些mRNA⼜可以被许多不同的miRNA调节,因此使得miRNA的功能相当复杂。
3¢UTR的动⼒学:miRNA功能不⽌⼀个。mRNA的3¢UTR区在长度和序列上具有⾼度多态性,奠定了miRNA靶点变化和相关mRNA稳定性的基础。3¢UTR的长度多态性是由于两种不同的机制引起的:⾮翻译区外显
⼦的选择性剪接(与⼤多数RNA⼀样)和替代性聚腺苷酸化(主要限于mRNA,lincRNA和NAT)的存在。Liaw等⼈研究发现癌细胞表达的
3¢UTR⽐正常细胞要短,这表明3¢UTR延长可能导致miRNA位点失调,因此不仅应将3¢UTR区作为miRNA结合位点进⾏研究,⽽且应将其作为动态结构研究,因为3¢UTR变化可能导致新的危险因素或新的疾病候选
基因的发现。Navarro等⼈研究发现3¢UTR调节miRNA活性。研究表
明,AAMDC的3¢UTR起源于两个长度不同的同⼯型,只有长的同⼯型对miR-2428/664a沉默敏感;Bruhn等⼈在ABCB1基因中发现了5个不同的3¢UTR长度变异体,其中只有3个较长⽚段带有miRNA结合位点;Pereira 等⼈的研究发现来⾃核受体超家族的转录因⼦Nurr1(NR4A2)mRNA中存在许多3¢UTR长度变异,⽽miR-93,miR-204和miR-302d也对
Nurr1(NR4A2)mRNA具有选择性相互作⽤。作者的研究也发现,在⿏Cd34基因的内部隐蔽剪接位点发⽣的剪接事件将调节miRNA-125/351对Cd34mRNA的3¢UTR或CDS的差异性结合(图2)。
图2. 3'UTR的结构变化影响特定miRNA的结合。1.替代性聚腺苷酸化信号的存在导致不同长度的3'UTR和miRNA结合潜⼒不同。2. 3'UTR的不同剪接⽅式使得与miRNA结合的潜⼒不同。3.外显⼦开关。就Cd
34基因⽽⾔,内部隐蔽剪接位点(CSS)激活了两个不同的终⽌密码⼦,并产⽣了两个不同的外显⼦,在⼀个Cd34同⼯型中,多数miRNA的结合位点位于3'UTR中,⽽在
另⼀个同⼯型中,其位于CDS内部。
ATH进展中的MicroRNA。关于ATH进化的遗传学和表观遗传学研究已相当多,已证实miRNA参与了ATH发⽣的许多病理过程,许多miRNA 是脂质处理,炎症和细胞⾏为(如增殖,迁移和表型转换)的关键调节剂。不仅在原组织中,⽽且在⾎清,尿液和外泌体中都检测到miRNA表达的改变。关于⼈类患者或ATH⼩⿏模型中miRNA表达调节的研究也有
众多,⽽且有部分研究已经涉及到机制研究。表2列出了动物模型或⼈类患者样品中ATH相关的miRNA,以及通过荧光素酶报告基因分析(并⾮
⽣物信息学预测)验证的其mRNA靶标及其表达改变对ATH进程的影响,强调了miRNA /mRNA系统的复杂性,如同⼀mRNA的不同miRNA(例如miR-103和miR-647与PTEN)和单个miRNA靶向不同mRNA(miR-370与FOXO1和TLR4)。
表2. ATH相关miRNA、mRNA靶标以及它们的表达对ATH进展的影响
基因沉默疗法中的⼩RNA。基因沉默中是基于⼩RNA的疗法,通过靶向药物⽆法到达的靶标或多基因病
理学中的mRNA达到疾病⽬的。针对miRNA的基因沉默⽅法包括激动剂或单链miRNA(ss-miRNA)和激活剂(含有互补序列的靶向miRNA序列的寡核苷酸),双链⼩⼲扰RNA(ds-siRNA)或miRNA海绵。针对ATH的RNA⽬前已经进⼊临床试验中。Patisiran作为第⼀款RNAi药物,可以使运甲状腺素蛋⽩(TTR)mRNA沉默,罕见的运甲状腺素蛋⽩介导的淀粉样变性多发性神经病。其他基于miRNA⽤于医学⼲预的药物⽬前正在临床开发中或处于1期或2期临床试验中,例如MRG-110是针对miR-92的锁定核酸(LNA)修饰的反义寡核苷酸,⽤于伤⼝愈合和⼼⼒衰竭的中;Remlarsen是⼀种miR-29b模拟物,可防⽌形成纤维化疤痕或⽪肤纤维化;拮抗miR-21的寡核苷酸,可以缓解Alport肾病⼩⿏模型中的肾脏疾病。此外,这些miRNA模拟物或拮抗剂也应⽤于实验室中调节ATH研究中miRNA的表达,还有针对miR-449a、miR-23a-5p或miRNA-98等在动物模型中的研究,也取得了理想的结果。最后,性miRNA不仅限于靶向特定的mRNA或miRNA,⽽且还被⽤作辅助因⼦,通过沉默促进药物低⽣物利⽤度的关键蛋⽩质达到降低耐药性的⽬的。
miRNA在基因沉默或基因模拟疗法中的应⽤仍然⾯临诸多挑战,⽐如合适的递送⽅式,以减少不必要的靶标副作⽤,或阻⽌免疫激活。miRNA/siRNA递送载体的主要缺点如由于ds-siRNA的刚性导致负载的siRNA量的限制,以及由于siRNA表⾯电荷低⽽导致封装困难。此外,与脂质纳⽶颗粒,阳离⼦复合物,⽆机纳⽶颗粒,RNA纳⽶颗粒和树状聚合物的常规络合或包封由于引⼊了⼤量的媒介物,导致潜在的免疫原性反应或毒性。⽽miRNA药物直接注射的⽅式由于提⾼了靶标的特异性和沉默功效,并最⼤程
度减少了副作⽤⽽受到青睐。因此,许多化学修饰物的开发例如硫代磷酸酯,2'-O-methyl、LNA(锁核酸)等可以增加DNA / RNA部分的稳定性。此外,针对具体运送⽅式的研究也越来越多,例如加⼊针对靶细胞蛋⽩质的特异性抗体
并连接到递送载体上可以增强功效,或“ TargomiRs”,通过靶向细菌的⼩型细胞来模拟miRNA。
此外,miRNA/siRNA由于与⾮靶标的3¢UTR端互补结合⽽导致脱靶效应,由此带来了药物副作⽤。据报道,在⼀项ApoE-/-⼩⿏致ATH的模型中抗CD40-siRNA的全⾝增加了肾NF-kB中的激活;⼀项使⽤miRNA-34的模拟物(MRX34)来抗肿瘤的1期试验,因为有5名患者出现严重的免疫反应⽽于2016年叫停;在⼀项TargomiR-16靶向EGFR恶性胸膜间⽪瘤的1期试验中,出现了输注相关的炎症综合征和⼼脏事件。这说明,miRNA/siRNA还需要进⼀步研究RNA运输载体、免疫反应以及寡核酸引起的炎症反应等副作⽤。
4  长⾮编码RNA(lncRNA)及其与miRNA的功能关系
LncRNA和miRNA海绵。长⾮编码RNA(lncRNA)是转录本> 200个核苷酸的ncRNA,可以通过表观遗传、转录等多种不同机制调节基因表达或转录后⽔平。LncRNA协调并整合多种信号通路,并在发育,分化和疾病中起重要作⽤。⼈类中lncRNA基因的数量是蛋⽩质编码基因数量的两倍以上,⽬前估计超过56,000,但由于它们的表达⽔平低,仍然有许多LncRNA未被发现和注释。根据其假定功能,lncRNA已
分类为许多功能组:竞争性内源lncRNA(ceRNA)和具有潜在miRNA抑制作⽤的环状lncRNA(circRNA),参与转录调控的与增强⼦相关的RNA(eRNA),超保守RNA(T-UCR),⾼度异质的天然反义转录本(NAT),内含⼦lncRNAs和长基因间RNA(lincRNA)等。
LncRNA在ATH进展和中的作⽤。ANRIL。⾼通量测序已发现了⼀些与ATH发病相关的lncRNA(表3),其中CDKN2B-AS1,也称为ANRIL(INK4基因座中的反义⾮编码RNA),已明确了在ATH中的致病机制,它是从9p21染⾊体转录⽽来,作为lncRNA向导将PRC通过直接与其亚基CBX7或SUZ12相互作⽤的⽅式定位于启动⼦上。ANRIL是由NF-kB途径的激活诱导的,上调的ANRIL与转录因⼦Yin Yang 1(YY1)形成功能复合物发挥对内⽪细胞中的炎症因⼦IL6和IL8的转录调控,⽽敲低ANRIL 可以抑制TNFα诱导的IL6和IL8表达,说明ANRIL参与了TNFα/NF-kB信号中炎症的表达。ANRIL也与增殖型的⾎管平滑肌细胞(VSMC)有关,并通过Alu重复元件调控促动脉粥样硬化的其他基因的表达。已有报道ANRIL以miRNA海绵的作⽤在不同的肿瘤中发挥作⽤,例如三阴性的乳腺癌中的miR-199a,宫颈癌中的miR-186或⼩⼉髓母细胞瘤中的miR-323等。
表3. ATH进展中的lncRNA:miRNA:mRNA轴
竞争性内源性lncRNA(ceRNA)和环状lncRNA(circRNA)。ceRNA和circRNA是miRNA“抑制剂/海绵”,通过与种⼦区域相互作⽤,成为负向调控miRNA的lncRNA家族,阻断相关miRNA的整个家族。同
时这种相互作⽤会使miRNA-靶标的相互作⽤也被抑制,如在癌症以及神经退⾏性疾病等病理状态中。CircRNA产⽣于哺乳动物细胞中外显⼦或内含⼦区域,通过共价连接转录本3¢和5¢末端的反向剪接完成,这使得CircRNA不具有5¢帽和3'尾,它们的表达也受到组织/发育阶段的调控。近年来,许多研究报道了lncRNA海绵对ATH和相关⼼⾎管疾病的影响,其机制包括整合的miRNA和mRNA靶标,这已成为⼼⾎管研究的热门话题(表3)。