云序助力丨北大魏文胜组登顶Nature Biotech (IF=42):Ribo-seq揭示同义突变不沉默!

前言

颠覆认知!Ribo-seq精准捕捉“沉默突变”不沉默!
传统观点认为,DNA序列发生改变但不改变氨基酸序列的同义突变是中性的。然而,在病毒和原核生物中的研究已暗示其可能影响细胞适应度。近期一项具有里程碑意义的研究借助Ribo-seq技术,首次在人类细胞中系统性地揭示了这类“沉默突变”潜在的重要功能!研究发现,虽然大部分同义突变整体趋向中性,但通过Ribo-seq捕捉到关键突变通过改变RNA折叠结构、显著抑制翻译起始效率,从而深刻影响细胞适应度的机制,彻底改写了人们对这类突变的认知。同时,该研究还提出了一套适用于精准突变研究的创新实验方法,为人类遗传学研究提供了新工具。通过整合筛选数据与开发的模型来预测临床上有害的同义突变,这项研究加深了对同义突变的理解,为临床疾病研究提供了见解。
云序生物用户北京大学魏文胜教授、刘莹副研究员作为共同通讯作者,在 Nature Biotechnology 期刊(IF=41.7)发表了题为“Prime editor-based high-throughput screening reveals functional synonymous mutations in human cells”的研究论文。研究开发了一种名为 PRESENT 的高通量筛选技术,利用先导编辑来研究人类基因组中的功能性同义突变。该研究拓展了对“沉默突变”生物学功能的认知,运用Ribo-seq透视其改写细胞适应新法则,并为绘制人类基因功能变异图谱提供了方法学上的指导。云序生物有幸提供了本次研究中的Ribo-seq以及生信分析等服务。
标题:Prime editor-based high-throughput screening reveals functional synonymous mutations in human cells
发表时间:2025/06/24
发表期刊:Nature Biotechnology IF=41.7
研究对象:人类结肠癌细胞系(HCT 116)
研究方法:DS Finder,PRESENT,DIRECTED-seq,Ribo-seq,scRNA-seq, RNA-seq, DEG, Western Blot, Real-time qPCR等
文章链接:Prime editor-based high-throughput screening reveals functional synonymous mutations in human cells
一、研究摘要
同义突变通常被认为是中性的,而它们在人类基因组中的作用在很大程度上仍未被探索。在这里,我们使用PEmax系统创建了一个包含297,900个工程化的先导编辑(prime-editing)向导RNA库,并进行广泛的筛选以识别影响细胞适应度的同义突变。与最近在酵母中的发现不同,组水平分析表明,同义突变在适应度效应方面与非同义突变有所不同,但相对于阴性对照表现出相似的表型分布。经过严格的质量控制,只有一小部分表现出可衡量的效果。针对这些功能突变,我们开发了一种专门的机器学习模型,并揭示了其对各种生物过程的影响,如mRNA的剪接和转录,并得到多方面实验证据的支持。我们发现同义突变可以改变RNA折叠并影响翻译,如PLK1_S2所示。我们通过整合筛选数据与开发的模型预测了临床上有害的同义突变。这项研究加深了我们对同义突变的理解,为临床疾病研究提供了见解。
二、研究路线

三、研究结果
利用PE开发同义突变的筛查方法
该研究使用PEmax系统和epegRNA进行有针对性的遗传编辑以生成不同类型的核苷酸取代的同义突变。PEmax通过慢病毒导入稳定整合到人类结肠癌(HCT 116)细胞系(该细胞系由于MLH1基因中存在天然纯合无义突变,便于PE编辑)中,并选择单个克隆用于后续研究。HCT 116-PEmax细胞的表达谱几乎与野生型(wild-type , WT)细胞的表达谱相同,并且感染非靶向或AAVS1(Adeno-Associated Virus Integration Site 1)靶向epegRNA的HCT 116-PEmax细胞(作为阴性对照)显示出最小的变化。这表明稳定的细胞系与WT HCT 116细胞系的特征非常相似。研究人员还评估了PEmax在HCT 116细胞中的编辑效率。在定期采样的28天培养期内,高效FANCF + 5 G-to-T突变的编辑在14天后显示出逐渐放缓的趋势,而低效RNF2 + 1 C-to-A突变的编辑效率随着时间的推移逐渐增加。鉴于表型变化往往落后于基因型变化,研究人员将筛查持续时间延长至35天,并将这种方法称为PRESENT(prime editor-based screen technology)(图 1a)。

图 1.高通量筛选揭示人类基因组中的功能性同义突变
筛选数据的质量控制和分析
为了处理数据,研究人员开发了一种名为ZFC-eBAR(方法)的生物信息学算法,全面评估从eBAR水平到突变水平的影响。此外,研究人员还使用epegRNA评估了遭受敲除突变的必要基因的性能,以评估筛选结果的可靠性。靶向高度必需基因的epegRNA的受试者工作特征(receiver operating characteristic, ROC)曲线下面积(AUC)为0.72,靶向更广泛的必需基因的曲线面积为0.65,反映了筛查的总体性能(图 1b,扩展数据图 2c)。其他突变水平分析得到两个评估标准的突变水平AUCs分别为0.75和0.68(图 1c,扩展数据图 2d)。为了直观地说明数据可重复性,研究人员将LFC(Log Fold Change)的绝对阈值设定为≥1(图 1d,扩展数据图 3b),表现出可比的一致性(扩展数据图 3c-e)。利用定义的筛选阈值(n=2134),确定了1914个影响细胞适应度的突变,其中包括耗竭和富集趋势(图 1e 和表 S3)。研究人员随机选择了高于阈值的同义突变验证结果的可靠性(图 1f,图 S1a-d),均表现出精确而干净的编辑(图 S1f)。
同义突变和非同义突变的特征
为了进一步探索筛选结果与酵母研究结果之间的差异,研究人员检查了饱和同义突变在各种基因组中的分布:所有67个具有饱和同义突变设计的基因,HCT 116中的11个高度必需基因和酵母的12个人类同源基因。结果表明,虽然同义突变始终表现出中性效应,但非同义突变(错义、移码和无义突变)都对细胞适应度有明显影响(图 1g),与酵母中的结果不同。在饱和突变设计所针对的11个基因中,同义突变和错义突变之间存在显著的功能性差异(图 1h)。研究人员对其余10个基因进行了比较,Spearman相关性显示出了合理的一致性,尤其是对于高度必需的基因(图 1i)。虽然人类基因组中的同义突变主要是中性的,但研究中鉴定的409个富集突变证明了对细胞增殖的生物学影响。
DS Finder 揭示有害同义突变的决定因素
为了阐明有害同义突变背后的机制,研究人员从基因、mRNA和核苷酸三个角度分析了它们。为探究其潜在机制,研究团队开发了机器学习模型DS Finder,并利用筛选数据将其训练为二元分类器(图 2a)。DS Finder超越了现有的两个模型:CADD(预测一般突变) 和 SilVA模型(针对同义突变)(图 2b)。
1. DS Finder 确定的关键特征包括密码子的第三个位置是 C-G 或 A-T 碱基对,其中 C-G 对更有可能影响细胞的适应性(扩展数据图 5i 和图 2c)。基因本质、表达水平和外显子 CpG 含量等因素也起着至关重要的作用(图 2c)。
2. 剪接的改变,尤其是剪接供体位点的缺失(图 2c),可能是驱动有害影响的主要机制(图 2d)。
3. 同义突变可通过改变密码子的使用和 mRNA 的折叠对细胞的适应性产生不利影响(图 2c,d)。
总之,DS Finder发现同义突变的有害影响是由多种因素共同驱动的,包括剪接破坏、密码子偏差和核苷酸保留等。

图2. 分析有害同义突变决定因素的机器学习模型
同义突变产生异常剪接事件
DS Finder发现剪接中断是同义突变产生有害影响的一个关键机制。结果发现,导致剪接供体缺失的突变占总数的12%,其次是产生新剪接供体的突变,占7%(图 3a,b)。研究人员开发了一种名为AbSplice的新模型来预测特定人体组织中由突变引起的异常剪接,利用AbSplice预测了可能导致结肠组织异常剪接的新突变,如PLK1_R136(AGG> AGA)和TSR2_Q88(CAG> CAA)(图 3c),结果发现近四分之一的同义突变可能导致异常剪接事件。研究选择了这些突变的一个子集进行验证,BUB1B_R322(AGG > AGA)突变位于 BUB1B 第 7 外显子和第 7 内含子的交界处(图 1e),是耗竭结果中排名第一的同义突变,它破坏了原来的剪接供体位点(供体缺失型),导致内含子保留(图 3d)。有趣的是,这种突变导致了两种异常的转录本变体:一种是第 7 内含子完全保留,另一种是在第 7 内含子中新建了一个剪接供体位点,导致内含子保留(图 3d)。由于过早地产生了终止密码子,这两种变体都可能导致 mRNA 降解。
研究进一步验证了这种突变对细胞适应度和 mRNA 丰度的影响(图 3e-g)。EEF2_G332 (GGC > GGT) 通过在外显子内产生一个新的剪接供体(供体增益型),这个新的剪接供体位于原来的供体之前,导致部分外显子切除和下游序列的移码(图 3h)。这种异常转录本会大大降低细胞的适应性和 mRNA 水平(图 3i-k)。这些发现表明,外显子-内含子边界附近的同义突变可诱导异常剪接,影响基因表达和细胞表型。

图3. 同义突变对异常RNA剪接的影响
Ribo-seq透视同义突变改写细胞适应新法则
除了异常的RNA剪接外,同义突变还影响细胞内的RNA折叠和翻译(图 2d)。在重要基因 PLK1 编码序列的早期发现了一个特定突变 PLK1_S2(AGT > AGC),该突变增强了 RNA 的稳定性(图 4a)。突变前后mRNA结构的预测分析显示,PLK1_S2 (AGT > AGC)突变增强了起始密码子附近局部mRNA结构的稳定性(图 4b,S5a-c)。研究人员进行了Western Blot分析测定PLK1蛋白水平,发现WT RTT对PLK1蛋白水平没有影响,而PLK1_S2(AGT > AGC)突变导致蛋白丰度下降(图 4c),观察到的细胞适应度下降完全归因于该单个同义突变(图 4d)。
考虑到突变诱导的茎结构破坏了WT PLK1 mRNA起始密码子附近的原始松散结构(图 4b),可能会阻碍翻译起始并带来翻译劣势,研究进一步使用核糖体印迹测序(Ribo-seq)评估该位点的翻译情况。结果表明,PLK1_S2(AGT > AGC)突变使得核糖体在起始密码子处的结合更具挑战性,但不影响转录水平(图 4e,扩展数据图 8b)。因此,启动翻译的困难导致蛋白质表达量减少。这种情况强调了同义突变诱导的RNA折叠变化及其对翻译过程的影响之间的关系,最终通过改变蛋白质水平影响细胞功能。

图4. 同义突变通过RNA折叠影响蛋白质翻译
scRNA-seq揭示同义突变的基因表达影响
为了系统性评估从筛选中发现的同义突变对高通量水平基因表达的影响,研究将单细胞筛选方法与PRESENT整合为DIRECTED-seq(直接epegRNA捕获和靶向测序)。研究人员同时捕获了单细胞的epegRNA和转录组(图 5a),还对同一批次的细胞进行了RNA-seq,以评估编辑效率(图 5a)。大多数 epegRNA 是有效的,在足够的测序深度下可检测到的突变的平均编辑效率约为15%(图 5b)。研究恢复了129193 个单细胞,平均每个细胞 5.5 个 epegRNA,每个目标同义突变在大约 1692 个细胞中都有体现(图 5c,d)。最终发现了40个显著影响基因表达的同义突变,假发现率(FDR)为10%(图 5e,表 S4)。一些同义突变(如BRCA1)可能会对细胞功能和肿瘤抑制机制产生重大影响(图 5f,表 S4)。DIRECTED-seq有效地将特定突变与基因表达的变化联系起来,揭示了其潜在的生物学影响。这些潜在影响凸显了进一步研究的必要性,以探索突变如何影响转录本丰富度及其更广泛的生物学影响。

图5. 基于DIRECTED-seq技术探究同义突变对基因表达的影响
发现新的疾病相关同义突变
研究系统性地探索了同义突变的致病机制与预测方法,使用了在筛选数据基础上训练的DS Finder,在临床数据库识别潜在致病的新型功能性突变(图 6a)。其中,G6PC3 c.G399A此前被注释为“可能良性”,但在该研究中却获得了最高的DS Finder评分,并得到了SilVA和CADD的支持(图 6b,表 S6)。该突变破坏了 RNA 剪接,损害了基因的正常功能,其方式与疾病机制一致(图 6c)。为了验证同义突变的致病性,研究人员在 HCT116 细胞中检测了 G6PC3 c.G399A,发现该突变产生了错误的转录本(图 6d),并显著降低了 G6PC3 的表达(图 6e)。DS Finder能够有效区分不同类别的突变(图 6f),证明了该模型的灵敏度。该研究还开发了"Hearing Silence"开放平台,提供免费使用的DS Finder算法。这项研究强调了探索人类基因组内其他功能性同义突变的潜力,这对理解疾病病因和深入研究其分子遗传机制至关重要

图6. 临床数据库中有害同义突变的预测研究
四、全文小结
利用PE开发同义突变的筛查方法
-
基于PEmax基因编辑系统,构建了一个覆盖3,644个人类蛋白编码基因、共计297,900条epegRNA的突变文库,并在人类结肠癌细胞系HCT116中开展了迄今最为系统的同义突变高通量功能筛选。结果共鉴定出409个显著影响细胞增殖的同义突变,占全部同义突变的0.43%,显著低于1,505个具有功能效应的非同义突变(占全部非同义突变的3.83%)。
-
同义突变对细胞适应度的影响相对较弱,大多数呈中性状态,且与错义、无义和移码突变等非同义突变相比,其功能性差异显著。这一结果与此前在酿酒酵母中的相关研究结果不同。
DS Finder 揭示有害同义突变的决定因素
-
尽管大多数同义突变不具显著功能效应,研究仍识别出一小部分可能对细胞有害的同义突变。
-
通过DS Finder分析发现这些功能性同义突变通常通过破坏RNA剪接位点、改变mRNA二级结构或干扰翻译起始,进而影响基因表达与蛋白质合成。
-
通过Ribo-seq 发现同义突变能够增强mRNA局部稳定性并干扰翻译起始,进而影响基因表达与蛋白质合成,如突变PLK1_S2(AGT>AGC)。
疾病相关同义突变的新发现
-
研究进一步整合筛选数据与DS Finder模型,对临床数据库中的同义突变开展系统性预测分析,成功识别出若干具有潜在致病意义的突变。其中,G6PC3 c.G399A此前被注释为“可能良性”。
-
本研究首次证实其具有明确的功能效应,为临床疾病研究提供了新见解。

五、文章相关产品
云序产品一:Ribo-seq
云序生物的翻译组测序技术通过使用翻译抑制剂使正在翻译的mRNA序列固定在核糖体上。加入核酸酶处理不受核糖体保护的mRNA,分离核糖体并提取纯化核糖体上未被消化的短片段mRNA(大约30nt),进而获得正在翻译的mRNA序列。这项技术可获得实时全转录组正在翻译的序列信息,使研究者能从分子水平检测蛋白组的翻译情况,并了解蛋白质的翻译水平及翻译过程,在蛋白翻译机制的研究领域中有广阔的应用前景。
云序产品二:RNA-seq
真核生物转录组测序的研究对象为特定组织或细胞在某一功能状态下所能转录出来的RNA的总和,主要包括 mRNA、 LncRNA和环状RNA。常规的转录组分析仅通过Oligo(dT)法对mRNA进行富集和分析,会导致包括环状RNA和相当比例的LncRNA丢失,无法准确,反映真实的转录组信息。云序生物转录组测序服务采用样品预处理和建库方案,能够同时检测样品中的mRNA、LncRNA和环状RNA,获取转录组信息,进而针对不同类型的RNA进行表达分析,结构研究,变异研究以及全新转录本的发现。
云序产品三:scRNA-seq
单细胞转录组测序技术(scRNA-seq)是指在单个细胞水平上,对转录组进行高通量测序分析的一项新技术,它能够弥补传统高通量测序的局限性,揭示单个细胞的转录组信息,从细胞水平上提供基因差异信息,比较各类细胞转录组之间的差异反映细胞间的异质性。云序生物的单细胞转录组测序服务能够提供全面高通量单细胞研究方案,涵盖从单细胞测序文库构建到个性化数据分析的全流程。可广泛应用于多项课题中,如肿瘤研究中对于肿瘤异质性及免疫微环境的研究、免疫中关于细胞分型、感染&自身免疫病的研究、神经科学中神经系统疾病和细胞通讯的研究以及发育生物学中的图谱构建和细胞发育轨迹研究等等。
单细胞测序的基本流程包括单细胞分离、mRNA提取与逆转录、cDNA扩增、文库构建、然后测序。与Bulk RNA-seq的基本流程相似,主要区别就在于单细胞分离获取。云序生物单细胞测序建库系统基于液滴微流控技术,采用突破性的微球-分子标签技术,携带千万级别的分子标签,能够快速高效地构建高质量的单细胞测序文库。
云序Ribo-seq其他用户发表文章
云序用户Nat Immu IF 27.7|acRIP-seq,Ribo-seq,RNA-seq联合揭秘ac4C修饰调控网络
客户文章|IF=10.6—甲状腺癌中m5C甲基转移酶NSUN2通过维持tRNA的稳定性促进密码子依赖性的致癌翻译
云序客户IF=14.7-Acta Pharmaceutica Sinica B Ribo-seq -卡里霉素通过直接与病毒移码刺激元件RNA假结结合降低e1核糖体程序性移码效率抑制冠状病毒复制
云序生物Ribo-seq优势
从 RNA 样品提取到最终数据获得,样品检测、建库、测序等每一环节都会直接影响数据的数量和质量,从而影响后续数据分析的结果。为从源头保证测序数据准确可靠,云序生物在数据的所有生产环节都严格把关,从根源上确保高质量数据的产出。
优势一:严格的建库和纯化流程
RPF高效富集:云序生物采用核酸消化结合PAGE胶纯化技术,富集核糖体保护的RNA片段(RPFs),确保目标片段(28nt左右)的精准捕获。
多重纯化步骤:包括rRNA去除、末端修复、接头连接及PAGE胶多次纯化,最大限度减少背景噪音,提升数据特异性。
优势二:全面的数据质控体系
错误率监控:针对当前 RNA-seq 测序技术的测序错误率分布特征(如测序错误率随着测序序列长度的增加而升高,前 6 个碱基测序错误率较高),进行测序错误率分布检查,确保碱基质量。
多层过滤标准:去除低质量reads、接头污染、polyA/T/G/C序列、rRNA reads等,clean reads可靠性高,保证信息分析的质量。
优势三:多维度生信分析
精准定量与标准化:云序使用 HTSeq 进行基因水平的定量分析(union模式),支持RPKM标准化,消除基因长度和测序深度偏差。
结合RNA-seq数据计算翻译效率(TE):TE = (RPKM in RiboProfiling) / (RPKM in RNAseq),直接反映翻译调控水平。并提供差异TE基因分析,揭示翻译效率变化。
灵活进行差异分析:针对不同的实验情况,云序选用合适的软件进行基因表达差异显著性分析,根据有无生物学重复,选择DESeq2(有重复)或edgeR(无重复),严格筛选差异基因。
功能与通路挖掘:云序采用 clusterProfiler 软件对差异基因或差异 TE 基因集进行 GO 功能富集分析,KEGG 通路富集分析等。
丰富的可视化结果:火山图、韦恩图、聚类热图和通路图等。
优势四:全流程标准化与可靠性
运用主流算法:比对(TopHat2)、定量(HTSeq)、差异分析(DESeq2/edgeR)均采用领域内主流工具。
严格质控阈值:云序要求生物学重复样品间皮尔逊相关系数的平方(R )至少要大于0.8,否则需要对样品做出合适的解释,或者重新进行实验。
完整分析链条:数据质控→比对→定量→差异分析→富集分析→ORF分析,覆盖翻译组研究多需求。
云序生物助力客户发表多篇Ribo-seq相关SCI论文,已成为客户心中值得信赖的Ribo-seq合作伙伴!如果您有更多想法及需求,欢迎后台与本公司联系!
识别下方二维码咨询:
咨询当地销售或拨打电话:021-64878766
云序生物全产品目录
| RNA修饰组 | |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| DNA修饰组 | |
|
|
|
|
|
|
| 表观基因组 | |
|
|
|
|
转录调控组和翻译组 |
|
|
|
|
| 分子互作组 | |
|
|
|
|
|
|
|
|
|
| 转录组 | |
|
|
|
|
|
|
|
|
|
| 单细胞测序与空间转录组学 | |
| 单细胞转录组测序 | |
|
|
|
| 基因组 | |
|
|
|
|
|
|
|
蛋白组 |
|
| 定量PCR服务 | |
|
|
|
云序生物介绍
上海云序生物科技有限公司(简称“云序生物”)成立于2015年,坐落于上海漕河泾新兴技术开发区,是国家高新技术企业及ISO9001认证单位。公司以RNA修饰组、表观遗传学与新型时空组学为特色,依托高通量测序、质谱技术、生物信息学等平台,致力于为全球科研与临床用户提供专业、精准、系统性的组学解决方案。云序生物以“技术创新+全链条服务”为核心,通过专利技术应用(如GLORI)、临床微量样本技术优化及单细胞-空间多组学整合能力,持续推动表观遗传与转录组学发展,赋能基础科研与精准医疗。
下期精彩继续



# END #
上海云序生物科技有限公司
电话:021-64878766
传真:021-64878766
Shanghai Cloud-seq Biotech Co.,Ltd.
地址:上海市松江区莘砖公路518号24号楼4楼

