拒绝随缘表达:质粒设计的底层逻辑
很多人做过这样一个实验:
同一段 CDS(编码序列),
只是换了个载体、换了个抗性、或者换了个菌株——
表达量直接从“肉眼可见”,变成“几乎测不到”。
这时候最容易怀疑的是:
操作是不是有问题?
菌是不是不行?
但大多数情况下,问题不在操作,而在系统。
质粒不是拼积木,拼对了就一定能用。
它更像一个小型操作系统:
DNA 在复制(消耗 dNTP)
RNA 在转录(占用 RNA polymerase)
蛋白在翻译(抢核糖体)
宿主在被持续“透支”
只要有一个环节失衡,表达就可能直接崩掉。
本篇文章只讲一件事:
如何把“靠运气表达”,变成“可预测表达”。
一、全局平衡:拷贝数不是越高越好
很多人的第一反应:
表达低?那我上高拷贝载体。
但问题是:
表达不是免费的。
高拷贝意味着:
更多 DNA 要复制(消耗 dNTP)
更多 RNA 要转录(占用 RNA polymerase)
更多蛋白要翻译(占用核糖体)
这里有一个关键点:核糖体才是真正的“战略资源”(ribosome pooling)
很多时候不是能量不够,而是:
核糖体已经被占满了。
结果就是:
正常生理活动被压制
细胞进入应激状态
表达系统不稳定
更隐蔽但更致命的问题:质粒被“淘汰”
当表达负担过高时:
带质粒的细胞:很累
不带质粒的细胞:轻装上阵
最终会发生:
不带质粒的细胞越长越快
整个体系表达能力逐渐下降
这个过程叫:
Segregational Instability(分离不稳定性)
所以你看到的是:
表达下降
但真实发生的是:
生产体系已经被“轻装细胞”替代了
生长 vs 表达:一个典型的对冲关系
表达越强,细胞长得越慢。
在强启动子系统(如 T7)中,当外源蛋白占总蛋白比例达到较高水平(经验上接近 ~30% 量级)时,常见现象包括:
生长明显减缓甚至停滞
诱导后细胞状态恶化
总产量不升反降
二、转录层:启动子之外的问题
很多人第一反应:
我换个更强的启动子。
但现实是:
转录只是第一步。
表达链条是:
转录 → 翻译 → 折叠 → 稳定
任何一步卡住,前面都是白干。
1. 漏表达:很多系统一开始就已经输掉
还没诱导就开始表达,这叫:
Leaky expression(漏表达 / basal expression)
对于以下蛋白尤其致命:
毒性蛋白
膜蛋白
调控蛋白
细胞往往在诱导前就已经受损
所以很多时候优化第一步不是“增强”,而是:
先让系统安静下来
2. 转录干扰:问题不是方向,而是边界
很多人知道对冲排布会出问题,
但更常见的是:
同向排布也会出问题
原因是:
Transcriptional Read-through(转录通读)
如果终止子不够强:
上游转录会“冲过去”
干扰下游表达模块
结果:
启动子被影响
表达不稳定
三、翻译起始:表达最容易“卡死”的地方
1. RBS 的本质:是能量,而不是序列
翻译起始效率可以用一个很经典的热力学关系来理解:
表达效率 ≈ exp( - ΔG_total / RT )
这里的 ΔG_total 不是一个简单值,而是由多个部分组成:
ΔG_total =
(核糖体与 mRNA 的结合能)
+(RBS 与起始密码子之间距离带来的影响)
+(核糖体“站位”所需能量)
−(打开 mRNA 二级结构所需的能量)
换句话说,这个 ΔG_total 本质上是在算一笔“总能量账”:
能不能结合(binding)
能不能站稳(spacing / standby)
最关键:能不能把结构“掰开”
2. 一个非常真实的坑:RBS 没变,但表达没了
很多人遇到过:
RBS没动
启动子没动
只换了 CDS
表达直接消失
原因通常是:
CDS 前端与 RBS 形成稳定发卡结构
结果:
核糖体进不去
翻译启动失败
这种现象常被戏称为“玄学”,
但本质上只是:
你的 RBS 被 CDS 卷进去“陪葬”了。
不是门没做好,是门被锁死了。
这也是为什么:
RBS Calculator 等工具已经成为标配
因为它计算的是:
整体能量,而不是局部序列
3. 稀有密码子:不是慢,而是“卡住”
稀有密码子会导致:
核糖体停滞
翻译中断
错误掺入
折叠异常
解决思路:
密码子优化
或使用 Rosetta 等菌株补充 tRNA
四、骨架效应:很多问题藏在“看不见的地方”
很多人设计时只关注:
CDS
启动子
标签
但真正影响表达的,还有:
载体骨架
非编码区
抗性基因
这类问题统称为:
Context-dependency(上下文依赖)
同一个模块,换个环境,表现就变了。
1. Ampicillin 的一个经典坑
Ampicillin 的问题在于:
β-lactamase 可扩散到培养基中
结果:
不带质粒的细胞也能存活
筛选压力下降
更稳定的选择是:
Kanamycin
原因:
通过胞内酶灭活,不会扩散
五、表达 = 质粒 × 宿主 × 条件
很多人问:
这个质粒好不好?
但真正的问题是:
系统匹不匹配
1. 换菌株,其实是在换“解决路径”
BL21:通用表达
Rosetta:补充稀有 tRNA
C41/C43:BL21 衍生株,降低毒性表达压力
Shuffle:适合二硫键蛋白
2. 条件优化:决定表达上限的关键变量
关键因素包括:
温度
IPTG 浓度
诱导时机
经典经验:
降低温度(如 37℃ → 16℃)通常会:
降低表达速率
提高折叠正确性
提高可溶性
结语
过去做表达,更像“炼金术”:
多试几个载体
多换几个菌株
总能碰到一个能用
但现在:
系统复杂度已经上来了
试错成本越来越高
表达设计正在变成一门工程学:
有模型
有参数
有边界
有代价
参考资料
[1] Salis H M. The ribosome binding site calculator. Methods in Enzymology, 2011, 498: 19–42.
[2] Kudla G, Murray A W, Tollervey D, et al. Coding-sequence determinants of gene expression in Escherichia coli. Science, 2009, 324(5924): 255–258.
[3] Plotkin J B, Kudla G. Synonymous but not the same: the causes and consequences of codon bias. Nature Reviews Genetics, 2011, 12(1): 32–42.
[4] Mutalik V K, Guimaraes J C, Cambas S Y, et al. Precise and reliable gene expression via standard transcription and translation initiation elements. Nature Methods, 2013, 10(4): 354–360.
[5] Bentley W E, Mirjalili N, Andersen D C, et al. Plasmid-encoded protein: the principal factor in the metabolic burden associated with recombinant bacteria. Biotechnology and Bioengineering, 1990, 35(7): 668–681.
[6] Rosano G L, Ceccarelli E A. Recombinant protein expression in Escherichia coli: advances and challenges. Frontiers in Microbiology, 2014, 5: 172.
[7] Carrier T A, Keasling J D. Library of synthetic 5′ secondary structures to manipulate mRNA stability in Escherichia coli. Biotechnology Progress, 1999, 15(1): 58–64.
[8] Chen Y J, Liu P, Nielsen A A K, et al. Characterization of 582 natural and synthetic terminators and quantification of their design constraints. Nature Methods, 2013, 10(7): 659–664.
[9] Cardinale S, Arkin A P. Contextualizing context for synthetic biology: identifying causes of failure of synthetic biological systems. Biotechnology Journal, 2012, 7(7): 856–866.
声明:本文仅用于科研交流与方法讨论,不构成具体实验方案建议。不同体系差异较大,实际应用需结合具体实验条件进行验证与优化。
鹏研社 · 研究 · 成长 · 连接

CN
