当基因编辑插上人工智能的翅膀“大礼包”来了(2)
2023-07-14 来源:旧番剧
2.0时代的基因编辑,以碱基编辑和引导编辑技术为代表,其特点是“精准”。所有生物的DNA都由A、T、C、G四个字母所代表的碱基组成,碱基编辑可不依赖DNA双链断裂实现部分特定碱基(如字母A-T、C-G、A-G)的高效精准替换,但仍无法实现所有字母的任意转换。在此基础上,2.0 版的引导编辑系统,则可实现4个字母任意编辑,以及小片段DNA的精准插入和删除。
不过,这样的基因编辑技术仍非完美无缺。
现有碱基编辑系统的核心元件——脱氨酶来源于单一家族,在基因编辑过程中存在效率不够高、序列有偏好性以及潜在的脱靶风险等问题。
“比如在实现字母C-T的转变过程中,如果C的前面是G,C字母就很难被改变。”高彩霞举例,此外,这些脱氨酶在一些重要作物如大豆中效果较差,这也是长期影响作物碱基编辑育种的一个关键问题。
同时,作为疾病治疗、农业育种以及科学研究的基础性、战略性工具,目前碱基编辑系统的底层专利由美国持有,我国亟需打破碱基编辑底层专利垄断。
能否挖掘出新的脱氨酶,解决碱基编辑现有挑战,同时打破我国所面临的底层专利困境?
2021年,在实验室的一次例行组会上,高彩霞与年轻的组员们就不同期刊的前沿进展做分享交流时,人工智能“明星”AlphaFold2在蛋白质结构预测中的突出表现让他们产生了一个想法:何不将它与现有碱基编辑技术结合起来看看会发生什么?
一直以来,科学家主要通过基因序列来定向改进现有脱氨酶。“脱氨酶的结构与其功能存在紧密关联,这意味着科学家需要花费大量的时间用实验解析相关的序列从而拿到一个蛋白的结构。所以我们就想能不能通过人工智能找一些跟现有脱氨酶在结构上相似度更高的蛋白。”高彩霞研究组博士生费宏源对《中国科学报》说。
“比如AlphaFold2让我们一天就能高通量地构建300多个蛋白的结构,是传统方法的很多倍。”费宏源补充说,经过一段时间的摸索,聚焦生物信息学的她成为研究组的“人工智能担当”。