跳到主要内容

感谢您访问nature.com。您使用的是对CSS支持有限的浏览器版本。为了获得最好的体验,我们建议您使用最新的浏览器(或关闭Internet Explorer的兼容性模式)。同时,为了确保持续的支持,我们将在没有样式和JavaScript的情况下显示站点。

  • 广告的功能广告客户保留对本文章内容的全部责任

由人工智能驱动的初创公司让蛋白质研究步入快车道

日本东北大学Mitsuo Umetsu的团队已经证明,在大型图书馆的直接进化过程中,机器学习可以大幅减少获得最佳序列所需的实验数据数量(通常从10,000个样本数据集减少到约100个样本数据集)。©ustas7777777 /伤风

日本政府支持人工智能研究的一项举措正在生物制药领域取得成效。

采取直接的方法

利用进化过程制造新蛋白质是日本东北大学生物分子工程学教授Mitsuo Umetsu的专长。通过在基因中引入随机突变,并在细菌生物工厂的帮助下迭代培养新一代蛋白质,Umetsu和他的团队已经创造出了粘附在塑料或陶瓷等表面的抗体,以及将纤维素转化为糖以生产生物乙醇的酶。

然而,这种“定向进化”方法的一个问题是,它可以生成巨大的DNA序列库,彼此之间只有轻微的差异。如果DNA文库太大,通过实验筛选感兴趣的蛋白质就变得很有挑战性。相反,没有足够序列的库可能不包含任何相关变量。

“在定向进化中,成功的概率取决于投资的规模,”Umetsu说。“这就是为什么我觉得机器学习可以指导我们找到最佳蛋白质,而不受DNA文库规模的限制。”

2016年,Umetsu加入了日本最大的国家研究机构RIKEN的高级智能项目中心,与来自全国各地的机器学习专家合作。这种合作关系对典型的蛋白质工程实验产生了不同的倾向。在创建了DNA文库后,该团队对这些变体进行了表征,并使用结果训练了一个机器学习模型。然后,新的算法被用于引导后续的基因突变向目标蛋白质方向发展。

RevolKa的aiProtein技术可以增强抗体和酶的活性和物理化学性质。©RevolKa

通过改变荧光蛋白的发射颜色和增强肽基酶的活性等实验,研究人员发现,机器学习可以显著降低定向进化中使用的典型DNA文库大小。

Umetsu解释说:“当我们仔细获取高质量的数据时,我们只需要大约100个样本来训练机器学习,以提出最佳的蛋白质和酶序列,而传统技术需要10,000个左右的样本。”

变得更好

在Umetsu进行机器学习研究时,他遇到了在生物制药领域拥有30多年经验的高管片冈四郎(Shiro Kataoka)。他们一起决定将机器学习技术商业化,并将其应用于优化临床前候选药物。

RevolKa的总裁兼首席执行官Kataoka说:“在先导优化中,生物活性、结构稳定性和表达等属性应该同时改变,而大规模的文库很难解决这个问题。”“我们的技术可以用最少的训练数据同时解决多个属性,这大大减少了寻找解决方案所需的时间和精力。”

Umetsu和Kataoka对RevolKa的计划是以阿伊努语“raise”(“reska”)和拉丁语“evolve”(进化)命名的,目的是成为优化生物制药开发的全球领导者。

Umetsu说:“蛋白质药物已经多样化,有各种各样的特征需要改进。”“我们正在利用最近一轮融资来发展我们的技术,以满足我们合作公司的需求,并帮助他们开发创新的生物产品。”

相关文章

搜索

快速链接

Baidu
map