日本政府支持人工智能研究的一项举措正在生物制药领域取得成效。
采取直接的方法
利用进化过程制造新蛋白质是日本东北大学生物分子工程学教授Mitsuo Umetsu的专长。通过在基因中引入随机突变,并在细菌生物工厂的帮助下迭代培养新一代蛋白质,Umetsu和他的团队已经创造出了粘附在塑料或陶瓷等表面的抗体,以及将纤维素转化为糖以生产生物乙醇的酶。
然而,这种“定向进化”方法的一个问题是,它可以生成巨大的DNA序列库,彼此之间只有轻微的差异。如果DNA文库太大,通过实验筛选感兴趣的蛋白质就变得很有挑战性。相反,没有足够序列的库可能不包含任何相关变量。
“在定向进化中,成功的概率取决于投资的规模,”Umetsu说。“这就是为什么我觉得机器学习可以指导我们找到最佳蛋白质,而不受DNA文库规模的限制。”
2016年,Umetsu加入了日本最大的国家研究机构RIKEN的高级智能项目中心,与来自全国各地的机器学习专家合作。这种合作关系对典型的蛋白质工程实验产生了不同的倾向。在创建了DNA文库后,该团队对这些变体进行了表征,并使用结果训练了一个机器学习模型。然后,新的算法被用于引导后续的基因突变向目标蛋白质方向发展。
通过改变荧光蛋白的发射颜色和增强肽基酶的活性等实验,研究人员发现,机器学习可以显著降低定向进化中使用的典型DNA文库大小。
Umetsu解释说:“当我们仔细获取高质量的数据时,我们只需要大约100个样本来训练机器学习,以提出最佳的蛋白质和酶序列,而传统技术需要10,000个左右的样本。”
变得更好
在Umetsu进行机器学习研究时,他遇到了在生物制药领域拥有30多年经验的高管片冈四郎(Shiro Kataoka)。他们一起决定将机器学习技术商业化,并将其应用于优化临床前候选药物。
RevolKa的总裁兼首席执行官Kataoka说:“在先导优化中,生物活性、结构稳定性和表达等属性应该同时改变,而大规模的文库很难解决这个问题。”“我们的技术可以用最少的训练数据同时解决多个属性,这大大减少了寻找解决方案所需的时间和精力。”
Umetsu和Kataoka对RevolKa的计划是以阿伊努语“raise”(“reska”)和拉丁语“evolve”(进化)命名的,目的是成为优化生物制药开发的全球领导者。
Umetsu说:“蛋白质药物已经多样化,有各种各样的特征需要改进。”“我们正在利用最近一轮融资来发展我们的技术,以满足我们合作公司的需求,并帮助他们开发创新的生物产品。”