若何发现并成立一种新型的药物或疗法?那是所有生物手艺或造药公司持久面临的根本问题。

总体而言,当前的药物发现体例有两种:基于靶点的办法和基于表型的办法。此中,基于靶点的药物发现(Target-based Drug Discovery,TDD)需要率先领会致病机造或针对相关通路展开摸索;而基于表型的药物发现(Phenotypic Drug Discovery,PDD)重点则在于识别出可改动细胞表型的化合物。

相较而言,后者愈加乏味耗时、且胜利率不高,那些客不雅因素招致基于靶点的药物挑选在过去的几十年间构成了支流。不外近年以来,跟着细胞表型挑选手艺、CRISPR-Cas 手艺、类器官和成像阐发手艺等范畴的飞速开展,表型药物发现办法从头回到了人们的视野。

MIT 及哈佛联手企业联盟公开大规模细胞表型数据库  第1张

(来源:JUMP–Cell Painting 联盟)

对此,来自哈佛和麻省理工学院博德研究所的一组研究人员基于先辈的机器进修办法,创建了表型阐发手艺 “Cell Painting”。该手艺旨在通过高通量成像尝试生成大规模的多维数据集,此中包罗每个细胞的可量化表型信息。基于那些图像信息,研究者能够利用深度进修等办法识别出化学或遗传扰动产生的影响,从而探究各类疾病的病因和治疗办法。

近期,由部门国际出名的生物手艺企业的 “Cell Painting” 数据汇总并创建的大型数据库 JUMP Cell Painting Datasets 正式向公家开放。对此,创建该数据库的生物手艺企业联盟暗示,希望数据库可以帮忙研究人员识别有潜力的化合物,而且在进入动物某人体试验之前关于目的化合物的功用,及潜在副感化进一步领会,最末加速药物发现历程。

“丈量一切,继而评估” 的表型药物发现手艺

早在上世纪 80 年代摆布,受限于其时的生物科学手艺程度,人们关于疾病的认知遍及停留在表型层面,很难成立其与靶点之间的联系关系。因而,大大都早期药物的发现次要是依靠表型药物发现办法(PDD)。

关于 PDD 形式而言,其工做重点在于评估某一化合物能否在心理模子中显示出预期的反响。那就需要研究者开展大量细胞尝试,然后通过比力图像变革从而获得成果 —— 好比荧光标识表记标帜卵白的变革,或者团结细胞数量削减等等。可想而知,那些庞杂的工做既乏味又耗时,并且非常容易失败,因为可能招致的成果完满是随机的 —— 研究人员也不确定事实是哪一部门图像会发作变革。

由此也就不难理解,在过去的几十年间,基于靶点的药物发现(TDD)形式开展成为了药物发现范畴的支流。因为靶点明白,关于该办法而言,药物发现的时间、过程和所需资本都是能够预测的。

然而,跟着可用靶点的发掘工做逐步进入瓶颈,研究者逐步意识到,单一的发现形式其实不足以处理所有问题。因而,成立在生物系统之上,与疾病间接相关的表型挑选模子再次得到重视。

MIT 及哈佛联手企业联盟公开大规模细胞表型数据库  第2张

▲图丨基于图像的形态学阐发战略概述(来源:Nature Protocols)

在表型挑选模子中,目的化合物将间接 “拜候” 相关的生物系统或细胞信号通路从而产生成果。“一切与靶点无关”,那是其与靶点发现形式的底子区别。不外,若何在海量图像中准确识别并抓取有效数据,仍是该范畴开展的关键所在。

2013 年,来自博德研究所的一组研究人员于 PLoS ONE 在线颁发论文,提出利用多达 6 种荧光染料来为细胞的次要成分 “上色”,包罗细胞核、内量网、线粒体、细胞骨架、高尔基体和 RNA。然后利用显微镜捕获那些带颜色的图像,并通过软件丈量其形态学特征从而绘造出细胞表型 “指纹”,用其指示细胞所处的差别心理学形态。最末,利用基于 AI 的图像阐发手艺比力试验前后的图像变革,以评估分子或遗传干扰所产生的的影响。

MIT 及哈佛联手企业联盟公开大规模细胞表型数据库  第3张

▲图丨 Cell Painting 图像数据示例(来源:博德研究所)

“丈量一切,继而评估”,那一思绪很好地归纳综合了 “Cell Painting” 的根本工做体例。出格是跟着机器进修手艺与各类阐发办法的不竭开展,研究人员可以以更轻松的体例获得大规模的生物信息数据。

2016 年,该办法被正式定名为 “Cell Painting”,该手艺由博德研究所的 CarPEnter–Singh 尝试室主导。此中,该尝试室的指导者之一、计算生物学家 Anne Carpenter 暗示,那 “几乎是办理起来最简单的成像阐发”。做为该办法的开发者之一,她强调,“我们的使命是选择更便宜、最简单的染料。”

后期运算成本较高,仍获出名药企逃捧

该手艺一经发布便遭到了部门国际出名药企的逃捧。在此之后,引入 “Cell Painting” 手艺的造药公司配合成立了名为 JUMP–Cell Painting 的联盟,并将各企业的 “Cell Painting” 数据资本停止了汇总并创建成为一个大型数据库 JUMP Cell Painting Datasets,该数据库现已在 github 网站上线。据悉,数据库中包罗了细胞关于 140,000 余种扰动做出反响的图像,包罗药物治疗或其它一些能够进步或降低基因活性的润色。

MIT 及哈佛联手企业联盟公开大规模细胞表型数据库  第4张

▲图丨 JUMP–Cell Painting 联盟企业名单(来源:博德研究所)

现阶段,越来越多的药物开发公司起头重视并积累来自各个维度的细胞数据,然后将其应用于机器进修。出格是关于表型阐发而言,虽然目前看来该办法可能具备庞大的价值,然而研究者同时指出,该办法在阐发软件方面提出了相当高的准入门槛。例如需要认真研究阐发办法,从而躲避可能存在的过度拟合、数据稠浊以及误差等风险,那将有可能进步其后期的运算成本。

基于该数据集,Carpenter 和她的同事已经发现了十几种可能对肌肉癌形成影响的化合物。在此之后,Carpenter 方案与其合做者配合兴办一家公司,以便进一步开发此中最有前途的候选化合物。

同样值得存眷的还有新药研发企业 Recursion Pharmaceuticals。在 2014 年公司创建初期,Anne Carpenter 曾在该公司担任科学参谋。在她的帮忙下,Recursion 很快基于表型组学阐发手艺成立起了药物发现平台 Recursion OS。开展至今,该公司已经成立起十余项涉及肿瘤学、神经科学、炎症和免疫学以及稀有病范畴的研究项目,此中已有 5 条管线进入临床试验阶段。

MIT 及哈佛联手企业联盟公开大规模细胞表型数据库  第5张

▲图丨 Recursion Pharmaceuticals 产物管线(来源:Recursion Pharmaceuticals)

在本次数据库公开颁发之后,JUMP-Cell Painting 联盟还颁布发表将与华盛顿特区的安康与情况科学研究所开展合做,以期将 “Cell Painting” 数据与其它类型数据相连系,从而用于预测药物和农用化学品的毒性。

参考材料:

1.https://doi.org/10.1371/journal.pone.0080999

2.https://doi.org/10.1038/nprot.2016.105

3.https://www.technologyreview.com/2023/03/03/1069261/a-technique-called-cell-painting-could-speed-drug-discovery/

4.https://github.com/jump-cellpainting/datasets

5.https://jump-cellpainting.broadinstitute.org/partners