品牌名称
阿斯利康
企业规模
1001-5000人

阿斯利康制药公司通过MongoDB加速研发

355次阅读

去年,制药巨头阿斯利康 (AstraZeneca) 启动了一项雄心勃勃的计划,利用下一代基因组测序开发药物来对抗包括癌症在内的各种疾病。

 

该技术创造了一种合成版本的信使 RNA,有助于在细胞中制造蛋白质。如果成功,这些蛋白质可以对抗癌症等疾病。

 

不幸的是,这种基因组测序需要大量的计算能力。正如阿斯利康 (AstraZenaca) 研发信息架构师 Jason Tetrault 最近解释的那样,分析 88 个完整的人类基因组需要 15,000 小时和 171 TB 的数据。分析一个人类基因组可能需要四天时间。

 

幸运的是,遗传学的突破与计算能力的飞跃同时发生。特别是 MongoDB 的跨平台、面向文档的数据库已经到了大规模处理这些数字的地步。“我会将 MongoDB 纳入极具颠覆性的技术阵营,”Tetrault 说。“任何能帮助我们加快步伐以帮助更快地找到东西的东西都很棒。”

 

对于 Tetrault 来说,基因组测序是非结构化数据挑战的典型例子。AstraZeneca 选择 MongoDB 是因为其文档存储能力。然后,公司提供午餐并学习教育员工。“当然是午餐和学习,”他说。“每个人都会出现以获得免费午餐。”

 

示例还有助于让员工参与进来。Tetrault 指出,CraigslistMTV等公司使用 MongoDB 来跟踪和整理他们的海量数据。Tetrault 说,去掉这些名字“真的打开了讨论……这是一个‘哇哦’的时刻。”

 

也许让每个人都加入的最有说服力的策略是展示 MongoDB 如何相对较快地取得有用的结果。“找到困难的事情,让它变得容易,”他说。

 

阿斯利康的实验包括提取其所有化合物的 10% 并从其不同的数据库系统中提取信息。使用 MongoDB,该公司能够对大约 500,000,000 种化合物进行 Tanimoto 比较。“所有这些,都在我的桌子底下,”Tetrault 说。

 

尽管在这个过程的早期,Tetrault 说他很高兴阿斯利康可以使用 MongoDB 来帮助对抗癌症。“我正在为癌症研究人员提供支持。我们的研究人员正试图找出哪种药物对特定肿瘤类型最有效。” Tetrault 表示,通过更好地掌握数据,阿斯利康可以追踪它以前从未注意到的链接和模式。“也许这对 10% 的肝癌有效,但哇,这种肺癌实际上具有相同的生物标志物。这就是我想问的问题,也是我对大数据技术感兴趣的原因。”