用云开裂基因组码

2021-10-06 19:46:13来源：

随着世界上有一半的人口的基因组预计将被2025年被测序，科学家正在为他们需要处理的数据量交错。

预测每年30个菌尿率的基因组数据已经被丹尼斯鲍尔等研究人员使用，以解锁疾病的疾病等疾病的基因组代码，这影响着名的英国理论物理学家斯蒂芬霍金。

嘎吱嘎吱的基因组数据可能是一个繁琐的过程。随着含有30亿DNA“字母”的人类基因组，单挑出导致诸如大型样品大小的疾病的基因类似于在大海捞针中寻找针。

据鲍尔介绍，澳大利亚英联邦科学和工业研究组织（CSIRO）的国际认可的生物信息学研究员和团队领导者，以前的机器学习技术无法应对纯粹的基因组数据。

例如，谷歌的行星算法擅长解决涉及数十万个样本的机器学习任务，比如每种样品，比如每种样本的1,000个数据点，“Bauer说。“但我们每个样本有30亿数据点。”

为了克服CSIRO创建Variantspark的鲍尔和她的团队，一种机器学习库，可用于使用Apache Spark Engine实时分析基因组数据以进行大数据处理。VariantSpark还可用于在其他应用中进行分裂数据，例如转录。

通过鉴定和分析疾病引起的基因，下一步是测试使用称为Crispr的基因组工程技术，以编辑导致人类某些疾病的基因。这种微妙的任务必须以高水平的精度进行，没有错误的空间。

为了提高成功率，Bauer表示有必要加快识别可以进行基因编辑的位置的过程。

“这样做对于一个基因很容易，并且可以通过平行化在几秒钟内完成。但是，对于使用Web服务的人类基因组中的所有基因很难这样做，“她说，并指出与亚马逊Web服务（AWS）Lambda无法计算服务，现在可以”触发许多函数并行触发并且足够便宜“。

那个说，鲍尔，谁会在Yow讲话！2017年在悉尼的会议上，承认兰姆达服务有局限性。“只有那么多的数据和请求，您可以使用Lambda函数来处理，因此我们必须提出替代方法，并将其并行为工作量，”她说。

Bauer的团队必须找到巧妙的方式来使他们的复杂研究工作适应AWS和其他人提供的，因为云提供商大多迎合了通用用例。

除了嘎吱嘎吱的基因组数据外，Bauer还使用AWS以安全的方式与世界各地的其他研究人员共享数据。

“我们上传到S3存储的数据被加密并保持加密，它只在计算节点上解密。我们还可以拥有日志文件和记录审计报告，以证明没有人可以访问处理管道，“Bauer说。

向前迈进，鲍尔不会认为，AWS的喜欢将开始提供专业的云服务，该专业云服务往往是往往是知识和技术的最前沿。

“即使云提供商要满足我们的需求，我们明天会有很大的要求。这也是为什么我们是第一个采用云并租用最新技术的原因是我们所做的事情，“她说。

返回科技金融网首页 >>

版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“科技金融网”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场，如有侵权，请联系我们删除。

精彩推荐

“大桥”G3铜陵长江公铁大桥先导索过江

“某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努

“亚马逊”哪些以色列芯片公司已被美国企业收购？

“装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人

“必胜客”必胜客最黑暗的料理来了

“运营商”运营商本周行业动态：电信年度优秀领导及上半年重点工

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回

用云开裂基因组码

相关文章

精彩推荐

最新文章

“在我”忆来只把旧书读

“科博会”芜湖科博会集中展示大国重器

“诗人”带着大海散步的人

“宁德”宁德时代三季报：业绩增速放缓、海

“新材料”信金控股完成新一期人民币基金首

“同比增长”失守3000点后，A股市场的危与

“商务部”商务部：达成共识！

“基金”又一家基金公司换董事长，年内公募

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名

“说了”云朵的话语，心灵的方剂 ——

“科幻”和成都和教育，一起遇见未来！两

“红星”梁静茹南京演唱会再现“柱子票”

热门文章

微软扩展了通过专利许可的连接车推送

“公益”TCL科技集团副总裁魏雪获奖背后，

“互联网”周鸿祎：听俞敏洪说直播带货很赚

“会员”爱奇艺重新上线会员权益转赠功能

“蓄电池”28分钟必达、迟就赔：途虎养车升

寻找客户数据是核心GDPR擦除的大障碍

“荣事达”荣事达副总杨其武曾创业失败如今

“科技”四个显著增强！十年来我国科技事业