为云推动:解锁谷歌数据中心的秘密

2021-08-18 09:46:09来源:

用户和服务的纯粹数量云巨头的数据中心必须支持,促使许多提供商在如何封装和连接他们在世界各地运营的大量设施的设计规则本。

他们不是在另一个地点备份到数据中心的单数,独立的设施,他们赞成创建多个巨大的校园式服务器场,这些服务器场没有任何未能防止停机时间。

高度扫描​​算子通常选择具有特定工作负载的定制硬件,这些硬件在思维中,这是以大量购买的,以确保 - 随着更多用户涌入其服务 - 他们看似无限的能力来应对需求。

在谷歌云下的几天内,旧金山的下一次会议,互联网搜索巨头对确保其自身的工作中的工作共享一些坦率的洞察力,这些工作是在可持续,高效,弹性,安全和快速的 - 表演方式。

谷歌在数据中心可持续发展周围的工作有充分的记录,2017年已经挂钩,它将与其数据传播遗产100%可再生能源使用承诺。

如前所述,该公司最近还开辟了它如何借鉴其深度策略的人工智能专业知识,以减少其数据中心舰队的电力使用效率(扁平)。

另一个承诺它在提供的讽刺中,这是一个在2017年全年开放一个新的DataceRe地区的承诺。在谷歌云下,它还宣布了今年荷兰,加拿大和加利福尼亚州的额外建筑计划和2018年。

当这些都完成时,公司将在全球范围内有16个地理数据中心区域,由50个可用区域组成,以及超过100点的存在。

除了站在Google云平台(GCP)及其业务生产力工具,G套件上,这些数据中心也是相同的,这些数据也是托管其消费者的服务,如搜索和YouTube,它形成几乎每个Web用户的骨干互联网体验。

因此,该公司的数据架构旨在确保用户可以随时尽可能富有成效,谷歌云端的技术基础设施高级副总裁,在此活动的第二天主题演讲期间,谷歌云端高级副总裁UrsHölzle表示。

“我们设计了我们基础设施的每个元素,因此您可能是唯一的富有成效,享受我们创建的表现,”他说。

“您必须优化每个元素。从高效的数据中心到自定义服务器,将自定义网络装备到一个软件定义的全局骨干,到专用应用专用集成电路(ASIC)进行机器学习。“

该公司在过去三年中投入了30亿美元,以建立一个弹性和响应的基础设施,这是由巨大的网络能力为基础。

“分析师将网络的流量放在25-40%的全球互联网用户流量之间。作为AGCP或G套件客户,您可以从这个网络中受益,因为您的流量在我们的私人超高速骨干上行驶,以获得最低延迟,“Hölzle说。

“将这个交通带到世界各地的几乎,我们也需要跨越海洋。九年前,谷歌成为第一个建造海底电缆的非电信带。这是我们到日本,从那时起,我们在世界上任何地方都建造或获得了潜艇纤维容量,因此我们几乎任何地方都有冗余的骨干。“

谷歌副总裁Joe Kava于Datentres副总裁展示了一个关于倒数第二天的会议,该节目提供了与会者在该公司如何构建其服务器场的场景后面。

虽然假设公司必须采取单尺寸适合的所有方法来逻辑,但事实不能更加不同,每个数据中心位置都非常影响设计和设置。

Kava说:“我们在水性冷却系统中开创和开发了水性冷却系统的进步,如海水冷却,再生灰水冷却,雨水捕获和再利用,雨水收获,工业管用水和热能储存。

“我们还设计了独立于其冷却的水分区。相反,它们在外面100%,新鲜空气冷却。点在这里没有一个尺寸适合 - 所有型号。

“我们所有的数据中心设计都是针对他们的特定地区定制的,以获得最佳效率,”他补充道。

与许多其他超级云公司一样,公司有利于使用定制的硬件以获得成本和性能原因,与Kava暗示的事实,即没有这样做,公司将努力满足用户对其服务的需求。

谷歌云技术基础设施高级副总裁ursHölzle

“几乎所有的基础架构都是定制和专门为我们自己的计算需求而设计的,所有这些都合作并优化,以提供最高的性能,以最低的价格计算到任何地方的总体拥有成本。”

“我们的服务器没有任何不必要的组件,例如视频卡,芯片组或外围连接器,可以引入漏洞,我们的生产服务器运行定制设计和剥离的Linux版本。我们的服务器和操作系统专为仅提供Google服务的唯一目的。“

在第二天主题演讲期间,该公司也是世界上第一个部署Intel Xeon处理器的云提供商,以其在其基础设施中称为Skylake,与HölzLe欢呼该公司对公司对性能承诺的表现改进。

“我们正在推动信封在这么多的性能方向上,这意味着我们必须非常不同地工作,并且Skylake为计算密集型工作量提供了良好的性能,”他说。

当他第一次加入公司九年前时,卡瓦承认为为什么公司在其基础设施中需要如此高度定制的为什么感到困惑,以提供其服务。

“我很快就会发现我们经历了如此常见的努力,因为我们在开始时我们需要的规模不需要,”他说。

“为了实现性能,效率和价格目标,我们必须建立自己的服务器并开发并创建可靠性的硬件,软件和文化,使Google成功。”

自2016年3月以来,谷歌已积极参与Facebook支持的开放式计算项目(OCP)计划,并借助与49伏机架系统有关的设计,其中包括其网站。

“我们在我们的数据中心的机器人创新也投入了很多投资。他补充说,我们每个数据中心都有完全自动化的磁盘擦除环境,允许更快,更高的吞吐量,更高效,更好的库存管理,“他补充说。

“我们必须建立自己的服务器并开发并创建可靠性的硬件,软件和文化,使Google成功”Joe Kava,Google

这并不是说人类在卡瓦卡说,人类在谷歌数据中心遗产中遇到折扣时,人类没有作用,因为该组织在每一个手头上有24小时支持。

“我们拥有自己的陀螺队团队,通过施工,调试和运营,从设计中密切相关。他们说,他们是最优秀,最聪明的工程师和操作专业人士,“他说。

“他们中的许多人来自关键任务环境,比如海军核潜艇计划,其中错误可能是灾难性的。他们理解关键任务。“

鉴于亚马逊Web服务的事件接近“(AWS)高调简单存储服务(S3)2017年2月底的中断,其原因是工程输入错误,卡瓦也热衷于指出多么不透明谷歌的基础设施是人为错误。

“在基础设施方面,行业规范是人类错误占大多数事件的账户,”他说。

“由于我们的设计和高素质的员工,只有一小部分问题与人类错误有关,而且,这些问题都没有人在我们的数据中心造成停机时间。”

每当Naysayers认为符合责任公共云公司提供的安全性时,通常会看到提供商的常见速度比较他们在他们使用的资源到较小的日常企业组织的资源。

它是一种方法,谷歌已经看到过去追求过去,一个Hölzle在主题演讲中加强,他透露了一个Datentre校园,公司运营有175个保安人员每周24小时,每周七天。

反过来,这是由摄像机,运动传感器,虹膜扫描仪和激光的入侵检测系统支持,这些入侵检测系统都是旨在忽略不应该在那里的人。

这种承诺,让人们延伸到物理硬件,Hölzle使用主题演讲以首次亮相谷歌的泰坦芯片,该码头在所有公司的新的数据中心服务器中安装。

“我们将一台安全芯片放在所有新机器上,作为对该机器的身份的信任的基础。这款芯片由谷歌设计,并帮助保护服务器免受篡改,即使在BIOS级别,“他说。

“它可以帮助我们认证硬件,并且最重要的是,帮助我们验证服务,就像他们互相调用时,它们必须相互证明他们的身份。”

该公司还有一种新的方法,可以确保其安全防御达到工作,揭示了卡瓦,在会议结束时的问答期间。

这将认为公司隐瞒招聘现有的谷歌员工,并任务与违反其数据中心的安全防御,以确保他们能够承受内部威胁。

“如果有人知道弱点的弱点以及如何利用它们,这是你自己的员工。他们没有告诉他们他们被招募的任何同事,他们试图做你不应该做的事情,“他说。

“如果有的脆弱性暴露,它是在世界各地的纠正,”卡瓦说。“如果找不到任何新的漏洞,可能就足够了。我们还没有那么点。我们总会有更多的东西。“


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章