黑客故事:12个月制造Facebook开源服务器

导读:Facebook从开源服务器、数据中心直到刚刚宣布将开源存储方案,Facebook正在帮助互联网企业除去那些昂贵而且不必要的组件来降低成本,从新设计供电、主板和散热系统,并将方案分享给所有人。Wired记者Cade Metz对Facebook的系统工程经理Amir Michael进行了采访,为我们描绘了Facebook开源服务器和数据中心的诞生过程。你很难想象,Michael和他的团队仅仅用了12个月就完成了这一切。以下为全文翻译:

Amir Michael在Faceobook的服务器实验室

Amir Michael 在 Facebook工作,作为一名黑客,这没有什么值得惊讶的。但他并非一名传统意义的软件黑客,而是一名硬件黑客——在作为临时实验室的收发室里。

到2010年底,Facebook在Palo Alto的总部码头不再接收任何货物。Michael和另外几名工程师随之涌入,,因为他们需要建立更大的服务器实验室,这不,他们已经在隔壁建立了存储房间。

这里曾是发货码头,在地板上有一个巨大的标尺。有时候,这个巨大的标尺用来给包裹称重。当Michael和他的团队搬进来后,标尺用来测量从零开始制造的服务器。12个月后,他们为Prineville数据中心设计的服务器完成,其中一台放在标尺上。他爱不释手,这个服务器已经批量生产并在世界各地使用。

Michael制造的服务器轻了10磅。

像其他互联网巨头一样,Facebook为他的互联网帝国提供了大量数据中心网络和服务器,投入巨大,很多很多钱。如果你要为上亿的用户提供网页,就需要花掉大量的金钱,不仅仅要购买硬件,而且要为这些硬件提供电力。从某种角度上说,你真的花了太多钱了。你需要的东西与世界上的任何一件东西都不一样。

2009年春天,Facebook将Michael招募进来,帮助公司提高效率。“我的主管和我说:‘嘿,来吧,我们有很多架构要建立,我们要做许多创新,更加经济以及更高的能源效率’”,Michael回忆。“我问道有没有什么具体的目标么?他说:‘没有。为什么不来加入我们并找到它呢?’”于是,Michael就做了这些。

为了保持Facebook世界知名“黑客文化”,他从一块空白的地板开始,利用能触手可及的一切东西,以工程师的疯狂速度建造了Facebook IT存储间以及隔壁的收货“码头”。结果就是一个全新的服务器诞生了,不仅能效高、更加经济,而且外形(physically )更高效。

“为了优化成本,我们拿掉了标准服务器中很多组件,”Michael说,“这使得它更容易维修。由于少了很多阻挡物,散热变得更加高效。并且轻了10磅:这让我们少购买了10磅,任何时候把它放入或从机架上卸下变的更轻松,最后到报废的那一天,也少回收了10磅。”

Facebook并不是独自设计自己的服务器。Google参与几年了。不同的是,Facebook会邀请你进入临时的实验室,参观他们是怎么做的,还会把Michael设计的服务器提供给你,甚至包括Prineville数据中心的设计蓝图,有了它你就可以用把这些服务器串联起来工作了。

互联网巨头需要高效的硬件处理各种大量的业务。无论是金融机构、生物医药还是其它的商业机构,都遇到了同样的问题。Facebook希望帮助自己,也帮助他们。通过Michael以及其他Facebook的硬件智能团,可以将双方紧密携手。

在曾经的收发室内,Michael把服务器从机架上卸下。

最好的经验就是没有经验

在加入Facebook前,Michael在Google做了5年半多的硬件工程师。他调试过各种主板和电源,但从未设计过自己的服务器。这就是为什么他适合为Facebook制造一台服务器的原因。“我的愿景并不是混乱的,”他说。“我研究了很多独立的部件,但我从未涉及整个系统。”

他开始摆弄Facebook数据中心中的各种服务器和设备,Facebook仅仅租赁空间和基础设施。他和其他工程师做了一些改进,但他们很快意识到他们不能改变多少,除非从头设计数据中心和服务器。“我们不能改变一点数据中心,再改变一点服务器,”Michael说。“我们的确改进一些,但我们想走的更长远。”

于是一名叫Jay Park的工程师发力研究数据中心,Michael专注服务器。但他们还在一起工作。设计的想法由两个人密切合作完成。

一般而言,数据中心在交流、直流电转换以及不同电压间转换会浪费很多电能。但一天晚上,Jay Park说,他梦见了一个新的数据中心不存在这些浪费。当他醒过来,手边并没有纸,就随手在餐巾纸上画出了他的构想图。

我们没有采用大量的分散的装置将电压降到208伏,而是直接将277伏电流供给服务器机房。“我们这么做的原因和供电公司在传输网络上采用高电压的原因是一样的。”Michael说。“更高的电压,意味着更少的浪费,更高的效率。”而且,省去了那些庞大的不间断电源(UPS),从而减少了损耗。取而代之的是,Park和其他工程师将直流电池放进旁边的机架上,并将其装进服务器。这意味着,后备电源的供电距离较短,而且不需要从直流电转换到交流电,再从直流电转换到交流的长途跋涉。

但Park梦想中的数据中心还不能工作,除非你有能够适应这些变化的服务器。Michael对数据中心生态系统的贡献是将提供了两个而不是一个电源接口。其中包含一个277伏特交流电源,和一个在旁边机架上的48伏特的直流电池。“电源装置十分智能,当交流供电失效时,将自动切换到电池供电,”Michael说。“服务器甚至不知道电源供电消失了。”

但他并没有停下脚步。他设计了从服务器底架、风扇、主板等一切东西。Michael和他的团队并不是在现有的基础上修修补补,而且完全设计了一个新的机器。

一个Facebook的服务器部门的工作台。有时候会增加一倍大小。

12下一页

查看其它分页:

就是去做你害怕的事,直到你获得成功的经验。

黑客故事:12个月制造Facebook开源服务器

相关文章:

你感兴趣的文章:

标签云: