Facebook技術戰(zhàn)略負責人,Vijay Rao
在OCP峰會的主題演講上,Rao表示:“開放硬件加速了自動化進程,使得所有人以軟件的速度工作成為可能?!?/p>
四種服務器模型
Bryce Canyon存儲服務器專用于包括照片和視頻的高密度存儲。它的處理器更強大,內(nèi)存也更大,硬盤密度提升了20%,相比它的前身Honey Badger計算能力提高了4倍。
而Facebook存儲硬件系統(tǒng)工程師,Jason Adrian在一篇博文中表示,Bryce Canyon存儲系統(tǒng)支持72個3.5英寸硬盤(12 Gb SAS/6 Gb SATA)。
這個系統(tǒng)可以作為單一72驅動器存儲服務器,作為電源路徑完全獨立的雙36驅動器存儲服務器,或作為一個36/72驅動器JBOD進行配置。這種靈活性因為減少了未來需要支持的存儲平臺配置數(shù)量從而進一步簡化了數(shù)據(jù)中心的操作。
Yosemite v2計算服務器適用于橫向擴展數(shù)據(jù)中心。它的設計能讓單個節(jié)點(sled)從機箱里取出以便維修組件,而無需服務器斷電。此外,運行在v2上的HHVM軟件還能夠有效編譯PHP且可用于開源。
Tioga Pass則是一款新型計算服務器,具有雙插槽主板,與前身Leopard相比,閃存,網(wǎng)卡和GPU具有更多I/O帶寬。它還允許分散閃存,所以一個Tioga Pass服務器可以在一個名為閃電的節(jié)里配置不同數(shù)量的閃存,有效地避免之前服務器模塊的SKU限制。
Big Basin是一款訓練神經(jīng)網(wǎng)絡的服務器——模擬了腦結構的機器學習系統(tǒng),是Facebook和廣達電腦合作設計,采用了8個NVIDIA Tesla P100 GPU加速器,通過NVIDIA NVLink技術形成類似NVIDIA深度學習超級電腦NVIDIA DGX-1的8 GPU hybrid cube。結合NVIDIA Deep Learning SDK(軟件開發(fā)包),新的架構可以提升所有GPU的深度學習訓練速度。
神經(jīng)網(wǎng)絡可以處理例如檢查大量數(shù)據(jù)來識別圖像的任務,相比前期使用的Big Sur提供了更大的內(nèi)存和處理能力。
峰會上,Rao還播放了一個視頻,視頻中三個盲人婦女可以對Facebook上的圖片作出反應,因為機器學習算法已經(jīng)識別出圖片的特征并進行了語言描述。
Facebook技術項目經(jīng)理,Kevin Lee還補充稱:“Big Basin的性能提升得益于每GPU單精度浮點運算從7 teraflops增加到了10.6 teraflops。之后半精度浮點運算也將引入這種新型架構,以進一步提高吞吐量?!?/p>