2021年10月,杭州云棲大會,阿里云正式對外推出自研磐久服務(wù)器家族,將基礎(chǔ)硬件創(chuàng)新與上層云產(chǎn)品軟硬件一體化,從而為客戶提供更多選擇,助力客戶業(yè)務(wù)創(chuàng)新。
2021年雙11、雙12期間,全新自研磐久服務(wù)器M系列首次上線運行,應(yīng)用于電商等多個重要核心場景,順利支撐了電商業(yè)務(wù)的峰值流量,性能和穩(wěn)定性均超預(yù)期。
從云棲首發(fā)到兩次電商流量洪峰考驗,阿里云加大底層基礎(chǔ)技術(shù)的自研邏輯是什么?磐久服務(wù)器M系列是什么?有何獨特技術(shù)優(yōu)勢?筆者帶您一起走進磐久服務(wù)器M系列研發(fā)背后的故事。
從云棲大會首次發(fā)布,到順利通過雙11、雙12兩次電商流量洪峰考驗,磐久服務(wù)器M系列不僅證明阿里云實現(xiàn)業(yè)界最快的ARM架構(gòu)服務(wù)器自研和業(yè)務(wù)上線運行,更是阿里云服務(wù)器研發(fā)團隊多年來砥礪創(chuàng)新、深耕自研的結(jié)果。
2014年,阿里云服務(wù)器團隊開始在內(nèi)部針對ARM架構(gòu)在數(shù)據(jù)中心上的應(yīng)用進行探索,業(yè)內(nèi)所有面向數(shù)據(jù)中心的ARM處理器都在阿里的核心產(chǎn)品和業(yè)務(wù)場景中進行過測試調(diào)優(yōu)和驗證,當(dāng)時,阿里積累了豐富的應(yīng)用經(jīng)驗和大量性能數(shù)據(jù),成為國內(nèi)針對ARM架構(gòu)在數(shù)據(jù)中心應(yīng)用探索的先行者之一。
“研發(fā)最開始是一股熱情,但到后面發(fā)現(xiàn)困難重重”,阿里云服務(wù)器研發(fā)資深專家陳義全回憶研發(fā)初期說到。研發(fā)小組面臨的第一個挑戰(zhàn)是對如何對原有MySQL數(shù)據(jù)庫、ODPS、機器翻譯、電商交易等應(yīng)用進行大規(guī)模代碼移植、適配和調(diào)優(yōu),當(dāng)時可沒有如今高級的AI工具幫忙,幾乎所有的代碼移植和適配工作都得靠研發(fā)小組手動操作。例如,MySQL應(yīng)用驗證初期遇到整機吞吐性能只有主流平臺50%問題,陳義全帶領(lǐng)團隊幾乎從零開始,深入分析源碼和熱點函數(shù),結(jié)合ARM架構(gòu)特點,快速找到瓶頸點,并使用ARM匯編重寫了部分MySQL內(nèi)核時間、鎖等函數(shù),最終實現(xiàn)整機吞吐與主流平臺持平。
研發(fā)團隊通過攻克一個個難題,積累了豐富的性能數(shù)據(jù)和寶貴的實踐經(jīng)驗,為后續(xù)自研服務(wù)器和處理器的設(shè)計鏟平了很多障礙,開創(chuàng)性地解決了眾多難題,并在2016年實現(xiàn)了部分自有業(yè)務(wù)在ARM架構(gòu)上小規(guī)模運行,用很短的時間實現(xiàn)了阿里云服務(wù)器歷史性飛躍。
2021年云棲大會上,阿里云正式發(fā)布自研磐久服務(wù)器家族。其中包括磐久高性能計算、磐久高性能存儲和磐久大容量存儲三大系列。但磐久服務(wù)器-M系列又是什么呢?M系列是磐久服務(wù)器中ARM架構(gòu)專屬分類,未來會全面覆蓋高性能計算,高性能存儲,和大容量存儲等機型。
阿里云為什么要全面自研磐久服務(wù)器呢?這應(yīng)該要從今天的云計算趨勢說起。
近幾年來,云原生業(yè)務(wù)呈現(xiàn)爆發(fā)式增長,給企業(yè)原有的基礎(chǔ)設(shè)施帶來了很大挑戰(zhàn)。廣義云原生是指因云而生的軟件、硬件和業(yè)務(wù)架構(gòu)。而落到基礎(chǔ)設(shè)施這個層面,主要的挑戰(zhàn)則是,基礎(chǔ)設(shè)施要真正具備敏捷、彈性、高穩(wěn)定性和高利用率等特性。
說起云原生大家都不陌生,但對于云原生硬件或云原生服務(wù)器基礎(chǔ)設(shè)施的解讀,業(yè)界說法不一。在陳義全看來,“說到底,云原生服務(wù)器基礎(chǔ)設(shè)施,就是面向云業(yè)務(wù)場景的需求,深挖IaaS層面,通過軟硬件一體化,實現(xiàn)極致性能和極致可靠性,真正做到硬件資源彈性,而不僅僅客戶看到的資源彈性。”
今天,數(shù)據(jù)中心的算力需求和2014年已完全不同。這幾年來,陳義全和其研發(fā)團隊一路向前,如今已拉通業(yè)務(wù)、產(chǎn)品和硬件研發(fā)三線團隊,基于前端客戶對云原生業(yè)務(wù)的需求分析,以及最新的服務(wù)器架構(gòu)和芯片的潛心打磨,最終落地阿里云磐久服務(wù)器-M系列。
如何讓業(yè)務(wù)更加簡單,整個算力資源更加彈性和快速,整個基礎(chǔ)設(shè)施或者整個業(yè)務(wù)運行更加穩(wěn)定,這正是阿里云一直追求的。而做到這一切,則需要打造適合云原生的服務(wù)器、網(wǎng)絡(luò)以及數(shù)據(jù)中心,大幅提升計算和存儲效率,實現(xiàn)云原生所需的極致彈性和性價比。作為云產(chǎn)品的基礎(chǔ)底座,過去幾年,阿里云基礎(chǔ)設(shè)施團隊通過自主研發(fā)持續(xù)重構(gòu)軟硬件之間的系統(tǒng)接口,部件和整機系統(tǒng),打造最高效的服務(wù)器和網(wǎng)絡(luò)基礎(chǔ)設(shè)施。聚焦到服務(wù)器技術(shù)領(lǐng)域,阿里云基礎(chǔ)設(shè)施走過了小型機、行業(yè)標準服務(wù)器、規(guī)格定制服務(wù)器和自研云原生服務(wù)器這幾個時代,最新的磐久服務(wù)器-M系列則是目前云原生時代最新的服務(wù)器技術(shù)實踐之一。
如何設(shè)計最高效的服務(wù)器硬件系統(tǒng)和CPU以獲取最佳的處理能力和高能效比,是業(yè)界自研服務(wù)器所面臨的最大挑戰(zhàn),但這對于阿里云來說反而是最大的優(yōu)勢。
阿里云在自研云原生服務(wù)器和定制處理器上具有很長的歷史積累和技術(shù)沉淀。首先,基于云計算對云服務(wù)器和處理器的要求,阿里云聯(lián)合業(yè)內(nèi)主流處理器供應(yīng)商開展了多代的處理器定制,獲取了基于業(yè)務(wù)場景的遠高于主流處理器的價值收益。其次,阿里巴巴百萬級在線服務(wù)器規(guī)模,有各種應(yīng)用場景下的性能模型和成本模型,而豐富的業(yè)務(wù)場景,如彈性計算,云存儲,大數(shù)據(jù)及分布式系統(tǒng)等方面積累了海量的性能數(shù)據(jù)和歷史問題總結(jié)經(jīng)驗,這些數(shù)據(jù)沉淀為云原生服務(wù)器和處理器的設(shè)計提供了系統(tǒng)架構(gòu)和微架構(gòu)的指導(dǎo)。
今天,阿里巴巴豐富的業(yè)務(wù)場景和客戶需求對云計算技術(shù)基礎(chǔ)提出了極致性能和高能效的要求,而阿里云磐久M服務(wù)器發(fā)布則為全棧云基礎(chǔ)設(shè)施填補上了最基礎(chǔ)的一環(huán)。通過將服務(wù)器架構(gòu)、軟硬件協(xié)同、操作系統(tǒng)、數(shù)據(jù)庫和中間件等基礎(chǔ)軟硬件能力有機結(jié)合,并通過阿里巴巴上層紛繁復(fù)雜的業(yè)務(wù)場景錘煉,必將為用戶提供更具性價比的云計算資源和更易落地的云服務(wù)解決方案,為客戶創(chuàng)造價值共同成長。
您的電子郵件地址不會被公開,必填項已用 * 標注。
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲 粵ICP備2021121885號網(wǎng)站地圖