阿里云智能容器平台丁宇:这是all in 云的时代-三明新闻网
点击关闭
您现在的位置新闻摄影作品首页>>财经新闻>>正文

服务西门子-阿里云智能容器平台丁宇:这是all in 云的时代

谭维维道歉

據新浪微博機器學習研發架構師于翔介紹,日活用戶超過2億的微博,已藉助雲原生搭建起高效穩定的機器學習平台、分鐘級創建上百節點的GPU計算集群,以及秒級啟動的大規模分佈式AI訓練任務。

丁宇是阿里雲智能容器平台負責人,也是阿里巴巴雙11的「大隊長」,曾9次參与雙11,推動了雙11體系技術架構的演進和升級。他對媒體表示,過去需要半年時間去準備雙11,但現在不到兩個月就可以準備好,對於互聯網大流量的峰值有很多配套和體系化的應對方法。

對於如何平衡微博擴容與成本的問題,于翔表示,「雖然大家都是看到微博掛了,但有時候是關注流刷不出來,有時候是熱搜,其實每次掛了的點,之後都不會掛了。另外,通過跟阿里雲合作,我們做了很多方案以及上雲彈性的改造。總體而言,還是彈性問題。以前半個小時才能彈出幾百台(雲服務器資源),現在3分鐘就可以彈出1000台。」

「雲計算的困難在於專業性高、學習成本大,而雲原生技術正是為了解決上述問題。雲原生技術將成為雲計算時代新的技術標準。」

通過儘早對容器化進行部署,阿里巴巴大大縮減了企業的運維成本。據悉,阿里巴巴從2011年開始全面地進行容器化,實現了100%的容器化,並基於容器化進行統一調度、混合部署,實現了異地多活、雲上可擴展的彈性。在雙11期間,節省了75%的成本,同時也節省了日常IT 30%的成本。

廣義的雲原生是全面使用雲服務構建的簡稱。狹義來講,雲原生包含以容器、服務網格、微服務、Serverless為代表的雲原生技術。前不久,IBM斥資340億美元收購紅帽,正是看中紅帽在雲服務構建領域的技術優勢。其用於構建和管理Kubernetes(k8s)容器的軟件套件Openshift,也成為IBM彎道超車的重中之重。

阿里雲是中國最大的雲計算企業,同時作為雲原生技術與應用的領先者,在雲計算高速發展的浪潮下,阿里雲容器服務ACK連續3年增速超400%。

對於為什麼是容器成為雲原生技術的基石,阿里雲容器服務研發總監易力補充道:「第一是敏捷,容器能夠幫助軟件開發交付效率提升10倍,幫助企業在經中贏得先機;第二是彈性,由於容器具有高密度部署的特性,加上彈性能力,通常來講可以幫助客戶節省50%的計算成本;第三是可移植,可以提供開放、標準化可移植的環境,在不同雲環境之間遷移實現無邊界的計算。」

隨着雲計算時代的到來,「雲原生」作為雲計算時代的新興技術理念,以平滑遷移、快速開發以及穩定運維等技術優勢,成為企業「上雲」重要工具,也成為雲計算廠商搶灘市場的籌碼。

阿里巴巴在Kubernetes規模與性能上已經取得較大進展:將存儲object的數量提升25倍,支持的節點數從5000提升到上萬,在端到端調度延遲從5s變為100ms等等。

與「雙十一」類似,新浪微博的明星出軌、結婚等新聞,給企業IP系統帶來大的流量挑戰,「微博癱瘓」作為明星新聞的代名詞,已成為網友調侃的對象。

作為工業領域的百年老店,西門子已經通過雲原生滿足了上線周期、擴容、運維等方面的要求。西門子工業互聯網首席架構師楊曉亮表示,西門子僅用數月時間,就完成了工業互聯網平台MindSphere基於阿里雲平台的開發、部署。

Gartner報告指出,到2022年有75%的全球化企業將在生產中使用雲原生的容器化應用。目前雲原生技術在中國發展到了什麼階段?被稱作「雲時代Linux」的Kubernetes又是如何影響企業的IT化進程?7月17日,阿里雲、新浪微博、西門子等企業的相關從業人員,接受了包括時代財經在內媒體的採訪,試圖給上述問題一個階段性答案。

阿里雲智能容器平台丁宇:這是all in 雲的時代

在集群調度方面,微博也已有十年歷史,機器從老到新,都對統一的線上服務有很大的壓力,業務對於算法、機器的要求也不一樣。如果將服務業務進行歸類,一類對CPU敏感,一類對GPU敏感,一類對網絡帶寬敏感,三類業務如何進行混合部署也是需要解決的問題。

西門子工業互聯網平台中國首席架構師:雲原生落地工業互聯網

楊曉亮表示,數據來自機器,也來自使用者。很多客戶會有突發情況。「客戶從終端訪問我們的平台,通過他們的軟件流量落到我們的平台上,就會產生擴容的問題。」而日常的流量穩定,使西門子MindSphere對系統穩定性要求更高,需要謹防雪崩效應的發生。「工業領域的要求就是不能掉數據,所以我們會做一些冗餘設計。」

「機器對我們很好,但是機器也對我們要求更高。」楊曉亮用詼諧的方式表達了西門子在這一領域可能面臨的挑戰。與微博不同,物聯網平台的機器不會「分手」,也不會「結婚」,但西門子的MindSphere面臨著擴容的問題。

新浪微博機器學習研發架構師:如何拯救明星效應下的微博掛機?

目前,阿里雲原生產品家族的應用範圍包括底層基礎設施、數據智能、分佈式應用等。具體而言,可應用於基因數據處理、視頻直播互動場景、智慧樓宇項目解決方案、電商大促等。

目前整個阿里有70%的業務位於公共雲上。丁宇透露,未來兩年內,阿里巴巴集團的業務能夠100%以雲原生的方式跑在公共雲上,「我們認為這是all in 雲的時代。」

楊曉亮表示,從頭搭建一個工業物聯網平台,西門子遇到了很多問題。首先是複雜的業務邏輯,如何將其快速部署、上線;此外,工業物聯網應用的擴容也是很大的問題,平台永遠不知道明天的客戶數、互動連接數;而運維、雲資源管理等都面臨很大的挑戰。

通過將微服務部署于阿里雲的容器服務,西門子工業互聯網平台可以快速實現微服務,最終實現產品的快速開發與迭代。「我們的基礎設施即代碼,通過腳本就能夠配置我們的基礎設施,配置我們基礎設施的參數,這一點也是我們能夠快速上線的保證。」

「這些事情都可以交給K8S做,幫你調度協調選擇更合適的資源節點去部署。」于翔表示。

以深度學習為例,其在訓練過程中會遇到很多問題。從業務角度看,不同模式下框架不盡相同;從平台角度看,一個具體場景下,一個集群管理、維護成本非常高,部署複雜度呈指數性上升。而模型訓練場景之後,又需要部署線上推薦系統,每個業務場景服務的時候也存在差異,包括多媒體分析、自然語言分析,以及推薦系統的排序模型服務等。

「通過雲原生技術,這些問題似乎都不是問題了。」他指出,「首先有成熟的CICD工具能夠解決上線部署問題。此外,阿里雲還提供了多種緯度擴展,以及多緯度的擴容工具。」

MindSphere是西門子推出的基於雲的開放式物聯網操作系統,向下提供數據採集API,支持西門子和第三方設備的數據連接;向上提供開發API,方便合作夥伴和用戶開發應用程序。MindSphere生態系統中包括數據採集開發者、系統集成商、應用開發者、渠道合作夥伴、設備製造商和最終客戶。

今日关键词:谭维维道歉