近年來,自動駕駛、生命醫學、智能制造等領域發展迅速,隨之而來的是超大規模人工智能(AI)模型和海量數據對算力需求的不斷提高,智算中心建設正當其時。
智算,簡單來說就是專門服務于人工智能的數據計算中心,是目前主流的算力中心之一,能夠為人工智能計算提供所需的專用算力,為計算基礎設施帶來新的建設方式。
近日,阿里云宣布正式啟動張北超級智算中心,總建設規模為12 EFLOPS(每秒1200億億次浮點運算)AI算力,超過谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成為全球最大的智算中心,可為AI大模型訓練、自動駕駛、空間地理等人工智能探索應用提供智能算力服務。
隨著張北超級智算中心的啟用,阿里云正式對外開放了這座超級智算中心的技術底座——飛天智算平臺,其可通過公共云和專有云的模式服務于各類機構。開發人員可以在平臺上進行數據存儲、數據治理、數據分析、模型開發、模型訓練與推理等。此外,平臺還提供了預訓練模型,語音、圖像、自然語言處理、決策等領域的模型能力,以方便開發者更好地加速AI應用的開發。
算力是這個時代的剛需。從政府主管部門到相關行業企業,都在為提升中國算力總量和水平,優化算力布局而努力。根深則葉茂,強勁算力能為人工智能的發展打下更廣闊、更穩固的基礎。
推進智算基礎設施建設
算力是重要的基礎設施,也是關鍵的生產要素。阿里云智能全球銷售總裁蔡英華在飛天智算平臺發布會上給出過這樣幾項數據:當下的中國,已經有58%的企業在使用人工智能,遠遠高于全球平均水平,領跑全球;數字化轉型會帶來大量的數據,預計到2025年,中國的數據量將達到486萬億億字節。
此外,我國的算力結構也在發生變化。“十三五”期間,我國算力總規模增長近5倍,通用算力增長3倍左右,智能算力增長近百倍,智能算力在整個融合算力中的占比達到了40%,未來可能會更多。“可以說,算力的發展不僅代表生產力水平的提升,還是產業革新的驅動力。”蔡英華說。
和通用型計算不同,智能計算需要海量數據對AI模式進行訓練,算力被損耗在數據遷移、同步等環節,這對智能計算提出了更高要求。因此,智算中心要具備高效算力、AI賦能、自主創新、綠色節能等多種特征,而建設智算中心,可以推進算力資源的優化配置,賦能各行各業的數字化轉型,帶動實現產、學、研、用多位一體,打造AI產業集群。
工信部數據表示,截至2021年底,我國在用數據中心機架總規模達520萬標準機架,在用數據中心服務器規模1900萬臺,算力總規模超過140 EFLOPS。全國在用超大型和大型數據中心超過450個,智算中心超過20個。工信部信息通信發展司司長謝存曾表示,工信部將持續推動算力基礎設施建設,統籌布局綠色智能的算力基礎設施,推進一體化大數據中心體系建設,加速打造數網協同、數云協同、云邊協同、綠色智能的多層次算力設施體系,實現算力水平的持續顯著提升,夯實數字經濟發展“算力底座”。
科研是智算中心的核心應用場景
在生命科學領域,北京深勢科技有限公司采用飛天智算平臺之后,將集群性能優化提升超過100%,讓分子動力學仿真模擬訓練效率提升了5倍;在工業領域,智己汽車科技有限公司通過飛天智算平臺提供的高性能計算,將智能駕駛訓練效率提升了70%,加速了新車型的研發上市……這些只是智算中心服務于科學研究的一個縮影。
阿里云智能副總裁、行業解決方案銷售部總經理霍嘉直言,很多高校和科研機構的研究人員本身不是學計算機的,但他們的確需要人工智能來完成他們的研究,專業知識與互聯網技術之間的隔閡,成為困擾研究人員的一大痛點。
據阿里云大計算產品研發負責人曹政介紹,“相較于一般數據中心,智算中心除了對算力規模和效率的要求大大提高外,還需要為客戶提供軟件平臺層的產品和服務,這是實現算力落地應用‘最后一公里’的關鍵。”曹政說。
“如今,人們需要的是‘開箱即用’的智能計算服務,這是最真實的需求。”霍嘉表示,在AI開發層,該智算中心可以提供“大數據+AI”一體化平臺支撐開發與運維全流程,尤其在模型訓練環節,分布式訓練框架可以對分布式策略進行自動組合和調優,將訓練效率提升了11倍以上。此外,該智算中心還為用戶提供了一站式的通用推理優化工具,可對算法模型進行量化、剪枝、稀疏化、蒸餾等操作,將推理效率提升6倍以上。此外,阿里云還同步啟動了另一座位于烏蘭察布的智算中心,其建設規模為3 EFLOPSAI算力。這兩座超大規模的智算中心正在服務于AI大模型訓練、遙感探測、數字人、自動駕駛、元宇宙等前沿智能應用。