(資料圖)
“比方說我們這個機柜里面,總共有10臺服務器,根據(jù)功率,每個機柜會安裝8到16臺服務器,根據(jù)不同的需求和功能,實現(xiàn)計算和存儲。”在位于安徽蕪湖的中國電信云計算中心,總經(jīng)理張運保向記者介紹數(shù)據(jù)中心的運營情況。2022年初,隨著國家發(fā)改委等四部門聯(lián)合批復,十個國家數(shù)據(jù)中心集群規(guī)劃正式公布,其中“蕪湖集群”赫然在列。政策引導下,蕪湖市迅速啟動算力“新基建”,一年多來,蕪湖市累計招引重點項目11個、總投資接近2300億元,其中不乏中國電信、聯(lián)云世紀、華為云等投資超百億的數(shù)據(jù)中心項目。蕪湖電信云計算中心,工作人員正在進行機房巡檢早在2017年,中國電信就將蕪湖作為31個云資源骨干節(jié)點之一,規(guī)劃建設集團級云計算中心。“目前已經(jīng)建成的數(shù)據(jù)中心機架總規(guī)模有1.5萬架,可容納的服務器的話有15萬臺,算力資源有50萬核。”蕪湖云計算中心總經(jīng)理張運保向記者介紹道,“我們目前部署的算力資源以通用算力為主,后續(xù)通過一些高性能的CPU,我們也在部署一些智算的能力。”從通用算力到智能算力數(shù)據(jù)中心建設贏來新機遇新動能當數(shù)據(jù)成為新的經(jīng)濟要素,算力也就成為了數(shù)據(jù)發(fā)揮價值的關鍵驅動力,引發(fā)了全球對于人工智能大模型的高度關注,在公眾“圍觀吃瓜”之前,業(yè)內(nèi)已經(jīng)先行一步。位于上海臨港的商湯科技人工智能計算中心(AIDC),面向的正是人工智能時代爆發(fā)的大模型訓練需求。位于上海臨港的商湯人工智能計算中心“從硬件層面來說包含了我們各類服務器、各類芯片組成的一個計算集群,以及我們所有的AI計算平臺、數(shù)據(jù)平臺、網(wǎng)絡等。”在商湯科技大裝置事業(yè)群智算中心總經(jīng)理林海看來,AIDC是需要打通軟件和硬件,組成可以進行模型生產(chǎn)的通用基礎設施。“目前為止我們可以實現(xiàn)4000卡GPU的單項任務的訓練,整個的并行效率可以達到91.5%,我們在這個園區(qū)里邊可以容納的訓練任務,可以實現(xiàn)20個千億級參數(shù)的模型的訓練。”據(jù)了解,商湯早在2018年便開始布局人工智能計算原型機的研制,去年初,AIDC正式在上海臨港啟動運營,在市場人士看來,商湯已拿到了智能算力時代的“船票”。頭部玩家群雄逐“數(shù)”帶動云、軟件、芯片產(chǎn)業(yè)重塑與商湯類似,作為國內(nèi)領先的ICT企業(yè),華為在2019年發(fā)布了由數(shù)千顆昇騰910處理器組成的AI訓練集群Atlas900。在上海超級中心的數(shù)據(jù)機房,記者見到了這臺號稱“全球最快”的服務器機柜。“從體積上來說,它跟我們傳統(tǒng)的機柜是同樣的,采用42U的設計,但是通過我們對于網(wǎng)絡、存儲和人工智能計算算力的高度集成,它單機柜可以實現(xiàn)20P算力。”上海昇騰人工智能生態(tài)創(chuàng)新中心COO張中陽告訴記者。上海超算中心機房搭載的華為Atlas900服務器立足于全棧自研的數(shù)據(jù)中心解決方案,華為推出了業(yè)界唯一覆蓋“端、邊、云”全場景的達芬奇架構處理器,發(fā)布了包括支持通用計算的鯤鵬系列,支持AI的昇騰系列,支持智能終端的麒麟系列及支持智慧屏的鴻鵠系列,“應該是把昇騰稱之為NPU,實際上N它代表的就是神經(jīng)網(wǎng)絡計算,我們其實也是希望能夠在人工智能領域里面,推出一款專用的AI計算的芯片。”張中陽談到。從芯片到軟件到云平臺,華為給出了支撐智能算力的國產(chǎn)答卷。進入算力基建化時代綠色+低碳成為數(shù)據(jù)中心建設新命題來自國家網(wǎng)信辦的數(shù)據(jù)顯示,截至2022年底我國數(shù)據(jù)中心機架總規(guī)模已超過650萬標準機架,近5年年均增速超過30%。面對大規(guī)模數(shù)據(jù)計算產(chǎn)生的熱能,傳統(tǒng)方式是使用空調(diào)降溫。而在中國電信蕪湖云計算中心即將啟用的機房內(nèi),“冷水主機+板換+冷卻塔”的聯(lián)合供冷模式讓人耳目一新。蕪湖電信云計算中心水冷機房“它跟我們早期的風冷相比,整個單位能耗就下降得非常多,通過冷水和熱水的交換,實際上實現(xiàn)了制冷的效果。”蕪湖云計算中心總經(jīng)理張運保向記者介紹道。商湯的AIDC則運用了一整套智能決策的系統(tǒng)來降低PUE,“在我們的訓練任務上來的時候,我們的IT功耗的水平,IT負載力的水平,跟外部的氣候條件以及跟我們所有設備運行的參數(shù),這三者之間實際上是一個聯(lián)動關系。”商湯科技大裝置事業(yè)群智算中心總經(jīng)理林海認為,解決能耗的問題,還需要借助AI管理的手段。高能耗背后隱含算力資源供需失衡的深層次矛盾數(shù)據(jù)中心的投資可以帶來較高的經(jīng)濟外部性、利潤溢出效應。但算力要動起來,要與數(shù)據(jù)連同,才能將價值發(fā)揮出來。在安永大中華區(qū)數(shù)字化與新興科技合伙人王志遠看來,當前我國算力供需存在“旱的旱死澇的澇死”這一結構不平衡現(xiàn)象。“其實現(xiàn)在可能超過50%以上的IDC,CPU以及內(nèi)存的使用比例非常低,存在算力的浪費,另外又有一些企業(yè)存在大量高并發(fā)的算力需求,由于缺少算力資源,無法響應客戶需求。”他認為,要解決這個問題,需要借助一些AI算力分配的邏輯,滿足企業(yè)對于算力的彈性需求。由上海超算中心打造的算力調(diào)度平臺我國算力供需結構失衡的另一層面體現(xiàn)在通用算力資源過多,智算資源不足,這一點也在人工智能時代被放大。上海超級計算中心主任李根國認為,在數(shù)字經(jīng)濟轉型和國際市場競爭的背景下,當前我國的建設的智算資源還遠遠不夠,在他看來,我國算力產(chǎn)業(yè)的發(fā)展離不開產(chǎn)業(yè)鏈各環(huán)節(jié)的共同努力。“不論是芯片制造的,還是服務器制造的,還是提供算力的機構,在國家戰(zhàn)略的推動下,攜手打造良好的產(chǎn)業(yè)生態(tài),每個環(huán)節(jié)各司其職,共同推動我國算力的發(fā)展。”李根國告訴記者。