算力資源有限,調(diào)度優(yōu)化問(wèn)題緊迫。OpenAI 此前在技術(shù)博客《Scaling Kubernetes to2,500 nodes》中提到,OpenAI k8s 集群從500 nodes 擴(kuò)展到2500 nodes 時(shí)遇到諸多存儲(chǔ)、網(wǎng)絡(luò)和資源初始化問(wèn)題,通過(guò)可視化監(jiān)控工具Datadog 發(fā)現(xiàn)ETCD(一種Key-Value 存儲(chǔ)服務(wù))寫(xiě)數(shù)據(jù)存在幾百毫秒延遲,list API 被頻繁調(diào)用、Fluentd 和DataDog 頻繁侵占資源等問(wèn)題。
什么是算力調(diào)度?在云計(jì)算中,資源調(diào)度是一個(gè)非確定性多項(xiàng)式優(yōu)化問(wèn)題,往往會(huì)出現(xiàn)“拆東墻補(bǔ)西墻”這樣的情況,因此云計(jì)算的算力調(diào)度必須考慮每個(gè)算力資源請(qǐng)求的需求邊界,比如OpenAI 團(tuán)隊(duì)使用“balloons”占位策略解決資源排隊(duì)問(wèn)題:
用一個(gè)低優(yōu)先級(jí)pod 占著整個(gè)節(jié)點(diǎn),要用節(jié)點(diǎn)的時(shí)候被自動(dòng)驅(qū)逐掉;使用污點(diǎn)策略手動(dòng)分配每個(gè)訓(xùn)練請(qǐng)求能使用的節(jié)點(diǎn)。
GPU 超算集群中,暴露出的不只是算力調(diào)度問(wèn)題。在此前對(duì)英偉達(dá)AI 超算的研究中,我們的結(jié)論是:通信網(wǎng)絡(luò)是制約數(shù)據(jù)中心算力高低的關(guān)鍵因素。在多線程并行計(jì)算下,通信成為制約算力的短板,只要有一條交換鏈路出現(xiàn)網(wǎng)絡(luò)阻塞或丟包,就會(huì)產(chǎn)生I/O 延遲;又如GH200 新增顯存互聯(lián)功能,我們認(rèn)為,相對(duì)于無(wú)顯存互聯(lián)的超算,GH200 對(duì)API server 的并發(fā)訪問(wèn)量是指數(shù)級(jí)增長(zhǎng),將對(duì)硬件資源調(diào)度提出更高挑戰(zhàn)。
多點(diǎn)硬件部署監(jiān)控效率更高。我們注意到,OpenAI 在針對(duì)網(wǎng)絡(luò)監(jiān)控進(jìn)行優(yōu)化時(shí)發(fā)現(xiàn)Prometheus 這類(lèi)監(jiān)控系統(tǒng)時(shí)常會(huì)導(dǎo)致OOM(Out of Memory,內(nèi)存溢出),從而不得不削減查詢(xún)頻率;每次初始化pod,Prometheus 都要重寫(xiě)WAL(Write-aheadlogging,預(yù)寫(xiě)式日志)拉長(zhǎng)啟動(dòng)時(shí)間。我們認(rèn)為,以上問(wèn)題都可以通過(guò)嵌入式的多點(diǎn)硬件層監(jiān)控系統(tǒng)避免上述問(wèn)題。我們認(rèn)為,在傳統(tǒng)的計(jì)算式和I/O 式云計(jì)算中,外部串接監(jiān)控服務(wù)器即可滿(mǎn)足監(jiān)控需求,而GPU 集群時(shí)代,需要并接部署“聯(lián)邦集群”并進(jìn)行不同監(jiān)控服務(wù)器的功能劃分,最后進(jìn)行北向匯聚,有望提升監(jiān)控采集效率、降低超算本身的資源侵占。
網(wǎng)絡(luò)可視化技術(shù)在國(guó)內(nèi)外均處于探索迭代過(guò)程中,國(guó)內(nèi)相關(guān)廠商的潛在機(jī)會(huì)巨大。
在北美,目前主流的監(jiān)控工具是Netscout、Prometheus、Datadog 等,都是基于在超算本地化部署;但在多點(diǎn)硬件部署的AI 超算中,軟硬件結(jié)合的廠商成長(zhǎng)性有望更為充分,經(jīng)過(guò)多年經(jīng)驗(yàn)積累的相關(guān)國(guó)內(nèi)DPI 廠商,形成了高容量下的數(shù)據(jù)監(jiān)控能力,有望成為全球算力調(diào)優(yōu)的上游關(guān)鍵角色。
投資建議:
1)重視GPU 超算集群中交換網(wǎng)絡(luò)性能的重要性,而光通信是現(xiàn)有技術(shù)下幾乎無(wú)法替代的交換網(wǎng)絡(luò)方案,關(guān)注光通信:中際旭創(chuàng)、新易盛、天孚通信、太辰光、騰景科技、德科立、聯(lián)特科技、華工科技、源杰科技、劍橋科技;算力設(shè)備:中興通訊、紫光股份、銳捷網(wǎng)絡(luò)、菲菱科思、恒為科技、工業(yè)富聯(lián)、寒武紀(jì)、震有科技。
2)重視網(wǎng)絡(luò)可視化及算力資源調(diào)優(yōu)策略的軟硬件廠商,該品種目前存在較大預(yù)期差,關(guān)注恒為科技、浩瀚深度、中新賽克。
風(fēng)險(xiǎn)提示:AI 發(fā)展不及預(yù)期,算力需求不及預(yù)期。
知前沿,問(wèn)智研。智研咨詢(xún)是中國(guó)一流產(chǎn)業(yè)咨詢(xún)機(jī)構(gòu),十?dāng)?shù)年持續(xù)深耕產(chǎn)業(yè)研究領(lǐng)域,提供深度產(chǎn)業(yè)研究報(bào)告、商業(yè)計(jì)劃書(shū)、可行性研究報(bào)告及定制服務(wù)等一站式產(chǎn)業(yè)咨詢(xún)服務(wù)。專(zhuān)業(yè)的角度、品質(zhì)化的服務(wù)、敏銳的市場(chǎng)洞察力,專(zhuān)注于提供完善的產(chǎn)業(yè)解決方案,為您的投資決策賦能。
轉(zhuǎn)自國(guó)盛證券有限責(zé)任公司 研究員:宋嘉吉/黃瀚/趙丕業(yè)/邵帥


2025-2031年中國(guó)算力行業(yè)市場(chǎng)全景調(diào)查及戰(zhàn)略咨詢(xún)研究報(bào)告
《2025-2031年中國(guó)算力行業(yè)市場(chǎng)全景調(diào)查及戰(zhàn)略咨詢(xún)研究報(bào)告 》共十一章,包含中國(guó)算力行業(yè)發(fā)展環(huán)境洞察,中國(guó)算力行業(yè)市場(chǎng)前景預(yù)測(cè)及發(fā)展趨勢(shì)預(yù)判,中國(guó)算力行業(yè)投資戰(zhàn)略規(guī)劃策略及發(fā)展建議等內(nèi)容。



