成日聽人吹風:「依家啲AI模型又做蒸餾(Distillation)、又做優化,根本唔使以前咁大算力都行到啦,晶片仲邊有人要?半導體爆炸喇!」
前幾日,調研機構SemiAnalysis出咗份報告,指新一代Vera Rubin伺服器會將記憶體容量砍半,即刻引發恐慌,搞到美股成個半導體板塊全線插水。
但我可以直接話你知結論:軟體幫手慳算力,唔會整死硬件需求。慳出嚟嘅算力空間,一瞬間就會被全新、更複雜嘅需求塞滿。
*台北現場直擊:機櫃密度癲到你唔信*
筆者早排去咗台北行GTC同Computex,雖然自己唔係咩科技專家,好多嘢都係睇YouTube或者跟身邊兩位拍檔邊學邊睇,但喺現場睇完一大堆server rack(機櫃)同presentation之後,用最layman嘅角度去理解,依家啲主機分工已經極度明確。
一個rack專攻GPU,其他就放埋CPU、DRAM同NVLink。成個趨勢就是體積愈來愈小,晶片愈塞愈多。
筆者喺GTC現場見到個CPU rack恐怖到極點:一個模組擺4粒CPU,每粒CPU隔籬排足32條RAM,而成個機櫃足足塞咗256粒CPU。至於入面到底插咗幾多條RAM?大家心照,自己撳計數機都知數目有幾驚人。
*算力一慳出嚟,一秒鐘就會被新怪獸吞噬*
呢兩年嚟,全球對算力嘅渴求基本上係一個無底深潭。軟體優化幫工程師慳咗算力?騰出嚟嘅資源,大家絕對唔會儲埋佢,而係即刻搶住用嚟挑戰更極限嘅玩法:
-模型無上限咁谷大:慳番嚟嘅算力,研發團隊會一秒鐘攞去跑更高級、參數翻幾倍嘅神經網絡,務求做到最全能嘅AI。
-多模態與Reasoning(連續思考):依家淨係玩文字對答已經唔夠,市場要嘅係AI即時生成高清片、行最頂級嘅自動駕駛,甚至乎同時指引幾十個AI Agent自己開會、debug兼執掂成套system。呢啲超大型任務,每行一步都係吞吐緊海量算力。
呢個現象喺經濟學上有個好經典嘅概念,叫「杰文斯悖論(Jevons Paradox)」:當一樣資源嘅使用效率提升、成本變平,人類唔會用少咗,反而會因為「太抵玩」而全面報復性消費,用得仲瘋狂。
*慳算力絕對唔係看空半導體嘅藉口*
千祈唔好一廂情願以為軟體進步,硬件廠就要乞食。事實上,NVIDIA老黃話:「完全睇唔到短缺結束嘅盡頭。」
就算硬件架構點樣微調、點樣幫個系統「減肥」,現實係成條AI產業鏈--TSMC晶圓代工、CoWoS先進封裝,到高頻寬記憶體(HBM),通通都處於供不應求嘅狀態:
-入場門檻低咗,全人類入局一齊搶:軟體優化將算力門檻拉低,本來得BigTech巨頭玩得起嘅高級AI,依家連Startup、中小企,甚至邊緣設備(例如手機、AI PC、電動車、全屋智能家電)全部都行得到。當每部機都要塞塊AI晶片入去,呢個普及化嘅市場胃口大到你無法想象。
-短缺潮起碼行多幾年:老黃放晒話,無論係超級電腦、AI PC或智能機器人,全球嘅Base建設需求都行得好急,成個半導體供應鏈斷貨嘅狀態,起碼仲要直路行多幾年。
當然,股票短期內嘅升跌,未必完全百分百反映基本面,市場有時對硬件嘅預期或者真係炒得太高、太急。但起碼從科技發展嘅本質嚟看,短期內成個行業完全無任何逆轉或者見頂嘅跡象。
出面有風吹草動就當係壞消息,周圍聽埋啲「AI就嚟爆破」嘅鬼故,真係認真便輸了。《方德證券高級分析師 莫灝楠》
*《經濟通》所刊的署名及/或不署名文章,相關內容屬作者個人意見,並不代表《經濟通》立場,《經濟通》所扮演的角色是提供一個自由言論平台。
【你點睇?】國家主席習近平於6月8日起訪問北韓兩天。你認為習近平今次訪朝,最有可能達成哪項目標?► 立即投票





































