天堂中文在线观看视频,亚洲男人的天堂av,精东影业在线观看,亚洲成a人无码

帳號:
密碼:
最新動態(tài)
產(chǎn)業(yè)快訊
CTIMES / 文章 /
生成式AI當(dāng)?shù)?GPU算力爭霸方興未艾
 

【作者: 王岫晨】   2025年05月07日 星期三

瀏覽人次:【3178】

生成式AI驅(qū)動的模型規(guī)模與複雜度急遽上升,正迫使晶片架構(gòu)以遠(yuǎn)超摩爾定律的速度進(jìn)化。在這場硬體競賽中,NVIDIA、AMD、Google等科技巨頭紛紛推出「算力核彈級」晶片,並在效能、功耗與生態(tài)系三大戰(zhàn)場上展開正面交鋒。


2023年,ChatGPT在短短五天內(nèi)突破億級用戶,徹底改寫科技與應(yīng)用場景的版圖。背後支撐其運(yùn)行的GPT-4模型,不僅需動用約1.7萬顆GPU,耗電量更高達(dá)50GWh,相當(dāng)於3.6萬戶家庭全年的用電需求。而最新的Sora影片生成模型,其單次訓(xùn)練成本更被傳已突破5億美元,堪稱「算力黑洞」的代表。



圖一 : ChatGPT需耗用大量的GPU運(yùn)算資源。
圖一 : ChatGPT需耗用大量的GPU運(yùn)算資源。

生成式AI驅(qū)動的模型規(guī)模與複雜度急遽上升,正迫使晶片架構(gòu)以遠(yuǎn)超摩爾定律的速度進(jìn)化。在這場硬體競賽中,NVIDIA、AMD、Google等科技巨頭紛紛推出「算力核彈級」晶片,並在效能、功耗與生態(tài)系三大戰(zhàn)場上展開正面交鋒。OpenAI執(zhí)行長Sam Altman更喊出募資7兆美元自建晶片廠,預(yù)示這場競賽不僅將改寫AI產(chǎn)業(yè)的格局,更可能重塑整個半導(dǎo)體生態(tài)。


AI模型推動硬體需求徹底重構(gòu)

從GPT-3的1,750億參數(shù)到GPT-4的1.8兆參數(shù),參數(shù)量膨脹超過10倍,模型訓(xùn)練所需的算力也呈指數(shù)級上升。而最新的多模態(tài)模型,如OpenAI的Sora,更需同時處理文本、影像與物理模擬,Transformer架構(gòu)中的「注意力機(jī)制」(Attention)大幅推升記憶體頻寬需求,是純語言模型的3倍以上。


另一方面,即時生成需求也正在向邊緣裝置逼近。例如Stable Diffusion要求裝置能在1秒內(nèi)生成一張512×512解析度的圖片,這推動NPU(神經(jīng)網(wǎng)路處理單元)導(dǎo)入如動態(tài)電壓與頻率調(diào)整(DVFS)等技術(shù)來平衡性能與功耗。


三大技術(shù)關(guān)鍵指標(biāo)浮現(xiàn)

為因應(yīng)模型規(guī)模與即時需求並存的挑戰(zhàn),三大硬體升級重點(diǎn)成為焦點(diǎn):


? 記憶體頻寬:HBM3e(高頻寬記憶體)堆疊技術(shù)進(jìn)一步解放資料吞吐瓶頸。


? 稀疏計(jì)算支援:Google TPU v6強(qiáng)化稀疏矩陣運(yùn)算能力,大幅提升訓(xùn)練效率。


? 高速互連:AMD MI300X採用第三代Infinity Fabric技術(shù),將CPU與GPU間延遲壓縮至35ns,強(qiáng)化即時推理場景的反應(yīng)速度。


三大巨頭硬體技術(shù)的競速戰(zhàn)

NVIDIA:CUDA帝國下的霸權(quán)延伸

作為AI晶片市場的霸主,NVIDIA以CUDA軟體平臺建立起無可撼動的技術(shù)護(hù)城河。其最新架構(gòu)在大型語言模型訓(xùn)練上表現(xiàn)卓越,加上CUDA 12支援動態(tài)並行運(yùn)算,使開發(fā)者能更靈活配置資源,提升訓(xùn)練效率。


目前NVIDIA已獨(dú)佔(zhàn)全球92%的AI訓(xùn)練市場,儘管單顆高階AI晶片售價高昂,卻反而催生出如CoreWeave等GPU雲(yún)端租賃服務(wù),讓中小企業(yè)得以接觸尖端算力。


NVIDIA之所以能在生成式AI浪潮中脫穎而出,關(guān)鍵在於其GPU架構(gòu)針對深度學(xué)習(xí)工作負(fù)載進(jìn)行高度優(yōu)化。以H100為例,其內(nèi)建的Tensor Core第四代張量處理器專為矩陣運(yùn)算設(shè)計(jì),支援FP8、BF16等混合精度格式,讓大型語言模型訓(xùn)練速度提升至前代的2倍以上,同時保持精度不墜。


此外,NVIDIA也針對大模型運(yùn)行瓶頸進(jìn)行記憶體創(chuàng)新,H100搭載的HBM3記憶體頻寬高達(dá)3 TB/s,遠(yuǎn)高於傳統(tǒng)GDDR6,顯著降低模型參數(shù)載入與中間層數(shù)據(jù)傳遞的延遲。再搭配NVLink互連技術(shù),可將多張GPU組成高速集群,實(shí)現(xiàn)「多GPU如單GPU」的運(yùn)算體驗(yàn),滿足如GPT-4、Sora等超大模型的分散式訓(xùn)練需求。


AMD異構(gòu)運(yùn)算的逆襲

AMD的MI300X以異構(gòu)整合架構(gòu)為亮點(diǎn),將Zen 4 CPU、CDNA 3 GPU與HBM3記憶體整合為單一APU,記憶體容量高達(dá)192GB,並大幅減少資料搬移造成的瓶頸。其性價比策略也具競爭力:在同等算力下,MI300X價格比H100低30%,並支援ROCm開源軟體框架,已成功打入Meta的Llama 3訓(xùn)練系統(tǒng)。不過,相較於CUDA,其軟體生態(tài)仍有明顯落差,目前PyTorch對MI300X的運(yùn)算支援覆蓋率僅約78%。


AMD在AI晶片領(lǐng)域的突圍,建立於其長年經(jīng)營的異質(zhì)運(yùn)算(Heterogeneous Computing)技術(shù)基礎(chǔ)之上。MI300X採用APU(Accelerated Processing Unit)架構(gòu),將高效能CPU核心(Zen 4)與GPU核心(CDNA 3)以及高頻寬記憶體(HBM3)整合於同一封裝中,透過統(tǒng)一記憶體架構(gòu)(Unified Memory Architecture),讓CPU與GPU可共享高達(dá)192GB的HBM3記憶體資源,大幅降低資料搬移造成的延遲與功耗。


這種設(shè)計(jì)特別適用於生成式AI推理階段,例如在需要快速回應(yīng)的即時應(yīng)用中,資料無需在CPU與GPU間頻繁複製,讓整體運(yùn)算流程更高效、連續(xù)。此外,CDNA 3架構(gòu)內(nèi)建對稀疏運(yùn)算(Sparse Compute)與混合精度計(jì)算(例如FP8、BF16)的原生支援,進(jìn)一步提升AI模型訓(xùn)練與推理的能源效率。


AMD的架構(gòu)策略,重點(diǎn)不在於單點(diǎn)性能的極致,而是以系統(tǒng)級協(xié)同與封裝創(chuàng)新爭取效能與成本的最佳平衡,這讓MI300X在資料中心與企業(yè)AI部署中,成為一項(xiàng)極具競爭力的選擇。



圖二 : NVIDIA與AMD在生成式AI應(yīng)用領(lǐng)域中的運(yùn)算優(yōu)勢比較。
圖二 : NVIDIA與AMD在生成式AI應(yīng)用領(lǐng)域中的運(yùn)算優(yōu)勢比較。

Google封閉但高效的垂直整合

Google以TPU v6為核心推出的Hypercomputer平臺,是垂直整合的極致範(fàn)例,強(qiáng)調(diào)能效與協(xié)同運(yùn)作。透過優(yōu)化的硬體設(shè)計(jì)與軟體疊代,其整體運(yùn)行效率領(lǐng)先業(yè)界。


然而,這套系統(tǒng)僅供Google Cloud內(nèi)部與合作客戶使用,其封閉性成為限制其普及化的最大障礙。


算力的突破口

Meta的Llama 3與開源模式

Meta的Llama 3展示了開源模型在算力資源緊張情境下的可行性。訓(xùn)練一個參數(shù)量為700億的模型,需動用7,200顆H100運(yùn)行90天,光電費(fèi)就高達(dá)870萬美元,相當(dāng)於3,000臺特斯拉Model Y的售價。


為解決這一痛點(diǎn),Meta導(dǎo)入PyTorch Fully Sharded Data Parallel(FSDP)技術(shù),能將模型參數(shù)分散至512張GPU上,大幅提升訓(xùn)練效率達(dá)70%。


CoreWeave雲(yún)端算力

CoreWeave則以「算力即服務(wù)」模式出線,提供GPU分鐘級租賃服務(wù),H100實(shí)例每小時費(fèi)用僅6.5美元。其與NVIDIA合作開發(fā)的液冷伺服器叢集,功率密度達(dá)傳統(tǒng)資料中心的8倍,支援千卡級高並行運(yùn)算,成為中小型AI開發(fā)者重要算力來源。


不過,其商業(yè)模式也受到外部市場影響。例如過去以太坊合併,從工作量證明 (PoW) 轉(zhuǎn)為持有量證明(PoS)後,GPU需求暴跌曾導(dǎo)致租金價格瞬間下修47%,揭示出其潛在風(fēng)險。


下一世代xPU技術(shù)的戰(zhàn)場

量子與光子:顛覆既有邏輯的潛力選項(xiàng)

IBM的量子優(yōu)勢實(shí)驗(yàn)展示出量子運(yùn)算處理特定優(yōu)化問題的潛力,速度比GPU快1,000倍,儘管目前錯誤率仍高,但前景令人矚目。


另一方面,新創(chuàng)公司Lightmatter的光子AI晶片利用光取代電子進(jìn)行傳輸與運(yùn)算,在矩陣乘法任務(wù)中能節(jié)省90%能源消耗,已獲Google Ventures等風(fēng)投資助。


OpenAI重塑晶片設(shè)計(jì)鏈

Sam Altman高喊7兆美元自建晶片廠的構(gòu)想,若以每片晶圓產(chǎn)出50顆AI晶片估算,足可建造1,750座晶圓廠,超越臺積電、三星與英特爾的總和。


此舉的戰(zhàn)略意涵明確:擺脫對NVIDIA的高度依賴,走蘋果M系列自研晶片的路線,實(shí)現(xiàn)演算法與硬體垂直整合。不過,半導(dǎo)體業(yè)界普遍質(zhì)疑其可行性,尤其在先進(jìn)製程與ASIC設(shè)計(jì)人才極度稀缺的當(dāng)下,該計(jì)畫恐淪為「資本黑洞」。



圖三 :  NVIDIA高階AI晶片規(guī)格與應(yīng)用比較
圖三 : NVIDIA高階AI晶片規(guī)格與應(yīng)用比較

結(jié)語

生成式AI正在從科技突破走向大規(guī)模應(yīng)用,而算力需求已成決定競爭力的關(guān)鍵要素。當(dāng)前這場硬體競賽,不再僅是晶片效能的比拼,更是生態(tài)系的全面戰(zhàn)爭。NVIDIA以CUDA鎖定開發(fā)者心智,Google透過雲(yún)端垂直整合降低總體運(yùn)算成本,AMD則以異構(gòu)架構(gòu)與性價比撬動市場。


然而,OpenAI晶片自研計(jì)畫、Meta的開源計(jì)算技術(shù),以及RISC-V的潛在顛覆,都預(yù)示這場戰(zhàn)爭沒有絕對的贏家。在AI時代,誰能在每瓦電力中萃取出最多智慧,誰就將成為新世代科技霸權(quán)的締造者。


相關(guān)文章
? 揭開CPO與光互連的產(chǎn)業(yè)轉(zhuǎn)折
? 運(yùn)用AI提升BFSI產(chǎn)業(yè)經(jīng)營優(yōu)勢的關(guān)鍵策略
? 當(dāng)生成式AI遇上機(jī)器視覺
? 生成式AI 整合機(jī)器視覺檢測的崛起
? 形塑AOI產(chǎn)業(yè)創(chuàng)新生態(tài)
相關(guān)討論
  相關(guān)新聞
» 達(dá)梭系統(tǒng)2025技術(shù)年會 用模擬技術(shù)驅(qū)動AI創(chuàng)新研發(fā)
» 趨勢科技於AWS re:Invent發(fā)表首套「AI集中曝險管理方案」
» TeamT5雙平臺奪下精品獎 國際化創(chuàng)新能力再獲肯定
» 資策會×衛(wèi)福部啟動綠色醫(yī)療國際對話 加速邁向永續(xù)與淨(jìng)零
» HPE攜手合作夥伴成立量子擴(kuò)展聯(lián)盟 加速量子技術(shù)主流化

?
刊登廣告 新聞信箱 讀者信箱 著作權(quán)聲明 隱私權(quán)聲明 本站介紹

Copyright ©1999-2025 遠(yuǎn)播資訊股份有限公司版權(quán)所有 Powered by O3  v3.20.2048.103.85.191.138
地址:臺北數(shù)位產(chǎn)業(yè)園區(qū)(digiBlock Taipei) 103臺北市大同區(qū)承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉(zhuǎn)接至總機(jī) /  E-Mail: webmaster@ctimes.com.tw
国产porny蝌蚪视频| 亚洲国产成人一区二区三区| 欧美理论电影在线观看| 欧美色图亚洲激情| caoporn视频在线观看| 色国产综合视频| 日韩免费高清一区二区| 日韩av影片| 精品无人区太爽高潮在线播放| 美女网站视频色| 只有精品亚洲| 欧美精品福利视频| 亚洲精品aaaa| 久久亚洲精品小早川怜子| 国产自偷自偷免费一区| 久cao在线| 精品国偷自产国产一区| 久久视频免费在线观看| 国产精品欧美三级在线观看| 欧洲亚洲免费视频| www五月婷婷| 日韩天天综合| 亚洲一区二区三区精品在线观看| 蜜桃传媒在线| 欧美精品一区二区三| 99国产揄拍国产精品| 日韩精品亚洲一区| 亚洲日本精品国产第一区| 翔田千里一区| 亚洲国产精品久久久久秋霞不卡| 国产婷婷在线视频| 久久久久久97三级| 五级黄高潮片90分钟视频| 狠狠综合久久av一区二区蜜桃| 久久大香伊蕉在人线观看热2| 国外av在线| 中文日韩在线观看| 国产大学生自拍视频| 亚洲成人中文在线| 麻豆成人在线视频| 精久久久久久久久久久| 中文字幕丰满乱码| 日韩精品成人| 亚洲第一精品区| 亚洲精品中文字幕| 99理论电影网| 亚洲av无码乱码在线观看性色| 成人动漫av在线| 久久免费小视频| 国产99一区视频免费| 一级黄色录像视频| 成人av先锋影音| 毛片a片免费观看| 久久综合色播五月| 国产精品成人久久久| 亚洲特黄一级片| 国产女18毛片多18精品| 色婷婷亚洲婷婷| 欧美四级剧情无删版影片| 日韩精品一区二区三区四区视频| 国产精品入口麻豆免费| 欧美xingq一区二区| 2020中文字幕在线| 欧美另类极品videosbest最新版本| 樱桃视频免费看| 国产九色91| 亚洲激情自拍| 99精品在线视频观看| 神马久久久久久| 国产精品原创视频| 爱爱免费小视频| 欧美综合亚洲图片综合区| 一本大道香蕉久在线播放29| 先锋影音一区二区三区| 视频一区视频二区中文| 亚洲爱爱综合网| 欧美黑人巨大xxx极品| 精品视频在线观看免费观看| jizz欧美性20| 欧美日韩在线精品一区二区三区激情 | 蜜臀国产一区二区三区在线播放| 91精品国产乱码在线观看| 亚洲午夜视频在线观看| 国产成人亚洲精品播放器下载| 久久视频这里只有精品| 污视频网站在线免费| 国内精品国产三级国产99| 99riav国产精品| 91极品身材尤物theporn| 日韩欧美不卡在线观看视频| 婷婷成人激情| 一区二区三区入口| 国产精品区一区二区三区| 美女被c网站| 成人动漫在线观看视频| 色婷婷色综合| 欧美一区二区三区久久久| 日韩精品在线视频| 激情黄产视频在线免费观看| 成人三级视频在线播放| 亚洲国产精品传媒在线观看| 春意影院普通入口| 国产三区二区一区久久| 玖玖精品视频| 91香蕉视频在线观看| 国产综合第一页| 久久久噜噜噜久久狠狠50岁| 黄色aaa毛片| 国产91色在线|免| 成人系列视频| 懂色av蜜臀av粉嫩av分享吧| 久热精品视频在线观看一区| 视频在线一区| 免费视频久久久| 色综合久久88| 日韩成人av在线资源| 69夜色精品国产69乱| 亚洲精品福利在线观看| 露出调教综合另类| 特级西西444www高清大视频| 欧美日韩成人精品| 91亚洲成人| 久在线观看福利视频| 国产一区二区三区av在线| 国模一区二区三区白浆| 色偷偷777| 欧美黄色免费影院| 色综合久久66| 日本免费精品| av资源免费看| 国产麻豆日韩| 国产网红主播福利一区二区| 久热视线观看免费视频| 亚洲精品在线免费| 亚洲丝袜av一区| 久久99国产精品久久99大师| 欧美熟女一区二区| 欧美日韩一区二区三区在线视频 | 给我免费播放日韩视频| 色噜噜一区二区三区| 亚洲乱码国产乱码精品天美传媒| 91福利资源站| 91久久电影| a视频免费看| 精品在线观看一区| 91亚洲永久免费精品| 国产亚洲精品超碰| 久久免费视频66| 色婷五月综激情亚洲综合| 91激情视频在线观看| 91色p视频在线| 伊人开心综合网| 久久一区91| 深夜福利视频一区| 亚洲天堂视频在线播放| 黄色网址在线免费看| 久青草国产97香蕉在线视频| 91免费精品国自产拍在线不卡| 91福利精品在线观看| 激情欧美成人久久综合小说| 公肉吊粗大爽色翁浪妇视频| 国产综合18久久久久久| 91精品麻豆日日躁夜夜躁| 日本特黄久久久高潮| 大胆国模一区二区三区| 天天操天天艹| 亚洲无码久久久久| 国产成人av免费观看| 国产一区不卡在线观看| 日韩午夜av电影| 国产精品综合视频| 免费观看亚洲视频大全| 天天操天天干天天| 国产亚洲精品女人久久久久久| 中文字幕欧美日韩一区二区| 国产丝袜精品视频| 乱一区二区av| √新版天堂资源在线资源| 一级黄色在线视频| 欧美日韩一区二区三区69堂| 91精品国产高清久久久久久| 在线免费观看日韩欧美| 国产在线日韩精品| 精品国内亚洲2022精品成人| 日本午夜免费福利视频| 最新亚洲精品国自产在线观看| 国产精品久久久视频| 国产精品久久国产三级国电话系列| 久久精品国产免费| 国产一区二区三区不卡视频网站| 直接在线观看的三级网址| 亚洲av无码乱码国产麻豆| 91亚洲精品久久久蜜桃借种| 国产精品狠色婷| 国产精品剧情在线亚洲| 欧美一级播放| 天天天综合网| 九九亚洲精品| 欧美成熟毛茸茸| 91极品女神私人尤物在线播放|