大模型后訓練時代,九章云極DataCanvas公司打造普惠算力服務新范式
9月12日,由工業(yè)和信息化新聞宣傳中心承辦的“算力服務高質(zhì)量發(fā)展論壇”在2024中國國際服務貿(mào)易交易會期間召開,九章云極DataCanvas公司AI首席科學家繆旭受邀出席論壇,并發(fā)表“大模型后訓練時代的算力服務思考”主旨演講。
本次論壇以“以算凝力,融創(chuàng)未來”為主題,匯聚來自政、產(chǎn)、學、研界多位重量嘉賓,剖析算力產(chǎn)業(yè)最發(fā)展新趨勢,分享算力基礎設施建設實踐經(jīng)驗,共同探討算力服務高質(zhì)量發(fā)展之道。
論壇上,繆旭先生在演講中表示,隨著基礎模型面臨的挑戰(zhàn)不斷升級與復雜化,大模型后訓練模式正在崛起,成為應對上述挑戰(zhàn)的關(guān)鍵路徑。然而后訓練模式的復雜性與高度定制化需求,對算力資源的精準調(diào)度、靈活配置和高效利用提出了前所未有的高標準挑戰(zhàn),企業(yè)亟需高質(zhì)量、高效能、更經(jīng)濟、更好用的算力服務新范式。
九章云極DataCanvas公司AI首席科學家繆旭發(fā)表演講
更自動、更高效、更精準,大模型后訓練模式崛起
繆旭指出,當前基礎模型發(fā)展迅猛,擁有廣泛的行業(yè)應用潛力,但也面臨著提示詞工程復雜度高、難以規(guī)避的幻覺問題、規(guī)劃能力不足以及高昂的成本負擔等核心挑戰(zhàn)??娦癖硎荆ㄟ^大模型后訓練策略的補足,可以有效應對上述瓶頸。
大模型后訓練的核心策略為,在大模型基礎訓練完成后,通過使用新的數(shù)據(jù)集或任務對模型進行再次訓練,以提高模型的適應性和性能。這個過程通常包含提示詞設計、模型微調(diào)、embedding優(yōu)化及調(diào)度優(yōu)化等多個環(huán)節(jié)。
具體而言,大模型后訓練的過程如下:將復雜的業(yè)務邏輯梳理并封裝成獨立的、可管理的任務模塊;隨后針對每個單一任務模塊實施精準的后訓練微調(diào),以增強其針對特定任務的適應性和性能。在完成模塊集成重組后,結(jié)合業(yè)務系統(tǒng)及用戶的互動反饋,持續(xù)進行自我學習和自我增強,最終實現(xiàn)模型性能自動、高效的持續(xù)提升。
大模型后訓練方法的補足
新標準、新需求、新模式,普惠算力開啟AI新時代
在大模型后訓練的過程中,算力調(diào)度尤為關(guān)鍵,包括訓練期的數(shù)據(jù)準備調(diào)度、微調(diào)任務編排,以及推理階段的動態(tài)加載和異構(gòu)算力管理。通過在調(diào)度過程中引入可訓練的調(diào)度模型,在優(yōu)化目標時增加效率和成本計算,結(jié)合線上、線下收集的數(shù)據(jù)持續(xù)優(yōu)化調(diào)度模型,可以從軟件層面有效提升算力調(diào)度能力,并降低計算成本,使算力應用更加貼近實際應用場景。
不同任務工作流的安排調(diào)度
在數(shù)據(jù)存儲與處理的關(guān)鍵環(huán)節(jié),大模型后訓練模式對系統(tǒng)的安全性提出了更高要求,以確保算力資源能夠無縫且安全地融入各類業(yè)務系統(tǒng)。依托業(yè)務系統(tǒng)與互聯(lián)網(wǎng)的海量數(shù)據(jù)資源,以任務為驅(qū)動,大模型可以智能識別任務需求,自動收集并處理所需數(shù)據(jù),生成高質(zhì)量的微調(diào)數(shù)據(jù)集。此外,應用存算一體架以構(gòu)可以有效降低數(shù)據(jù)傳輸?shù)膸捪?,提升?shù)據(jù)處理的整體效率與安全性。
面對不同行業(yè)、不同場景的多樣化大模型后訓練需求,基于Alaya NeW高效的算力管理內(nèi)核,九章云極DataCanvas公司提出國際首創(chuàng)的算力服務新范式,憑借統(tǒng)一性能基準、資源管理優(yōu)化、方便估算成本收益、算力一體化等優(yōu)勢,提出了統(tǒng)一的算力服務計量單位“度”(DCU),并用其實現(xiàn)標準化的算力計量計費,讓算力消費者輕松獲得好用、經(jīng)濟、普惠的算力服務,實現(xiàn)算力資源0浪費。此外,通過提供完整的大模型+Agent開發(fā)工具鏈,Alaya NeW為各行業(yè)用戶提供靈活的大模型和AI Agent定制能力,加速人工智能技術(shù)在各領域的深度融合與廣泛應用。
作為國內(nèi)領先的人工智能基礎設施提供商,九章云極DataCanvas公司將繼續(xù)堅持AI技術(shù)的自主創(chuàng)新,以領先的AI智算產(chǎn)品推動算力服務向更高質(zhì)量、更高水平邁進,深度賦能千行百業(yè)的數(shù)智化轉(zhuǎn)型。