close

                                                                                   大模型應用瘋狂加速,洗牌卻在靜悄悄進行了

 

隨著未來不斷有新的企業通過備案,“大模型+”的應用拐點正在到來。

在被譽為“科技企業行銷聖經”的《跨越鴻溝》一書中,傑佛瑞·摩爾寫道:“高科技產品面世過程中,最危險、最關鍵的一點,就是由少數有遠見者所主宰的早期市場,向實用主義者占支配地位的主流市場過渡。”此刻,狂飆突進已半年有餘的國內生成式人工智慧(AIGC)市場,正面臨著這個關鍵的過渡。

截至8月底,首批8AI大模型企業通過備案。與上半年“甚囂塵上”的行業境況不同,具備實力且具備滿腔“產業抱負”的實力型玩家,總是姍姍來遲,但卻總是能夠一鳴驚人,為產業的大規模應用創造機會。目前來看,隨著未來不斷有新的企業通過備案,“大模型+”的應用拐點正在到來。

01 “大模型+”應用拐點加速到來

8月份剛剛過去,9月初百度就迫不及待地對外公佈了文心一言大模型開源。與此同時,“姍姍來遲”的騰訊混元大模型,一亮相便“秀”起了“肌肉”,科大訊飛與華為合作發佈“星火一體機”,進一步把大模型端側應用擺在了檯面上。一波接一波的行業浪潮席捲而來,正推動整個“大模型+”應用時代加速到來。

首先,大模型從C端應用逐漸轉向B端應用領域,以“實用”為導向的大模型日漸成為行業趨勢。自從去年12ChatGPT,在短短一個月之內實現月活破億之後,圍繞整個C端市場的AI大模型玩家如百度等,就開始大規模地湧入該領域,一時之間C端大模型應用迎來了外界的一致關注。但進入下半年以後,市面上越來越多的“面向B端”的應用開始出現,更加“實用”的行業大模型也在成群結隊地出現,大大加速了生成式AI產業化的進程。比如,京東發佈了言犀大模型、京醫千詢大模型,攜程發佈了攜程問道大模型,網易有道發佈了基於教育的子曰大模型,用友發佈了用友GPT大模型等等。

相比通用大模型廠商而言,垂直大模型廠商在相關行業深耕已久,因而在尋找產業機會方面往往走得更加深入。以網易有道、京東兩家為例,網易有道在教育領域深耕已久,它在長期深耕行業的過程中,不僅積累了龐大的使用者和教育行業資料,還積累了相對應的高品質資料,這使其在做教育大模型過程中,擁有更多比較優勢。無獨有偶,京東在零售、大健康領域廣有佈局,這使其在構建產業大模型和京醫大模型方面,擁有堅實根基;而攜程則在文旅行業深耕已久,積累了廣泛的文旅產業鏈資料和資源。

顯然,相比通用大模型廠商而言,圍繞垂直領域的行業大模型,不僅可以依靠專業資料讓大模型更加“實用”,還可以在特定領域發揮獨特作用,幫助行業儘快完成數位化轉型。

其次,具備通用能力的大型雲服務企業,正在加速與各路行業大模型企業展開合作,新的大模型生產機制正在成型。目前業內包括百度、騰訊、阿裡、華為等主要雲廠商,都紛紛依託自身的技術優勢、團隊優勢和資金支援,在通用大模型領域實現搶跑。除此之外,各主要廠商還聯合行業頭部企業,推出行業大模型解決方案。

比如,騰訊雲聯合行業頭部企業,已為文旅、政務、金融等10餘個行業,提供了50多個大模型行業解決方案。華為旗下盤古大模型,更是可以提供5個基礎大模型+N個行業大模型+X個場景模型的三層解耦架構,目前已經應用到了鐵路、礦山、能源、氣象、政務等諸多領域。阿裡雲更是對外開放了“通義千問”的全部能力,説明企業結合自身的行業知識和應用場景,訓練自己的企業大模型;加上目前已經開源的文心一言,由大的雲平臺提供包括雲服務、算力、通用大模型工具支援等基礎設施,各行業頭部企業提供專業經驗和資料訓練的大模型生產機制已經基本成型。

02 志在必得的騰訊

對於大模型的發展,騰訊高層顯然很早之前就已經定下了調子,但其推出的時間卻在一眾巨頭中最晚。在上半年如火如荼的大模型混戰中,騰訊的大模型在業內一直是“只聞其聲、不見其名”的存在。但從9月其正式面世之後的外界反應來看,此前“默默無聞”的騰訊大模型,更多是在“厚積薄發”。

97日騰訊正式對外發佈了騰訊混元大模型,據瞭解該模型擁有超千億參數規模,預訓練語料超過2萬億Tokens,並已接入騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔等50多個騰訊業務。而且在國家公佈的首批大模型廠商中,騰訊混元大模型赫然在列。同時,騰訊混元大模型還宣佈對外開放,千行百業的人都可以通過API調用混元,或者將其作為產業底座,為不同產業場景構建大模型應用,不難看出騰訊對大模型的“志在必得”。

首先,騰訊構建了“更強”的“探真”技術方法,這使其具備更強的資訊可信度,極大增強了大模型自身的實用性。基於全網的資料檢索和生成,是大模型的核心能力之一。值得一提的是,無論是基於GPT-3.5還是國內其他大模型,源於錯誤資訊帶來的錯誤答案,依然不可避免。但騰訊混元大模型卻基於自身的技術能力,保證正確答案的輸出。

與業界消除“幻覺”的通用做法不同,混元大模型並沒有為大模型增加搜索或者知識圖譜等外掛,而是從源頭上解決問題。具體來說,混元大模型從第一行代碼開始,就採用了預訓練階段優化目標函數的“探真”技術方法。據業內專業人士介紹,該方法與常見的開源大模型相比,能有效降低幻覺30%50%

除了“探真”能力優秀之外,騰訊混元的另一大超強能力在於其支援超長文本輸出。儘管目前多模態正在成為主流大模型演進方向,但在文本輸出方面,包括GPT-3.5GPT-4在內的大模型,都很難支援1000字以上的文本輸出,但騰訊混元通過位置編碼優化提高了超長文的處理效果和性能,已經具備輸出4000多字的完整答案的能力。

其次,騰訊構建了從軟到硬的全流程基礎設施,這讓騰訊具備了更強的“全域優化”能力。從自研的星星海伺服器,到新一代HCC高性能計算集群,再到自研的星脈高速網路,騰訊已經為自己打造了一整套面向AIGC的高性能智算網路。據騰訊內部負責人介紹,目前騰訊雲已經可支援超過10萬張卡平行計算的大規模訓練集群,萬億參數大模型可以在四天之內完成。

目前,騰訊雲已經建立起了圍繞大模型的全套能力,包括高性能算力集群、雲原生資料湖倉和向量資料庫等資料處理引擎,以及模型安全、支援模型訓練和精調的工具鏈等,企業和開發者都可以根據自己的需求,靈活選擇產品,降低大模型的訓練成本。

03 不甘落後的科大訊飛

除了騰訊大模型之外,在大模型上已經先行一步的科大訊飛也是不甘落後,不僅積極參與通用大模型的建設,還持續發力行業大模型的建設。目前科大訊飛的大模型已經具備7大能力,分別為:文本生成、語言理解、知識問答、邏輯推理、數學和多模態能力,並且這種能力還在不斷提升。而基於大模型開發所需的巨大投入量,科大訊飛也做了多方面的準備。

一方面,科大訊飛積極展開與業內巨頭的合作,強化星火大模型的技術實力。早在今年8月中旬,科大訊飛就與華為共同發佈星火一體機,讓所有企業都可以在國產自主創新平臺上私有化部署大模型。一來,星火一體機基於星火認知大模型,針對汙語料和幻覺問題,形成了“立體化”的內容安全機制。二來,星火一體機基於昇騰AI硬體、昇思AI開源框架,提供業界領先的大模型訓練、推理能力,為大模型全流程創新提供堅實的自主創新算力底座。

具體來說,訊飛星火認知大模型基於訓練推理一體化設計,實現大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業落地應用和反覆運算;與此同時,以昇騰AI為核心,軟硬體協同優化,構建算力集中、協同優化、供給穩定、資料安全的大模型訓練集群,這些都可以強化星火大模型的自身實力。

另一方面,科大訊飛積極推動與自身業務場景的整合,加速大模型的場景落地。除了不斷強化自己核心能力之外,科大訊飛還結合自身的業務場景,推動大模型在辦公、政務、電力、教育、醫療、工業、司法、金融等行業的場景落地。星火一體機內已涵蓋辦公、代碼、運維、客服、行銷、採購等10多個場景包,支援對話開發、任務編排、外掛程式執行、知識接入、提示工程等5種定制優化模式,並將持續拓展更多專業場景和模式優化,為客戶快速定制企業專屬大模型。

總的來看,科大訊飛在大模型上,外部合作和內部場景落地相結合的方式,很好地保證了其大模型產業化的加速落地。

04 大模型大洗牌正在加速到來

在眾多頭部巨頭和行業巨頭的共同努力之下,“百模大戰”甚至“千模大戰”的局面正在加速形成。而在這種的形勢之下,圍繞大模型的“行業大洗牌”或將提前到來。

首先,產品能力的比拼已經初見分曉。據知名廠商IDC依據演算法模型、通用能力、創新能力、平臺能力和安全可解釋等五方面的要求,評估出了目前市面上在大模型方面綜合評分最高的三家廠商,分別是百度、阿裡巴巴、科大訊飛。不過由於這個資料排出的時間較早,未考慮到騰訊和華為的產品能力,所謂真實的綜合技術實力方面,排名靠前的依舊會是BATH這些行業巨頭。

但各家的能力並不相同,也各有側重。具體來說,百度的能力在於其具有“晶片—框架—模型—應用”四層技術棧完整佈局的獨特優勢:晶片層—昆侖芯、框架層—飛漿、模型層—文心大模型,以及各種AI的落地應用。阿裡的能力也相近,其強大之處在於圍繞雲搭建起了一整個的大模型基礎設施;華為的能力在於強大的基礎技術能力,以及廣泛的終端生態應用和B端應用能力。在BATH之外,其他大模型廠商依然排在第二梯隊、第三梯隊,產品層面的分化已經出現。

其次,是大模型生態服務能力的比拼已然拉開序幕。以阿裡為例,阿裡不僅推出了通義千問大模型,還推出了魔搭大模型社區,還有眾多的生態合作夥伴;百度在這方面也不遑多讓,不僅有基於大模型的技術能力,還有廣泛的生態夥伴,推理能力和速度伴隨著大模型的版本更新,也在日新月異;作為同級別大廠,華為、騰訊等廠商自然也具備類似能力。不難預見,未來各路廠商圍繞預訓練、邏輯推理等相關方面的技術服務,將成為行業競爭的常態。

當然,無論是產品維度還是服務能力,最終都要落地到產業實踐上。從行業覆蓋來看,從文心大模型出發,百度已經在能源、汽車、政務、交通、金融等重點領域佈局11個行業大模型,將大模型融入到垂直領域,真正做到產業實踐和商業落地。阿裡、騰訊、華為等也覆蓋電商零售、物流、社交、礦業等諸多行業,產業化落地也在快速提升。

而隨著各大平臺的大模型,在產品、生態服務和產業實踐上的全面展開,大模型的大洗牌正在加速到來。

 

arrow
arrow
    全站熱搜

    微社群馬丁 發表在 痞客邦 留言(0) 人氣()