摘要:當(dāng)前,“ChatGPT”“文心一言”“盤古Chat”等大模型的爆火推動(dòng)了新一輪人工智能技術(shù)發(fā)展熱潮,AI大模型相關(guān)研究、產(chǎn)品不斷涌現(xiàn),中國(guó)大模型產(chǎn)業(yè)規(guī)??焖僭鲩L(zhǎng)。據(jù)統(tǒng)計(jì),中國(guó)AI大模型行業(yè)市場(chǎng)規(guī)模從2020年的15億元增長(zhǎng)至2022年的70億元,年均復(fù)合增長(zhǎng)率達(dá)116.02%,2023年市場(chǎng)規(guī)模為147億元。預(yù)計(jì)2024年中國(guó)AI大模型行業(yè)市場(chǎng)規(guī)模將達(dá)216億元,行業(yè)發(fā)展前景廣闊。
一、定義及分類
大模型是大規(guī)模語(yǔ)言模型(Large Language Model)的簡(jiǎn)稱,是指模型具有龐大的參數(shù)規(guī)模和復(fù)雜程度的機(jī)器學(xué)習(xí)模型。這些模型通常在訓(xùn)練過(guò)程中需要大量的數(shù)據(jù)和計(jì)算能力,并且具有數(shù)百萬(wàn)到數(shù)十億個(gè)參數(shù)。大模型的設(shè)計(jì)目的是為了提高模型的表示能力和性能,在處理復(fù)雜任務(wù)時(shí)能夠更好地捕捉數(shù)據(jù)中的模式和規(guī)律。根據(jù)其應(yīng)用場(chǎng)景和功能,大模型可分為自然語(yǔ)言處理大模型、計(jì)算機(jī)視覺(jué)大模型、語(yǔ)音識(shí)別大模型、推薦系統(tǒng)大模型、強(qiáng)化學(xué)習(xí)大模型、生成對(duì)抗網(wǎng)絡(luò)大模型、對(duì)話系統(tǒng)大模型等。
二、行業(yè)政策
1、主管部門和監(jiān)管體制
大模型行業(yè)主管部門主要是指工業(yè)和信息化部,其主要負(fù)責(zé)擬訂實(shí)施行業(yè)規(guī)劃、產(chǎn)業(yè)政策和標(biāo)準(zhǔn);監(jiān)測(cè)工業(yè)行業(yè)日常運(yùn)行;推動(dòng)重大技術(shù)裝備發(fā)展和自主創(chuàng)新;管理通信業(yè);指導(dǎo)推進(jìn)信息化建設(shè);協(xié)調(diào)維護(hù)國(guó)家信息安全等。
中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟是行業(yè)的自律性組織,其宗旨是將認(rèn)真貫徹落實(shí)黨中央、國(guó)務(wù)院有關(guān)決策部署,以國(guó)家產(chǎn)業(yè)政策為導(dǎo)向,以市場(chǎng)為驅(qū)動(dòng),以企業(yè)為主體,搭建產(chǎn)學(xué)研用合作平臺(tái),促進(jìn)聯(lián)盟成員的研發(fā)、設(shè)計(jì)、生產(chǎn)、集成、服務(wù)等水平,構(gòu)建我國(guó)人工智能產(chǎn)業(yè)生態(tài),提升我國(guó)人工智能產(chǎn)業(yè)的競(jìng)爭(zhēng)力,強(qiáng)化人工智能與經(jīng)濟(jì)社會(huì)各領(lǐng)域深度融合,促進(jìn)技術(shù)進(jìn)步、提高生產(chǎn)效率,推動(dòng)傳統(tǒng)行業(yè)數(shù)字化轉(zhuǎn)型,支持新技術(shù)、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式加快發(fā)展。
2、行業(yè)相關(guān)政策
近年來(lái),大模型已逐漸得到國(guó)家政府的高度重視,出臺(tái)了一系列政策和措施來(lái)推動(dòng)行業(yè)發(fā)展。如2023年7月發(fā)布的《人工智能氣象應(yīng)用工作方案(2023—2030年)》中,提出啟動(dòng)氣象預(yù)報(bào)大模型等新興技術(shù)研發(fā),開(kāi)展人工智能新興技術(shù)與監(jiān)測(cè)預(yù)警、預(yù)報(bào)預(yù)測(cè)、數(shù)值預(yù)報(bào)和專業(yè)服務(wù)“四大領(lǐng)域”融合。2023年11月發(fā)布的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》中,提出建設(shè)大模型訓(xùn)練數(shù)據(jù)庫(kù),創(chuàng)新數(shù)據(jù)自動(dòng)化標(biāo)注、清洗、使用等方法,擴(kuò)充高質(zhì)量的多模態(tài)數(shù)據(jù)??茖W(xué)布局人形機(jī)器人算力,加速大模型訓(xùn)練迭代和產(chǎn)品應(yīng)用。隨著這些政策的順利實(shí)施,我國(guó)大模型產(chǎn)業(yè)將得到快速發(fā)展。
三、發(fā)展歷程
隨著人工智能的快速發(fā)展,大模型成為當(dāng)前研究的熱點(diǎn)之一。國(guó)內(nèi)在大模型的發(fā)展上也取得了顯著的進(jìn)展。從發(fā)展歷程來(lái)看,我國(guó)大模型主要分為三個(gè)階段:起步階段、應(yīng)用拓展階段、產(chǎn)業(yè)化階段。2001年,中國(guó)科學(xué)院計(jì)算技術(shù)研究所成立了機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘?qū)嶒?yàn)室,開(kāi)始了對(duì)大模型的研究工作。2011年,百度推出基于大數(shù)據(jù)和大模型的搜索算法“海量深度學(xué)習(xí)技術(shù)”,取得了重大突破。此后,國(guó)內(nèi)的互聯(lián)網(wǎng)公司紛紛加大在大模型領(lǐng)域的研發(fā)投入,推動(dòng)了大模型的應(yīng)用拓展。2016年阿里巴巴成立“達(dá)摩院”,并在大模型研究方面取得了一系列的突破。同年,騰訊成立了“騰訊研究院”,推動(dòng)了大模型在智能推薦、自然語(yǔ)言處理等領(lǐng)域的應(yīng)用。2019年國(guó)內(nèi)的大模型研究取得了重大突破,其中最為重要的是在自然語(yǔ)言處理領(lǐng)域。2020年國(guó)內(nèi)的大模型開(kāi)始向其他領(lǐng)域拓展,如計(jì)算機(jī)視覺(jué)、語(yǔ)言識(shí)別等。
四、行業(yè)壁壘
1、技術(shù)壁壘
技術(shù)壁壘是大模型行業(yè)面臨的主要挑戰(zhàn)之一。大模型技術(shù)的研發(fā)需要大量的專業(yè)知識(shí)和技術(shù)積累,包括深度學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等多個(gè)領(lǐng)域。這使得一些技術(shù)實(shí)力較弱的企業(yè)難以進(jìn)入該領(lǐng)域或難以在競(jìng)爭(zhēng)中取得優(yōu)勢(shì)。同時(shí),大模型技術(shù)的更新?lián)Q代速度非???,企業(yè)需要不斷投入研發(fā)資源進(jìn)行技術(shù)創(chuàng)新,否則很容易被市場(chǎng)淘汰。
2、資金壁壘
大模型的研發(fā)需要投入大量的資金用于算法研究、模型訓(xùn)練、數(shù)據(jù)收集和處理等方面。如在模型訓(xùn)練方面,行業(yè)內(nèi)企業(yè)通常需要高性能的計(jì)算機(jī)和大量的計(jì)算資源,這意味著企業(yè)需要投入大量的資金購(gòu)買和維護(hù)這些設(shè)備。對(duì)于一些規(guī)模較小的企業(yè)來(lái)說(shuō),這是一筆不小的開(kāi)支,難以承受。因此,大模型行業(yè)的資金壁壘較高,新進(jìn)入者需要充分考慮自身的資金實(shí)力和融資能力。
3、人才壁壘
大模型行業(yè)是一個(gè)多學(xué)科交叉的領(lǐng)域,涵蓋了深度學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等多個(gè)專業(yè)領(lǐng)域。這意味著從業(yè)人員不僅需要具備扎實(shí)的專業(yè)知識(shí),還需要具備跨學(xué)科的視野和綜合能力。然而,目前這種復(fù)合型的人才需求使得該領(lǐng)域的人才供給相對(duì)緊張,導(dǎo)致企業(yè)難以招聘到合適的人才。對(duì)于新進(jìn)入者來(lái)說(shuō),大模型行業(yè)具有較高的人才壁壘。
五、產(chǎn)業(yè)鏈
1、行業(yè)產(chǎn)業(yè)鏈分析
從大模型行業(yè)產(chǎn)業(yè)鏈來(lái)看,上游主要包括硬件和軟件,硬件又包括芯片、服務(wù)器、通信網(wǎng)絡(luò)等;軟件又包括云計(jì)算、數(shù)據(jù)庫(kù)、中間件等。中游是指大模型行業(yè);下游是指大模型的應(yīng)用領(lǐng)域,包括游戲、辦公、傳媒影視、醫(yī)療、金融、電商、工業(yè)等,這些領(lǐng)域的多樣化需求將推動(dòng)大模型不斷進(jìn)行技術(shù)創(chuàng)新和優(yōu)化,提升模型的準(zhǔn)確性和效率。
2、行業(yè)領(lǐng)先企業(yè)分析
(1)深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司
深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司于1998年成立,并于2004年在港交所成功上市。經(jīng)過(guò)20年的發(fā)展,騰訊由一家聊天軟件開(kāi)發(fā)商逐步成長(zhǎng)為全球最大的互聯(lián)網(wǎng)企業(yè)之一。通過(guò)廣告、游戲、社交、支付等多個(gè)業(yè)務(wù)板塊相互交織,形成了一個(gè)龐大的產(chǎn)品和服務(wù)生態(tài)系統(tǒng),公司規(guī)模及企業(yè)影響力持續(xù)擴(kuò)大。近年來(lái),隨著新一代信息技術(shù)的崛起,騰訊持續(xù)加大在人工智能、物聯(lián)網(wǎng)、云計(jì)算投資布局及技術(shù)研發(fā),已取得較大成果。公司擁有超10億用戶的連接能力,旗下多個(gè)版塊業(yè)務(wù)發(fā)展至今已積累了大量的數(shù)據(jù)和技術(shù)經(jīng)驗(yàn),使其在發(fā)展大模型方面具有天然優(yōu)勢(shì)。騰訊正圍繞大模型產(chǎn)業(yè)鏈核心節(jié)點(diǎn)展開(kāi)技術(shù)布局,夯實(shí)算法、算力和數(shù)據(jù)“底座”,并于2023年9月正式發(fā)布混元大模型,參數(shù)規(guī)模超千億,已在多個(gè)內(nèi)部產(chǎn)品測(cè)試。從企業(yè)經(jīng)營(yíng)業(yè)績(jī)來(lái)看,2023年前三季度公司實(shí)現(xiàn)收入4538.2億元,同比增長(zhǎng)11%;歸母凈利潤(rùn)達(dá)到881.91億元,同比增長(zhǎng)7.58%。
(2)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司成立于2000年,是國(guó)內(nèi)領(lǐng)先的AI公司,同時(shí)也是全球?yàn)閿?shù)不多的集AI芯片、軟件構(gòu)架和應(yīng)用程序等全棧AI技術(shù)研發(fā)及生產(chǎn)為一體的公司之一。目前,公司的核心業(yè)務(wù)包括搜索服務(wù)、交易服務(wù)、移動(dòng)生態(tài)、智能云和智能駕駛等。2023年,公司各項(xiàng)業(yè)務(wù)均呈現(xiàn)穩(wěn)中向好的發(fā)展態(tài)勢(shì),其中,AI成為百度的增長(zhǎng)新動(dòng)力,這主要得益于公司在迭代文心大模型與文心一言、重構(gòu)產(chǎn)品和服務(wù)、以及商業(yè)化方面取得重大進(jìn)展。公司全面推進(jìn)旗下產(chǎn)品及服務(wù)的AI原生化重構(gòu),推出百度新搜索、百度新文庫(kù)、文心一言App等AI原生應(yīng)用,以及輕舸、品牌智能體等AI營(yíng)銷工具。從企業(yè)經(jīng)營(yíng)業(yè)績(jī)來(lái)看,2023年公司實(shí)現(xiàn)營(yíng)業(yè)收入1345.98億元,同比上漲8.83%,歸母凈利潤(rùn)達(dá)到203.15億元,同比上漲191.55%。
六、行業(yè)現(xiàn)狀
當(dāng)前,“ChatGPT”“文心一言”“盤古Chat”等大模型的爆火推動(dòng)了新一輪人工智能技術(shù)發(fā)展熱潮,AI大模型相關(guān)研究、產(chǎn)品不斷涌現(xiàn),中國(guó)大模型產(chǎn)業(yè)規(guī)??焖僭鲩L(zhǎng)。據(jù)統(tǒng)計(jì),中國(guó)AI大模型行業(yè)市場(chǎng)規(guī)模從2020年的15億元增長(zhǎng)至2022年的70億元,年均復(fù)合增長(zhǎng)率達(dá)116.02%,2023年市場(chǎng)規(guī)模為147億元。預(yù)計(jì)2024年中國(guó)AI大模型行業(yè)市場(chǎng)規(guī)模將達(dá)216億元,行業(yè)發(fā)展前景廣闊。
七、發(fā)展因素
1、機(jī)遇
(1)國(guó)家政策的大力支持
國(guó)家和地方政府對(duì)于大模型的發(fā)展給予高度重視,制定并出臺(tái)了一系列法律法規(guī)和政策支持。如2023年12月,國(guó)家數(shù)據(jù)局等17部門發(fā)布《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》,其中提出以科學(xué)數(shù)據(jù)支持大模型開(kāi)發(fā),深入挖掘各類科學(xué)數(shù)據(jù)和科技文獻(xiàn),通過(guò)細(xì)粒度知識(shí)抽取和多來(lái)源知識(shí)融合,構(gòu)建科學(xué)知識(shí)資源底座,建設(shè)高質(zhì)量語(yǔ)料庫(kù)和基礎(chǔ)科學(xué)數(shù)據(jù)集,支持開(kāi)展人工智能大模型開(kāi)發(fā)和訓(xùn)練。這將有利于推動(dòng)大模型的開(kāi)發(fā)和應(yīng)用,為人工智能技術(shù)的發(fā)展注入新的活力。
(2)下游應(yīng)用場(chǎng)景廣闊
越來(lái)越多的行業(yè)開(kāi)始意識(shí)到大模型在提高效率、降低成本、創(chuàng)新業(yè)務(wù)模式等方面的潛力,紛紛加大投入,推動(dòng)大模型在各自領(lǐng)域的應(yīng)用。在醫(yī)療領(lǐng)域,大模型可以幫助醫(yī)生更快速地診斷疾病,通過(guò)分析大量的醫(yī)療數(shù)據(jù),提高診斷的準(zhǔn)確性和效率。在金融領(lǐng)域,大模型可以應(yīng)用于風(fēng)險(xiǎn)評(píng)估和欺詐檢測(cè),快速識(shí)別潛在風(fēng)險(xiǎn),提高金融機(jī)構(gòu)的運(yùn)營(yíng)效率。在制造業(yè)中,大模型可以優(yōu)化生產(chǎn)流程,提高生產(chǎn)效率,降低生產(chǎn)成本。大模型的應(yīng)用場(chǎng)景正在不斷拓展。
(3)技術(shù)水平不斷提升
隨著技術(shù)水平的不斷提升,大模型的能力越來(lái)越強(qiáng)大,能夠處理更為復(fù)雜、精細(xì)的任務(wù)。如在算法方面,深度學(xué)習(xí)算法的不斷成熟和演進(jìn)使得大模型的性能和精度得到了顯著提升。研究者們通過(guò)持續(xù)探索和優(yōu)化算法,使得大模型在各個(gè)領(lǐng)域的應(yīng)用效果得到了進(jìn)一步提升。這包括改進(jìn)模型的架構(gòu)、優(yōu)化訓(xùn)練過(guò)程、提升模型的泛化能力等,從而使得大模型能夠更好地適應(yīng)各種復(fù)雜場(chǎng)景和任務(wù)。
2、挑戰(zhàn)
(1)泛化能力和魯棒性不足
大模型雖然具有強(qiáng)大的學(xué)習(xí)能力和特征提取能力,但往往存在過(guò)擬合和泛化能力不足的問(wèn)題。這通常是因?yàn)槟P瓦^(guò)于依賴訓(xùn)練數(shù)據(jù)的特定特征,而未能學(xué)習(xí)到更一般化的規(guī)律。同時(shí),大模型也容易受到一些攻擊和干擾,其性能可能會(huì)受到嚴(yán)重影響。例如,在醫(yī)學(xué)圖像診斷中,模型可能會(huì)因?yàn)閳D像的微小變化或噪聲而產(chǎn)生錯(cuò)誤的診斷結(jié)果。
(2)數(shù)據(jù)質(zhì)量和多樣性問(wèn)題
大模型需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練,但數(shù)據(jù)的質(zhì)量和多樣性往往存在很多問(wèn)題。這不僅會(huì)影響模型的訓(xùn)練效果,也會(huì)增加模型的風(fēng)險(xiǎn)和不可預(yù)測(cè)性。如數(shù)據(jù)不一致問(wèn)題的出現(xiàn)有可能導(dǎo)致模型在訓(xùn)練過(guò)程中學(xué)習(xí)到錯(cuò)誤的模式,從而影響其在真實(shí)場(chǎng)景中的表現(xiàn);數(shù)據(jù)泄露問(wèn)題的出現(xiàn)可能會(huì)對(duì)個(gè)人隱私和企業(yè)安全造成威脅;數(shù)據(jù)偏斜問(wèn)題的出現(xiàn)可能導(dǎo)致模型會(huì)過(guò)于依賴這些偏斜的特征,導(dǎo)致在真實(shí)場(chǎng)景中的性能下降。
(3)技術(shù)更新迭代風(fēng)險(xiǎn)
技術(shù)發(fā)展的快速性意味著新的模型架構(gòu)、算法和訓(xùn)練方法不斷涌現(xiàn)。大模型作為技術(shù)的前沿領(lǐng)域,其相關(guān)的技術(shù)更新?lián)Q代速度尤為迅速。新的技術(shù)可能在性能、效率或適用性方面相較于舊技術(shù)有顯著的提升。如果大模型不能及時(shí)跟進(jìn)最新的技術(shù)更新,其性能可能會(huì)逐漸落后,甚至被新的模型完全取代。此外,隨著技術(shù)的不斷進(jìn)步,舊版本的模型可能逐漸失去與新技術(shù)的兼容性,導(dǎo)致維護(hù)和升級(jí)變得困難。
八、競(jìng)爭(zhēng)格局
隨著人工智能領(lǐng)域的飛速發(fā)展,各大科技公司紛紛布局大模型市場(chǎng),以推動(dòng)科技創(chuàng)新和產(chǎn)業(yè)變革。在這波瀾壯闊的時(shí)代背景下,華為、阿里巴巴、騰訊、百度等中國(guó)科技巨頭競(jìng)相推出了自家的大模型,各自擁有獨(dú)特的特點(diǎn)和重要的合作伙伴??梢?jiàn),我國(guó)在大模型市場(chǎng)的競(jìng)爭(zhēng)格局日益激烈,各家公司都在尋找創(chuàng)新的應(yīng)用場(chǎng)景,并與各個(gè)行業(yè)的龍頭企業(yè)建立合作關(guān)系。
九、發(fā)展趨勢(shì)
大模型產(chǎn)品百花齊放的當(dāng)下,模型實(shí)現(xiàn)了計(jì)算機(jī)能力從“搜索”到“認(rèn)知與學(xué)習(xí)”,再以進(jìn)一步發(fā)展為“行動(dòng)與解決方案”層面。除常見(jiàn)的智能客服、智能推薦、情感分析等應(yīng)用領(lǐng)域以外,大模型逐步于教育、醫(yī)療、金融等垂直領(lǐng)域得到了廣泛應(yīng)用,行業(yè)應(yīng)用場(chǎng)景日趨多樣化。同時(shí),隨著大模型相關(guān)技術(shù)不斷創(chuàng)新,將推動(dòng)大模型實(shí)現(xiàn)模型規(guī)??s小、模型性能提升,進(jìn)一步促進(jìn)大模型發(fā)展。此外,伴隨計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等技術(shù)的不斷發(fā)展,跨模態(tài)大模型也逐漸成為研究熱點(diǎn),未來(lái)相關(guān)企業(yè)將不斷加強(qiáng)投入推動(dòng)跨模態(tài)大模型的發(fā)展。
智研咨詢倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán),對(duì)有明確來(lái)源的內(nèi)容注明出處。如發(fā)現(xiàn)本站文章存在版權(quán)、稿酬或其它問(wèn)題,煩請(qǐng)聯(lián)系我們,我們將及時(shí)與您溝通處理。聯(lián)系方式:gaojian@chyxx.com、010-60343812。
趨勢(shì)研判!2024年中國(guó)大模型行業(yè)產(chǎn)業(yè)鏈、市場(chǎng)規(guī)模、重點(diǎn)企業(yè)及發(fā)展趨勢(shì)分析:大模型技術(shù)不斷進(jìn)步,市場(chǎng)規(guī)模持續(xù)增長(zhǎng)[圖]
大模型是大規(guī)模語(yǔ)言模型(Large Language Model)的簡(jiǎn)稱,是指模型具有龐大的參數(shù)規(guī)模和復(fù)雜程度的機(jī)器學(xué)習(xí)模型。這些模型通常在訓(xùn)練過(guò)程中需要大量的數(shù)據(jù)和計(jì)算能力,并且具有數(shù)百萬(wàn)到數(shù)十億個(gè)參數(shù)。大模型的設(shè)計(jì)目的是為了提高模型的表示能力和性能,在處理復(fù)雜任務(wù)時(shí)能夠更好地捕捉數(shù)據(jù)中的模式和規(guī)律。根據(jù)其應(yīng)用場(chǎng)景和功能,大模型可分為自然語(yǔ)言處理大模型、計(jì)算機(jī)視覺(jué)大模型、語(yǔ)音識(shí)別大模型、推薦系統(tǒng)大模型、強(qiáng)化學(xué)習(xí)大模型、生成對(duì)抗網(wǎng)絡(luò)大模型、對(duì)話系統(tǒng)大模型等。