大語(yǔ)言模型發(fā)展研究及其在防洪“四預(yù)”平臺(tái)智能交互的應(yīng)用探討
Development of large language models and their application in intelligent interaction on the “four pres” platform
郭磊,馮鈞,直偉,周思源
(1.廣東省水利水電科學(xué)研究院,510635,廣州;2.河口水利技術(shù)國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,510635,廣州;3.廣東省粵港澳大灣區(qū)水安全保障工程技術(shù)研究中心,510635,廣州;4.河海大學(xué),211100,南京)
摘要:大語(yǔ)言模型(LLMs)是近年來(lái)人工智能領(lǐng)域的重大突破,依托Transformer架構(gòu)與自注意力機(jī)制,在超大規(guī)模參數(shù)下涌現(xiàn)出接近人類(lèi)的自然語(yǔ)言理解能力,為人類(lèi)認(rèn)知、思考、判斷和決策提供輔助。當(dāng)前大語(yǔ)言模型在垂直細(xì)分領(lǐng)域的應(yīng)用已成為熱點(diǎn),特別是基于MOE融合架構(gòu)的DeepSeek開(kāi)源發(fā)布,為行業(yè)大模型應(yīng)用提供了更為便捷的技術(shù)路徑,進(jìn)一步推動(dòng)了相關(guān)研究熱潮?!八念A(yù)”是基于數(shù)字孿生水利建設(shè)的新型水利智能業(yè)務(wù)應(yīng)用,具有專(zhuān)業(yè)性強(qiáng)、業(yè)務(wù)鏈條長(zhǎng)、系統(tǒng)架構(gòu)復(fù)雜等特點(diǎn),功能完備,但在易用性方面仍有優(yōu)化空間。基于大語(yǔ)言模型的理解和推理能力分析,首次提出了大模型智能交互L0至L3級(jí)分類(lèi)體系,以意圖識(shí)別和智能調(diào)用為切入點(diǎn),研究其支撐“四預(yù)”平臺(tái)的交互應(yīng)用場(chǎng)景和實(shí)現(xiàn)技術(shù)路徑,提出了通過(guò)優(yōu)化“預(yù)設(shè)內(nèi)容”和疊加具體問(wèn)題增強(qiáng)大模型輸出確定性的方法,并在通用大模型上進(jìn)行測(cè)試,探索大模型智能調(diào)用“四預(yù)”平臺(tái)專(zhuān)業(yè)模型的路徑,為提升防洪“四預(yù)”的交互友好性提供了可行方案,同時(shí)也為大語(yǔ)言模型在水利智能業(yè)務(wù)中的深度應(yīng)用提供參考。
關(guān)鍵詞:大語(yǔ)言模型;ChatGPT;DeepSeek;防洪“四預(yù)”;意圖識(shí)別;模型驅(qū)動(dòng);垂直領(lǐng)域大模型;專(zhuān)業(yè)小模型
作者簡(jiǎn)介:郭磊,黨委副書(shū)記,教授級(jí)高級(jí)工程師,主要研究方向?yàn)橹腔鬯?、水文水資源、水力學(xué)及河流動(dòng)力學(xué)等。
基金項(xiàng)目:廣東省水利科技創(chuàng)新項(xiàng)目“廣東省大中型水庫(kù)汛期水位動(dòng)態(tài)控制與洪水資源安全利用關(guān)鍵技術(shù)研究”。
DOI:10.3969/j.issn.1000-1123.2025.05.003
研究背景
1.總體思路
防洪“四預(yù)”基于數(shù)字孿生水利建設(shè)基礎(chǔ),融合前端感知、數(shù)據(jù)底板、模型平臺(tái)、知識(shí)平臺(tái)等功能模塊,實(shí)現(xiàn)預(yù)報(bào)、預(yù)警、預(yù)演、預(yù)案,為防洪決策提供支撐。其在實(shí)際防洪調(diào)度中仍需完善,一是因平臺(tái)系統(tǒng)交互復(fù)雜、業(yè)務(wù)流程鏈路長(zhǎng)、專(zhuān)業(yè)性強(qiáng)、使用體驗(yàn)不友好,通常需信息技術(shù)和水利專(zhuān)業(yè)人員配合使用,影響了平臺(tái)推廣和擴(kuò)展;二是專(zhuān)家經(jīng)驗(yàn)和歷史場(chǎng)景較難直接融入“四預(yù)”平臺(tái),如模型需由專(zhuān)業(yè)人員根據(jù)實(shí)際條件設(shè)定規(guī)則后才能調(diào)用,要求專(zhuān)業(yè)人員充分理解具體場(chǎng)景并熟練掌握模型特性;三是需要專(zhuān)家對(duì)模型計(jì)算結(jié)果進(jìn)行判斷,提出參數(shù)修改意見(jiàn)等;四是數(shù)據(jù)底板建設(shè)效用尚未全部發(fā)揮,如基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、監(jiān)測(cè)數(shù)據(jù)等工作成果較為扎實(shí),但是構(gòu)架于其上的應(yīng)用功能智慧化不足。綜上,需基于現(xiàn)有“四預(yù)”平臺(tái)框架,優(yōu)化交互方式,耦合專(zhuān)家經(jīng)驗(yàn)和歷史場(chǎng)景,充分挖掘數(shù)據(jù)和模型價(jià)值等,為防洪決策提供更好支撐。
大語(yǔ)言模型具備3個(gè)重要功能:語(yǔ)言理解和表達(dá)、知識(shí)存儲(chǔ)和查詢(xún)、推理。語(yǔ)言理解和表達(dá)使其具備意圖識(shí)別能力,知識(shí)存儲(chǔ)和查詢(xún)使其具備行業(yè)領(lǐng)域?qū)I(yè)技能,推理則使其具備判斷、決策等高階智能。對(duì)防洪“四預(yù)”平臺(tái)而言,語(yǔ)言理解和表達(dá)可輔助交互操作,知識(shí)存儲(chǔ)和查詢(xún)可用于“四預(yù)”平臺(tái)的業(yè)務(wù)鏈條存儲(chǔ)、專(zhuān)家經(jīng)驗(yàn)和歷史場(chǎng)景存儲(chǔ)、知識(shí)圖譜構(gòu)建等,推理則可用于“四預(yù)”平臺(tái)體系輔助決策。
基于大語(yǔ)言模型以上基本能力特征,分析大語(yǔ)言模型應(yīng)用技術(shù)路徑,探索利用大語(yǔ)言模型輔助防洪“四預(yù)”平臺(tái)的交互驅(qū)動(dòng),以意圖識(shí)別和智能調(diào)用為切入點(diǎn),分析大語(yǔ)言模型交互的優(yōu)勢(shì)和不足,為后續(xù)大語(yǔ)言模型在更深層次、更廣范圍實(shí)現(xiàn)對(duì)“四預(yù)”平臺(tái)的輔助使用提供借鑒。
大語(yǔ)言模型發(fā)展及特點(diǎn)
1.大模型的發(fā)展
大語(yǔ)言模型屬于大模型的一種。2022年11月30日ChatGPT的發(fā)布引發(fā)大模型研發(fā)熱潮,經(jīng)過(guò)近2年的技術(shù)進(jìn)化和快速迭代,大模型種類(lèi)、數(shù)量、能力等均呈現(xiàn)暴發(fā)式增長(zhǎng),其推理能力、參數(shù)優(yōu)化、架構(gòu)、多模態(tài)支持等方面都在不斷進(jìn)化,應(yīng)用場(chǎng)景日漸豐富。當(dāng)前,綜合類(lèi)大模型國(guó)外有OpenAI公司OpenAI o1、Gpt-4o,Anthropic公司的Claude,谷歌公司的Gemini,Meta公司的Llama等;國(guó)內(nèi)有文心大模型、Qwen、GLM、云雀、Kimi、豆包、星火等。特別是2025年年初DeepSeek的R1版本發(fā)布,刺激了大模型技術(shù)和性能的快速提升,促使各行各業(yè)加速智能布局和迭代,推動(dòng)大模型的廣泛應(yīng)用。截至2025年1月底,全國(guó)已有302個(gè)生成式人工智能服務(wù)通過(guò)國(guó)家網(wǎng)信辦備案。另外,人工智能也寫(xiě)入政府工作報(bào)告,明確要“深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開(kāi)展‘人工智能+’行動(dòng)”。由此可見(jiàn),無(wú)論是政界、學(xué)界、技術(shù)界還是社會(huì)公眾都極大關(guān)注人工智能特別是大模型發(fā)展。探索大模型在行業(yè)領(lǐng)域的應(yīng)用成為當(dāng)前研究的重點(diǎn)和熱點(diǎn),并預(yù)期對(duì)各行業(yè)規(guī)則和業(yè)態(tài)產(chǎn)生革命性或顛覆性深刻影響。
2.分類(lèi)及能力
就通用大模型而言,其泛化性(訓(xùn)練樣本集之外的表現(xiàn)能力)、專(zhuān)業(yè)性(特定領(lǐng)域問(wèn)題的準(zhǔn)確性和效率)和經(jīng)濟(jì)性(投入產(chǎn)出比)之間存在“不可能三角”,另外靈活性和安全性方面也存在一定不足。為促進(jìn)應(yīng)用落地,在通用大模型基礎(chǔ)上進(jìn)行優(yōu)化和改造,形成適應(yīng)特定場(chǎng)景的垂直領(lǐng)域大模型和專(zhuān)業(yè)小模型是大模型應(yīng)用的路徑之一。通用大模型具有全面知識(shí)能力,重在知識(shí)“廣度”;垂直領(lǐng)域大模型在領(lǐng)域內(nèi)具有更多數(shù)據(jù)和知識(shí)訓(xùn)練,重在知識(shí)“深度”;專(zhuān)業(yè)小模型則更加聚焦行業(yè)領(lǐng)域單項(xiàng)能力或縮小模型規(guī)模,重在應(yīng)用“靈活度”。一般而言,通用大模型作為底座和基礎(chǔ),垂直領(lǐng)域大模型在其上通過(guò)微調(diào)融入行業(yè)知識(shí)、邏輯和專(zhuān)家經(jīng)驗(yàn),具備行業(yè)“廣而深”特點(diǎn),而專(zhuān)業(yè)小模型則是在垂直領(lǐng)域大模型基礎(chǔ)上,通過(guò)微調(diào)、量化和蒸餾等技術(shù),將其轉(zhuǎn)變成小模型,使其具備垂直領(lǐng)域大模型基本能力,但減少模型量以增加應(yīng)用靈活程度。各類(lèi)模型分類(lèi)與關(guān)系如下表和下圖所示。
大模型分類(lèi)及特點(diǎn)
模型關(guān)系
就能力而言,通用大模型屬于“全科醫(yī)生”,覆蓋全領(lǐng)域知識(shí),遵循規(guī)?;▌t(Scaling Law),其通用能力也不斷增強(qiáng)。在翻譯、棋類(lèi)等某些領(lǐng)域,通用大模型甚至超過(guò)了當(dāng)前人類(lèi)的能力水平。垂直領(lǐng)域大模型屬于“專(zhuān)科醫(yī)生”,聚焦在某特定領(lǐng)域,具有較高的專(zhuān)業(yè)性和精度,其能力可能超過(guò)行業(yè)專(zhuān)家平均水平。專(zhuān)業(yè)小模型雖規(guī)模最小,像個(gè)“赤腳醫(yī)生”,能力可能高于通用大模型而低于垂直領(lǐng)域大模型,但是其實(shí)用性、靈活性更高。當(dāng)前通用大模型仍持續(xù)進(jìn)化和迭代,能力不斷增強(qiáng),領(lǐng)域覆蓋能力不斷提升,未來(lái)實(shí)現(xiàn)通用人工智能(AGI)充滿(mǎn)無(wú)限可能。各類(lèi)模型能力范圍如下圖所示。
各類(lèi)模型能力范圍
3.不足及趨勢(shì)
(1)不足和風(fēng)險(xiǎn)
一是大模型的不確定性增加了應(yīng)用難度。實(shí)際場(chǎng)景通常要求高度確定性,而大模型作為巨量參數(shù)的數(shù)學(xué)概率模型,其輸出存在不可控的隨機(jī)性,相較于嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型或機(jī)理模型,可能帶來(lái)更高的不確定性和風(fēng)險(xiǎn)。
二是“不可解釋性”給使用者帶來(lái)疑惑。大模型因其“黑盒模型”的不可解釋性存在“幻覺(jué)”、偏差、公平性、知識(shí)產(chǎn)權(quán)、意識(shí)形態(tài)等風(fēng)險(xiǎn),影響在特定行業(yè)的應(yīng)用。
三是“數(shù)據(jù)”問(wèn)題。數(shù)據(jù)來(lái)源、質(zhì)量及內(nèi)容安全難以保障,行業(yè)模型還存在數(shù)據(jù)“霸權(quán)”“倫理”等問(wèn)題。
(2)發(fā)展趨勢(shì)
一是繼續(xù)提升通用大模型能力是主要趨勢(shì)。通用模型技術(shù)能力提升依然是角逐的主戰(zhàn)場(chǎng),隨著通用模型能力增強(qiáng),各類(lèi)模型融合統(tǒng)一是未來(lái)趨勢(shì),DeepSeek-R1和Grok3的發(fā)布將加速模型融合。
二是輕量化依然是重要應(yīng)用發(fā)力點(diǎn)。C端(消費(fèi)端)應(yīng)用是行業(yè)快速發(fā)展的主賽道,而輕量化是C端應(yīng)用的前提。
三是跨模態(tài)是發(fā)展方向。更多高階應(yīng)用,如預(yù)測(cè)能力、決策能力等需要跨模態(tài)能力的支持。
四是研究中心逐步向高階認(rèn)知智能轉(zhuǎn)變。大模型在“聽(tīng)、說(shuō)、看”等感知領(lǐng)域已接近或超越了人類(lèi)水平,在理解、思考和創(chuàng)造等認(rèn)知領(lǐng)域取得顯著進(jìn)展,大模型研究重心逐步向認(rèn)知智能轉(zhuǎn)變,這成為新一代人工智能發(fā)展趨勢(shì)。
大語(yǔ)言模型應(yīng)用技術(shù)
1.應(yīng)用類(lèi)別
大模型落地應(yīng)用技術(shù)路徑較為清晰,但效果參差不齊,“門(mén)檻不高,天花板高”是其特征。通用大模型主要面向C端,泛化能力較強(qiáng)。垂直領(lǐng)域大模型主要面向B端(企業(yè)端)應(yīng)用,如智能制造(優(yōu)化生產(chǎn)流程、提高生產(chǎn)效率和產(chǎn)品質(zhì)量)、金融(信用評(píng)分、風(fēng)險(xiǎn)管理、欺詐檢測(cè)和算法交易)、教育(定制優(yōu)化培訓(xùn)方案)、水利(水文、決策支持)、醫(yī)療(輔助診斷)、能源(優(yōu)化電網(wǎng)管理)、交通(優(yōu)化路線(xiàn)規(guī)劃)、農(nóng)業(yè)(預(yù)測(cè)作物產(chǎn)量、智能施肥)等。相比通用大模型,垂直領(lǐng)域大模型在數(shù)據(jù)質(zhì)量、安全、隱私保護(hù)、成本控制等方面具有優(yōu)勢(shì),是大模型落地應(yīng)用的主要模式之一。專(zhuān)業(yè)小模型對(duì)終端要求低,可用于端側(cè)設(shè)備,如移動(dòng)設(shè)備、邊緣設(shè)備等,其靈活性和經(jīng)濟(jì)性強(qiáng),是專(zhuān)業(yè)領(lǐng)域面向C端應(yīng)用的主要模式,在消費(fèi)終端的產(chǎn)業(yè)界備受關(guān)注,如蘋(píng)果公司參數(shù)量為3 B且可在手機(jī)端直接運(yùn)行的純端側(cè)模型Apple On-Device、谷歌DeepMind的開(kāi)源小模型Gemma 2 B、DeepSeek蒸餾的1.5 B或7 B小模型等,可以廣泛應(yīng)用于本地工作站、個(gè)人電腦、手機(jī)等邊緣設(shè)備,用途更為廣泛。
2.應(yīng)用技術(shù)
大模型領(lǐng)域應(yīng)用路徑有4種,包括提示詞工程(Prompt)、檢索增強(qiáng)生成(RAG)、微調(diào)(Fine-tune)和預(yù)訓(xùn)練(Pretrain),如下圖所示。
大模型領(lǐng)域化應(yīng)用技術(shù)路徑
提示詞工程比較適合快速探索應(yīng)用,如對(duì)話(huà)系統(tǒng)、文案創(chuàng)作、流程定制等;優(yōu)化提示詞可以顯著提升生成內(nèi)容的質(zhì)量。提示詞優(yōu)化方式包括少樣本提示、思維鏈等。特點(diǎn)是實(shí)操簡(jiǎn)便,不需要調(diào)整大模型,但對(duì)基座大模型能力依賴(lài)性較強(qiáng),提示詞的設(shè)計(jì)質(zhì)量對(duì)結(jié)果影響很大。
檢索增強(qiáng)生成技術(shù)是對(duì)提示詞工程的強(qiáng)化,通過(guò)引入外部數(shù)據(jù)庫(kù),并依據(jù)用戶(hù)輸入(Query)檢索得到相關(guān)信息(Context),將其和提示詞一并輸入大模型,其本質(zhì)是給定樣本的提示詞方式,對(duì)外部數(shù)據(jù)庫(kù)的向量化、排序及檢索技術(shù)等較為敏感,技術(shù)難度不大,無(wú)需對(duì)大模型進(jìn)行調(diào)整,還可以利用當(dāng)前的外部知識(shí),應(yīng)用廣泛。
微調(diào)技術(shù)是利用專(zhuān)業(yè)數(shù)據(jù)集對(duì)基座大模型進(jìn)行布局的參數(shù)調(diào)整,使得通用大模型對(duì)專(zhuān)業(yè)領(lǐng)域更加適應(yīng),具有較高的專(zhuān)業(yè)泛化性。常用技術(shù)方法有監(jiān)督微調(diào)、低秩調(diào)整等方式。需局部調(diào)整基座大模型,技術(shù)難度較大,對(duì)專(zhuān)業(yè)數(shù)據(jù)集的質(zhì)量要求較高,目前在領(lǐng)域應(yīng)用較為廣泛。
預(yù)訓(xùn)練則是基于領(lǐng)域知識(shí)重新構(gòu)建或全面調(diào)整基座大模型,技術(shù)難度大,資源要求高,投入大,周期長(zhǎng),專(zhuān)業(yè)性強(qiáng),目前應(yīng)用較少。
3.行業(yè)應(yīng)用難點(diǎn)
不確定性是大模型的應(yīng)用難點(diǎn)之一。為了增強(qiáng)大模型確定性,可以對(duì)不同應(yīng)用方式或階段輸入更多“確定性”,如在訓(xùn)練基座大模型階段提高訓(xùn)練數(shù)據(jù)集的確定性和質(zhì)量,對(duì)檢索增強(qiáng)生成方式提高外部數(shù)據(jù)和檢索結(jié)果的確定性,對(duì)提示詞工程錄入更多確定性樣本或設(shè)計(jì)高質(zhì)量思維鏈等。需要指出的是,大模型架構(gòu)和原理決定了其本質(zhì)是“黑箱”模型,不可解釋和“幻覺(jué)”不可避免,因此在行業(yè)應(yīng)用特別是對(duì)結(jié)果的確定性要求比較高的行業(yè),大模型定位是“助手”而非“決策者”。
領(lǐng)域知識(shí)提取和模型適配與優(yōu)化是難點(diǎn)之一。領(lǐng)域知識(shí)高質(zhì)量提取較為困難,領(lǐng)域知識(shí)圖譜構(gòu)建復(fù)雜,模型的適配和優(yōu)化難度較大。
倫理與安全問(wèn)題影響模型應(yīng)用落地。大模型的學(xué)習(xí)訓(xùn)練數(shù)據(jù)中可能存在偏見(jiàn),并產(chǎn)生歧視性輸出;模型可能生成虛假、誤導(dǎo)性信息;模型可能被惡意利用造成不良社會(huì)影響,最終影響領(lǐng)域應(yīng)用信任性等。
大語(yǔ)言模型智能交互分析
1.智能交互分級(jí)
從大模型與系統(tǒng)平臺(tái)的交互融合深度而言,可將智能交互分為4個(gè)層級(jí),即L0、L1、L2和L3(見(jiàn)下表)。
智能交互分級(jí)
第一層級(jí)是模擬操作(L0級(jí)),大模型類(lèi)似模擬人類(lèi)操作系統(tǒng),基于平臺(tái)交互界面,快速定位平臺(tái)內(nèi)置功能,包括查詢(xún)、模型調(diào)用、計(jì)算、結(jié)果展示、簡(jiǎn)報(bào)生成等,L0級(jí)交互通過(guò)監(jiān)督學(xué)習(xí)來(lái)熟悉系統(tǒng)的功能,明確調(diào)用路徑,人類(lèi)參與程度高。
第二層級(jí)是智能分析生成(L1級(jí)),交互模式是基于垂直領(lǐng)域大模型,其具備讀懂專(zhuān)業(yè)領(lǐng)域知識(shí)的能力,并經(jīng)過(guò)監(jiān)督學(xué)習(xí)熟悉了數(shù)字孿生平臺(tái)的業(yè)務(wù)邏輯和框架體系,基于數(shù)字孿生水利平臺(tái)的后臺(tái)數(shù)據(jù)、模型和知識(shí),進(jìn)行綜合交互,具有“生成”能力,不局限于平臺(tái)前端已有功能的調(diào)用能力,具有理解提問(wèn)者意圖,并通過(guò)后臺(tái)數(shù)據(jù)進(jìn)行分析整理提供“專(zhuān)業(yè)答案”的能力,人類(lèi)參與程度較高。
第三層級(jí)為類(lèi)Agent的交互模式(L2級(jí)),在平臺(tái)已有信息和功能基礎(chǔ)上結(jié)合大模型已有的專(zhuān)業(yè)基礎(chǔ)知識(shí),對(duì)相關(guān)外部知識(shí)進(jìn)行融合和調(diào)用并綜合提出決策建議,人類(lèi)的參與程度為一般。
第四層級(jí)是自主決策(L3級(jí)),屬于類(lèi)“智人”型自主交互模式,可根據(jù)平臺(tái)數(shù)據(jù)和業(yè)務(wù)邏輯情況,結(jié)合調(diào)用外部已有的知識(shí),自行開(kāi)展決策,并對(duì)需要人類(lèi)加入的部分進(jìn)行主動(dòng)式交互。
2.“四預(yù)”平臺(tái)交互流程
按上述大語(yǔ)言模型智能交互分級(jí),L0~L2級(jí)均需人類(lèi)參與,L3級(jí)人類(lèi)較少參與。對(duì)于人類(lèi)參與的L0~L2級(jí)交互,人類(lèi)作為決策事項(xiàng)發(fā)起方,首先要提出問(wèn)題、需求和要求,大語(yǔ)言模型在理解問(wèn)題、需求和要求的基礎(chǔ)上,結(jié)合自身的語(yǔ)義識(shí)別能力、通用或水利專(zhuān)業(yè)知識(shí)、學(xué)習(xí)到的平臺(tái)功能等,確定解決問(wèn)題的業(yè)務(wù)流程;然后根據(jù)業(yè)務(wù)流程逐步執(zhí)行模型平臺(tái)功能,包括數(shù)據(jù)采集生成、模型調(diào)用驅(qū)動(dòng)計(jì)算、結(jié)果展示、預(yù)案制定等。最后根據(jù)現(xiàn)狀、歷史場(chǎng)景和預(yù)案等,綜合給出推薦的決策建議,如下圖所示。
“四預(yù)”平臺(tái)智能交互流程
“四預(yù)”平臺(tái)意圖識(shí)別和模型調(diào)用
意圖識(shí)別是大語(yǔ)言模型輔助交互的核心,而模型是“四預(yù)”平臺(tái)的核心。因此以意圖識(shí)別和模型調(diào)用為例,說(shuō)明大語(yǔ)言模型交互技術(shù)的實(shí)現(xiàn)。
1.意圖識(shí)別技術(shù)
大語(yǔ)言模型本身具有一定的意圖識(shí)別能力,就“四預(yù)”平臺(tái)而言,需提高其防洪專(zhuān)業(yè)或者“四預(yù)”平臺(tái)專(zhuān)業(yè)意圖識(shí)別能力,實(shí)現(xiàn)任務(wù)分解或確定業(yè)務(wù)流程。技術(shù)實(shí)現(xiàn)方法通常包括上下文理解和多輪對(duì)話(huà)、規(guī)則或模式匹配、思維鏈、專(zhuān)業(yè)小模型等。主要體現(xiàn)在:
一是上下文理解和多輪對(duì)話(huà),采用Prompt方式,將輸入(Query)和平臺(tái)功能集作為Prompt方式,并結(jié)合多輪交互對(duì)話(huà),最終確定意圖功能點(diǎn),技術(shù)難度小,效率不高,效果與平臺(tái)功能集質(zhì)量相關(guān)。
二是規(guī)則和模式匹配,其要求“四預(yù)”平臺(tái)或行業(yè)領(lǐng)域?qū)<叶x一系列規(guī)則來(lái)捕捉特定意圖,優(yōu)點(diǎn)是簡(jiǎn)單直接,易于理解和維護(hù),但是難以覆蓋所有情況,擴(kuò)展性和泛化能力較弱。
三是思維鏈形式,提前設(shè)定“四預(yù)”平臺(tái)業(yè)務(wù)鏈條過(guò)程作為大模型默認(rèn)輸入,讓其“照葫蘆畫(huà)瓢”。
四是專(zhuān)業(yè)小模型方式,可以理解為“四預(yù)”平臺(tái)的助手,通過(guò)基于通用大模型和平臺(tái)功能及數(shù)據(jù)的微調(diào),形成一個(gè)功能聚焦的交互小模型,實(shí)現(xiàn)難度相對(duì)較大,在“四預(yù)”平臺(tái)內(nèi)的泛在性較好。意圖識(shí)別技術(shù)如下圖所示。
意圖識(shí)別技術(shù)
針對(duì)“四預(yù)”特定場(chǎng)景,例如“未來(lái)三天石角站最高水位多少?”,以上下文理解和多輪對(duì)話(huà)為例,說(shuō)明其意圖識(shí)別實(shí)現(xiàn),過(guò)程如下圖所示。
上下文理解和多輪對(duì)話(huà)示意
采用預(yù)設(shè)內(nèi)容和Query作為Prompt方式,預(yù)設(shè)內(nèi)容限定多輪對(duì)話(huà)內(nèi)容、范圍等。當(dāng)Query輸入:“未來(lái)三天石角站最高水位多少?”,是將預(yù)設(shè)內(nèi)容和Query同時(shí)輸入給大語(yǔ)言模型,大模型會(huì)根據(jù)內(nèi)容進(jìn)行第一輪回復(fù)。然后第二輪Query:“加入決策建議,并完成流程圖繪制”,將“預(yù)設(shè)內(nèi)容+Query1+第一輪回復(fù)+Query2”同時(shí)輸入給大模型,則得到第二輪回復(fù),以此類(lèi)推經(jīng)過(guò)多輪對(duì)話(huà),生成Markdown格式的業(yè)務(wù)流程圖。
需要指出,大語(yǔ)言模型生成的業(yè)務(wù)流程精準(zhǔn)度與預(yù)設(shè)內(nèi)容設(shè)計(jì)相關(guān)性較大。根據(jù)平臺(tái)功能庫(kù)和大語(yǔ)言模型結(jié)合方式及專(zhuān)家經(jīng)驗(yàn),形成質(zhì)量較高的預(yù)設(shè)內(nèi)容,然后通過(guò)優(yōu)化對(duì)話(huà)輪次和回答精準(zhǔn)度,可提高生成的業(yè)務(wù)流程精準(zhǔn)度。因此,對(duì)于防洪“四預(yù)”平臺(tái),統(tǒng)籌開(kāi)展業(yè)務(wù)流程數(shù)據(jù)集匯聚,對(duì)相關(guān)的業(yè)務(wù)流程、技術(shù)規(guī)范、標(biāo)準(zhǔn)、指引、指南等進(jìn)行“量化”、“結(jié)構(gòu)化”或者自然語(yǔ)言處理,形成通用和標(biāo)準(zhǔn)的規(guī)則、模式或知識(shí)庫(kù)和數(shù)據(jù)集,可有效提升大模型智能交互的確定性,提高決策支持能力和效率。
2.模型調(diào)用
模型調(diào)用的基礎(chǔ)是意圖識(shí)別,當(dāng)生成的業(yè)務(wù)流程中涉及模型使用的時(shí)候,由大模型智能調(diào)用專(zhuān)業(yè)模型進(jìn)行計(jì)算。首先大模型根據(jù)調(diào)用模型類(lèi)別,調(diào)用已有庫(kù)中的中間數(shù)據(jù)交換格式文件,并根據(jù)現(xiàn)狀錄入或交互錄入模型參數(shù),生成可執(zhí)行的中間數(shù)據(jù)交換文件進(jìn)行驅(qū)動(dòng),通常的中間數(shù)據(jù)交換格式包括XML、JSON等,然后通過(guò)大模型,調(diào)用接口(API)驅(qū)動(dòng)平臺(tái)內(nèi)置的水利專(zhuān)業(yè)模型進(jìn)行計(jì)算,具體如下圖所示。
模型調(diào)用示意
總結(jié)和建議
1.總結(jié)
“四預(yù)”平臺(tái)在防洪決策中發(fā)揮了重要作用,針對(duì)“四預(yù)”平臺(tái)普遍存在的交互復(fù)雜、專(zhuān)家經(jīng)驗(yàn)融入難等問(wèn)題,基于大語(yǔ)言模型在理解和表達(dá)、知識(shí)存儲(chǔ)和查詢(xún)、推理能力等應(yīng)用分析,結(jié)合當(dāng)前大模型技術(shù)落地應(yīng)用主要技術(shù)路徑,淺述了利用大語(yǔ)言模型優(yōu)化“四預(yù)”平臺(tái)交互的路徑,并以意圖識(shí)別和智能調(diào)用為例進(jìn)行了說(shuō)明。
2.建議
大模型是人工智能技術(shù)發(fā)展的重要里程碑,也是人工智能技術(shù)可與千行百業(yè)進(jìn)行直接鏈接并注入智能的重要手段之一。盡管當(dāng)前大模型還存在不確定性、“幻覺(jué)”、安全等方面的問(wèn)題,領(lǐng)域應(yīng)用成效還缺乏廣泛性,但隨著大模型能力不斷提升和外圍技術(shù)不斷迭代,大模型領(lǐng)域應(yīng)用將不可或缺。防洪“四預(yù)”平臺(tái)是水利防洪調(diào)度的重要利器,探索大模型應(yīng)用于防洪“四預(yù)”平臺(tái),增強(qiáng)平臺(tái)在實(shí)戰(zhàn)中的高效性和實(shí)時(shí)性,提升平臺(tái)的生命活力和韌性,更好助力防洪調(diào)度,具有必要性和緊迫性。
為進(jìn)一步提升大模型的水利應(yīng)用支撐能力,建議如下:
①統(tǒng)籌水利垂直領(lǐng)域大模型的開(kāi)發(fā)。水利知識(shí)邊界是有限的,統(tǒng)籌開(kāi)展水利業(yè)務(wù)數(shù)據(jù)集、專(zhuān)業(yè)知識(shí)集、標(biāo)準(zhǔn)規(guī)劃集、水利模型集等數(shù)據(jù)集建設(shè),基于結(jié)構(gòu)化知識(shí)體系,訓(xùn)練以通用大模型為底座的水利垂直領(lǐng)域大模型,構(gòu)建行業(yè)內(nèi)的水利大模型用戶(hù)生態(tài)體系,通過(guò)不斷迭代升級(jí),提升水利大模型的泛化能力和確定性,打造“能用好用管用”的水利垂直領(lǐng)域大模型,助力水利新質(zhì)生產(chǎn)力發(fā)展。
②探索水利領(lǐng)域的專(zhuān)業(yè)小模型研發(fā)。基于水利垂直領(lǐng)域大模型或通用大模型,通過(guò)蒸餾、量化等形成更小參數(shù)量的水利領(lǐng)域?qū)I(yè)小模型,推進(jìn)水利行業(yè)端側(cè),如前端感知設(shè)備智能監(jiān)測(cè)、圖像和視頻識(shí)別判斷等應(yīng)用。
③探索大模型與水利傳統(tǒng)專(zhuān)業(yè)模型的融合。傳統(tǒng)的機(jī)理模型或概念模型在精度上具有一定優(yōu)勢(shì),而大模型在速度上更加突出,為適應(yīng)數(shù)字孿生水利特別是“四預(yù)”的實(shí)時(shí)性要求,需探索大模型與水利專(zhuān)業(yè)模型的融合,在確保精度的同時(shí)提升決策的速度。
④探索大模型在水利科研中的應(yīng)用。傳統(tǒng)水利工程建設(shè)的科研課題往往通過(guò)數(shù)學(xué)模型、物理模型等手段進(jìn)行優(yōu)化論證,嘗試借助大模型手段進(jìn)行輔助研究,探索研究方法和路徑,助力水利科研高效優(yōu)質(zhì)發(fā)展。
Abstract: Large language models (LLMs) have emerged as a significant breakthrough in artificial intelligence in recent years. Leveraging the Transformer architecture and self-attention mechanisms, these models exhibit near-human natural language understanding capabilities at an ultra-large scale, assisting human cognition, reasoning, judgment, and decision-making. Currently, the application of LLMs in specialized domains has become a focal point, especially with the open-source release of DeepSeek based on the Mixture of Experts (MOE) architecture, which offers a more accessible technical pathway for industry applications and further stimulates related research. The “four pres” (forecasting, early warning, pre-planning, and emergency response) in flood control represent a novel intelligent business application in water conservancy based on digital twin technology. This system is characterized by strong specialization, lengthy business chains, and complex system architecture. While functionally comprehensive, there remains room for improvement in usability. Based on an analysis of the understanding and reasoning capabilities of large language models, this study proposes, for the first time, a classification system for intelligent interaction with large models, ranging from L0 to L3 levels. Focusing on intent recognition and intelligent invocation, the research explores application scenarios and technical implementation paths that support the “four pres” platform. Methods to enhance the output certainty of large models are proposed by optimizing “preset content” and incorporating specific problem overlays, which are tested on general large models. The study also explores pathways for large models to intelligently invoke professional models within the “four pres” platform, providing feasible solutions to improve interactive friendliness. Additionally, this research offers valuable references for the deep application of large language models in intelligent water conservancy business.
Keywords:large language models (LLMs); ChatGPT; DeepSeek; “four pres” in flood control; intent recognition; model-driven; vertical domain large models; specialized small models
本文引用格式:
郭磊,馮鈞,直偉,等.大語(yǔ)言模型發(fā)展研究及其在防洪“四預(yù)”平臺(tái)智能交互的應(yīng)用探討[J].中國(guó)水利,2025(5):29-36.
封面供圖林曉敏
責(zé)編李博遠(yuǎn)
校對(duì)董林玥
審核王慧
監(jiān)制軒瑋
聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請(qǐng)讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。若對(duì)該稿件內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應(yīng)并做處理,再次感謝您的閱讀與關(guān)注。
不想錯(cuò)過(guò)新鮮資訊?
微信"掃一掃"