鐵甲工程機械網> 工程機械資訊> 行業(yè) > 大語言模型發(fā)展研究及其在防洪“四預”平臺智能交互的應用探討

大語言模型發(fā)展研究及其在防洪“四預”平臺智能交互的應用探討

語音播報
點擊播放

大語言模型發(fā)展研究及其在防洪“四預”平臺智能交互的應用探討

Development of large language models and their application in intelligent interaction on the “four pres” platform

郭磊,馮鈞,直偉,周思源

(1.廣東省水利水電科學研究院,510635,廣州;2.河口水利技術國家地方聯(lián)合工程實驗室,510635,廣州;3.廣東省粵港澳大灣區(qū)水安全保障工程技術研究中心,510635,廣州;4.河海大學,211100,南京)

摘要:大語言模型(LLMs)是近年來人工智能領域的重大突破,依托Transformer架構與自注意力機制,在超大規(guī)模參數(shù)下涌現(xiàn)出接近人類的自然語言理解能力,為人類認知、思考、判斷和決策提供輔助。當前大語言模型在垂直細分領域的應用已成為熱點,特別是基于MOE融合架構的DeepSeek開源發(fā)布,為行業(yè)大模型應用提供了更為便捷的技術路徑,進一步推動了相關研究熱潮?!八念A”是基于數(shù)字孿生水利建設的新型水利智能業(yè)務應用,具有專業(yè)性強、業(yè)務鏈條長、系統(tǒng)架構復雜等特點,功能完備,但在易用性方面仍有優(yōu)化空間?;诖笳Z言模型的理解和推理能力分析,首次提出了大模型智能交互L0至L3級分類體系,以意圖識別和智能調用為切入點,研究其支撐“四預”平臺的交互應用場景和實現(xiàn)技術路徑,提出了通過優(yōu)化“預設內容”和疊加具體問題增強大模型輸出確定性的方法,并在通用大模型上進行測試,探索大模型智能調用“四預”平臺專業(yè)模型的路徑,為提升防洪“四預”的交互友好性提供了可行方案,同時也為大語言模型在水利智能業(yè)務中的深度應用提供參考。

關鍵詞:大語言模型;ChatGPT;DeepSeek;防洪“四預”;意圖識別;模型驅動;垂直領域大模型;專業(yè)小模型

作者簡介:郭磊,黨委副書記,教授級高級工程師,主要研究方向為智慧水利、水文水資源、水力學及河流動力學等。

基金項目:廣東省水利科技創(chuàng)新項目“廣東省大中型水庫汛期水位動態(tài)控制與洪水資源安全利用關鍵技術研究”。

DOI:10.3969/j.issn.1000-1123.2025.05.003

研究背景

1.總體思路

防洪“四預”基于數(shù)字孿生水利建設基礎,融合前端感知、數(shù)據底板、模型平臺、知識平臺等功能模塊,實現(xiàn)預報、預警、預演、預案,為防洪決策提供支撐。其在實際防洪調度中仍需完善,一是因平臺系統(tǒng)交互復雜、業(yè)務流程鏈路長、專業(yè)性強、使用體驗不友好,通常需信息技術和水利專業(yè)人員配合使用,影響了平臺推廣和擴展;二是專家經驗和歷史場景較難直接融入“四預”平臺,如模型需由專業(yè)人員根據實際條件設定規(guī)則后才能調用,要求專業(yè)人員充分理解具體場景并熟練掌握模型特性;三是需要專家對模型計算結果進行判斷,提出參數(shù)修改意見等;四是數(shù)據底板建設效用尚未全部發(fā)揮,如基礎數(shù)據、業(yè)務數(shù)據、監(jiān)測數(shù)據等工作成果較為扎實,但是構架于其上的應用功能智慧化不足。綜上,需基于現(xiàn)有“四預”平臺框架,優(yōu)化交互方式,耦合專家經驗和歷史場景,充分挖掘數(shù)據和模型價值等,為防洪決策提供更好支撐。

大語言模型具備3個重要功能:語言理解和表達、知識存儲和查詢、推理。語言理解和表達使其具備意圖識別能力,知識存儲和查詢使其具備行業(yè)領域專業(yè)技能,推理則使其具備判斷、決策等高階智能。對防洪“四預”平臺而言,語言理解和表達可輔助交互操作,知識存儲和查詢可用于“四預”平臺的業(yè)務鏈條存儲、專家經驗和歷史場景存儲、知識圖譜構建等,推理則可用于“四預”平臺體系輔助決策。

基于大語言模型以上基本能力特征,分析大語言模型應用技術路徑,探索利用大語言模型輔助防洪“四預”平臺的交互驅動,以意圖識別和智能調用為切入點,分析大語言模型交互的優(yōu)勢和不足,為后續(xù)大語言模型在更深層次、更廣范圍實現(xiàn)對“四預”平臺的輔助使用提供借鑒。

大語言模型發(fā)展及特點

1.大模型的發(fā)展

大語言模型屬于大模型的一種。2022年11月30日ChatGPT的發(fā)布引發(fā)大模型研發(fā)熱潮,經過近2年的技術進化和快速迭代,大模型種類、數(shù)量、能力等均呈現(xiàn)暴發(fā)式增長,其推理能力、參數(shù)優(yōu)化、架構、多模態(tài)支持等方面都在不斷進化,應用場景日漸豐富。當前,綜合類大模型國外有OpenAI公司OpenAI o1、Gpt-4o,Anthropic公司的Claude,谷歌公司的Gemini,Meta公司的Llama等;國內有文心大模型、Qwen、GLM、云雀、Kimi、豆包、星火等。特別是2025年年初DeepSeek的R1版本發(fā)布,刺激了大模型技術和性能的快速提升,促使各行各業(yè)加速智能布局和迭代,推動大模型的廣泛應用。截至2025年1月底,全國已有302個生成式人工智能服務通過國家網信辦備案。另外,人工智能也寫入政府工作報告,明確要“深化大數(shù)據、人工智能等研發(fā)應用,開展‘人工智能+’行動”。由此可見,無論是政界、學界、技術界還是社會公眾都極大關注人工智能特別是大模型發(fā)展。探索大模型在行業(yè)領域的應用成為當前研究的重點和熱點,并預期對各行業(yè)規(guī)則和業(yè)態(tài)產生革命性或顛覆性深刻影響。

2.分類及能力

就通用大模型而言,其泛化性(訓練樣本集之外的表現(xiàn)能力)、專業(yè)性(特定領域問題的準確性和效率)和經濟性(投入產出比)之間存在“不可能三角”,另外靈活性和安全性方面也存在一定不足。為促進應用落地,在通用大模型基礎上進行優(yōu)化和改造,形成適應特定場景的垂直領域大模型和專業(yè)小模型是大模型應用的路徑之一。通用大模型具有全面知識能力,重在知識“廣度”;垂直領域大模型在領域內具有更多數(shù)據和知識訓練,重在知識“深度”;專業(yè)小模型則更加聚焦行業(yè)領域單項能力或縮小模型規(guī)模,重在應用“靈活度”。一般而言,通用大模型作為底座和基礎,垂直領域大模型在其上通過微調融入行業(yè)知識、邏輯和專家經驗,具備行業(yè)“廣而深”特點,而專業(yè)小模型則是在垂直領域大模型基礎上,通過微調、量化和蒸餾等技術,將其轉變成小模型,使其具備垂直領域大模型基本能力,但減少模型量以增加應用靈活程度。各類模型分類與關系如下表和下圖所示。

大模型分類及特點

模型關系

就能力而言,通用大模型屬于“全科醫(yī)生”,覆蓋全領域知識,遵循規(guī)?;▌t(Scaling Law),其通用能力也不斷增強。在翻譯、棋類等某些領域,通用大模型甚至超過了當前人類的能力水平。垂直領域大模型屬于“??漆t(yī)生”,聚焦在某特定領域,具有較高的專業(yè)性和精度,其能力可能超過行業(yè)專家平均水平。專業(yè)小模型雖規(guī)模最小,像個“赤腳醫(yī)生”,能力可能高于通用大模型而低于垂直領域大模型,但是其實用性、靈活性更高。當前通用大模型仍持續(xù)進化和迭代,能力不斷增強,領域覆蓋能力不斷提升,未來實現(xiàn)通用人工智能(AGI)充滿無限可能。各類模型能力范圍如下圖所示。

各類模型能力范圍

3.不足及趨勢

(1)不足和風險

一是大模型的不確定性增加了應用難度。實際場景通常要求高度確定性,而大模型作為巨量參數(shù)的數(shù)學概率模型,其輸出存在不可控的隨機性,相較于嚴謹?shù)臄?shù)學模型或機理模型,可能帶來更高的不確定性和風險。

二是“不可解釋性”給使用者帶來疑惑。大模型因其“黑盒模型”的不可解釋性存在“幻覺”、偏差、公平性、知識產權、意識形態(tài)等風險,影響在特定行業(yè)的應用。

三是“數(shù)據”問題。數(shù)據來源、質量及內容安全難以保障,行業(yè)模型還存在數(shù)據“霸權”“倫理”等問題。

(2)發(fā)展趨勢

一是繼續(xù)提升通用大模型能力是主要趨勢。通用模型技術能力提升依然是角逐的主戰(zhàn)場,隨著通用模型能力增強,各類模型融合統(tǒng)一是未來趨勢,DeepSeek-R1和Grok3的發(fā)布將加速模型融合。

二是輕量化依然是重要應用發(fā)力點。C端(消費端)應用是行業(yè)快速發(fā)展的主賽道,而輕量化是C端應用的前提。

三是跨模態(tài)是發(fā)展方向。更多高階應用,如預測能力、決策能力等需要跨模態(tài)能力的支持。

四是研究中心逐步向高階認知智能轉變。大模型在“聽、說、看”等感知領域已接近或超越了人類水平,在理解、思考和創(chuàng)造等認知領域取得顯著進展,大模型研究重心逐步向認知智能轉變,這成為新一代人工智能發(fā)展趨勢。

大語言模型應用技術

1.應用類別

大模型落地應用技術路徑較為清晰,但效果參差不齊,“門檻不高,天花板高”是其特征。通用大模型主要面向C端,泛化能力較強。垂直領域大模型主要面向B端(企業(yè)端)應用,如智能制造(優(yōu)化生產流程、提高生產效率和產品質量)、金融(信用評分、風險管理、欺詐檢測和算法交易)、教育(定制優(yōu)化培訓方案)、水利(水文、決策支持)、醫(yī)療(輔助診斷)、能源(優(yōu)化電網管理)、交通(優(yōu)化路線規(guī)劃)、農業(yè)(預測作物產量、智能施肥)等。相比通用大模型,垂直領域大模型在數(shù)據質量、安全、隱私保護、成本控制等方面具有優(yōu)勢,是大模型落地應用的主要模式之一。專業(yè)小模型對終端要求低,可用于端側設備,如移動設備、邊緣設備等,其靈活性和經濟性強,是專業(yè)領域面向C端應用的主要模式,在消費終端的產業(yè)界備受關注,如蘋果公司參數(shù)量為3 B且可在手機端直接運行的純端側模型Apple On-Device、谷歌DeepMind的開源小模型Gemma 2 B、DeepSeek蒸餾的1.5 B或7 B小模型等,可以廣泛應用于本地工作站、個人電腦、手機等邊緣設備,用途更為廣泛。

2.應用技術

大模型領域應用路徑有4種,包括提示詞工程(Prompt)、檢索增強生成(RAG)、微調(Fine-tune)和預訓練(Pretrain),如下圖所示。

大模型領域化應用技術路徑

提示詞工程比較適合快速探索應用,如對話系統(tǒng)、文案創(chuàng)作、流程定制等;優(yōu)化提示詞可以顯著提升生成內容的質量。提示詞優(yōu)化方式包括少樣本提示、思維鏈等。特點是實操簡便,不需要調整大模型,但對基座大模型能力依賴性較強,提示詞的設計質量對結果影響很大。

檢索增強生成技術是對提示詞工程的強化,通過引入外部數(shù)據庫,并依據用戶輸入(Query)檢索得到相關信息(Context),將其和提示詞一并輸入大模型,其本質是給定樣本的提示詞方式,對外部數(shù)據庫的向量化、排序及檢索技術等較為敏感,技術難度不大,無需對大模型進行調整,還可以利用當前的外部知識,應用廣泛。

微調技術是利用專業(yè)數(shù)據集對基座大模型進行布局的參數(shù)調整,使得通用大模型對專業(yè)領域更加適應,具有較高的專業(yè)泛化性。常用技術方法有監(jiān)督微調、低秩調整等方式。需局部調整基座大模型,技術難度較大,對專業(yè)數(shù)據集的質量要求較高,目前在領域應用較為廣泛。

預訓練則是基于領域知識重新構建或全面調整基座大模型,技術難度大,資源要求高,投入大,周期長,專業(yè)性強,目前應用較少。

3.行業(yè)應用難點

不確定性是大模型的應用難點之一。為了增強大模型確定性,可以對不同應用方式或階段輸入更多“確定性”,如在訓練基座大模型階段提高訓練數(shù)據集的確定性和質量,對檢索增強生成方式提高外部數(shù)據和檢索結果的確定性,對提示詞工程錄入更多確定性樣本或設計高質量思維鏈等。需要指出的是,大模型架構和原理決定了其本質是“黑箱”模型,不可解釋和“幻覺”不可避免,因此在行業(yè)應用特別是對結果的確定性要求比較高的行業(yè),大模型定位是“助手”而非“決策者”。

領域知識提取和模型適配與優(yōu)化是難點之一。領域知識高質量提取較為困難,領域知識圖譜構建復雜,模型的適配和優(yōu)化難度較大。

倫理與安全問題影響模型應用落地。大模型的學習訓練數(shù)據中可能存在偏見,并產生歧視性輸出;模型可能生成虛假、誤導性信息;模型可能被惡意利用造成不良社會影響,最終影響領域應用信任性等。

大語言模型智能交互分析

1.智能交互分級

從大模型與系統(tǒng)平臺的交互融合深度而言,可將智能交互分為4個層級,即L0、L1、L2和L3(見下表)。

智能交互分級

第一層級是模擬操作(L0級),大模型類似模擬人類操作系統(tǒng),基于平臺交互界面,快速定位平臺內置功能,包括查詢、模型調用、計算、結果展示、簡報生成等,L0級交互通過監(jiān)督學習來熟悉系統(tǒng)的功能,明確調用路徑,人類參與程度高。

第二層級是智能分析生成(L1級),交互模式是基于垂直領域大模型,其具備讀懂專業(yè)領域知識的能力,并經過監(jiān)督學習熟悉了數(shù)字孿生平臺的業(yè)務邏輯和框架體系,基于數(shù)字孿生水利平臺的后臺數(shù)據、模型和知識,進行綜合交互,具有“生成”能力,不局限于平臺前端已有功能的調用能力,具有理解提問者意圖,并通過后臺數(shù)據進行分析整理提供“專業(yè)答案”的能力,人類參與程度較高。

第三層級為類Agent的交互模式(L2級),在平臺已有信息和功能基礎上結合大模型已有的專業(yè)基礎知識,對相關外部知識進行融合和調用并綜合提出決策建議,人類的參與程度為一般。

第四層級是自主決策(L3級),屬于類“智人”型自主交互模式,可根據平臺數(shù)據和業(yè)務邏輯情況,結合調用外部已有的知識,自行開展決策,并對需要人類加入的部分進行主動式交互。

2.“四預”平臺交互流程

按上述大語言模型智能交互分級,L0~L2級均需人類參與,L3級人類較少參與。對于人類參與的L0~L2級交互,人類作為決策事項發(fā)起方,首先要提出問題、需求和要求,大語言模型在理解問題、需求和要求的基礎上,結合自身的語義識別能力、通用或水利專業(yè)知識、學習到的平臺功能等,確定解決問題的業(yè)務流程;然后根據業(yè)務流程逐步執(zhí)行模型平臺功能,包括數(shù)據采集生成、模型調用驅動計算、結果展示、預案制定等。最后根據現(xiàn)狀、歷史場景和預案等,綜合給出推薦的決策建議,如下圖所示。

“四預”平臺智能交互流程

“四預”平臺意圖識別和模型調用

意圖識別是大語言模型輔助交互的核心,而模型是“四預”平臺的核心。因此以意圖識別和模型調用為例,說明大語言模型交互技術的實現(xiàn)。

1.意圖識別技術

大語言模型本身具有一定的意圖識別能力,就“四預”平臺而言,需提高其防洪專業(yè)或者“四預”平臺專業(yè)意圖識別能力,實現(xiàn)任務分解或確定業(yè)務流程。技術實現(xiàn)方法通常包括上下文理解和多輪對話、規(guī)則或模式匹配、思維鏈、專業(yè)小模型等。主要體現(xiàn)在:

一是上下文理解和多輪對話,采用Prompt方式,將輸入(Query)和平臺功能集作為Prompt方式,并結合多輪交互對話,最終確定意圖功能點,技術難度小,效率不高,效果與平臺功能集質量相關。

二是規(guī)則和模式匹配,其要求“四預”平臺或行業(yè)領域專家定義一系列規(guī)則來捕捉特定意圖,優(yōu)點是簡單直接,易于理解和維護,但是難以覆蓋所有情況,擴展性和泛化能力較弱。

三是思維鏈形式,提前設定“四預”平臺業(yè)務鏈條過程作為大模型默認輸入,讓其“照葫蘆畫瓢”。

四是專業(yè)小模型方式,可以理解為“四預”平臺的助手,通過基于通用大模型和平臺功能及數(shù)據的微調,形成一個功能聚焦的交互小模型,實現(xiàn)難度相對較大,在“四預”平臺內的泛在性較好。意圖識別技術如下圖所示。

意圖識別技術

針對“四預”特定場景,例如“未來三天石角站最高水位多少?”,以上下文理解和多輪對話為例,說明其意圖識別實現(xiàn),過程如下圖所示。

上下文理解和多輪對話示意

采用預設內容和Query作為Prompt方式,預設內容限定多輪對話內容、范圍等。當Query輸入:“未來三天石角站最高水位多少?”,是將預設內容和Query同時輸入給大語言模型,大模型會根據內容進行第一輪回復。然后第二輪Query:“加入決策建議,并完成流程圖繪制”,將“預設內容+Query1+第一輪回復+Query2”同時輸入給大模型,則得到第二輪回復,以此類推經過多輪對話,生成Markdown格式的業(yè)務流程圖。

需要指出,大語言模型生成的業(yè)務流程精準度與預設內容設計相關性較大。根據平臺功能庫和大語言模型結合方式及專家經驗,形成質量較高的預設內容,然后通過優(yōu)化對話輪次和回答精準度,可提高生成的業(yè)務流程精準度。因此,對于防洪“四預”平臺,統(tǒng)籌開展業(yè)務流程數(shù)據集匯聚,對相關的業(yè)務流程、技術規(guī)范、標準、指引、指南等進行“量化”、“結構化”或者自然語言處理,形成通用和標準的規(guī)則、模式或知識庫和數(shù)據集,可有效提升大模型智能交互的確定性,提高決策支持能力和效率。

2.模型調用

模型調用的基礎是意圖識別,當生成的業(yè)務流程中涉及模型使用的時候,由大模型智能調用專業(yè)模型進行計算。首先大模型根據調用模型類別,調用已有庫中的中間數(shù)據交換格式文件,并根據現(xiàn)狀錄入或交互錄入模型參數(shù),生成可執(zhí)行的中間數(shù)據交換文件進行驅動,通常的中間數(shù)據交換格式包括XML、JSON等,然后通過大模型,調用接口(API)驅動平臺內置的水利專業(yè)模型進行計算,具體如下圖所示。

模型調用示意

總結和建議

1.總結

“四預”平臺在防洪決策中發(fā)揮了重要作用,針對“四預”平臺普遍存在的交互復雜、專家經驗融入難等問題,基于大語言模型在理解和表達、知識存儲和查詢、推理能力等應用分析,結合當前大模型技術落地應用主要技術路徑,淺述了利用大語言模型優(yōu)化“四預”平臺交互的路徑,并以意圖識別和智能調用為例進行了說明。

2.建議

大模型是人工智能技術發(fā)展的重要里程碑,也是人工智能技術可與千行百業(yè)進行直接鏈接并注入智能的重要手段之一。盡管當前大模型還存在不確定性、“幻覺”、安全等方面的問題,領域應用成效還缺乏廣泛性,但隨著大模型能力不斷提升和外圍技術不斷迭代,大模型領域應用將不可或缺。防洪“四預”平臺是水利防洪調度的重要利器,探索大模型應用于防洪“四預”平臺,增強平臺在實戰(zhàn)中的高效性和實時性,提升平臺的生命活力和韌性,更好助力防洪調度,具有必要性和緊迫性。

為進一步提升大模型的水利應用支撐能力,建議如下:

①統(tǒng)籌水利垂直領域大模型的開發(fā)。水利知識邊界是有限的,統(tǒng)籌開展水利業(yè)務數(shù)據集、專業(yè)知識集、標準規(guī)劃集、水利模型集等數(shù)據集建設,基于結構化知識體系,訓練以通用大模型為底座的水利垂直領域大模型,構建行業(yè)內的水利大模型用戶生態(tài)體系,通過不斷迭代升級,提升水利大模型的泛化能力和確定性,打造“能用好用管用”的水利垂直領域大模型,助力水利新質生產力發(fā)展。

②探索水利領域的專業(yè)小模型研發(fā)。基于水利垂直領域大模型或通用大模型,通過蒸餾、量化等形成更小參數(shù)量的水利領域專業(yè)小模型,推進水利行業(yè)端側,如前端感知設備智能監(jiān)測、圖像和視頻識別判斷等應用。

③探索大模型與水利傳統(tǒng)專業(yè)模型的融合。傳統(tǒng)的機理模型或概念模型在精度上具有一定優(yōu)勢,而大模型在速度上更加突出,為適應數(shù)字孿生水利特別是“四預”的實時性要求,需探索大模型與水利專業(yè)模型的融合,在確保精度的同時提升決策的速度。

④探索大模型在水利科研中的應用。傳統(tǒng)水利工程建設的科研課題往往通過數(shù)學模型、物理模型等手段進行優(yōu)化論證,嘗試借助大模型手段進行輔助研究,探索研究方法和路徑,助力水利科研高效優(yōu)質發(fā)展。

Abstract: Large language models (LLMs) have emerged as a significant breakthrough in artificial intelligence in recent years. Leveraging the Transformer architecture and self-attention mechanisms, these models exhibit near-human natural language understanding capabilities at an ultra-large scale, assisting human cognition, reasoning, judgment, and decision-making. Currently, the application of LLMs in specialized domains has become a focal point, especially with the open-source release of DeepSeek based on the Mixture of Experts (MOE) architecture, which offers a more accessible technical pathway for industry applications and further stimulates related research. The “four pres” (forecasting, early warning, pre-planning, and emergency response) in flood control represent a novel intelligent business application in water conservancy based on digital twin technology. This system is characterized by strong specialization, lengthy business chains, and complex system architecture. While functionally comprehensive, there remains room for improvement in usability. Based on an analysis of the understanding and reasoning capabilities of large language models, this study proposes, for the first time, a classification system for intelligent interaction with large models, ranging from L0 to L3 levels. Focusing on intent recognition and intelligent invocation, the research explores application scenarios and technical implementation paths that support the “four pres” platform. Methods to enhance the output certainty of large models are proposed by optimizing “preset content” and incorporating specific problem overlays, which are tested on general large models. The study also explores pathways for large models to intelligently invoke professional models within the “four pres” platform, providing feasible solutions to improve interactive friendliness. Additionally, this research offers valuable references for the deep application of large language models in intelligent water conservancy business.

Keywords:large language models (LLMs); ChatGPT; DeepSeek; “four pres” in flood control; intent recognition; model-driven; vertical domain large models; specialized small models

本文引用格式:

郭磊,馮鈞,直偉,等.大語言模型發(fā)展研究及其在防洪“四預”平臺智能交互的應用探討[J].中國水利,2025(5):29-36.

封面供圖林曉敏

責編李博遠

校對董林玥

審核王慧

監(jiān)制軒瑋



聲明:本文系轉載自互聯(lián)網,請讀者僅作參考,并自行核實相關內容。若對該稿件內容有任何疑問或質疑,請立即與鐵甲網聯(lián)系,本網將迅速給您回應并做處理,再次感謝您的閱讀與關注。

相關文章
我要評論
表情
歡迎關注我們的公眾微信