人工智慧演算法在共同作戰圖像、指揮與管制之運用
2025.11.06
瀏覽數
763
壹、前言
近年國防部成立國防創新小組(Defense Innovation office, DIO),專注創新作戰發展、產業調研評估、軍民科技應用等三個領域,專注於無人載具、反制無人機系統、人工智慧目標辨識等技術領域。[1]其中人工智慧項目應是當前最能有效提升整體防衛能量的項目之一。另國家中山科學研究院亦積極與美商科技公司(如Anduril與Northrop Grumman)尋求合作及簽署備忘錄,顯示我國對於最新科技與人工智慧輔助作戰需求孔急。[2]為凸顯人工智慧演算法對於軍事作戰之重要性,筆者簡述以「檢索增強生成」(Retrieval-Augmented Generation, RAG)與「本體論」(Ontology)為基礎的人工智慧關鍵演算法,如何應用於知識密集、複雜、機敏且高風險的軍事作戰環境中,以提升「共同作戰圖像」(Common Operational Picture, COP)的清晰度,並強化「指揮與管制」(Command and Control, C2)的效能。
一、「檢索增強生成」(RAG)
RAG是一種增強「大型語言模型」(large language models, LLM)的方法,其核心係將外部檢索組件整合至生成流程中,以應對傳統LLM對固有的知識產生不實資訊(幻覺)的風險。RAG在企業應用中展現的關鍵優勢包括「高事實準確性」、「完整性」以及「資訊的可追溯性」,都符合軍事作戰領域中的作業需求。[3]RAG系統運作原理包含索引階段(將數據處理、分割,在儲存於知識庫中)和生成階段(將查詢轉為檢索最相關的上下文,再提供給LLM生成答案)。
在軍事作戰中,RAG就像一位聰明的參謀。當指揮官用自然語言提問(例如:「附近有哪些單位能對付敵方裝甲部隊?」),這位參謀會先「檢索」即時情資資料庫,找出相關單位的具體位置、戰備狀態及武器的能力與限制等事實數據。接著,它會將這些事實與原始問題「增強」打包成一個新提示,最後交由大型語言模型「生成」一段基於上述準確情報、而非憑空猜測的自然語言回答,例如明確指出「某甲反裝甲排」和「某乙砲兵營」是最佳選擇,因為他們的即時數據顯示已準備就緒且配備了有效武器。
二、「本體論」
本體論在知識工程領域被視為一種工程產物,是對概念化的明確、形式化規格說明。其主要結構由概念、概念關係、函數、公理及實例組成。本體論能夠清楚表達概念之間多樣化的複雜關係,例如邏輯關係和本體關係(空間上的整體與部分關係、時間上的連續關係等)。本體論的應用旨在透過共通的術語和規範描述來實現知識共享和相互操作性。[4]
在軍事領域中,本體論是一種將戰場知識結構化的方法,它會明確定義如「軍事單位」、「武器系統」和「目標」等核心概念,以及它們各自的屬性(例如武器的有效射程)與彼此之間的關係(例如單位配備了某武器)。透過這個架構,電腦系統能接收即時情報(如我方砲兵與敵方目標的位置),並根據預設規則自動進行推理,例如在計算出雙方距離後,與武器射程進行比對。最終,系統能自動得出「某單位可攻擊某目標」的結論,將複雜的數據分析轉化為直觀的決策輔助,從而大幅提升指揮效率與決策速度。
貳、安全意涵
在軍事作戰中,COP與C2所要求資訊必須具備最高層級的準確性、可靠性與安全性。RAG與本體論的特性在以下幾個方面具有關鍵的安全意涵:
一、確保事實準確性與決策信任度
RAG在「事實準確性」(Factual Accuracy)和「完整性」(Completeness)方面表現出色。這在軍事規劃或情報分析等要求極高準確性的領域中非常重要。
(一)減少幻覺與可追溯性
RAG明確檢索文件(基於事實的來源資訊)作為答案的依據,有助於減少LLM產生「幻覺」(Hallucination)的風險。答案可直接追溯到可驗證的來源材料,從而提高指揮者在決策過程中的信任度(可信賴的人工智慧)。
(二)適用於動態情報
RAG系統特別適合用於資訊快速演變的內部環境,這與軍事知識庫,特別是不斷更新的情報、戰術手冊或裝備規格等等的動態性質相符。
二、知識體系的精確組織與相互操作性
在建構精確的共同作戰圖像時,需要對複雜的軍事概念(例如部隊編制、作戰階段、裝備類型)及其關係進行嚴格定義,此時就換上本體論上場。
(一)結構化知識網路
本體論能夠作為強大的知識組織基礎,為RAG提供結構清晰、關係明確的知識鏈結。本體論可定義複雜的本體關係,例如某部隊「包含」(空間上的整體或部分關係)某裝備。
(二)強化語義匹配
當用戶(指揮官或情報分析師)提出涉及複雜關係的查詢時,若知識庫是透過本體論結構定義的,RAG的檢索器能夠利用這些定義好的關係,更準確地進行語義相似性搜索,進而提升答案的精確度。
(三)促進跨部門與跨國協作
本體論有助於透過共通的術語和規範描述來實現互操作性。在涉及多部門、多機構或跨國協作的軍事環境中,定義統一的軍事術語領域本體論,有助於確保所有系統對同一概念的理解一致(統一各個不同原始碼的作戰圖像,而不是統一其原始碼,可有效解決對於不同國家系統或涉及商業機密的原始碼取得問題)。
三、數據安全與可靠性的挑戰
儘管RAG提供了高準確與可靠性,且本體論更強化其提供答案的品質,但在其系統建構中,資料安全和可靠性仍是嚴峻的挑戰。
(一)檢索可靠性的瓶頸
RAG系統的品質極度依賴其知識庫和檢索設計。經實際運用之經驗顯示,部分有關「低品質」回答並非源於LLM的能力不足,而是因為檢索資料庫時無法回傳正確的上下文,這在C2環境中可能導致重大的決策失誤。
(二)資訊洩漏風險
建構高品質RAG系統時,必須仔細規劃知識庫,並保留對敏感數據的存取限制。若未能遵循最佳數據管理實務,或未依相關機敏資訊處理規範及限制執行,將可能導致最終生成的答案包含使用者原本不應存取的機密或敏感資訊。
參、趨勢研判
未來在軍事作戰COP與C2應用中,RAG與本體論的發展趨勢應以混合架構、大規模部署以及嚴格的評估標準,以克服單一技術的限制。
一、混合與強化架構以應對複雜性
(一)RAG與本體論的協同作用
本體論提供知識結構,能有效解決RAG的檢索瓶頸。透過將本體論定義的結構化知識整合到RAG的知識庫中,可以確保知識庫的語義清晰度和完整性。
(二)混合搜索的必然性
為了在複雜的查詢中提高檢索的召回率,趨勢是實施「混合搜索」(Hybrid Search),結合「向量搜索」(擅長語義匹配)和「關鍵字搜索」(擅長精確詞彙匹配)。這對於C2系統中涉及術語與概念的模糊和精確查詢助益甚巨。[5]
(三)RAG與微調的結合
研究趨勢指出,結合RAG與「微調」(Fine-Tuning, FT)的混合解決方案是未來方向。[6]微調能使LLM學習特定的語氣、風格,使其具有一致性,而RAG則能提供最新的事實準確性。在軍事C2環境中,這可以確保系統的回答既符合嚴格的軍事指揮語言風格,又能基於最新的情報事實。[7]
二、大規模與高可用性系統架構
隨著軍事系統的規模和地域範圍擴大,RAG架構必須轉向高可擴展性和高可用性。
(一)分散式架構的必要性
為了應對高需求、大規模的數據和流量(例如全球範圍的軍事工作負載),需要採用「分散式檢索」(Distributed Retrieval)系統,而非單點故障的「集中式」(Centralized)系統。分散式架構能夠提供冗餘、更高的故障轉移能力和正常運行時間。
(二)資料更新率管理
在情報快速變動的軍事環境中,資料的「新鮮度」(Freshness)至關重要。趨勢是採用混合嵌入策略,結合離線(批次)更新用於靜態知識庫,以及線上(即時)嵌入用於處理即時或使用者產生的數據(如最新情報)。
三、嚴格的多面向評估
由於軍事作戰的風險極高,系統的可靠性不僅需要技術測試,還需要嚴格的品質評估。
(一)雙重評估策略
趨勢是採用「自動化評估指標」(如ROUGE、BERT Score)與結構化人工評估相結合的雙重評估策略,以進行全面和公正的性能評估。[8]
(二)注重事實正確性
上述自動化評估指標與人類對流暢度和相關性的判斷相關性較高,但對於高風險的C2系統,更需要專注於「事實正確性」(Factual Correctness)和「完整性」(Completeness)的人工評估。需要建立相關的標準與觀察指標,讓使用者對於答案品質具有一定能力的判斷與警覺,這對高風險環境中的驗證至為關鍵。
RAG與本體論的結合,為提升軍事COP與C2的效能,提供了兼具結構化與靈活性的解決方案。RAG透過外部知識庫的即時檢索,有效降低大型語言模型的幻覺風險,確保了決策資訊的高度事實準確性與可追溯性;而本體論則為複雜的軍事知識提供了清晰、可互通的語義網路,強化了COP中各作戰單元與概念的精確性。然而,此技術組合並非沒有挑戰。其成效除高度依賴檢索系統的可靠性外,若知識庫的數據管理不當,更可能引發敏感資訊洩漏的嚴重安全風險。展望未來,發展趨勢將朝向整合性架構進行,透過本體論來優化RAG的檢索瓶頸、採用混合搜索策略,並結合「微調」以兼顧事實與專業,將是克服現有技術限制的關鍵。同時,為應對大規模作戰需求,系統架構必須走向分散式與高可用性,並建立包含自動化與人工驗證的嚴格評估機制,以確保在分秒必爭的高風險環境中,提供最可靠的決策支援。總體而言,本體論與RAG的協同應用,不僅是技術上的演進,更是實現智慧化、高信賴度軍事決策支援體系的關鍵基礎。
趨勢是採用「自動化評估指標」(如ROUGE、BERT Score)與結構化人工評估相結合的雙重評估策略,以進行全面和公正的性能評估。[8]
[1] 蘇晏男,〈新版國防報告書出爐!首提DIO小組要導入AI厚植整體國防戰力〉,《ETtoday新聞雲》,2025年10月9日,https://www.ettoday.net/news/20251009/3047550.htm。
[2] 陳治程,〈美Anduril公司確定進駐台灣,與中科院合作產品9月現台北航太展〉,《自由時報電子報》,2025年8月6日,https://def.ltn.com.tw/article/breakingnews/5134229。〈中科院與諾格合作打造台版IBCS 整合國內防空指管體系〉,《Yahoo奇摩新聞》,2025年9月17日,https://tw.news.yahoo.com/share/90b74708-b0fa-3b33-8b9b-92eabb87492f。
[3] Aysha Nihal, “Comparative Study of Retrieval-Augmented Generation (RAG) and Fine-Tuned Large Language Models in Conversational AI” (Master Degree Project in Informatics with a specialization in Data Science, Autumn term 2025), pp. 5-7, https://his.diva-portal.org/smash/get/diva2:1985482/FULLTEXT01.pdf.
[4] Ying Ding and Schubert Foo, “Ontology Research and Development. Part I - A Review of Ontology Generation,” Journal of Information Science, Vol. 28, No. 2, 2002, pp. 2-3.
[5] Microsoft, “Hybrid Search - Azure AI Search,” Microsoft Learn, July, 22, 2025, https://learn.microsoft.com/zh-tw/azure/search/hybrid-search-overview.
[6] Nihal, “Comparative Study of Retrieval-Augmented Generation,” pp. 8-10.
[7] 微調是指在一個已經在海量通用數據上訓練好的基礎模型(Foundation Model)之上,使用少量、特定領域的數據集,進行額外的訓練,以調整模型的權重,使其在特定任務上更專業、更精確。簡單來說,微調的目的,是讓模型從「大致知道」變成「精確做到」。
[8] Nihal, “Comparative Study of Retrieval-Augmented Generation,” p. 3.(ROUGE 和 BERT Score 都是用來自動評估機器生成文本(例如摘要或翻譯)品質的常用指標。ROUGE 主要計算生成文本與參考答案之間字詞的重疊率,計算速度快但無法理解語意;而 BERT Score 則利用大型語言模型來比較兩者在語意上的相似度,更能準確判斷同義詞或換句話說的情況。)