遠超阿爾法狗? “戰顱”成戰場輔助決策“最強大腦”

        科技日報 2021-04-19 11:15:04

        團隊成員基于“戰顱”進行戰法推演受訪者供圖

        在第四屆全國兵棋推演大賽“機—機”智能博弈專項賽中,國防科技大學系統工程學院智能規劃與目標工程研究團隊研發的作戰輔助決策智能體“戰顱”升級版“戰顱二號”,上演了一場扣人心弦的“戲碼”:在敵方搶占先機向它發起猛攻之時,它展開了強力反擊,最終以1架飛機的優勢反敗為勝。

        現代戰爭是個復雜的系統工程,單靠指揮員個人的腦力運算很難實現快速最優決策,需要指控系統這個“機器大腦”輔助決策甚至替代指揮員執行部分決策。如何使“機器大腦”各要素協同更密切、信息處理更高效、決策更精準,成為戰場上輔助決策的“最強大腦”,該團隊一直在思考和鉆研。

        探索智能決策“無人區”

        提起人工智能算法,“戰顱”首席設計師馮旸赫如數家珍。2012年攻讀博士期間為了完成某項目研發,他與人工智能算法結緣,從此開始系統的學習和研究。

        2016年AlphaGo(阿爾法狗)戰勝世界圍棋冠軍,令人工智能名聲大噪。對于這個結果,馮旸赫并不感到意外,他早就敏銳地覺察到,智能化時代即將到來,將智能化技術運用到軍事領域將大有可為。

        馮旸赫與同事們交流了自己的想法,大家一致認為軍事智能化是一個重磅課題,甚至可能是制勝未來戰爭的關鍵,團隊當即把軍事智能研究列入了重大項目研究計劃。

        “我們的研究方向是復雜對抗環境下作戰智能決策問題,這個領域當時在國內還屬于無人區。”程光權副研究員介紹說。

        團隊定下了達到一般人類智能水平的階段性研發目標。集中攻關4個月后,他們最終基于兵棋推演平臺研制出了融合知識推理、監督學習、集成學習和強化學習等一系列方法的作戰輔助決策智能體,并將其取名為“戰顱”。

        團隊成員吳克宇表示:“我們在摸索中遇到了很多技術難關,‘戰顱’面對的對抗環境中實體多、變數多、空間大、規則復雜,對動作、速度等精準度要求極高,遠超AlphaGo等人工智能所要處理場景的復雜度。”

        好的理論推演結果曾讓馮旸赫對實戰效果信心滿滿。但和真人進行實戰對抗時,“戰顱”暴露出智能化水平低、結果不穩定的弱點,效果并不盡如人意。

        問題出在哪里?團隊經過反復試驗后發現,與理論推演中設置的理想環境不同,作戰環境充斥著不確定性,態勢難以感知、目標不易評判、信息不夠完全影響著“戰顱”的決策。團隊認為,單純對標AlphaGo的研發思路,直接運用深度學習、強化學習等算法對“戰顱”行不通。

        基于多年對運籌和規劃問題的研究積累,團隊調整了技術路線:將傳統的優化方法和智能化算法相結合,突出規則和經驗性知識,綜合實體模型和人的經驗,分階段、分場景處理。終于,“戰顱”的智能越來越強大,在實戰對抗中表現也越來越好。

        “戰顱”以全勝戰績贏得冠軍

        在人機大戰中,紅方“米格”戰機出發不久,藍方各傳感器已偵察到對方信息,迅速派出大批戰機升空壓制。“米格”剛一進入戰斗射程,藍方便發動進攻。一番糾纏,“戰顱”憑借強大的計算性能,不僅能利用戰機的盲區進行規避,而且能抓住有利時機精準打擊,紅方戰機接連被擊落數架。首場交戰,“戰顱”就以770分的高分獲勝。

        這是第三屆全國兵棋推演大賽“人機挑戰賽”場景。大賽吸引了全國11名優秀人類挑戰者參與,他們與“戰顱”展開了22場激烈對決,最終,“戰顱”以22場全勝戰績贏得冠軍,也標志著我國走出了智能決策技術落地應用的重要一步。

        挑戰者王俊翔與“戰顱”交手后表示,“戰顱”的優點是數據分析和學習的能力強,能針對人類選手的操作,根據實時態勢改變應對策略,擅長精算、細算。

        實際上在開賽前,“戰顱”便已與48名選手對戰了36場,并保持全勝戰績。58場全勝,如此“神操作”,究竟是如何做到的?

        馮旸赫介紹說:“賽前,我們利用人與人對抗產生的優質數據和機器自打產生的大數據對‘戰顱’進行了充分訓練。截至參賽,‘戰顱’一共訓練了136天,每天自打160余場。”

        光鮮亮麗的背后,更多的是不為人知的付出。備戰比賽階段,團隊在實驗室安營扎寨,每天都工作到深夜。

        “從近一個月的參賽表現看,‘戰顱’不僅學會了一些人類選手的經典戰法,還獨創了特有的戰法戰術。”團隊負責人黃金才研究員表示,人工智能技術的應用提高了指控系統的自動化程度和打擊精度,是奪取未來戰場制高點的關鍵。

        升級版“戰顱二號”戰法更靈活

        與往屆全部使用行動指令、控制實體作戰的“人人對抗賽”“人機對抗賽”不同,第四屆全國兵棋推演大賽首次設置了“機—機”智能體博弈專項賽,比賽采用任務級兵棋推演平臺,作戰任務為海空聯合攻防。

        團隊派出了“戰顱”智能體的最新升級版本——“戰顱二號”。最終,“戰顱二號”以107分的高分排名第一,勇奪“機—機”智能博弈專項賽冠軍。

        “在交戰中,我感覺到‘戰顱二號’的戰法很靈活,每一步決策都精準到位,給人一種難以攻破、難以防守的感覺。”與“戰顱二號”交鋒的選手說。

        “‘戰顱二號’完成了聯合防空、對海攻擊以及空中作戰3個模塊的任務,通過模塊間的組織,‘戰顱二號’能夠面對不同的敵人選擇不同的打法,做到敵變我變。”馮旸赫表示,今年的比賽中,智能體不再是給飛機、艦船等實體下達“動作級”指令,指揮它們具體往哪個方向行動,而是憑借具有自主決策能力的智能化模型,讓實體完成如巡邏、偵察、開火等“任務級”指令。經此改進,實體具備了“主觀能動性”,能像人一樣根據戰場態勢機動靈活地執行智能體下達的命令,這不僅提高了輔助決策的效率,也有助于探索更加出其不意的戰法。

        對抗過程中,憑借戰法模塊間的任務調度、力量配置、任務觸發,“戰顱二號”一路高歌猛進,任憑對方智能體使出“繞后偷襲”“強力防守”“猛烈進攻”“誘騙導彈”等多種戰法,它都能精準研判態勢,快速形成決策,一一擊敗對手。

        走下賽場,團隊領軍專家劉忠表示,要繼續將數據、知識和機理很好地融合,將運籌規劃和知識推理、強化學習等人工智能技術相結合,探索智能博弈的新機理,推動智能規劃技術的研究落地,打造自主決策能力更強、學習能力更快、具有較強場景遷移能力的新一代智能體。(張 強)

        免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

        最新推薦