將決策權(quán)“外包”給AI靠譜么?

        《中國科學(xué)報》 2021-08-05 23:45:07

        很多時候,選擇或決策是困難的。人們不但會面臨諸多兩難選擇,還經(jīng)常受到情緒、偏好、認(rèn)知水平等因素的影響。同樣,精準(zhǔn)地預(yù)測人類的選擇也非易事。在人工智能(AI)和大數(shù)據(jù)相關(guān)技術(shù)日新月異的今天,將決策和預(yù)測決策結(jié)果“外包”給人工智能,也許是個不錯的選擇。

        ■記者 張雙虎

        從個人衣食住行到國際間邦交誓盟,選擇或決策無處不在。

        很多時候,選擇或決策是困難的。人們不但會面臨諸多兩難選擇,還經(jīng)常受到情緒、偏好、認(rèn)知水平等因素的影響。同樣,精準(zhǔn)地預(yù)測人類的選擇也非易事。在人工智能(AI)和大數(shù)據(jù)相關(guān)技術(shù)日新月異的今天,將決策和預(yù)測決策結(jié)果“外包”給人工智能,也許是個不錯的選擇。

        近日,上海大學(xué)悉尼工商學(xué)院(擬聘)副教授何黎勝和美國賓夕法尼亞大學(xué)Sudeep Bhatia合作發(fā)表在《科學(xué)》的文章,分析了深層神經(jīng)網(wǎng)絡(luò)模擬人類行為特征,在預(yù)測人類決策領(lǐng)域起到的重要作用。

        預(yù)測決策行為的瓶頸

        以20%的概率得到100美元,或以80%的概率得到50美元。如果面臨這樣的選擇,你會選擇哪個?

        1979年,諾貝爾經(jīng)濟(jì)學(xué)獎獲得者卡尼曼等人提出的前景理論(Prospect Theory)認(rèn)為,人們在面臨獲得時往往小心翼翼,不愿冒風(fēng)險;在失去時會很不甘心,更容易冒險。人們對損失的痛苦感要大大超過獲得時的快樂感。

        前景理論為人們理解決策者如何組織決策提供了模型,但用前景理論來模擬選擇行為并非沒有缺點(diǎn)。依據(jù)前景理論提出新理論的研究者通常會對諸如感知、注意力、記憶和情感等過程,以及干擾和選擇錯誤的原因做出復(fù)雜的假設(shè)。

        Sudeep Bhatia認(rèn)為,這些理論本身只在“小數(shù)據(jù)集”的選擇上進(jìn)行測試,很少與“大數(shù)據(jù)集”的已有模型進(jìn)行比較。考慮到?jīng)Q策研究的跨學(xué)科歷史和風(fēng)險選擇的復(fù)雜性,這是不可避免的:決策者很容易憑直覺對預(yù)期效用的偏差作出心理解釋。而且,很多新理論模型通常類似于先前發(fā)布的模型,許多理論在基準(zhǔn)數(shù)據(jù)集上高度模仿彼此的預(yù)測。

        “盡管新理論模型產(chǎn)生的速度正在加快,但在過去20年中,這些數(shù)據(jù)集的預(yù)測精度幾乎沒有提高。”何黎勝告訴《中國科學(xué)報》,“其根本原因是我們的認(rèn)知系統(tǒng)具有高度復(fù)雜性。”

        何黎勝解釋說,風(fēng)險決策看似簡單。如果問大學(xué)生或高中生如何做風(fēng)險決策,他們中的大多數(shù)人可能會說“我們先算出每個選項的期望價值,然后選擇期望價值最高的選項”。

        但風(fēng)險決策比這復(fù)雜得多,受到多種認(rèn)知和情感因素影響。以往研究者通過考慮這些影響因素,對風(fēng)險決策行為提出了多種理論解釋模型。

        “近20年來,這種‘小數(shù)據(jù)集+小模型’的研究范式遇到了瓶頸,主要表現(xiàn)為我們對決策行為的解釋越來越多,但對決策行為的預(yù)測能力并沒有顯著提升。”何黎勝說,“這很大程度上取決于常用的‘小數(shù)據(jù)集’和‘小模型’(與深度神經(jīng)網(wǎng)絡(luò)相比,常規(guī)的決策模型都是小模型)研究范式。小數(shù)據(jù)集不足以支撐像深度神經(jīng)網(wǎng)絡(luò)這樣的‘大模型’,而‘小模型’又不足以支撐決策過程中復(fù)雜的認(rèn)知與情感因素。”

        “大模型”顯身手

        “人工智能技術(shù)雖然發(fā)展迅速,但計算機(jī)不會有人類意義上的感情,短期內(nèi)也不可能產(chǎn)生人類特征的情緒。”天津大學(xué)自動化學(xué)院副教授楊正瓴對《中國科學(xué)報》說,“這也許會成為人工智能的優(yōu)勢,讓它在某些領(lǐng)域比人類做得更好。比如,利用‘大數(shù)據(jù)’的人工智能決策,的確可以幫助人類減少決策失誤。”

        近年來,不同學(xué)科之間的交叉研究提供了新的突破口,特別是行為決策、認(rèn)知科學(xué)和機(jī)器學(xué)習(xí)等領(lǐng)域的交叉。

        “總體而言,在‘小模型’范圍內(nèi),前景理論的預(yù)測精度是上佳的,是迄今為止預(yù)測精度最好的風(fēng)險決策模型之一。”何黎勝說,“如果我們把視野放到更廣闊的‘大模型’(例如深度神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法),前景理論等小模型的預(yù)測劣勢就顯現(xiàn)出來了。”

        不久前,美國學(xué)者喬舒亞·彼得森等人發(fā)表于《科學(xué)》的文章,系統(tǒng)地比較了“大模型”與“小模型”(如前景理論)對風(fēng)險決策行為的預(yù)測能力。結(jié)果發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的預(yù)測能力比前景理論高出幾個能級。研究者首先針對10000多個不同的選擇問題(涉及概率貨幣回報的賭博,超過了先前數(shù)據(jù)集的大小)和人類最終在這些問題中作出的決定,來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),發(fā)現(xiàn)這種網(wǎng)絡(luò)能夠以非常高的準(zhǔn)確率模擬人類決策,大大優(yōu)于現(xiàn)有的(人為)風(fēng)險選擇模型。

        “在我與南丹麥大學(xué)教授Pantelis Analytis和賓夕法尼亞大學(xué)教授Sudeep Bhatia共同完成的另一項研究中,通過群體智慧算法整合不同的認(rèn)知與情感因素,我們發(fā)現(xiàn)這樣的集成模型能顯著地提高對決策行為的預(yù)測能力。”何黎勝說,“這里的集成模型也是一種‘大模型’,它的預(yù)測精度也超過了前景理論。”

        前景理論提出至今,給后續(xù)研究帶來極大的啟發(fā),成為決策科學(xué)中的經(jīng)典研究。當(dāng)前,研究人員在此基礎(chǔ)上,利用人工智能和大數(shù)據(jù)算法,一方面不斷完善前景理論,另一方面通過新的技術(shù)方法不斷拓展決策理論的邊界,提高預(yù)測精度。

        實(shí)現(xiàn)決策智能化

        “經(jīng)過學(xué)習(xí)和訓(xùn)練,深度神經(jīng)網(wǎng)絡(luò)能夠模仿人類的行為,它甚至可以像人類在做選擇時會有不理性的行為那樣,表現(xiàn)出非理性。”Sudeep Bhatia告訴《中國科學(xué)報》,“因此,用它來預(yù)測人類決策行為會大大提高預(yù)測精度。”

        “人工智能、認(rèn)知神經(jīng)科學(xué)的發(fā)展,將為心理學(xué)、決策科學(xué)的發(fā)展提供有力的研究手段。”何黎勝說,“得益于學(xué)術(shù)界和工業(yè)界的大模型投入,近年來人工智能和認(rèn)知神經(jīng)科學(xué)發(fā)展迅速,涌現(xiàn)出大量的開創(chuàng)性研究,也為其他學(xué)科提供了成熟的研究工具。”

        何黎勝認(rèn)為,在決策研究中,研究人員會研究不同類型的決策,像風(fēng)險決策、跨期決策、社會決策、博弈決策等。目前,對這些不同決策類型的研究和建模工作通常相互獨(dú)立。然而,從認(rèn)知的角度,不同的決策類型必然有互聞共通的認(rèn)知與情感機(jī)制。“而不同決策類型之間互聞共通的建模研究還非常稀缺,未來完全有可能通過與人工智能、認(rèn)知神經(jīng)科學(xué)融合,實(shí)現(xiàn)不同決策類型的互聞建模。”

        “機(jī)器生成理論在決策和管理場景中有巨大的應(yīng)用潛力,其核心的變革在于管理自動化。這個轉(zhuǎn)變類似于計算視覺研究中的深度神經(jīng)網(wǎng)絡(luò)模型在醫(yī)學(xué)圖像處理中的應(yīng)用。”何黎勝說。

        目前,管理科學(xué)越來越趨向于數(shù)據(jù)驅(qū)動的決策。在工業(yè)界和公共政策等領(lǐng)域,越來越多的公司和組織實(shí)驗方法(如A/B 測試)獲得實(shí)證數(shù)據(jù),通過分析實(shí)證數(shù)據(jù)達(dá)到?jīng)Q策優(yōu)化的目的。然而,目前這種數(shù)據(jù)驅(qū)動的決策有不小的局限性。其中一個重要原因是管理者很多時候面臨的是一個復(fù)雜的動態(tài)系統(tǒng),是由多種因素交織而成的綜合體。但A/B測試等方法收集到的數(shù)據(jù)往往是針對某個特定的小點(diǎn),對復(fù)雜決策中多因素之間的交錯互動缺乏全局把握,限制了A/B測試實(shí)驗數(shù)據(jù)的適用性。

        “機(jī)器生成理論可以更大程度地利用A/B測試等方法收集到的數(shù)據(jù)。更為重要的是,機(jī)器生成理論足夠靈活,我們可以用真實(shí)的數(shù)據(jù)去訓(xùn)練這個系統(tǒng),讓它不斷地逼近真實(shí)的管理場景。”何黎勝說,“未來,訓(xùn)練好的機(jī)器生成理論模型可以自動地對復(fù)雜管理場景中的事件作出反應(yīng)。也就是說,機(jī)器生成理論有能力將分散的實(shí)驗數(shù)據(jù)升華成具有邏輯一致性的體系,實(shí)現(xiàn)復(fù)雜管理決策的自動化、智能化。”

        關(guān)鍵詞: 決策權(quán) 外包 AI

        免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

        最新推薦