国产精选午睡沙发系列999,欧美三级成版人版在线观看,国产精品区一区第一页

作為人工智能的一個重要分支，認知體系的研究和應(yīng)用經(jīng)過了近40年的發(fā)展，已取得了可見的成果。前兩期內(nèi)容對認知體系的概念、感知和注意力進行了介紹，本期將繼續(xù)分享關(guān)于行動選擇和記憶的部分。

一般來說，行動選擇決定在什么時間要做些什么，被分為“做什么”（即做什么決策）和“怎樣做”（即動作如何控制）。例如，在MIDAS體系，行動選擇包含了目標任務(wù)和執(zhí)行這個選擇的動作或行動。同樣的，在MIDCA中，下一個動作通常是從一個被計劃好的序列中選擇出來的（如果這個序列存在的話）。因為在不同的認知體系中，行動選擇的方法是不同的。在接下來的討論中，行動選擇機制可應(yīng)用于決策和動作。

圖1行動選擇所涉及的機制

圖1顯示了所有被執(zhí)行的行動選擇機制，根據(jù)相關(guān)的體系類型（符號、混合、涌現(xiàn)）來組織。執(zhí)行行動選擇的主要兩種方式：計劃和動態(tài)。計劃是事先制定一系列的步驟以達到一個確定的目標。在動態(tài)的行動選擇中，一個最好的動作是從其他方案中被選擇出來的，基于當(dāng)時可獲得的知識。對于這個類別，我們考慮選擇的類別（贏者通吃、概率、預(yù)定義）和選擇的標準（相關(guān)性、效用、感情）。默認選項一直是基于給定的標準做出的最好的動作（有最高激活水平的動作）。

最后，學(xué)習(xí)也可以影響行動選擇，但會在第8節(jié)中討論。注意，這些行動選擇機制并不互相排斥并且大多數(shù)體系中有不止一種機制。盡管很少的體系會執(zhí)行同樣的行動選擇機制，可行的組合空間通常會很大。

圖1中可視化分為三列：符號、混合和涌現(xiàn)。注意，在這個圖中，排序順序強調(diào)具有相似動作的選擇機制（或分別為記憶和學(xué)習(xí)方法）的體系結(jié)構(gòu)簇。

1．1 計劃與反應(yīng)式動作

可以預(yù)見的是，計劃型行動選擇在符號范式體系中更加常見，但是也能在一些混合的甚至是涌現(xiàn)范式體系中被發(fā)現(xiàn)。尤其是在任務(wù)分解中，當(dāng)目標被遞歸地分解成子目標，任務(wù)分解是計劃動作的一種非常常見的形式。

其他被使用的計劃動作的類型有：暫時性的、連續(xù)性的、層級性任務(wù)網(wǎng)絡(luò)的、生成式的、基于搜索的、局部擇優(yōu)的等等。在我們的選擇中，很少有體系僅僅只依賴于計劃，例如OSCAR做邏輯推理和IMPRINT使用任務(wù)分解來模擬人類行動。除此之外，計劃型行動選擇經(jīng)常利用加強動態(tài)的行動選擇機制，來提升對變化的環(huán)境的適應(yīng)性。

1．2 動態(tài)行動選擇

動態(tài)行動選擇能提供更多靈活性，并且能被用來模擬人類和動物?！摆A者通吃”是神經(jīng)網(wǎng)絡(luò)中的一種選擇策略（最強的輸入被增強而其余的被抑制），它和它的變異體在各種新興體系中很常見。同樣的機制也被用來在所有體系中尋找最適合的動作，通常行動是多個并行過程的合作和競爭的結(jié)果。

行動選擇的預(yù)定義序（方式）可能服務(wù)于不同目的。比如，在Subsumption體系中，機器人行動被附屬行動等級所表示，高級行動優(yōu)先于（包含）低級行動的輸出。

在FORR中，做決策的部分根據(jù)遞增順序來從顧問中考慮選項，以達到與人類成員類似的學(xué)習(xí)。在YMIR中，優(yōu)先級首先被給與到反應(yīng)層中的過程中，然后是內(nèi)容層，再是過程控制層。這里，目的是提供一個平滑的實時行動生成。每層有一個不同的認知反應(yīng)時間上限，因此，反應(yīng)式模塊為用戶提供自動的反饋（變化的臉部表情、自動發(fā)聲），而審議性模塊生成更復(fù)雜的行動。剩余的行動選擇機制包含有限狀態(tài)機制，被經(jīng)常用來表示動作的順序甚至來編譯整個系統(tǒng)的行動，概率行動選擇也常見。

行動選擇標準

在選擇下一個動作時，有多個標準要被考慮到：相關(guān)性、效用和感情（包括動機、情感狀態(tài)、情緒、心情、積極性等）。

相關(guān)性反映出動作有多么契合現(xiàn)在的情況，這主要應(yīng)用于有符號范式推理的系統(tǒng)和在應(yīng)用前測試規(guī)則前／后的條件。動作的效用是測量為了達到現(xiàn)有目標的期望貢獻。一些體系也會執(zhí)行候選動作的“干運行（dry run）”，并觀察他們的效果來決定他們的效用。效用也會考慮到過去動作的表現(xiàn)并在將來通過強化學(xué)習(xí)來促進行動的成長。其他機器學(xué)習(xí)技術(shù)也可以被用來把過去的成功行動和目標做關(guān)聯(lián)。最后，內(nèi)部因素并不直接決定下一個行動，但是會使選擇存在偏差。

簡單來說，我們會考慮關(guān)聯(lián)到情緒、積極性和人類個性特征的短期、長期和終身因素?；谶@些因素對于人類的決策和其他認知能力的影響，在認知體系中模擬情緒和情感是重要的，特別在人機交互、社交機器人和虛擬代理的領(lǐng)域。

123下一頁>

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）