- 存檔
- 2023
《學過、無學過、不用學、學一半》- 終章
在世界的一些地區,例如非洲及東南亞等,非法捕獵的情況頗為嚴重。根據有關統計,老虎的全球數目已經從1900年大跌95%,到現在只剩下約3000隻左右。而從2003年起計,非法捕獵者更已殺死超過1,000名野生動物保護員。非法販賣市場的規模,達到每年230億美元。利之所在,引誘愈來愈多人鋌而走險。
幸好,有一班AI學者製作出一個名叫PAWS (Protection Assistant for Wildlife Security) 的系統。它在柬埔寨野生動物保護區試用的頭一個月內,已成功找出1,000個非法捕獸器、42個電鋸、24輛電單車和一輛大卡車。
PAWS的運作是這樣的,輸入的數據主要是環境數據、歷史巡邏數據、以及過往盜獵的數據。系統首先輸出的是一些包含概率的建議巡邏路線,然後系統會根據隨機的巡邏策略,定出最終的建議路線。系統的內部運算模型包括盜獵者的行為模型、博弈論推理、路線規劃等。
以上的人工智能組合是有其需要的。根據開發者所述,單純用博弈論的模型來建構系統是不現實的。在一般的經濟學以至博弈論中,都有一個基礎的假設 - 人類都是理性的,即都會採取令他們獲得最大預期得益的行動。但在處理反盜獵的問題時,開發者卻發現盜獵者其實並不會進行精準的計算,他們認為某一個地點的預期收益最大,便會在該處設下陷阱來捕捉野獸。因此,開發者採用機器學習來做出盜獵者的行為模型,來補博弈論的不足。
另外,在巡邏人員進行巡邏任務時,他們也許會在樹上發現一些文字或箭頭符號等的標記,在地上或會看到非巡邏人員的腳印,甚至可能聽到一些不尋常的聲音。這些新增的資訊都可能跟非法的行為有關。巡邏人員需要根據他們所觀察到的情況,來作出不同的應變。這種連續地做決策以達致整體行動收益得到最大化的行為,跟強化學習的場景很相近。但是,不要忘記,巡邏人員的對手是會適應策略的。盜獵者們如果知道巡邏人員會按照腳印走,就可能會故意做出一些虛假的腳印,來迷惑巡邏人員,或者,盜獵者也可以把自己的腳印刷走,使巡邏人員難以追蹤。這樣的話,就變成了雙方博弈的一個場景。
本文以《學過、無學過、不用學、學一半》為題,膚淺地談了一下不同種類的人工智能系統。它們其實沒有優劣之分,只是當面對的問題不同時,我們人類便需要選取合適的人工智能工具,來幫助我們,令我們的生活更方便、更美好。
LSCM – David Chung