- 存档
- 2023
《学过、无学过、不用学、学一半》- 终章
在世界的一些地区,例如非洲及东南亚等,非法捕猎的情况颇为严重。根据有关统计,老虎的全球数目已经从1900年大跌95%,到现在只剩下约3000只左右。而从2003年起计,非法捕猎者更已杀死超过1,000名野生动物保护员。非法贩卖市场的规模,达到每年230亿美元。 利之所在,引诱愈来愈多人铤而走险。
幸好,有一班AI学者制作出一个名叫PAWS (Protection Assistant for Wildlife Security) 的系统。它在柬埔寨野生动物保护区试用的头一个月内,已成功找出1,000个非法捕兽器、42个电锯、24辆电单车和一辆大卡车。
PAWS的运作是这样的,输入的数据主要是环境数据、历史巡逻数据、以及过往盗猎的数据。系统首先输出的是一些包含概率的建议巡逻路线,然后系统会根据随机的巡逻策略,定出最终的建议路线。系统的内部运算模型包括盗猎者的行为模型、博弈论推理、路线规划等。
以上的人工智能组合是有其需要的。根据开发者所述,单纯用博弈论的模型来建构系统是不现实的。在一般的经济学以至博弈论中,都有一个基础的假设 - 人类都是理性的,即都会采取令他们获得最大预期得益的行动。但在处理反盗猎的问题时,开发者却发现盗猎者其实并不会进行精准的计算,他们认为某一个地点的预期收益最大,便会在该处设下陷阱来捕捉野兽。因此,开发者采用机器学习来做出盗猎者的行为模型,来补博弈论的不足。
另外,在巡逻人员进行巡逻任务时,他们也许会在树上发现一些文字或箭头符号等的标记,在地上或会看到非巡逻人员的脚印,甚至可能听到一些不寻常的声音。这些新增的信息都可能跟非法的行为有关。巡逻人员需要根据他们所观察到的情况,来作出不同的应变。这种连续地做决策以达致整体行动收益得到最大化的行为,跟强化学习的场景很相近。但是,不要忘记,巡逻人员的对手是会适应策略的。盗猎者们如果知道巡逻人员会按照脚印走,就可能会故意做出一些虚假的脚印,来迷惑巡逻人员,或者,盗猎者也可以把自己的脚印刷走,使巡逻人员难以追踪。 这样的话,就变成了双方博弈的一个场景。
本文以《学过、无学过、不用学、学一半》为题,肤浅地谈了一下不同种类的人工智能系统。它们其实没有优劣之分,只是当面对的问题不同时,我们人类便需要选取合适的人工智能工具,来帮助我们,令我们的生活更方便、更美好。
LSCM – David Chung