允中 发自 凹非寺
量子位 | 公众号 QbitAI
如何快速理解强化学习的概念?
驯只猫就行。
比如下面这位爷,巨皮。
整天就是跑酷、尿炕、抓沙发,搞到人头皮发麻、心态爆炸。
直到你忍不了了,决定对它进行残酷的猫德教育。方案是:
以后在家,每当它表现出一次守猫德的行为,就奖励一根猫条;
而每当它皮一次,你就立刻扑过去,咬它的头……
这样反复拉扯两个月之后,你的猫再也不敢皮了——
这个过程里发生的事情,就是“强化学习”:
一个智能体(你的猫)在与环境(有你的你家)互动的过程中,在奖励(猫条)和惩罚(咬头)机制的刺激下,逐渐学会了一套能够最大化自身收益的行为模式(安静,躺平)。
所以其实,养猫跟搞人工智能,道理是一样的。