新颖启发式算法（启发式的正确算法） - 原点资讯

蚁群优化的例子——一种集体智能算法

算法类型：搜索/寻路

生物学启示：蚁群/鱼群/鸟群

用例:机器人，视频游戏AI，制造，路径规划。

蚁群优化和粒子群优化是符合“集体智慧”概念的两种最常见的算法。它们(作为一个包)一起工作，以产生更复杂的、紧急的行为，来解决问题。

蚁群优化（ACO）与粒子群优化（PSO）非常不同。两者以不同的方式实现紧急行为。ACO是利用信息素气味引导代理寻找最短的路径。开始初始化一个随机信息素，信息素将以一个特定的速率进行衰减，单一代理人遍历搜索空间，根据信息素的强弱做出选择。最强的信息素气味将成为最有名的的解决方案。

PSO更多的是整体的方向。一些单一的代理人被初始化后选择随机的方向。最每个时间段都需要决定是否改变方向。这一决定将基于最著名的解决方案的方向（称pbest/global best），即最近邻（本地最好）的方向，以及当前的旅行方向。旅行的新方向通常是所有这些价值观的“妥协”。

4、强化学习

新颖启发式算法,启发式的正确算法(5)

强化学习环境中的代理行为

算法类型：预测建模

生物启示：经典条件作用

用例：视频游戏，控制自动车辆，生产线软件，金融系统

基于基础心理学和经典条件反射，强化学习（RL）支持为代理人采取的有力行动提供积极的数字响应。强化学习的经典案例：Pavlov’s Dogs，当狗被喂食时，会自动分泌唾液。从本质上讲，如果一个RL代理采取了好的行为，就会得到一个数字奖励。所以代理将使用策略不断学习，以争取在每个步骤最大限度的获得奖励。

RL算法与其他机器学习技术(如神经网络)相结合是很常见的。这通常被称为深度强化学习。神经网络常被用来估量应当给予RL代理人的奖励。Deep Mind采用深度Q学习方法来解决更为普遍的问题，例如处理特别复杂的游戏如“星际争霸II”。

作为参考，Q学习是一种无模型的强化学习算法。它可用于求解有限马尔可夫决策过程的最优行为选择策略。在程序初始化时，每个动作值对的Q值由开发者定义，并在每一步中由RL算法更新。下图是更新Q动作值对的示例。

新颖启发式算法,启发式的正确算法(6)

5、人工免疫系统

新颖启发式算法,启发式的正确算法(7)

人工免疫系统的组成部分

算法类型：预测建模

生物学启发：免疫系统

用例：安全软件，自主导航系统，调度系统，故障检测软件

免疫系统是一种通过产生免疫反应来保护机体免受物质和病原体侵害的系统。人工免疫系统(AIS)是自适应系统，受理论免疫学的启发并用于解决问题的免疫功能。AIS系统是一个与机器学习和人工智能有关联的，由生物启发的计算和自然计算的子领域。有多种算法与AIS相关：

·克隆选择

·树突细胞

·否定选择

·人工免疫识别

与生物免疫系统一样，AIS能够将系统内的所有细胞分类为“自体”和“非自体”细胞。参与免疫的两种最重要的细胞类型为B细胞和T细胞（白细胞）。T细胞分为三类，一种是激活B细胞，一种是结合并破坏入侵者，还有一种是抑制自身免疫问题。而B细胞负责产生能够与抗原结合成特定蛋白质的抗体。人工免疫系统能够监视入侵检测，所以被用来防御网络攻击，并经常集成到企业级的软件中。

本文由阿里云云栖社区组织翻译。

文章原标题《5 Ways mother nature inspires artificial intelligence》

作者：Luke JamesFollow

译者：奥特曼，审校：袁虎。