1新智元编译
背景
传统观点一般认为,深度神经网络通常比较擅长从高维数据中学习,例如图像或者语言,但这是建立在它们有大量标记的样本来训练的情况下。然而,人类却拥有单样本学习的能力——如果你找一个从来没有见过小铲刀的人,给他一张小铲刀的图片,他应该就能很高效的将它从其他厨房用具里面鉴别出来。
这是一种对人类来说很容易的任务,但是直到我们想写一个算法让它去做这件事……那就GG了 。很明显,机器学习系统很希望拥有这种快速从少量样本中去学习的能力,因为收集和标记数据是一个耗时费力的工作。而且,我认为这是通往通用人工智能的漫漫长路中很重要的一步。
最近涌现出来很多有趣的基于神经网络的单样本学习论文,它们已经得到了一些不错的结果。这是一个让我很激动的新领域,所以我想去对它做一个简要介绍,来让深度学习新手更好的认识它。
在这篇博客中,我想:
介绍并定义单样本学习问题
描述单样本分类问题的基准,并给出一个其性能的baseline
给出一个少样本学习的例子,并部分实现这篇论文中提到的模型
指出一些大家通常不会想到的小点子
定义问题:N类别单样本学习(One-shot Learning)
在我们解决任何问题之前,我们应该精准的定义出这个问题到底是什么,下面是单样本分类问题的符号化表示: 我们的模型只获得了很少的标记的训练样本S,它有N个样本,每个相同维度的向量有一个对应的标签y