鱼羊 编译整理
量子位 报道 | 公众号 QbitAI
这年头不学点AI知识,可能都不好意思说自己是新时代的接班人了。
人工智能风头正盛,无论你是支持还是怀疑,AI对这个时代的影响都已逐渐渗透到各行各业当中,哪怕身处非互联网行业,也能感受到AI的滚滚浪潮。
学习已成刚需,不过对于初学者而言,要正正经经上手机器学习,如何入门就有点让人头大了。
好在计算机领域向来有和谐互助之风,德国程序猿Michiel Mulders近日就精心炮制了一份机器学习入门新手指南。一起来看看AI大法该当如何修炼吧。
入门指南欲练此功,首先要知道,纸上谈兵是本门大忌。
吴恩达就曾经说到,想要入门机器学习,应该进行一些项目实践。
所以入门第一步,从选择一个数据集开始:
- 找到一个大小合宜,并且相对容易分析的数据集。UCL ML Repository和Kaggle盛产此物。
- 对数据集进行试验。挑几个顶级的机器学习算法跑一跑这些数据,看看数据的表现,了解一下每种算法的性能。
- 挑选表现最佳的算法,调教它。
这就完事了?no,no,no,本份指南还贴心奉上五佳项目,任君挑选。
↓↓↓↓↓↓
TOP 5项目:监督式机器学习
数据集:鸢尾花数据集
鸢尾花数据集堪称机器学习领域的“Hello World”。对数据一无所知?那么选择它就对了。
这个数据集的好处是足够小,仅仅只有150行,并且它只有四个属性:花瓣长度,花瓣宽度,萼片长度和萼片宽度。
通过判别四个已知属性,四种不同类型的鸢尾花在数据集中被标记出来,所以你可以拿它来学学监督式机器学习。
这里建议使用多元分类训练方法。
另外,记得给自己设立一个小目标:根据花瓣和萼片的大小对三种花进行分类。