lr模型计算简单吗,lr分析方法

首页 > 影视动漫 > 作者:YD1662023-05-11 00:26:08

lr模型计算简单吗,lr分析方法(1)

来源:机器学习算法与自然语言处理

本文共6600字,建议阅读13分钟。

本文为你带来22道机器学习常见的面试问题和回答。

1、无监督和有监督算法的区别?

有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。

无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里,所有的标记(分类)是未知的。因此,训练样本的岐义性高。聚类就是典型的无监督学习。

2、SVM 的推导,特性?多分类怎么处理?

SVM是最大间隔分类器,几何间隔和样本的误分次数之间存在关系,

lr模型计算简单吗,lr分析方法(2)

,其中

lr模型计算简单吗,lr分析方法(3)

从线性可分情况下,原问题,特征转换后的dual问题,引入kernel(线性kernel,多项式,高斯),最后是soft margin。

线性:简单,速度快,但是需要线性可分。

多项式:比线性核拟合程度更强,知道具体的维度,但是高次容易出现数值不稳定,参数选择比较多。

高斯:拟合能力最强,但是要注意过拟合问题。不过只有一个参数需要调整。

多分类问题,一般将二分类推广到多分类的方式有三种,一对一,一对多,多对多。

一对一:将N个类别两两配对,产生N(N-1)/2个二分类任务,测试阶段新样本同时交给所有的分类器,最终结果通过投票产生。

一对多:每一次将一个例作为正例,其他的作为反例,训练N个分类器,测试时如果只有一个分类器预测为正类,则对应类别为最终结果,如果有多个,则一般选择置信度最大的。从分类器角度一对一更多,但是每一次都只用了2个类别,因此当类别数很多的时候一对一开销通常更小(只要训练复杂度高于O(N)即可得到此结果)。

多对多:若干各类作为正类,若干个类作为反类。注意正反类必须特殊的设计。

3、LR 的推导,特性?

LR的优点在于实现简单,并且计算量非常小,速度很快,存储资源低,缺点就是因为模型简单,对于复杂的情况下会出现欠拟合,并且只能处理2分类问题(可以通过一般的二元转换为多元或者用softmax回归)。

4、决策树的特性?

决策树基于树结构进行决策,与人类在面临问题的时候处理机制十分类似。其特点在于需要选择一个属性进行分支,在分支的过程中选择信息增益最大的属性,定义如下 

lr模型计算简单吗,lr分析方法(4)

首页 12345下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.