正如你可能知道的那样,机器学习研究计算机算法来学习如何做东西。例如,我们可能对学习完成一项任务或做出准确的预测或表现出明智的行为感兴趣。正在进行的学*是基于某种观察或数据,例如实例、直接经验或指导。所以,一般来说,机器学习是基于过去的经验,学习将来做得更好。
机器学习正在许多实际应用中用于各种目的。在这篇文章中,我们将看到机器学习的各种应用。
图像识别
机器学习最常见的用途之一就是图像识别。在很多情况下,你可以将对象分类为数字图像。对于数字图像,测量值描述图像中每个像素的输出。
在黑白图像的情况下,每个像素的强度都可以用作一次测量。因此,如果黑白图像具有N * N个像素,则总像素数和测量结果为N2。
在彩色图像中,每个像素都被认为提供三个主要颜色分量即RGB的强度的三个测量值。所以在N * N彩色图像中,有三个N2测量值。
人脸检测:类别可能是脸部存在与否的区别。在几个人的数据库中,每个人的数据库都可能都有一个单独的类别。
字符识别:我们可以将一段文字分割成较小的图像,每个图像包含一个字符。这些类别可能包含26个英文字母,10个数字和一些特殊字符。
语音识别
语音识别(SR)是口头文字翻译成文本的识别。它也被称为自动语音识别(ASR)、计算机语音识别或语音到文本(STT)。
在语音识别中,软件应用程序可识别口语词汇。本应用中的测量可能是一组表示语音信号的数字。我们可以将信号分割成包含不同单词或音素的部分。在每个段中,我们可以用不同时频段的强度或能量表示语音信号。
尽管信号表示的细节超出了本文的范围,但我们可以用一组实际值来表示信号。
语音识别应用包括语音用户界面。语音用户界面包括语音拨号、呼叫路由和domotic设备控制。它也可以用于简单的数据输入,准备结构化文档,语音到文本处理。
医疗诊断
ML提供的方法、技术和工具可以帮助解决各种医疗领域的诊断和预后问题。它被用于分析重要的临床参数及其预后组合,即预测疾病进展,提取用于研究的医学知识、治疗计划、支持和总体患者管理。
ML还被用于数据分析,例如通过适当处理不完善的数据来检测数据的规律性,解释重症监护病房中使用的连续数据以及智能报警,从而实现有效和高效的监测。
有人认为,ML方法的成功实施可以帮助将基于计算机的系统整合到医疗保健环境中,为促进和加强医学专家的工作提供机会,并最终提高医疗保健的效率和质量。
在医学诊断中,主要兴趣在于确定疾病的存在,然后准确识别。对于所考虑的每种疾病都有一个单独的类别,对于没有疾病存在的病例也有一个类别。这里,机器学习是通过分析患者的数据来提高医学诊断的准确性。
本应用中的测量结果通常是某些医学测试(如血压、体温、血液测试),医学诊断(如医学图像),各种症状的存在/不存在/强度以及患者的基本身体信息(年龄,性别,体重等)。根据这些测量结果,医生缩小了患者的疾病范围。
统计套利
在金融领域,统计套利指的是自动交易策略,这种策略通常是短期的,涉及大量证券。在这样的策略中,用户尝试为一组基于数量的证券(如历史关联和一般经济变量)实现交易算法。这些测量结果可以作为分类或估算问题,基本假设是价格将走向历史平均水平。
我们应用机器学习方法来获得指数套利策略。特别是,我们对交易所交易基金和股票流的价格采用线性回归和支持向量回归(SVR)。通过使用主成分分析(PCA)来降低特征空间的维度,我们观察到了好处并注意到了SVR应用中的问题。为了产生交易信号,我们将先前回归的残差模型化为均值回归过程。
在分类的情况下,类别可能会出售、购买或不被触及的每个安全。在估计的情况下,人们可能会尝试预测一段时间内每个证券的预期回报。在这种情况下,通常需要使用预期收益的估计来作出交易决策(买入、卖出等)
关联分析
关联分析是发展对产品之间各种关联的见解的过程。一个很好的例子就是,在与顾客的购买行为相关的分析中,看似不相关的产品可能揭示彼此之间的关联。
机器学习的这种应用涉及研究人们购买的产品之间的关联,也称为购物篮分析。如果买方购买X,他们是否会购买Y,因为它们之间的某种关系?了解这些关系可能有助于向客户推荐相关产品。为了客户购买它的可能性更高,它还可以帮助捆绑产品以获得更好的效果。
通过机器学习产品之间产生的关联被称为关联分析。一旦我们通过检查大量销售数据发现关联,大数据分析师就可以制定一条规则,以获得学习条件概率的概率测试。
分类
分类是将来自正在研究的人群中的每个个体分成许多类的过程。这被确定为独立变量。
分类有助于分析人员使用对象的度量来标识对象所属的类别。为了建立有效的规则,分析师使用数据。数据由许多具有正确分类的对象组成。
例如,在银行决定发放贷款之前,它会评估客户偿还贷款的能力。通过考虑客户的收入、年龄、储蓄和财务历史等因素,我们可以做到这一点。这些信息取自过去的贷款数据。因此,寻求者使用这些数据来建立客户属性和相关风险之间的关系。
预测
考虑银行计算贷款申请人违约偿还贷款的可能性的例子。为了计算故障的概率,系统首先需要对某些组中的可用数据进行分类。它由分析师规定的一套规则来描述。
一旦我们按照需要进行分类,我们就可以计算出概率。这些概率计算可以针对各种目的在所有扇区上进行计算
目前的预测是最热门的机器学习算法之一。我们举一个零售例子。此前,我们能够获得诸如上个月、年等销售报告的见解。这种类型的报告称为历史报告。但目前,企业更有兴趣了解下个月、年等的销售情况。这样,企业就可以按时做出所需的决策(涉及采购,库存等)。
萃取
信息提取(IE)是机器学习的另一个应用。它是从非结构化数据中提取结构化信息的过程。例如,网页、文章、博客、商业报告和电子邮件。关系数据库维护信息提取产生的输出。
提取过程将输入作为一组文档并生成结构化数据。此输出为摘要格式,例如Excel表格或关系数据库中的表格。
提取已成为大数据行业的关键。
正如我们所知道的那样,大量的数据一直在生成,而且大部分数据都是非结构化的。第一个关键挑战是处理非结构化数据。现在,将非结构化数据转换为基于某种模式的结构化表单,以便同样可以存储在RDBMS中。
除此之外,目前数据收集机制也在发生变化。以前,我们以批量方式收集数据,例如结束日期(EOD),但现在,企业需要的是实时获取的数据。
回归
我们也可以将机器学习应用于回归。
假设x = x1,x2,x3,... xn是输入变量,y是结果变量。在这种情况下,我们可以使用机器学习技术根据输入变量(x)生成输出(y)。你可以使用模型来表示各种参数之间的关系,如下所示:
Y = g(x)其中g是取决于模型特定特征的函数。
在回归中,我们可以使用机器学习的原理来优化参数,并减少近似误差,计算最接近的可能结果。
我们也可以使用机器学习来进行功能优化。选择改变输入以获得更好的模型。这提供了一个新的、改进的模型,这就是所谓的响应面设计。
结论
总之,这里列出的机器学习应用程序仅仅是改善我们生活的许多方法中的一部分,而随着人工智能的进步,机器学习也会有更多的落地!