预测进化:选择团队
创建训练数据需要人员、流程和工具的战略组合。要解决收集、清理和标记数据的模糊性,你需要一个高效的技术人员团队,其中包括熟练的技术人员和先进的技术。
许多组织无法管理或扩展内部团队来准备训练数据,因此他们寻求利用人类智能的替代方法。众包劳动力是一种常见选择,它使你可以在短时间内找到数百名匿名工人。
然而,匿名众包带来了隐性成本,包括与员工的沟通不畅,这可能导致工作质量低下。而且,如果在开发初期训练数据集时这些缺点很明显,那么当你尝试重新训练和更新模型时,这些缺点将让人特别沮丧。
在一群匿名的众包工人的情况下,几乎不可能进行监督或转移机构记忆。每次开发新的训练数据时,都有发现新的不一致和性能问题的风险。
或许你也可以选择另一种方式,将这个问题外包给靠谱的、专业解决这种问题的企业,会更有保障。
如果有不清楚的地方或其他意见,欢迎评论告诉我们。
原文:
https://hackernoon.com/how-to-keep-your-machine-learning-models-up-to-date-vd5z3yzw
【end】
有奖征文
如何用Jupyter Notebook制作新冠病毒疫情追踪器?
万人马拉松赛事,人脸识别系统如何快速、准确完成校验?
突破性能极限,阿里云神龙最新ASPLOS论文解读
DevOps 转型时如何安全融入?对企业产出有何影响?2019年 DevOps 最新现状研究报告解读
百万人学AI:CSDN重磅共建人工智能技术新生态
漫画:如何给女朋友解释什么是熔断?
你点的每个“在看”,我都认真当成了AI