平台一方面提供DNN、RNN、LSTM等深度学习算法节点,让用户可以和使用其他机器学习算法一样,快速构建深度学习模型,另一方面平台支持基于TensorFlow的深度学习集群框架,方便用户自由编写深度学习代码逻辑,实现更灵活的自主深度建模分析。
5) 模型性能提升利器之集成学习集成学习严格意义上来说,这不算是一种机器学习算法,而更像是一种优化手段或者策略,它通常是结合多个简单的机器学习算法,去做更可靠的决策。集成学习是一种能在各种机器学习任务上提高准确率的强有力技术,集成算法往往是很多数据竞赛关键的一步,能够很好地提升算法的性能。平台提供Bagging、Voting等集成学习框架节点,使模型准确性和泛化能力得到明显的提升。
6) “精细化、结构化”的文本分析目前,市场上的文本工具主要是以文本整体分析应用为主来设计功能,未从技术角度进行细致的功能划分,这样导致用户对于文本的分析过于主题化,用户在分析过程中无法过多的加入自己的构建思想,同时无法真正将文本挖掘技术与传统结构化数据挖掘技术融合在一起。本平台中的文本挖掘算法模块以“拖拽式操作、精细化节点设计、结构化自由文本为目标”的设计理念为指导,将文本挖掘的各技术功能点进行粗细划分,使得节点的功能更集中更明确,一方面兼顾使用的NLP技术的独立性,另一方面兼顾节点所具功能的全面性,同时将文本挖掘模块的最终产出是对应原始文本的结构化形式,这种结构化信息需要很好地涵盖原始文本的有用内容;同时,这种结构化的形式输出也方便与平台已有的其他建模分析节点串联复用。
7) 可扩展式的设计平台一方面内置Python、SQL、Matlab、Java、Scala、PySpark、R编程节点,方便用户实现个性化数据分析逻辑,另一方面通过提供自定义算法功能,用户可以将本企业所研究的成熟算法,通过该功能在平台上发布,形成固化的算法节点,供平台所有用户使用。