首先突出显示的功能是一些附加功能,使团队可以密切关注其模型的运行情况。集成了新的监视服务,据说可以同时解决功能和技术方面的问题。
它可以帮助测量诸如模型漂移,等待时间和预测准确性之类的东西,然后可以通过专用UI对其进行可视化。但是,由于各个公司的设置和监视目标不同,因此Cloudera还提供了Python SDK,用于编写用于跟踪和分析的自定义代码。
CML被广告宣传为Cloudera Data Platform的机器学习服务,Cloudera Data Platform是Hortonworks-Cloudera合并于2019年初完成的产品,因此该工具现在可以利用该平台的共享数据体验了。SDX的创建是为了在不同环境中实施统一策略。现在完成的对CML的扩展意味着CDP上设置的安全和治理规则也可以用于模型部署,这对于生产环境而言是个好兆头。
广告
如果这听起来不够有趣,那么该公司还表示已经扩展了数据治理和元数据框架Apache Atlas(该平台的一部分),以包括模型元数据。这可能证明对调试和解释模型很有用,因为这些信息可以说明如何构建模型,包括使用了哪些数据。由于基本的可解释性是在各种行业(例如金融或医学)中使用机器学习的先决条件,因此越来越喜欢这种功能。
ML服务的此迭代中的其他修改包括一些内部重组,旨在改善已部署模型对Kubernetes集群的可用性以及对模型进行分类的方法。
可以在Cloudera博客上找到一个演示新功能的分步示例。CML按小时收费,每个实例每小时0.68美元,并且可在CDP上用于Azure和AWS。