Mason之前担任Bitly的首席数据科学家,后者是快速实验室的创始人兼首席执行官,Cloudera于2017年收购了Fast Forward Labs。尽管Fast Forward仍然作为Cloudera的一个部门存在并且正在做非常重要的工作,但梅森的角色使她成为AI的负责人。在Cloudera整体而言。由于几个原因,这是一个强大的地方。一个是Cloudera最近与Hortonworks的合并使其成为数据湖/Hadoop/Spark/ analytics领域无可争议的领导者。或许更重要的是,AI是公司的三大核心焦点之一(另外两个是Edge和Data Warehousing)。
执行意见
凭借这一权力席位以及她目前和以前的角色所带来的经验,梅森的大脑是最好的选择之一,以便了解应用AI的运作方式,作为商业努力。我最近有机会与梅森交谈并做到这一点。而我发现,虽然梅森对人工智能真的很乐观和兴奋,但她认为,作为一个行业,我们可以做得更好。
梅森说人们正在关注错误的事情。她坚信我们几乎专注于人工智能技术,因此,我们未能专注于人工智能实际可以提供给我们的东西。总的来说,梅森说我们需要关注“无聊”的商业问题,比如优惠券和反洗钱,而不是“冷静”的事情,比如与我们交谈的机器人。
两个阵营
更具体地说,梅森在该领域描述了一种有些令人震惊的隔离。
一方面,人工智能世界的研究人员正在进行突破性的创新工作,但往往处于学术界的真空中。研究人员通常不会与行业进行足够的合作,并且经常使用稳定的教学上常见的数据集,这些数据集并不总能很好地解决业务问题。因此,许多人工智能研究工作都被隐藏起来了。这剥夺了企业组织研究人员的创新进步,而且缺乏来自现实世界工业问题的各种数据也阻碍了研究人员可以取得的进步,即使在这个隐蔽的领域也是如此。
另一方面,工业也有其自身的问题。如此迷恋人工智能,企业组织通常采用先花费先计划的方法。并且,无法自行引导AI工作,他们也可能让初创公司为他们工作,其中许多并不是特别稳定或资金充足。这种组合导致了令人无法接受的高项目失败率,即使对于被认为是成功的项目,这些结果往往也没有达到潜力。
缩小差距
FastForward Lab(FF)的使命是帮助弥合这一学术 - 工业差距和各方的绩效不足。FF这样做的一种方式是担任顾问,为企业客户提供有关他们的数据是否具有足够的质量以向前发展并建立ML或深度学习模型的建议。如果数据确实提供了足够的完整性和功效,那么FF可以帮助将最先进的AI应用于学术界和工业界。FF还发布学术级别的报告,这些报告来自与研究人员的对话以及将研究人员的工作应用于真正的商业环境的原型的构建。
客户可以订阅这些报告并与FF合作,帮助他们建立数据科学组织。这包括帮助客户招募数据科学家人才,以及确定优先事项和举措。FF将通过可以展示快速结果和强大投资回报率的早期计划来指导客户,然后可以进行更复杂的工作,风险更高但潜在价值更高。FF甚至会为客户进行机器学习开发工作 - 但所有这些都着眼于帮助客户获得其内部数据科学小组 - 而不是在外包的基础上作为该小组。
AI对我们其他人?
对于那些无法参与FF的人来说,有哪些方法可以让AI更具可操作性?最近有很多关于自动机器学习(AutoML)作为“民主化”技术的讨论。当然,目前有很多数据科学平台可供各种公司使用,包括Cloudera。
梅森在哪些方面采用这些技术?首先,她预测AutoML将在几年内商品化。她认为它不是商业用户进行人工智能的工具,而是作为我们仍然需要技能的数据科学家的生产力工具。当然,梅森是一名数据科学家,在这一观点上可能有一些既得利益;AutoML可能对两个群体都有好处,也可能使开发人员受益。
梅森说,今天的工具面向技术数据科学家,而这还不够 - 因为数据工程师和管理员也需要成为这个方程式的一部分。她说,Cloudera的雄心壮志远远超过了目前的Data Science Workbench产品。因此,也许我们会看到Cloudera支持这些其他AI工作负载,也许商品化的AutoML技术也将受到影响。
船上有“无聊”
但有一点非常清楚:如果业界最重要的数据科学家之一认为我们必须冷静了人工智能技术,那么供应商和客户应该更多地关注其多产和谨慎的应用,而不是其光泽和声望。
尽管如此,早期创业公司通常很难做到这一点,因此世界上的Clouderas,Microsofts,Amazons和Google可能会让我们更进一步。