聪明的助手会在视觉上战斗
人工智能需要用于学习和处理的数据,随着我们越来越接近更像“人类”的人工智能,它将越来越需要视觉数据。LDV Capital的Evan Nisselson说:“这是所有主要公司都在争夺拥有我们活动视觉数据的原因之一。” “要做到这一点,他们需要拥有相机。”亚马逊最近为其Alexa驱动的Echo添加了一个相机,谷歌(Lens)和Facebook最近发布了新的增强现实公告。
仅光学就足以指导自动驾驶汽车
我们看到关于自动驾驶汽车是否需要LiDAR或仅仅依赖于光学解决方案的争论。例如,特斯拉首席执行官埃隆·马斯克(Elon Musk)并不认为LiDAR是一种庞大而昂贵的设备,它使用激光实时地映射其环境,这对于全自动驾驶来说是必要的。Wheras Humatics首席技术官Gregory Charvat在发泄时表示,汽车“需要的不仅仅是光学传感器平台[相机],他们还需要比差分GPS更精确的LiDAR,雷达和高精度无线电导航。”
LiDAR和雷达通过范围和角度精确定位周围环境中的实际物体,而基于深度学习的相机解决方案需要通过算法运行图像,并且最终仍然是预测。然而,光学解决方案更能真正识别出什么东西 - 例如,行人与一堆看起来像圣诞树的像素,正如Auto X创始人兼首席执行官Jianxiong Xiao在他的公司令人印象深刻和低成本的自我演示中所展示的那样只使用相机的驱动解决方案。
除了技术优点和缺点,汽车公司通常提前五年工作,因此现在需要购买必要的硬件才能达到2021年的最后期限。目前,LiDAR和更先进的雷达形式仍然很昂贵(前者认为80,000美元便宜)而且体积庞大。同时,以融合方式操作所有这些光学和传感器技术需要足够小的超级计算机以适应汽车。
3.愿景可以比机器学习更好地教授机器
LDV的一些演示提醒我们,机器不只是通过神经网络和机器学习来学习。他们还可以通过其他方式来识别和分析周围的世界。谷歌研究科学家Tali Dekel演示了一种技术,该技术利用计算机视觉来识别然后扩大屋顶上直线的偏差或者水果上紫色的微妙存在,例如,确定旧房屋中是否存在结构问题或哪些西红柿比其他人更加成熟。这似乎很简单,但它是计算机视觉比人类更好的东西。
机器视觉可以帮助进行医疗诊断
当病理学家平均每天有500张幻灯片,每张幻灯片包含数十万个需要分析的单个细胞,例如癌症的存在时,很容易错过诊断。PathAI联合创始人兼首席执行官安德鲁贝克说:“对于人类而言,这是一项不可能完成的任务,因为我们无法仔细查看每一个细胞。” “我们认为计算机每次都能很好地获得完美的诊断。”
根据美国医学会的一项研究,只有不到一半的病理学家同意正确的诊断。Beck引用另一项针对乳腺癌淋巴结活检的研究,显示了计算机与人类病理学家发现的热点之间的差异; 前者强调了许多其他可能含有癌细胞的区域。“我们为病理学家提供了原始图像,因此他们仍然在查看他们习惯使用的数据,以及学习系统处理的图像,这些图像基本上可以识别癌症的区域,使医生能够专注于在那些地区,“贝克说。乳腺癌研究发现,如果没有AI,这种活检的准确率仅为85%。使用AI辅助解决方案,错误率急剧下降到0.5%。
计算机视觉领域越来越容易进入
更好的相机,传感器和深度学习软件库(如Google TensorFlow)的商品化大大扩展了对计算机视觉的访问,我们看到许多新的创业公司因此而出现。在Vision Summit的两次创业竞赛中,我们看到了从Google街景图像中生成人口统计数据的技术到评估损坏的应用程序以及计算刚刚发生事故的汽车维修成本的所有内容 - 仅此而已图片。
“出现的是计算机视觉和机器学习这么多部分令人难以置信的商品化,过去需要博士团队才能在基础设施方面发展,”康奈尔科技教授和峰会组织者Serge Belongie说,“但现在个别黑客可能会这样做或小型创业团队的开发人员将这类功能带到任何类型的产品上。“
即便如此,商品化仍然不是100%即插即用。联合广场风险投资公司(Union Square Ventures)执行合伙人艾伯特•温格(Albert Wenger)告诉我,“这是其中一条很容易获得80%的曲线,然后非常难以完成其余工作。”
因此,仍有许多工作要做,对于有兴趣帮助构建下一个大型视觉技术的人来说这是一件好事 - 无论是商业,健康还是娱乐。