看看,在“星际争霸II”中,你的任务是控制数十个单独的单位,每个单位都有独特的技能,同时管理资源并与试图消灭你的对手作战。这是人类擅长的复杂任务,但机器可以挣扎。听起来有点熟悉吗?
(提示:这很像驾驶汽车。)
星际争霸II的人工智能正在发生的事情是谷歌的DeepMind系统正在使用一种称为基于人口的训练来模拟自然选择。该算法通过从最有效的单元开始,然后基于未来的适应性来缩短学习过程。
自动驾驶发展也是如此。DeepMind正在选择最有效的神经网络方面,并在新数据进入时需要重新训练或调整其程序时使用这些方面。
“在工业系统中进行机器学习的任何人面临的主要挑战之一就是能够重建系统以利用新代码,”Waymo机器学习基础设施主管Matthieu Devin在接受麻省理工学院技术评论采访时表示。 。“我们需要不断重新训练网络并重写我们的代码。当你重新训练时,你可能需要调整你的参数。”
谷歌已将其部分机器学习技术商业化,但它特别在其Waymo自动驾驶车辆上使用这种基于人口的培训模式,这已被许多人视为世界上最先进的自动驾驶汽车计划并且已经推动了数十亿甚至数十亿的模拟里程。