Facebook的新人工智能在较少人工帮助的情况下自学了视觉

大多数人工智能仍然建立在人类劳动的基础上。同伴在一个人工智能算法，你会发现一些用数据构建的东西这些数据是由一群人类工人精心策划和标记的。

现在,脸谱网展示了一些人工智能算法能学会用很少的人力帮助做有用的工作。该公司建立了一种算法，可以在几乎没有标签帮助的情况下学会识别图像中的物体。

Facebook的算法名为Seer(意为“自我监督”)，从超过10亿张图片中提取数据Instagram，决定哪些物体看起来相似。例如，有胡须、皮毛和尖耳朵的图像被收集到一堆。然后给出少量有标记的图像，包括一些有标记的“猫”。然后，它能够识别图像，以及使用数千个标记了每个物体的例子进行训练的算法。

“结果令人印象深刻，”他说奥尔加Russakovsky他是普林斯顿大学专攻人工智能和计算机视觉的助理教授。“让自我监督学习工作是非常具有挑战性的，在这一领域的突破对提高视觉识别具有重要的下游影响。”

Russakovsky说，值得注意的是，Instagram上的图片并不是为了让独立学习更容易而精心挑选的。

Facebook的首席科学家表示，Facebook的研究是人工智能方法“自我监督学习”的一个里程碑，Yann勒存．

勒存开创了机器学习这种方法被称为深度学习，包括向大型人工智能输入数据神经网络．大约在十年前，深度学习作为一种更好的方式出现，让机器做各种有用的事情，比如图像分类和语音识别。

但是LeCun说传统的方法，需要通过输入大量标记数据来“训练”算法，根本无法扩展。他说:“我提倡自我监督学习的整个理念已经有一段时间了。“从长远来看，人工智能的进步将来自那些整天看视频、像婴儿一样学习的程序。”

LeCun说，自我监督学习可以有很多有用的应用，例如学习阅读医学图像，而不需要标记那么多扫描和x光。他说，类似的方法已经被用于为Instagram图片自动生成标签。他还表示，Seer技术可以用于Facebook，将广告与帖子匹配，或帮助过滤不受欢迎的内容。

Facebook的研究建立在调整深度学习算法以使其更高效和有效的稳步进展的基础上。自我监督学习之前曾被用于将文本从一种语言翻译成另一种语言，但它在图像上的应用比在文字上的应用更困难。LeCun说，研究团队开发了一种新的方法，让算法学会识别图像，即使图像的一部分已经改变。

Facebook将公布Seer背后的一些技术，但不会公布算法本身，因为它是使用Instagram用户的数据进行训练的。

这是他说，这种方法“将使我们能够承担更有野心的视觉识别任务。”但奥利瓦说，像Seer这样的尖端人工智能算法，其庞大的规模和复杂性——可以拥有数十亿甚至数万亿的神经连接或参数——比性能相当的传统图像识别算法多得多——也带来了问题。这种算法需要巨大的计算能力，使可用的芯片供应紧张。

阿列克谢•埃弗他表示，Facebook的这篇论文很好地展示了一种方法，他认为这种方法对推进人工智能(让机器通过使用“海量数据”进行自我学习)很重要。他说，就像当今人工智能的大多数进展一样，它建立在Facebook的同一个团队以及学术界和工业界的其他研究小组取得的一系列其他进展的基础上。

这个故事最初出现在wired.com．

Facebook的新人工智能可以在较少的人工帮助下自学观察