Google Deep Dream 的工作原理

从远处看,Deep Dream 图像几乎正常,但当你走近时,你会发现所有的形状都由奇特的复合元素组成。
十万个为什么 员工上传的 Deep Dream 图像

地球上的数百万台计算机从不需要睡眠。但这并不能阻止它们做梦。当人类工作、娱乐和休息时,我们的机器却在不停地重新解读旧数据,甚至吐出各种新奇、古怪的材料,这部分要归功于 Google Deep Dream。

Deep Dream 是一款计算机程序,它能识别并修改数字图片中的模式。然后它会将这些经过大幅调整的图像呈现给人类观看。根据输入数据和 Google 员工设置的具体参数,结果可能从滑稽到艺术,再到噩梦般的效果不等。

广告

了解 Deep Dream 的最佳方式之一是亲自尝试。Google 将其“做梦”的计算机公开,以便更好地了解 Deep Dream 如何分类和索引某些类型的图片。你可以将任何喜欢的图像上传到 Google 的程序中,几秒钟后,你将看到基于你的照片生成的奇幻渲染图。

结果通常是一个奇特的混合数字图像,看起来就像萨尔瓦多·达利与耶罗尼米斯·博斯和文森特·梵高进行了一场疯狂的通宵绘画派对。树叶、岩石和山脉变形为色彩斑斓的漩涡、重复的矩形和优雅的高亮线条。

在原本空旷的风景中,Deep Dream 创造出宝塔、汽车、桥梁和人体部位。Deep Dream 还看到了动物……许多许多动物。上传一张汤姆·克鲁斯的肖像,Google 的程序会将褶皱和空间重塑为狗头、鱼和其他熟悉的生物。只不过这些动物看起来并不寻常——它们是奇幻的再创造,像是与沾染了迷幻剂的万花筒交织在一起。它们令人毛骨悚然,常常不止一点点吓人。

显然,Google 并没有每晚举办狂欢派对,也没有给它的计算机喂食致幻化学品。不知何故,该公司正在引导这些服务器分析图像,然后将它们以我们世界的新表现形式“反刍”出来。

这一切的运作方式揭示了我们构建数字设备的方式,以及这些机器如何消化我们这个科技痴迷世界中存在的难以想象的数据量。

广告

比特中的神经元

当应用 Deep Dream 算法时,那些可爱的度假照片变成了噩梦般的景象。
十万个为什么 员工上传的 Deep Dream 图像

计算机是无机产品,因此它们不太可能像人类一样做梦。然而,Deep Dream 是一个孤立的例子,它展示了当计算机程序与人类世界的数据结合时,它们会变得多么复杂。

Google 的软件开发人员最初构思并构建 Deep Dream,是为了参加ImageNet 大规模视觉识别挑战赛,这是一项始于 2010 年的年度竞赛。每年,数十个组织都会竞争,寻找最有效的方法来自动检测和分类数百万张图像。每次活动结束后,程序员都会重新评估他们的方法并努力改进其技术。

广告

图像识别是我们互联网工具箱中大部分缺失的关键组成部分。我们的搜索引擎主要针对理解输入的关键词和短语,而不是图像。这就是为什么你必须用“猫”、“房子”和“汤米”等关键词标记你的图片集的原因。计算机很难以任何可靠的准确性识别图像内容。视觉数据杂乱无章、陌生,所有这些都使得计算机难以理解。

多亏了 Deep Dream 这样的项目,我们的机器在识别周围视觉世界方面做得越来越好。为了使 Deep Dream 工作,Google 程序员创建了一个**人工神经网络**(ANN),这是一种可以自主学习的计算机系统。这些神经网络是仿照人脑的功能建模的,人脑使用超过 1000 亿个神经元(神经细胞)来传输神经冲动,从而实现我们所有的身体过程。

在神经网络中,人工神经元替代生物神经元,以多种方式反复过滤数据,直到系统得出某种结果。在 Deep Dream 的案例中,它通常有 10 到 30 层人工神经元,最终结果就是一幅图像。

Deep Dream 如何重新构想你的照片,将它们从熟悉的场景转换为可能让你在未来几年饱受噩梦困扰的计算机艺术渲染图?

广告

计算机大脑与自行车

你可以看到 Deep Dream 获取了一张甲虫的图像,并利用其关于类似生物的数据来重建原始照片的主体和背景。
十万个为什么 员工上传的 Deep Dream 图像

神经网络不会自动开始识别数据。它们实际上需要一些训练——需要输入数据集作为参考点。否则,它们只会盲目地筛选数据,无法理解其中任何意义。

根据 Google 官方博客,训练过程基于重复和分析。例如,如果你想训练一个 ANN 来识别自行车,你会向它展示数百万辆自行车。此外,你还需要——当然,用计算机代码——清晰地指定自行车的样子,有两轮、一个座位和车把。

广告

然后,研究人员让网络自由运行,看看它能找到什么结果。肯定会有错误。例如,程序可能会返回一系列包含摩托车和轻便摩托车的图像。在这种情况下,程序员可以调整代码,向计算机澄清自行车不包含发动机和排气系统。然后他们一遍又一遍地运行程序,微调软件,直到它返回令人满意的结果。

Deep Dream 团队意识到,一旦网络能够识别某些对象,它就可以自行重建这些对象。因此,一个能够识别自行车的网络,无需进一步输入即可再现自行车的图像。其理念是,该网络凭借其分类和排序图像的能力,正在生成富有创意的新图像。

有趣的是,即使筛选了数百万张自行车图片,计算机在生成自己的自行车图片时仍然会犯严重错误。它们可能会在车把上包含部分人手,或在踏板上包含脚。发生这种情况是因为许多测试图像也包含人,计算机最终无法辨别自行车的部件在哪里结束,人的部件在哪里开始。

这类错误发生的原因有很多,即使是软件工程师也未能完全理解他们所构建的神经网络的各个方面。但通过了解神经网络的工作原理,你就可以开始理解这些缺陷是如何发生的。

网络中的人工神经元堆叠运行。Deep Dream 可能使用少至 10 层,多至 30 层。每一层都会捕捉图像的各种细节。初始层可能会检测图片中的基本要素,如边界和边缘。另一层可能会识别特定的颜色和方向。其他层可能会寻找类似椅子或灯泡等物体的特定形状。最终层可能只会对更复杂的物体作出反应,例如汽车、树叶或建筑物。

Google 的开发人员将此过程称为**“初始主义”**(inceptionism),以指代这种特殊的神经网络架构。他们甚至发布了一个公共画廊来展示 Deep Dream 的作品示例。

一旦网络确定了图像的各个方面,就会发生许多事情。通过 Deep Dream,Google 决定指示网络创建新图像。

广告

边缘的黑暗

当 Deep Dream 创建自己的图像时,结果引人入胜,但并不完全真实。
Google Inc.,根据知识共享署名 4.0 国际许可协议使用。

Google 的工程师实际上让 Deep Dream 选择要识别图像的哪些部分。然后他们基本上告诉计算机,提取图像的这些方面并加以强调。如果 Deep Dream 在沙发上的织物图案中看到了狗的形状,它就会突出那只狗的细节。

每一层都为狗的形象增添更多细节,从毛发到眼睛再到鼻子。你沙发上原本无害的佩斯利花纹变成了一只完整的狗形,带着牙齿和眼睛。Deep Dream 在每次迭代创作中都会稍微放大一点,为图片增加越来越多的复杂性。想象一下狗中套狗,层层叠叠。

广告

当 Deep Dream 过度解读和过度强调图片中的每一个细节时,一个反馈循环就开始了。一片充满云朵的田园风光,会变成充满太空蝗虫、迷幻形状和彩虹色汽车的景象。还有狗。Deep Dream 的结果中狗的数量过多是有原因的。当开发人员选择用于训练此神经网络的数据库时,他们选择了一个包含 120 个狗子类别的数据库,所有这些都经过了专业分类。因此,当 Deep Dream 去寻找细节时,它就非常可能在它搜索的任何地方都看到小狗的脸和爪子。

Deep Dream 甚至不需要真实的图像来创建图片。如果你给它一张空白的白色图像或一张充满静态噪声的图像,它仍然会“看到”图像的一部分,并将其用作构建越来越奇怪图片的基石。

这是该程序试图从原本无形的数据中揭示意义和形式。这与整个项目背后的理念不谋而合——试图找到更好的方法来识别和理解散布在全球计算机上的图像内容。

那么,计算机真的能做梦吗?它们是否变得过于聪明,以至于对自己不利?或者 Deep Dream 只是我们想象技术处理数据方式的一种奇妙方式?

很难确切知道是什么在控制 Deep Dream 的输出。没有人明确指导软件完成预编程任务。它只是接受一些相当模糊的指令(一遍又一遍地寻找细节并加以强调),并在没有明显人为指导的情况下完成工作。

生成的图像是该工作的表现。也许这些表现形式是机器创作的艺术品。也许它是数字梦想的体现,由和电路诞生。也许它是一种人工智能的开端,将使我们的计算机对人类的依赖程度降低。

你可能会担心有感知能力的计算机崛起并掌控世界。但就目前而言,这类项目正直接造福于所有互联网用户。在短短几年内,图像识别技术取得了显著进步,帮助人们更快地筛选图像和图形,以找到所需的信息。按照目前的进步速度,你可以期待图像识别在不久的将来取得重大飞跃,这部分要归功于 Google 的“做梦”计算机。

广告

常见问题

什么是 DeepDream 项目?
DeepDream 是 Google 于 2015 年推出的一款人工智能软件,它使用卷积神经网络来增强图像中的模式。它通过向图像添加新层来实现这一点,这些新层随后由软件进行增强。这可以创建一些奇怪、超凡脱俗的图像,因为软件“看到”了实际不存在的东西。
DeepDream 生成器是免费的吗?
是的,DeepDream 生成器可免费使用。

更多信息

作者注:Google Deep Dream 的工作原理

计算机不会创作艺术。至少目前还不会。它们也不会做梦。这两个过程都是人类特有的,并深受个人文化、生理、心理、生活经验、地理以及更多因素的影响。计算机可能会吸收大量关于这些变量的数据,但它们不会像人类一样体验和处理它们。所以,如果你担心技术会使你的人类体验过时,现在还不用担心。你对世界的感知比计算机网络要深刻得多。

相关报道

更多精彩链接

  • Brownlee, John. "Why Google's Deep Dream A.I. Hallucinates in Dog Faces." FastCoDesign. July 23, 2015. (Aug. 22, 2015) http://www.fastcodesign.com/3048941/why-googles-deep-dream-ai-hallucinates-in-dog-faces
  • Bulkeley, Kelly. "Algorithms of Dreaming: Google and the 'Deep Dream' Project." Psychology Today. July 14, 2015. (Aug. 22, 2015) https://www.psychologytoday.com/blog/dreaming-in-the-digital-age/201507/algorithms-dreaming-google-and-the-deep-dream-project
  • Campbell-Dollaghan, Kelsey. "This Artist is Making Haunting Paintings with Google's Dream Robot." Gizmodo. July 9, 2015. (Aug. 22, 2015) http://gizmodo.com/this-human-artist-is-making-hauting-paintings-with-goog-1716597566
  • Chayka, Kyle. "Why Google's Deep Dream is Future Kitsch." Pacific Standard. July 10, 2015. (Aug. 22, 2015) http://www.psmag.com/nature-and-technology/googles-deep-dream-is-future-kitsch
  • Clark Estes, Adam. "Watch How Google's Artificial Brain Transforms Images in Real Time." Gizmodo. July 10, 2015. (Aug. 22, 2015) http://gizmodo.com/watch-how-googles-artificial-brain-transforms-images-in-1717058258
  • Culpan, Daniel. "These Google 'Deep Dream' Images Are Weirdly Mesmerizing." Wired. July 3, 2015. (Aug. 22, 2015) http://www.wired.co.uk/news/archive/2015-07/03/google-deep-dream
  • Gershgorn, Dave. "These Are What the Google Artificial Intelligence's Dreams Look Like." Popular Science. June 19, 2015. (Aug. 22, 2015) http://www.popsci.com/these-are-what-google-artificial-intelligences-dreams-look
  • Hern, Alex. "Yes, Androids Do Dream of Electric Sheep." The Guardian. June 18, 2015. (Aug. 22, 2015) http://www.theguardian.com/technology/2015/jun/18/google-image-recognition-neural-network-androids-dream-electric-sheep
  • Kay, Alexx. "Artificial Neural Networks." ComputerWorld. Feb. 12, 2001. (Aug. 22, 2015) http://www.computerworld.com/article/2591759/app-development/artificial-neural-networks.html
  • McCormick, Rich. "First Computers Recognized Our Faces, Now They Know What We're Doing." The Verge. July 17, 2015. (Aug. 22, 2015) http://www.theverge.com/2015/7/17/8985699/stanford-neural-networks-image-recognition-google-study
  • Melanson, Don. "Google's Deep Dream Weirdness Goes Mobile with Unofficial Dreamify App." TechTimes. Aug. 10, 2015. (Aug. 22, 2015) http://www.techtimes.com/articles/75574/20150810/googles-deep-dream-weirdness-goes-mobile-unofficial-dreamify-app.htm
  • Mordvintsev, Alexander et al. "Inceptionism: Going Deeper Into Neural Networks." Google Research Blog. June 17, 2015. (Aug. 22, 2015) http://googleresearch.blogspot.co.uk/2015/06/inceptionism-going-deeper-into-neural.html
  • Mordvintsev, Alexander and Mike Tyka. "DeepDream — A Code for Visualizing Neural Networks." Google Research Blog. July 1, 2015. (Aug. 22, 2015) http://googleresearch.blogspot.jp/2015/07/deepdream-code-example-for-visualizing.html
  • Rosenthal, Emerson. "Google's Deep Dream for Dummies." Vice. Aug. 3, 2015. (Aug. 22, 2015) http://www.vice.com/read/no-they-dream-of-puppy-slugs-0000703-v22n8
  • Sufrin, Jon. "Google's Deep Dream Images Are Eye-Popping, but Are They Art?" CBC. July 31, 2015. (Aug. 22, 2015) http://www.cbc.ca/beta/arts/google-s-deep-dream-images-are-eye-popping-but-are-they-art-1.3163150

广告

加载中...