计算机技术论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 1335|回复: 0

深度强化学习系统可自动学习和生成图像

[复制链接]
发表于 2021-4-10 22:09:12 | 显示全部楼层 |阅读模式
#111723#通过眼睛的天下不但仅是咱们角膜所反应的映像。比方,当咱们看建造物并观赏其计划的庞杂性时,咱们能够观赏它所需的工艺。这类通过发明它们的东西来说明物体的才能使咱们对天下有了愈加丰盛的懂得,而且是咱们获得信息的一个主要方面。
咱们盼望咱们的体系可能发明出一样丰盛的天下表示情势。比方,视察绘画的图象时,咱们盼望它会懂得用于绘画时的举措,而不但仅是在屏幕上表现它的像素。
在这项任务中,咱们为天然智能管家装备了与用来天生图象雷同的东西,并证实它们能够揣摸数字、人物和肖像的结构方法。相当主要的是,他们是本人进修怎样做到这一点,而不须要工资标签的数据集。这与之构成赫然对照近来的研讨(https://arxiv.org/pdf/1704.03477.pdf)依附于从工资标志(human demonstrations)中进修,那样可能会是愈加消耗时光。

credit:Shutterstock
咱们计划了一个与盘算机绘画顺序交互的深度强化进修体系(http://mypaint.org/),将笔触放在数书画布上并变动画笔巨细、压力巨细和色彩。未经练习的体系起首会绘制随便的笔划,但没有显明的构图。为了战胜这一点,咱们必需创立一种嘉奖机制,激励体系天生成心义的丹青。
为此,咱们练习了第二个神经收集,称为辨别器,其独一目标是猜测特定图形是由呆板制造的,仍是从实在照片的数据会合采样得来。绘画体系的嘉奖是通过“诈骗”辨别者以为它的绘画是实在的。换句话说,体系的嘉奖信号自身就是进修的。固然这与天生友好收集(GAN)中应用的方式相似,但它差别,由于GAN设置中的天生器平日是直接输出像素的神经收集。相反,咱们的体系通过编写图形顺序来与画图情况交互来天生图象。

在第一组试验中,体系接收了练习以天生相似于MNIST(http://yann.lecun.com/exdb/mnist/)数字的图象:它表现了数字的模样,但没有表现它们是怎样绘制的。通过实验天生用以诈骗辨别器的图象,智能体系学会了把持画笔并把持它以顺应差别数字的作风--可视化顺序分解技巧(https://en.wikipedia.org/wiki/Program_synthesis)。
咱们也练习它重现特定的图象。这里,辨别器的目标是肯定再现的图象能否是目的图象的正本,或许能否曾经由体系发生。辨别者的这类区分越艰苦,体系失掉的嘉奖(rewarded)就越多。
相当主要的是,这个框架是能够说明的,由于它发生了一系列把持摹拟画笔的举措。这象征着该模子能够将其在摹拟绘画顺序中学到的常识利用于其余相似情况中的人物重修,比方在摹拟(或许实在)的呆板人手臂上。这个视频能够在这里看到(https://youtu.be/XXM3PdIdLJQ)。

另有可能将这个框架扩大到现实的数据集上(real dataset)。经由练习能够绘制名流面部心情,体系可能捕获到面部的重要特点,比方外形、色彩和发型,就像陌头艺术家在应用无限数目的画笔刻画肖像时一样:

从原始感触中规复构造化表现是人类轻易具有并常常应用的才能。在这项任务中,咱们标明能够通过让人工体系取得咱们用来重现咱们四周天下的类似东西来指点天然体系发生相似的表现。在如许做时,他们学会制造可视化顺序,简练地表白引发视察的因果关联。
虽然咱们的任务仅代表了向机动的顺序综合化(synthesis)迈出的一小步,但咱们估计可能须要相似的技巧才干使存在相似人类认知、概括和相同才能的人工智能成为可能。
更多内容阅读推荐:冰箱倒着放了怎么办
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

无图版|手机版|计算机技术论坛 JSJBBS.CN @ 2008-2024 ( 鲁ICP备17021708号 )

技术支持 : 北京康盛新创科技有限责任公司

快速回复 返回顶部 返回列表