图源: Zhang et. al
2019
2019年,另一支主要隶属于微软的团队尝试了不同的“两步走”方法。第一步是生成场景中对象所在位置的示意图,第二步是使用该示意图作为向导生成构成目标图片所需的对象。
图源: Li et. al
2020
去年年底,美国人工智能艾伦研究所发表了一项使用转换器模型的研究,与OpenAI使用的转换器模型相同。艾伦研究所的研究人员没有追求模型的规模,而是依赖于“隐蔽”。
在《麻省理工学院科技评论》上有一篇文章详细解释了这一概念,Karen Hao将“隐蔽”描述为“把不同的单词隐藏在句子中,让模型填补空白”。算法掌握这些直观性跳跃后,研究者发现生成的图像质量得到显著提升。
图源: Cho et al.
回溯过去这些研究案例,我们可以发现OpenAI的DALL-E确实是一项飞跃。从模糊不清的斑点开始,最先进的技术已发展到能够生成牛油果形状的椅子,OneZero专栏作家欧文·威廉姆斯表示他真的愿意购买这样的椅子。
这些进步足以让一代家具设计师、图库艺术家以及其他网络艺术家感到害怕。
留言点赞关注
我们一起分享AI学习与发展的干货
如转载,请后台留言,遵守转载规范