现在,研究人员还将Make-A-Scene整合了一个超分辨率网络,就可以生成2048x2048、4倍分辨率的图像。
如下:
其实,与其他生成AI模型一样,Make-A-Scene通过对数百万个示例图像进行训练来学习视觉和文本之间的关系。
不可否认的是,训练数据中反映的偏差会影响这些模型的输出。
正如研究者所指出的那样,Make-A-Scene还有很多地方有待提高。
参考资料:
https://ai.facebook.com/blog/greater-creative-control-for-ai-image-generation/