把「我的世界」马赛克变成逼真大片,英伟达又出黑科技 / 头条资讯

3年前 阅读 / 189 来源 / 原创 文 / 越读党订阅

子豪 发自 凹非寺量子位 报道 | 公众号 QbitAI 先来看一张海岛大片: 这可不是哪个摄影师的杰作,而是出自GANcraft之手。 原图是「我的世界」中一个马赛克画质的场景: 这下「我的世界」真的变成了,我的世界! GANcr...

子豪 发自 凹非寺
量子位 报道 | 公众号 QbitAI

先来看一张海岛大片:


这可不是哪个摄影师的杰作,而是出自GANcraft之手。

原图是「我的世界」中一个马赛克画质的场景:


这下「我的世界」真的变成了,我的世界!

GANcraft由英伟达和康奈尔大学合作完成,它是一个无监督3D神经渲染框架,可以将大型3D块状世界生成为逼真图像。


究竟有多逼真?和与其他模型对比来看。

以下是在两个场景中,分别使用MUNIT、GauGAN用到的SPADE、wc-vid2vid,以及NSVF-W(NSVF+NeRF-W)生成的效果。


再感受下GANcraft的效果:(色彩和画质有所压缩)


通过对比可以看到:

诸如MUNIT和SPADE这类im2im(图像到图像转换)方法,无法保持视角的一致性,这是因为模型不了解3D几何形状,而且每个帧是独立生成的。

wc-vid2vid产生了视图一致的视频,但是由于块状几何图形和训练测试域的误差累积,图像质量随着时间迅速下降。

NSVF-W也可以产生与视图一致的输出,但是看起来色彩暗淡,且缺少细节。

而GANcraft生成的图像,既保持了视图一致性,同时具有高质量。

这是怎么做到的?

GANcraft中神经渲染的使用保证了视图的一致性,而创新的模型架构和训练方案实现了空前的真实感。

具体而言,研究人员结合了3D体积渲染器和2D图像空间渲染器,使用Hybird体素条件神经渲染方法。


首先,定义一个以体素(即体积元素)为边界的神经辐射场,并且为块的每个角,分配一个可学习的特征向量;

再使用三线性插值法,在体素内的任意位置定义位置代码,把世界表示为一个连续的体积函数;并且每个块都被分配了一个语义标签,如泥土、草地或水。

然后,使用MLP隐式定义辐射场,将位置代码、语义标签和共享的样式代码作为输入,并生成点特征(类似于辐射)及其体积密度。

最后给定相机参数,通过渲染辐射场获得2D特征图,再利用CNN转换为图像。


虽然能够建立体素条件神经渲染模型,但是没有图像能用作ground truth,为此,研究人员采用了对抗训练方式。

但是「我的世界」不同于真实世界,其街区通常具有完全不同的标签分布,比如:场景完全被雪或水覆盖,或是多个生物群落出现在一个区域。

在随机采样时,使用互联网照片进行对抗训练,会生成脱离实际的结果:


因此研究人员生成Pseudo-ground truth,用来进行训练。

使用预训练的SPADE模型,通过2D语义分割蒙版,获得具有相同语义的Pseudo-ground truth图像。


这不仅减少了标签和图像分配的不匹配,而且还能用更强的损失,来进行更快、更稳定的训练。生成效果得到了显著改善:


此外,GANcraft还允许用户控制场景语义和输出风格:


其介绍页中提到:它将每个Minecraft玩家变成了3D艺术家!

并且,简化了复杂风景场景的3D建模过程,无需多年的专业知识。

参考链接:
[1]https://nvlabs.github.io/GANcraft/
[2]https://arxiv.org/abs/2104.07659
[3]https://news.ycombinator.com/item?id=26833972


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关阅读
#头条资讯

5月十款畅销新能源车型四成售价超30万

近日,乘联会发布了全国乘用车产销数据,5月新能源乘用车批发销量7.02万辆,同比下降25.8%,环比4月增长19.5%,新能源车市正在补贴退坡和疫情的双重影响下艰难恢复“元气”。与此同时,乘联会还公布了5月国内新能源车销量前十...

#头条资讯

卢伟冰:对友商关停芯片业务表示遗憾 小米坚定在芯片方面的投入

5月24日消息,今天小米2023年Q1财报公布,在财报沟通会上,小米总裁卢伟冰对友商(OPPO)关闭芯片业务表示了遗憾,同时向外界传递了小米在芯片业务方面坚定投入的决心。卢伟冰表示小米投资芯片的决心没有任何动摇。近期,OPP...

#头条资讯

保时捷中国销量稳步提升 电气化数字化转型深入

进入中国市场十多年来,保时捷的销量持续稳步攀升。数据显示,2019年保时捷中国销售8.68万辆新车,创下年度最高销量纪录,中国市场连续五年成为保时捷全球第一大市场。而今年上半年,即便受到疫情的影响,保时捷中国依然交出了...

#杂志目录

《世界中医药》杂志2020年10期最新目录订阅

目录中药研究丨基于网络药理学从系统层面探讨黄芩苷治疗肺纤维化的效应机制研究摘要 目的:基于网络药理学的方法,从系统层面探讨黄芩苷对肺纤维化的潜在作用机制。方法:通过NCBI pubchem、ZINC和TCMSP获取黄芩苷的化合物信息,在NC...

#杂志目录

《世界家苑》杂志2020年04期最新目录订阅

目录建筑前沿丨基于LEEDV4评价标准的绿色建筑模拟流程探究摘要:近几年来,我国绿色建筑发展迅猛。但有助于优化绿色建筑设计的能耗模拟分析,在当前设计中存在指导滞后的问题。因此,本文基于LEED V4整合设计的要求,结合绿色...

#杂志目录

《当代家庭教育》杂志2021年05期最新目录订阅

目录科研课题丨互联网思维在家庭教育中运用的现状、特点、原因及对策摘 要:在“互联网+”时代,将互联网思维引入家庭教育是我国教育发展的必然趋势。本文将简要阐述互联网思维在家庭教育中运用的现状、特点及原因,并探索...