栏目导航
您现在的位置:主页 > 工具 > » 信息列表工具

英伟达把PS软件GAN了 P图工具即将发布

发布日期:2021-12-06 11:35   来源:未知   阅读:

  只要你会上传图片、能画草图,就能够轻松P图。如此“魔性”的工具,难怪得到了网友热捧。

  而你要做的,只是上传一张图片,然后由程序生成一张语义分割草图,直接在草图上涂抹修改。

  和最近的GauGAN2一样,英伟达也为EditGAN开发了一个电脑软件:

  本文一作是来自多伦多大学的华人博士生凌欢,他同时在该校人工智能研究院(Vector Institute)和英伟达做研究。

  研究人员表示,EditGAN是第一个GAN驱动的图像编辑框架,它的主要特点是:

  1、提供非常高的精度编辑,2、只需要很少的注释训练数据,3、可以实时交互式运行,4、允许多个编辑的直接合成,5、适用于真正的嵌入式、GAN生成甚至域外图像。

  StyleGAN2的工作流程是:获取图像,将其编码到潜在空间,并使用生成器将这个编码子空间转换为另一个图像。

  但问题在于,这个空间是多维的,我们很难将其可视化,也很难确定该子空间的哪一部分负责重建图像中的哪个特征。

  通常,需要庞大的标注数据集,才能知道模型中潜在空间哪一部分控制哪些特征。

  而EditGAN仅通过对少数标记的数据集示例进行学习,就能将分割与图像相匹配,从而实现图像图像的编辑。

  更重要的是EditGAN不仅知道潜在空间对应控制那个部分,而且还将它们与草图对应起来。这样,我们就可以通过修改草图轻易地修改图像了。

  具体而言,就是将图像嵌入GAN的潜在空间,并根据分割编辑执行条件潜在代码优化。

  以上展示了EditGAN的训练过程:修改语义分割并优化共享的潜在代码,与编辑区域内的新分割,以及编辑区域外的RGB外观保持一致。相应的梯度通过共享生成器进行反向传播。

  为了摊销优化,作者在实现编辑的潜在空间中找到“编辑矢量”。该框架允许学习任意数量的编辑矢量,然后以实时的速率直接应用于其他图像。

  作者团队在英伟达内部GPU集群上使用V100执行底层 StyleGAN2、编码器和分割分支的训练以及嵌入和编辑的优化。

  该项目使用了大约14000个GPU 小时,其中大约3500个 GPU 小时用于最终实验,其余用于研究项目早期阶段的探索和测试。

  此前英伟达发布的Canvas就集成了GauGAN2等最新成果,可以用手绘草图生成精细的PS文件。

  有个好消息是,英伟达表示,将会代码和编辑工具软件即将推出。你是是不是迫不及待想尝试一把了?

中国储备粮管理集团有限公司,简称中储粮,是经国务院批准组建的涉及国家安全和国民经济命脉的国有大型重要骨干企业,是国家授权投资机构的试点单位,享受国务院确定的国有大中型重点联系企业的有关政策,在国家计划、财政中实行单列。