艺考网
全国站

CMU和Petuum联合提出contrastGAN:实现生成式语义处理

xunaa
2025-05-04 14:12:18
编辑说
机器之心合集
参加者:史密斯
论文:https://arxiv.org/abs/1708.00315
生成对抗网络(GAN)最近在配对/不配对图像到图像的转换方面取得了重大进展,例如照片 简笔画和艺术绘画风格转

机器之心合集

参加者:史密斯

论文:https://arxiv.org/abs/1708.00315

生成对抗网络(GAN)最近在配对/不配对图像到图像的转换方面取得了重大进展,例如照片 简笔画和艺术绘画风格转换。然而,现有模型只能传递低级信息(例如颜色或纹理变化),而无法编译目标对象的高级语义(例如几何结构或内容)。

另一方面,虽然研究人员可以在给定一类标签或注释的情况下合成真实的图像,但他们无法处理任意图形或结构,这极大地限制了他们的应用场景和模型结果的解释。解释能力。

在本文中,我们关注一个更具挑战性的语义处理任务,即修改对象的语义,同时保持图像的独特特征(例如透视和形状),例如牛羊,摩托车自行车,猫 狗。为了处理如此大的语义转换,我们引入了具有新颖的对抗性对比目标的对比GAN(contrast-GAN)。

与之前直接使合成样本近似目标数据的GAN 不同,我们的对抗性比较目标是优化样本之间的距离比较,使得处理后的数据在语义上比输入数据更接近目标。类别的真实数据。我们提出了一种带有新的比较目标的掩模条件对比度-GAN(mask-conditionalcontrast-GAN)结构,它可以使用目标语义变换来分离图像背景。

在ImageNet 和MSCOCO 数据集上的几个语义处理任务的相关实验表明,我们的对比GAN 的表现明显优于其他条件GAN。定量结果进一步说明了我们的模型在生成具有高视觉保真度和合理目标语义的可操作结果方面的优势。

在本文中,我们在没有任何配对训练示例的情况下进一步进行图像语义处理。它不仅通过处理高级目标语义来概括图像到图像的翻译工作,而且通过保留尽可能多的原始图像传达的内部特征来推进可控图像合成的相关研究。

图1 显示了我们模型的语义处理结果的一些示例。可以看出,与输入图像相比,我们的模型在形状、几何或纹理上只有很少的变化,并且成功地改变了目标对象的语义特征,例如猫狗。

通过对比GAN 进行语义处理

如图2 所示,我们的对比GAN 学习一个条件生成器G,该生成器将所需语义cy 和输入图像x 作为输入,然后对x 进行操作以使其进入y'。语义感知的对抗性判别器Dcy 被设计为判别y Y 的图像,并且结果y'=G(x, cy)。我们新颖的对抗性对比损失迫使生成的结果y' 的表示比输入图像x 的相应表示更接近目标区域Y 中的那些图像{y}。

CMU和Petuum联合提出contrastGAN:实现生成式语义处理

图2:对比GAN 概述。 cy和cx分别表示X和Y区域的对象类别(语义)。 Gcy将样本平移到Y区域,Dcy区分处理结果y'和真实结果y,Gcx和Dcx也是如此。 (a) 显示了原始的CycleGAN,它使用循环一致性损失针对每对单独的生成器和鉴别器进行了优化。 (b) 显示了对比GAN 的工作流程,优化了条件生成器G 和几个语义认知鉴别器D1、D2.DC,其中C是目标对象类别的总数。我们在GAN 中引入对抗性对比损失,以促使样本y' 生成的特征fy' 比输入x 的特征更接近目标区域Y 的特征中心¯fy。

Mask-conditional Contrast-GAN (Mask-conditional Contrast-GAN)

图3 显示了模型的草图,该模型以输入图像x、目标对象掩模M 和目标类别cy 开始,并输出处理后的图像。请注意,整个结构对于反向传播来说是完全微分的。为了更清楚起见,图3 中省略了全周期架构(例如,通过G(y, cx) 映射y' x^)。

图3:用于语义处理的掩模条件对比度GAN(掩模条件对比度-GAN),它将输入图像、目标对象掩模和目标类别作为输入。

图4:在给定目标掩码的MSCOCO 数据集上,马斑马和斑马马翻译的掩码比较GAN 和CycleGAN 的结果比较。它演示了集成目标对象掩模来解耦图像背景和目标语义的效果。其中,和控制目标对象的相对重要性。 G 试图最小化这个目标,而一组判别器{Dcy} 则试图最大化它。大量的实验表明,每个目标对象对于实现高质量的处理结果都发挥着重要作用。

实验结果对比:

表1:Cityscapes 注释图像数据集上的FCN 分数比较。

表2:Cityscapes 图像注释数据集的分类性能比较。

图5:ImageNet 上对比GAN 和CycleGAN 的橙色苹果(第一行)和苹果橙色(第二行)翻译结果的比较。

图6:给定目标掩码的MSCOCO 数据集上狗猫和猫狗翻译的掩码比较GAN 和CycleGAN 的结果比较。

表3:MSCOCO 数据集上8 个掩模条件语义处理任务的AMT 感知测试结果比较。

用户评论

墨染年华

CMU和Petuum联合研发的新模型确实厉害呀!直接在生成的语境中对目标进行学习,希望效果特别好!

    有5位网友表示赞同!

最迷人的危险

对比学习和生成对抗网络的结合,真是太期待了!能更准确地完成语义处理!

    有10位网友表示赞同!

君临臣

contrastGAN这个名字听起来就很酷炫~ 希望能够真正实现生成式语义处理。

    有12位网友表示赞同!

暮染轻纱

CMU 和Petuum 的实力不容小觑!他们的研究成果总是走在前沿!

    有6位网友表示赞同!

轨迹!

太期待了!希望能应用到各个领域,比如机器翻译、文本摘要等等!

    有20位网友表示赞同!

ok绷遮不住我颓废的伤あ

希望能够在少样本学习中有所突破!

    有13位网友表示赞同!

古巷青灯

生成式语义处理一直是人工智能的一个重要挑战!对比GAN 或许能给我们带来惊喜!

    有13位网友表示赞同!

命该如此

CMU做得好!

    有12位网友表示赞同!

景忧丶枫涩帘淞幕雨

这技术太强大了!

    有14位网友表示赞同!

|赤;焰﹏゛

对模型训练的数据集要求很高吧?

    有13位网友表示赞同!

青瓷清茶倾城歌

生成式语义处理能进一步提高人工智能的智能水平。

    有5位网友表示赞同!

将妓就计

这个技术很有潜力,可以应用到很多领域!

    有9位网友表示赞同!

浮殇年华

对比学习和对比GAN 结合起来的效果应该非常出色!

    有19位网友表示赞同!

你tm的滚

未来语言模型的进化方向可能就是生成式语义处理啦!

    有18位网友表示赞同!

夏日倾情

期待看到 contrastGAN 在真实世界中的应用!

    有20位网友表示赞同!

月下独酌

这论文一定要看一看!

    有18位网友表示赞同!

执拗旧人

对比学习能够让模型更深入地理解文本语义。

    有6位网友表示赞同!

▼遗忘那段似水年华

CMU和Petuum 再次突破!

    有17位网友表示赞同!

墨城烟柳

新技术开发永远让人兴奋!

    有8位网友表示赞同!

免责声明
本站所有收录的学校、专业及发布的图片、内容,均收集整理自互联网,仅用于信息展示,不作为择校或选择专业的建议,若有侵权请联系删除!

大家都在看

CMU和Petuum联合提出contrastGAN:实现生成式语义处理

CMU和Petuum联合提出contrastGAN:实现生成式语义处理

机器之心合集 参加者:史密斯 论文:https://arxiv.org/abs/1708.00315 生成对抗网络(GAN)最近在配对/不配对图像到图像的转换方面取得了重大进展,例如照片 简笔画和艺术绘画风格转
2025-05-04
云南省临沧市某学校简介、优势、学费、专业及招生简章全解析

云南省临沧市某学校简介、优势、学费、专业及招生简章全解析

临沧市桑嘎艺术学校摘要:本文介绍了临沧市桑嘎艺术学校的简介、优势、学费、专业以及招生简章等信息。临沧市桑嘎艺术学校是一所致力于培养优秀艺术人才的学校
2025-05-04
死而后已的意思 关于‘而’在古文中表承接的连词用法及示例解析

死而后已的意思 关于‘而’在古文中表承接的连词用法及示例解析

论语十则中死而后已的"而"是什么意思?死而后已,不亦远乎?" 而:表承接,是连词,无具体意义,以下供参考连词。 ⒈表示并列关系
2025-05-04
乙醇化学式是什么?结构、性质及相关介绍全解析

乙醇化学式是什么?结构、性质及相关介绍全解析

乙醇是什么?乙醇是一种有机化合物,一般我们也把它叫做酒精。乙醇的用途非常广,除了能够制作饮料、燃料之外,还能作为医疗用品使用。医用乙醇可以根据不同的浓度进行区分
2025-05-04
云南临沧优势明显但高校资源匮乏,仅一所滇西科技师范学院

云南临沧优势明显但高校资源匮乏,仅一所滇西科技师范学院

临沧地处云南省西南部,市辖区面积2.36万平方公里,下辖1区4县和3个民族自治县,2003年临沧地区正式升级为地级市,是傣族文化的发祥地之一。该市的水资源丰富
2025-05-04
乙醇是什么?了解乙醇的化学式、性质、用途及制造过程

乙醇是什么?了解乙醇的化学式、性质、用途及制造过程

乙醇是一种有机化合物。 乙醇是酒精吗?乙醇是一种简单的醇,化学式为C 2 H 4O。 乙醇的分子式也可以写成CH 3 -CH 2 -OH或C 2 H 4 OH,通常缩写为EtOH。
2025-05-04
死而后已的含义、读音、出处及相关扩展介绍

死而后已的含义、读音、出处及相关扩展介绍

死而后已的,已是什么意思。
2025-05-04
临沧中专学校大盘点:财贸学校、卫生学校等介绍

临沧中专学校大盘点:财贸学校、卫生学校等介绍

1、临沧财贸学校;2、云南省临沧卫生学校;3、临沧高级技工学校;4、凤庆县职业教育中心;5、临沧师范高等专科学校;6、临沧市农业学校;7、临沧桑嘎艺术学校。
2025-05-04
成语鞠躬尽瘁,死而后已的详细解释及示例典故

成语鞠躬尽瘁,死而后已的详细解释及示例典故

鞠躬尽瘁死而后已什么意思?(详细)
2025-05-04
第一百十七回:邓士载偷度阴平诸葛瞻战死绵竹及相关战事详情

第一百十七回:邓士载偷度阴平诸葛瞻战死绵竹及相关战事详情

三国演义里诸葛亮的故事情节——病逝五丈原诸葛亮在五丈原积劳成疾,呕血昏迷,蜀营上下一片担心。诸葛亮躺在病榻上,自知生命垂危,但由于大事未成,耿耿于怀,遂寄希望于禳星术,以延寿命
2025-05-04