201
微软
风格迁移新方法:微软与上海交大提出深度图像类比技术
参与:李泽南
近年来,科学家们已经开发出了多种图像内容转换工具,其中包括颜色转换、纹理转换和风格转换。最近这一领域的研究集中于深度卷积神经网络,除康奈尔大学和 转换以外,也引起了很多人的关注。它们随着社交媒体的发展而变得广为人们所知——因为图片分享是互动的重要组成部分。Prisma 和 Facetune 等应用就成功利用了这种吸引力。
来自微软和上海交大的廖菁等人最近推出了又一种图像风格转换方法。据研究者称,这种名为 Deep Image Analogy 的技术相比最近的其他研究可以得到更好的风格迁移效果,并适用于多种不同的图像转换任务。
摘要
我们提出了一种在图片中进行视觉风格转移的新技术,可以让图片进行外观上的转换,但保留感知上相似的纹理结构。我们的技术可以在两个输入图像之间找到有意义的对应关系。为了实现这点,它使用「图像类比」方式用深度卷积神经网络进行对比;我们把这一新技术称为 Deep Image Analogy。它使用粗化-精细的策略来计算生成结果的邻域纹理。我们在各种任务中验证了新方法的有效性,包含风格/纹理转换、颜色/风格对换、素描/绘画到照片的转换和不同时间的光照条件转换。
图 1. 新技术可以在两张图片(A 和 B')之间建立起语义有意义的对应关系,A'和 B 是风格转换后输出的结果
这项新技术在输入图像之间建立起了有意义的予以对应关系,从而让有效的视觉转换成为可能。研究者在论文中称,该研究的主要贡献在于:
提出了「深度图像类比」方法,并证明了新方法在不同图像类别任务的处理中是有效的。
将 PatchMatch 和重建从图像域延展到了特征域,后者可以引导语义上有意义视觉风格转换。
图 2. 该方法将相对困难的 AB0(红色)映射分解为两个相对简单的映射:AA'和 A' B。
图 3. 输入图 A(或 B')在 CNN 中每层的抽象程度。在这里,每一层的图像过滤都做了可视化。
图 4. 系统处理过程
图 8. 神经网络中每一层 NNF 的可视化(第一行),NNF 重建结果(中间行)以及独立层 NNF 重建结果(第三行)。
Deep Image Analogy 算法
图 11. 对比不同对应密度的方法。
图 14. 对比其他基于神经网络的方法与应用(包括 Prisma)
图 21. 该方法与其他目前表现最佳的图像风格转换的处理结果对比,其中包括康奈尔大学和 Adobe 最近的研究。左侧小图为输入图像和参考图像。
通过调整图像深层空间中的类比概念,研究人员发现了语义上的密集对照关系。Deep Image Analogy 在光照、颜色、纹理和风格的表现上都优于此前推出的其他方法。该方法在真实世界照片的风格转换任务中展现了广泛的适用性。在 Adobe 之后,微软和上海交通大学将图像风格转换又向前推进了一步。
论文链接:https://arxiv.org/abs/1705.01088
最后更新:2017-10-08 03:04:11
上一篇:
微软系统的手机哪里好 告诉你三大手机系统的优劣势
下一篇:
微软2018校招全面开始,还有美国职位!
获取insider preview版本出错 错误代码:0x800bfa07
hhukapi.dll,程序丢失怎么办
原来的【文本和其他项目大小调整的高级选项】界面咋没了?
无法获取Insider Preview 内部版本 错误代码 0x800bfa07
Windows 10,Windows Defender\Scans文件夹占用空间过大
windows10 *64 16215更新时下载过程中失败,代码 0x80240034
安装16226.1000更新时出现一些问题,但我们稍后会重试。
注册表值hklm\software\3fd8f8eac是什么
defender服务无法自动启动
Microsoft AntimalwareMicrosoft 反恶意软件 试图更新签名时遇到错误。
热门内容
Android Studio 3.0发布,支持 Kotlin;微软开源深度学习库MMLSpark;敏捷开发?真的假的?
微软Surface Note概念手机,三星Note 8的杀手?
微软2018财年Q1财报:游戏业务收入仅增长1%
微软高管解读财报:云计算业务发展良好 为客户创造巨大价值
聚焦场所体验与本土文化表达,微软Microsoft马其顿办公设计
微软也来搞折叠屏手机,有望明年推出,打开秒变平板电脑!
微软枪车球中“车”的代表,《极限竞速7》视频评测
微软的Kinect停产了,但它为今天的VR/AR做了很多贡献
微软一季度财报:游戏业务盈利增长显着
微软买断未来15年GE风力电厂能源:供应数据中心