畅谈人工智能艺术新命题：神经风格迁移

发布时间：2020-08-08 07:12:02 作者：云编
来源：ITPUB博客阅读：190

畅谈人工智能艺术新命题：神经风格迁移

波士顿

介绍

神经风格迁移（Neural Transfer Style）是人工智能在创造性环境中最令人惊奇的应用之一。在这个项目中，我们将看到如何将艺术绘画风格转换为所选图像，从而创造出令人惊叹的效果。Leon A. Gatys等人在2015年发布的论文"艺术风格的神经算法"中构思了神经风格迁移的概念。之后，许多研究人员应用和改进了方法，增加了损失的元素，尝试了不同的优化器并试验了用于此目的的不同神经网络。尽管如此，这篇原始论文仍然是理解这一概念的最佳来源，而VGG16和VGG19网络是这方面最常用的模型。考虑到两者在最近的网络中表现优异，这种选择是不寻常的，这种选择在风格迁移中获得了最高的性能。

https://arxiv.org/abs/1508.06576

你可以查看此GitHub存储库以获取完整代码。

https://github.com/maurock/neural_transfer_style

它是如何工作的？

这种技术的目标是将图像的风格（我们称之为"风格图像"）应用于目标图像，从而保留后者的内容。我们来定义这两个术语：

风格是图像中的纹理和视觉图案。一个例子是艺术家的笔触。
内容是图像的宏观结构。人物、建筑物、物体是图像内容的示例。

这里显示了不错的效果：

畅谈人工智能艺术新命题：神经风格迁移

你想看到更多的效果吗？在文章的最后可以浏览。

让我们看看高级步骤：

选择要设置风格的图像
•选择样风格参考图像。通常，这是一幅具有独特和可识别风格的绘画。
初始化预训练的深度神经网络，并获得中间层的特征表示。完成该步骤以实现内容图像和风格图像的表示。在内容图像中，最好的选择是获得最高层的特征表示，因为它们包含有关图像宏结构的信息。对于风格参考图像，从不同比例的多个层获得特征表示。
定义损失函数，以最小化内容损失、样式损失和变化损失的总和。每次迭代，优化器都会生成一个图像。内容损失是生成的图像和内容图像之间的差异（L2归一化），而生成的图像和样式之间的样式损失。稍后我们将看到这些变量是如何在数学上定义的。
重新考虑损失的最小化

图像处理和图像逆向处理

首先，我们需要格式化在网络使用的图像。我们将要使用的卷积神经网络（CNN）是经过预先训练的VGG19会议。当我们将图像处理成兼容的阵列时，我们还需要对生成的图像进行解处理，从BGR切换到RGB格式。让我们构建两个辅助函数来执行此操作：

畅谈人工智能艺术新命题：神经风格迁移

内容损失

内容损失将主要输入图像的内容保留为风格。由于卷积神经网络的较高层包含图像宏观结构的信息，因此我们将内容损失计算为输入图像的最高层的输出与所生成图像的同一层之间的差异（L2归一化）。

内容损失定义为：

畅谈人工智能艺术新命题：神经风格迁移

内容损失

在等式中，F是内容图像的特征表示（当我们运行输入图像时网络输出的内容），以及P是在特定隐藏层l处生成的图像之一。

这是实施的内容：

畅谈人工智能艺术新命题：神经风格迁移

风格损失

理解风格损失并不像内容丢失那么简单。目标是在新生成的图像中保持图像的样式（即视觉图案作为笔画）。在前一种情况下，我们比较中间层的原始输出。在这里，我们比较样式参考图像和生成的图像的特定图层的Gram矩阵之间的差异。Gram矩阵被定义为给定层的矢量化特征映射之间的内积。矩阵的含义是捕获层的特征之间的相关性。计算多个层的损失允许保留在样式图像和生成的图像之间的不同层内部相关的类似特征。

单个图层的样式损失计算如下：

畅谈人工智能艺术新命题：神经风格迁移