实战| 一行命令对你的图像视频进行风格迁移

1.项目介绍

今天我们要做的是一个快速图像风格迁移的程序。

那么,什么是图像风格迁移?图像风格迁移就是把一种图像风格转变为另一种图像风格。例如,原图为:

加上不同风格的图像可以得到如下不同的结果:

2.使用训练好的模型来生成图像

2.1环境

Python
Tensorflow

2.2模型下载

训练好的模型有7个,表示7种类型的风格,模型文件的百度云:
模型的百度云地址
密码:35pg

2.3使用训练好的模型

在项目根目录下执行:

python eval.py --model_file <your path to wave.ckpt-done> --image_file img/test.jpg

--model_file 是模型的路径,可以选择7个模型中的一个
--image_file是原始图片的路径

新的图片会存放在项目根目录下:generated/res.jpg

3.训练一个新的模型

3.1下载VGG16模型

如果要训练一种新的图像风格,可以先下载VGG16的模型:
VGG16模型
密码:ykfy

然后在项目根目录下新建一个名为pretrained的文件夹,把vgg16的模型文件放入pretrained文件夹中。

3.2下载COCO数据集

下载地址
把解压后的train2014文件夹放在项目根目录下。

3.3创建新的yml文件

找一个新的风格的图片,比如找一个火的图片,路径在img/fire.jpg。复制conf文件夹中wave.yml文件,然后改名fire.yml。把fire.yml中的:
style_image: img/wave.jpg
naming: "wave"
改为
style_image: img/fire.jpg
naming: "fire"

3.4训练新的图像风格

python train.py -c conf/fire.yml

4.视频的风格转换

需要安装opencv,安装方式:
pip install opencv-python

准备好一个视频文件,然后在项目根目录下执行
python video.py --model_file models/wave.ckpt-done --video_file video/a.mp4

--model_file 是模型的路径,可以选择7个模型中的一个
--video_file是视频文件的路径

视频效果

5.项目打包

大家可以去我的Github下载源代码:
qbf的Github

原文地址:http://blog.51cto.com/12340098/2330156

时间: 2024-11-09 05:14:46

实战| 一行命令对你的图像视频进行风格迁移的相关文章

一行命令搞定没有Visual Studio2003(2005)时的手动编译

一行命令搞定没有Visual Studio2003(2005)时的手动编译命令 起因: 有时可能会发生这样的情况,网站做好了,要在服务器上布署.布署中发现,有些地方代码需要小改,然而,在服务器或其他地方没有安装VS系列工具,但服务器上已安装有.net框架,此时仍然需要对已有项目的某些文件进行少量修改,并再次进行编译.此时,在服务器上安装VS系列开发工具并不可能,也不经济.那么下面的方法就可以派上用场了. (1)将下面一行保存到你项目所在的目录下一个名为:buid.bat文件中: %SYSTEMR

如何在Linux命令行中剪裁图像

涉及到在Linux中转换或编辑图像文件时,ImageMagick毫无疑问是最为熟知的一体化软件之一.它包含了一整套命令行工具,用以显示.转换,或复制超过200中类型的光栅或矢量图像文件,所有这一切都在命令行下完成.ImageMagick可以用于多样化的图像编辑工作,如转换文件格式,添加特殊效果,添加文本,以及改变图像(调整大小.旋转.翻转.剪裁). 如果你想要剪裁映像以去除空白,你可以使用ImageMagick自带的两个命令行工具.如果你还没有安装ImageMagick,请参照本指南来安装. 在

〖Network〗一行命令创建 http-server

一行命令启动http-server总结:1. python2.x python2 -m SimpleHTTPServer 8000 2. python3.x python -m http.server 8000 3. twistd(python) twistd -n web -p 8000 --path . 或者 python -c 'from twisted.web.server import Site; from twisted.web.static import File; from tw

ubuntu设置开机默认进入界面及命令行下开启图像界面

前言 环境:ubuntu12.04 一. ubuntu设置默认开机界面 在网上查看了好几种方法,对于当前环境方便或者有用的方式是对/etc/default/grub文件进行设置. 1.默认开机命令行界面 file: /etc/default/grub文件中 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"替换为GRUB_CMDLINE_LINUX_DEFAULT="text" 更新grub.cfg $sudo update-grub

一行命令创建 http-server

一行命令启动http-server总结:1. python2.xpython2 -m SimpleHTTPServer 8000 2. python3.xpython -m http.server 8000 3. twistd(python)twistd -n web -p 8000 --path .或者 python -c 'from twisted.web.server import Site; from twisted.web.static import File; from twiste

图像/视频处理交流群 : 582226901

推荐一个学习交流群:图像/视频处理交流群 582226901        建群目的就是促进学术交流,欢迎任何和学术有关的朋友加入!群共享会持续更新各类代码资源.

python pip 一行命令升级所有包

一行命令升级所有pip安装的Python包 pip freeze --local | grep -v '^\-e' | cut -d = -f 1 | xargs pip install -U 建议在执行前先执行: pip install -U distribute 由于使用了mysql-connector-python的包,在安装时要使用 --allow-external mysql-connector-python 参数,所以在升级时,也应该加上该参数,命令行为: pip install -

机器学习:利用卷积神经网络实现图像风格迁移 (一)

相信很多人都对之前大名鼎鼎的 Prisma 早有耳闻,Prisma 能够将一张普通的图像转换成各种艺术风格的图像,今天,我们将要介绍一下Prisma 这款软件背后的算法原理.就是发表于 2016 CVPR 一篇文章, " Image Style Transfer Using Convolutional Neural Networks" 算法的流程图主要如下: 总得来说,就是利用一个训练好的卷积神经网络 VGG-19,这个网络在ImageNet 上已经训练过了. 给定一张风格图像 a 和

Distill详述「可微图像参数化」:神经网络可视化和风格迁移利器!

近日,期刊平台 Distill 发布了谷歌研究人员的一篇文章,介绍一个适用于神经网络可视化和风格迁移的强大工具:可微图像参数化.这篇文章从多个方面介绍了该工具. 图像分类神经网络拥有卓越的图像生成能力.DeepDream [1].风格迁移 [2] 和特征可视化 [3] 等技术利用这种能力作为探索神经网络内部原理的强大工具,并基于神经网络把艺术创作推进了一小步. 所有这些技术基本上以相同的方式工作.计算机视觉领域使用的神经网络拥有图像的丰富内部表征.我们可以使用该表征描述我们希望图像具备的特性(如