百度MP3+图片+文字:生成结果文件;(声音58秒,视频59秒,同步性需要进一步优化)

import os

os_sep = os.sep
this_file_abspath = os.path.abspath(__file__)
this_file_dirname, this_file_name = os.path.dirname(this_file_abspath), os.path.abspath(__file__).split(os_sep)[
    -1]

f_mp3 = ‘{}{}{}‘.format(this_file_dirname, os_sep, ‘auido.mp3‘)
from playsound import playsound

import time
import math

this_time = time.time()

# playsound(f_mp3)

# t_spend = time.time() - this_time
t_spend = 58.777058839797974
# 音频的秒数
t_spend = math.ceil(t_spend)
import cv2
import glob

‘‘‘
python+opencv视频图像相互转换 - CSDN博客 https://blog.csdn.net/m0_37733057/article/details/79023693
链接:https://www.zhihu.com/question/49558804/answer/343058915

OpenCV: Drawing Functions in OpenCV https://docs.opencv.org/3.1.0/dc/da5/tutorial_py_drawing_functions.html

‘‘‘
# 每秒传输帧数(Frames Per Second)
fps = 100  # 保存视频的FPS,可以适当调整 FPS是图像领域中的定义,是指画面每秒传输帧数,通俗来讲就是指动画或视频的画面数。FPS是测量用于保存、显示动态视频的信息数量。每秒钟帧数愈多,所显示的动作就会愈流畅。通常,要避免动作不流畅的最低是30。某些计算机视频格式,每秒只能提供15帧。
fps = 15
fps = 5

fourcc = cv2.VideoWriter_fourcc(‘M‘, ‘J‘, ‘P‘, ‘G‘)  # opencv3.0

f_v = ‘{}{}‘.format(int(time.time()), ‘saveVideo.avi‘)
f_img_d = ‘{}{}{}{}{}‘.format(this_file_dirname, os_sep, ‘mypng‘, os_sep, ‘*.jpg‘)
imgs = glob.glob(f_img_d)

img = cv2.imread(imgs[0])
img_size = (img.shape[1], img.shape[0])
videoWriter = cv2.VideoWriter(f_v, fourcc, fps, img_size)

"""
用图片总数均分音频时间
"""
os_delay_factor = 0.14
os_delay_factor = 0.11
myinterval = t_spend / len(imgs) * os_delay_factor

f, l = ‘mybaidu.parp.txt‘, []
with open(f, ‘r‘, encoding=‘utf-8‘) as fr:
    for i in fr:
        ii = i.replace(‘\n‘, ‘‘)
        l.append(ii)
char_loop_l = []
for i in l:
    mystr, le = ‘‘, len(i)
    for ii in range(le):
        iii = i[ii]
        print(‘-----‘, iii)
        mystr = ‘{}{}‘.format(mystr, iii)
        print(mystr)
        char_loop_l.append(iii)

#
# from fontTools.ttLib import TTFont
# myfont = TTFont(‘simhei.ttf‘)

from PIL import Image, ImageDraw, ImageFont

myfont = ImageFont.truetype("simhei.ttf", 50, encoding="utf-8")

import cv2
import numpy as np

os_delay_factor = 0.23
myinterval = t_spend / (len(char_loop_l) * 1) * os_delay_factor
for i in l:
    i_index=l.index(i)
    img_index=i_index%len(imgs)
    imgname=imgs[img_index]

    mystr, le = ‘‘, len(i)
    for ii in range(le):
        iii = i[ii]
        print(‘-----‘, iii)
        if len(mystr) % 15 == 0:
            mystr = ‘{}{}‘.format(mystr, ‘\n‘)
        mystr = ‘{}{}‘.format(mystr, iii)
        print(mystr)

        this_time = time.time()
        while time.time() - this_time < myinterval:
            print(imgname)

            frame = cv2.imread(imgname)
            frame_cv2 = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            frame_pil = Image.fromarray(frame_cv2)  # 转为PIL的图片格式

            draw = ImageDraw.Draw(frame_pil)
            font = ImageFont.truetype("simhei.ttf", 50, encoding="utf-8")
            # 第一个参数为字体,中文黑体
            # 第二个为字体大小
            ImageDraw.Draw(frame_pil).text((100, 20), mystr, (0, 0, 255), font)

            ‘‘‘
                frame_pil:目标图像
                第一个参数为打印的坐标
                第二个为打印的文本
                第三个为字体颜色
                第四个为字体
            ‘‘‘

            frame_cv2 = cv2.cvtColor(np.array(frame_pil), cv2.COLOR_RGB2BGR)
            img = frame_cv2
            videoWriter.write(img)

videoWriter.release()

  

原理是将字幕写到图片中,然后再写入视频的帧中

原文地址:https://www.cnblogs.com/yuanjiangw/p/8759181.html

时间: 2024-10-16 09:01:18

百度MP3+图片+文字:生成结果文件;(声音58秒,视频59秒,同步性需要进一步优化)的相关文章

用图片文字识别软件 复制微信小助手的开票信息

微信目前有开票小助手的功能,可以保存开票信息,客户经常会发微信开票小助手里的截图,附带有个二维码,这边可以扫描二维码获取抬头,虽然听说有用二维码极速开票的,对于这个不清楚,也不打算了解,本人还是用的传统方式,开票信息也不算多,最多也就四条.刚开始的时候,如果客户发这种图,我会直接对照着手打,因为数据不是很多,如果不是很忙,没有其他事情,下单的时候还没给快递打电话,手打之后在一个个对照一下,确认后打出来,再对照一下,也没什么问题.后来,客户由于有时候下午下单,时间有时候比较晚,已经给顺丰打电话了,

python之图片文字识别

总体思路: 1.借用热键截图,保存到本地 2.用百度的图片文字识别api,识别图中文字 import time import keyboard # 监控键盘事件pip install keyboard from PIL import ImageGrab # 能够去从剪切板当中把图片读取出来pip install pillow from aip import AipOcr #百度文字识别库 pip install baidu-aip # 上面的都是扩展包, 得安装 pip install pill

在指定图片上生成文字,文字格式可调

在指定图片上生成文字,文字格式可调,最终效果为 public class Waterark { private int _width; private int _height; private string _fontFamily; private int _fontSize; private bool _adaptable; private FontStyle _fontStyle; private bool _shadow; private string _backgroundImage;

根据html生成Word文件,包含图片

根据html内容生成word,并自动下载下来.使用到了itext-1.4.6.jar import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.InputStream; import java.io.OutputStream; import java.io.StringReader; import java.net.URLEncoder; import

多图片生成pdf文件

这里记录多个图片合并生成一个pdf文件的方法. @Test public void exportTest() throws IOException, DocumentException { // 图片文件夹地址 String imageFolderPath = "F:/imgtest/"; // 图片地址 String imagePath = null; // PDF文件保存地址 String pdfPath = "F:/ceshi.pdf"; FileOutput

jmeterPlugin CMD命令行生成png图片及csv统计文件

Jmeter是个纯java的开源的轻量级性能测试工具,功能强大.因为是轻量级的,与loadrunner相比,报告统计的相对较少.不过有jmeter的插件-JMeterPlugins,可以提供不少其他的报告,包括各种响应时间.吞吐率.线程等的变化曲线等 并且这个插件提供了命令行工具,可以将我们看到的各种曲线,各种报告统计成png图片,或者csv文件.这样我们就完全可以通过命令行来运行jmeter,生成jtl文件,然后在解析jtl文件,产生各种报告,或者展示到网页,或者插入到数据库,等等. 英文地址

java根据图片和文字生成自定义图片

import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.Graphics2D; import java.awt.image.BufferedImage; import java.io.BufferedOutputStream; import java.io.FileOutputStream; import java.io.IOException; import com.sun.i

百度开源富文本编辑器 UEditor配置:图片上传和文件上传独立使用方法

使用UEditor编辑器自带的插件实现图片上传和文件上传功能,这里通过配置UEditor单独使用其内置的第三方插件swfupload来实现图片和文件的上传,通过对UEditor配置轻松实现图片批量上传,文件披批量上传 第一步:先配置UEditor <script src="ueditor/ueditor.config.js"></script> <script src="ueditor/ueditor.all.min.js">&l

图片文字转电子档

原文地址:http://blog.csdn.net/chindroid/article/details/7995239 前期工作: 硬件: 电脑一台,数码相机(手机亦可,主要能拍出清晰的图片) 软件:word2003(其他的版本还没试,想想应该都可以,貌似2010版可以另存为PDF的文件) doPDF (百度一下即可搜到,是一款免费的PDF制作软件,我的版本是v7.3.382 多国语言版) CAJViewer(有些资料说是AJViewer,其实是CAJViewer,百度即可搜到,是一款免费的阅读