A video translator (that cannot translate video yet)
- 🎥 支持多种视频格式
- 🎯 使用 Whisper 模型进行语音识别
- 📝 自动生成 ASS 格式字幕文件
- 🎨 支持自定义字幕样式
- 💻 支持 CPU 和 CUDA 加速
- Python 3.10 或更高版本
- FFmpeg(用于音频提取)
- CUDA(可选,用于 GPU 加速)
点击右上角Code -> Download Zip
或
# 从源码安装
git clone https://github.com/yourusername/video_translator.git
cd video_translator
pip install -e .首先你得有个python
双击运行 run_web.bat 文件bash run_web.shpython -m video_translator.run_web_server然后打开浏览器访问:http://127.0.0.1:5000
video-translator translate your_video.mp4 --model-size base --device cudafrom video_translator import VideoTranslator, Device
translator = VideoTranslator('video.mp4', 'large-v3', device=Device.cpu)
translator.singleVideoPipeline()以下是一个基本的使用示例:
from video_translator import VideoTranslator, Device, AssStyle
# 创建翻译器实例
translator = VideoTranslator(
vid_path="your_video.mp4",
model_size="base",
device=Device.cuda # 或 Device.cpu
)
# 设置工作环境
translator.env_setup()
# 开始处理视频
translator.get_audio_stream()
translator.whisper_transcription()
# 自定义字幕样式(可选)
style = AssStyle(
name="Custom",
font="Arial",
font_size=48,
primary_color=(255, 255, 255, 255) # 白色
)
generate_subtitle([style])
compress_subtitle()
# 或者直接使用打包好的方法
vidTr = VideoTranslator('input.mp4','large-v3')
vidTr.singleVideoPipeline(translation = False)VideoTranslator: 核心翻译类,处理视频转换和字幕生成Device: 设备选择枚举类(CPU/CUDA)AssStyle: 字幕样式配置类AssGenerator: ASS 字幕生成器
- av==16.0.0
- faster-whisper==1.2.0
- onnxruntime==1.23.1
- 其他依赖请参见 pyproject.toml
MIT License
欢迎提交 Issues 和 Pull Requests!
- 初始版本发布
- 支持 ASS 字幕生成