GoForum🌐 V2EX

将影片自动转录出字幕,并翻译的本地应用

andyskaura · 2026-03-19 15:47 · 0 次点赞 · 2 条回复

前几天看到 v 友分享的字幕翻译工具,想想我迫切需要的功能是 生成外语影片中文字幕 功能。 于是调研了下方案,原本打算古法编程的。 但 gpt5.4 真的远超想象,没那么完美,但已符合我的需求,解决了某些电影字幕无->有的跨越。

核心功能: ffmpeg 分离音频->VAD 本地模型降噪切片->Whisper 本地模型转录(非翻译)->LLM 大模型翻译

分享给有需要的 v 友
https://github.com/AndySkaura/crosssubtitle-ai/releases/tag/1.0 当前只有 mac arm 版本,win 版本等下周 codex 有额度了再督促它干活儿。 只在本机进行过测试

原本想内置一个 qwen 7b ,但还是太重了,不如用免费不限量的 GLM-4-Flash-250414 。有条件的自己本地部署个小模型吧。 https://i.imgur.com/TN3dbsn.png https://i.imgur.com/0eez82o.png

2 条回复
Daybyedream · 2026-03-19 15:57
#1

我现在转文字都白嫖千问 APP 里的 视频都不传直接提取音频发过去还是很快处理好的。

andyskaura · 2026-03-19 16:27
#2

@Daybyedream 大模型还是太权威了 https://i.imgur.com/NIvxivj.png 我用 Whisper 本地识别,如果不做降噪和切片,和上下文优化,识别准度还差很大意思

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: andyskaura
发布: 2026-03-19
点赞: 0
回复: 0