使用Whisper批量转换视频中的文字——慢慢学AI001
因为工作需要把视频中的语音转换成文字,网上找了很多方案,效果不佳不说,大部分都是价格不菲。正好最近在学习OpenAI,于是找到了这款神器,意外的效果好,而且免费,而且本地就能运行。它有一个windows下客户端可以直接使用,但是一次只能处理一个文件,所以就想着如何自动化批量处理,发现原来它有个cli版本。总的来说,它的原理是先通过ffmpeg转换成音频文件,然后再通过whisper转换成文字
总的来说,命令行的方式还比较简介
1、去哪里下载
代码下载
https://github.com/openai/whisper/releases在github上可以下载到最新的版本
这个是官方的地址,有兴趣可以下来看看,主要用到的是下面地址的内容
模型下载(针对命令行方式和客户端方式)
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
很好理解,模型越大越慢,也越精准,所以我下载了large。
2、客户端版本这里说的客户端版本,就是它提供了一个exe文件,里面可以设置一些东西。https://github. ...