本地语音识别模型SenseVoice部署文档 - 知乎

AI框架CUDAcuDNN的安装(如果已安装,可跳过):

(1)CUDA下载地址(需下载显卡支持的版本,且大于等于V11.8):https://developer.nvidia.com/cuda-toolkit-archive

//检查显卡支持的最大CUDA版本命令行指令
nvidia-smi

(2)cuDNN下载地址(需下载CUDA支持的版本,且大于等于V8.5):https://developer.nvidia.com/rdp/cudnn-archive

//检查是否安装CUDA成功的命令行指令
nvcc -V

项目部署流程

一、使用git克隆代码

Git安装(如果安装过Git,可跳过):

软件下载地址:https://git-scm.com/downloads

Git克隆项目文件到本地:

git clone --recursive https://github.com/FunAudioLLM/SenseVoice.git

二、创建环境和安装三方库

(1)安装Miniconda(如果安装过conda,可跳过)

下载地址:https://docs.anaconda.com/miniconda/

如果安装成功:输入conda --version,能返回conda版本号

(2)创建虚拟环境、下载三方库:

conda create -n sensevoice python=3.8
conda activate sensevoice

如果有Nvidia GPU,需将requirements改为以下内容,方能调用GPU。

如果没有,requirements默认就好,会调用CPU处理。

--extra-index-url https://download.pytorch.org/whl/cu118 torch==2.0.1+cu118 torchaudio==2.0.2 modelscope huggingface huggingface_hub funasr>=1.1.2 numpy<=1.26.4 gradio

官方推荐,速度慢点:

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

清华镜像,速度快:

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple --extra-index-url https://download.pytorch.org/whl/cu118

PS:如果torch-2.0.1+cu118-cp38-cp38-win_amd64.whl下载过慢,可手动下载该文件后,重新激活虚拟环境,然后手动安装该库,速度会快很多。

步骤:

手动下载该文件(可用浏览器、IDM或迅雷下载),文件地址可复制命令行中提示的文件地址;

重新激活虚拟环境,运行手动安装指令:指令格式为pip install 下载文件的完整路径 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install F:\AI\torch-2.0.1+cu118-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple

手动安装该库成功后,重新执行(6)中的安装三方库指令,这样系统会继续安装别的库了,直到全部安装完。

三、下载模型

git clone https://www.modelscope.cn/iic/SenseVoiceSmall.git

四、启动文件

cd SenseVoice //切换到你的项目文件夹
python webui.py //启动后会给你一个网址,打开

五、安装FFmpeg(非必要)

PS:要使用非wav格式的音频,需安装FFmpeg(也可用剪辑软件将其转为wav格式)。

下载解压后,将其目录下的bin路径配置到系统环境变量的path变量中。

例如:D:\ffmpeg\bin

FFmpeg下载地址:

https://www.ffmpeg.org/download.html


原网址: 访问
创建于: 2025-07-24 00:47:48
目录: default
标签: 无

请先后发表评论
  • 最新评论
  • 总共0条评论