SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测
富文本识别:
SenseVoice-Small
模型采用非自回归端到端框架,推理延迟极低,10s音频推理仅耗时70ms,15倍优于Whisper-Large。SenseVoice
在线预览:https://www.modelscope.cn/studios/iic/SenseVoice
这里使用autodl 机器学习平台,官网地址:https://www.autodl.com/market/list
直接到算力市场,选择按量计费,地区随便选择一个,这里使用4090显卡。
如图选择PyTorch
版本,最后点击创建。
创建好以后就来到了控制台,点击AutoPanel
面板,设置默认为清华源。
点击选择清华源,因为清华源下载依赖包比较快。
接着回到控制台,点击进入JupyterLab
。
进入到autodl-tmp 目录下,然后打开终端。
然后克隆项目,输入如下命令:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
git clone https://github.com/FunAudioLLM/SenseVoice.git
如果提示网络超时等,输入如下命令,完了重新拉取代码就好。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
source /etc/network_turbo
继续打开一个笔记本,下载模型。
键入如下代码后运行:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
!pip install modelscope
继续键入如下代码下载模型:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download("iic/SenseVoiceSmall", cache_dir='ai_models')
print(model_dir)
model_dir = snapshot_download("iic/speech_fsmn_vad_zh-cn-16k-common-pytorch", cache_dir='ai_models')
print(model_dir)
出现进度条说明模型开始下载了。
然后回到终端,进入SenseVoice目录。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd SenseVoice/
创建虚拟环境
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 创建一个名为venv 的虚拟环境。
python -m venv venv
接着激活虚拟环境。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
source ./venv/bin/activate
安装依赖
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install -r requirements.txt
安装好依赖以后,我们更新pip
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install --upgrade pip
回到控制台,复制ssh配置。
打开Vsocode,远程连接。
粘贴登录信息
选择第一个默认配置。
选择第一个链接。
复制密码
粘贴密码
接着打开文件夹,选择/root/autodl-tmp/
选择信任
点击打开终端
接着激活虚拟环境。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
source ./venv/bin/activate
接着回到笔记本模型哪里,复制下载的模型路径。
回到VsCode ,编辑SenseVoice/webui.py
,设置模型的路径为如下:
最后,见证奇迹的时候到了,运行我们的Python代码。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
python webui.py
选择在浏览器打开。
接着,就可以快乐的玩耍了。
当我们上传音频时遇到了错误如下错误:
针对安装ffmpeg时遇到的问题,按以下步骤操作:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo apt update
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo add-apt-repository universe
sudo apt update
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo apt install ffmpeg -y
如果还是不行,可能是ffmpeg所在的仓库没有启用。那么可以尝试:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo add-apt-repository multiverse
sudo apt update
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo apt install ffmpeg
本文由博客一文多发平台 OpenWrite 发布!
原网址: 访问
创建于: 2025-07-24 00:41:33
目录: default
标签: 无
未标明原创文章均为采集,版权归作者所有,转载无需和我联系,请注明原出处,南摩阿彌陀佛,知识,不只知道,要得到
java windows火焰图_mob64ca12ec8020的技术博客_51CTO博客 - 在windows下不可行,不知道作者是怎样搞的 监听SpringBoot 服务启动成功事件并打印信息_监听springboot启动完毕-CSDN博客 SpringBoot中就绪探针和存活探针_management.endpoint.health.probes.enabled-CSDN博客 u2u转换板 - 嘉立创EDA开源硬件平台 Spring Boot 项目的轻量级 HTTP 客户端 retrofit 框架,快来试试它!_Java精选-CSDN博客 手把手教你打造一套最牛的知识笔记管理系统! - 知乎 - 想法有重合-理论可参考 安宇雨 闲鱼 机械键盘 客制化 开贴记录 文本 linux 使用find命令查找包含某字符串的文件_beijihukk的博客-CSDN博客_find 查找字符串 ---- mac 也适用 安宇雨 打字音 记录集合 B站 bilibili 自行搭建 开坑 真正的客制化 安宇雨 黑苹果开坑 查找工具包maven pom 引用地 工具网站 Dantelis 介绍的玩轴入坑攻略 --- 关于轴的一些说法 --- 非官方 ---- 心得而已 --- 长期开坑更新 [本人问题][新开坑位]关于自动化测试的工具与平台应用 机械键盘 开团 网站记录 -- 能做一个收集的程序就好了 不过现在没时间 -- 信息大多是在群里发的 - 你要让垃圾佬 都去一个地方看难度也是很大的 精神支柱 [超级前台]sprinbboot maven superdesk-app 记录 [信息有用] [环境准备] [基本完成] [sebp/elk] 给已创建的Docker容器增加新的端口映射 - qq_30599553的博客 - CSDN博客 [正在研究] Elasticsearch, Logstash, Kibana (ELK) Docker image documentation elasticsearch centos 安装记录 及 启动手记 正式服务器 39 elasticsearch 问题合集 不断更新 6.1.1 | 6.5.1 两个版本 博客程序 - 测试 - bug记录 等等问题 laravel的启动过程解析 - lpfuture - 博客园 OAuth2 Server PHP 用 Laravel 搭建带 OAuth2 验证的 RESTful 服务 | Laravel China 社区 - 高品质的 Laravel 和 PHP 开发者社区 利用Laravel 搭建oauth2 API接口 附 Unauthenticated 解决办法 - 煮茶的博客 - SegmentFault 思否 使用 OAuth2-Server-php 搭建 OAuth2 Server - 午时的海 - 博客园 基于PHP构建OAuth 2.0 服务端 认证平台 - Endv - 博客园 Laravel 的 Artisan 命令行工具 Laravel 的文件系统和云存储功能集成 浅谈Chromium中的设计模式--终--Observer模式 浅谈Chromium中的设计模式--二--pre/post和Delegate模式 浅谈Chromium中的设计模式--一--Chromium中模块分层和进程模型 DeepMind 4 Hacking Yourself README.md update 20211011
Laravel China 简书 知乎 博客园 CSDN博客 开源中国 Go Further Ryan是菜鸟 | LNMP技术栈笔记 云栖社区-阿里云 Netflix技术博客 Techie Delight Linkedin技术博客 Dropbox技术博客 Facebook技术博客 淘宝中间件团队 美团技术博客 360技术博客 古巷博客 - 一个专注于分享的不正常博客 软件测试知识传播 - 测试窝 有赞技术团队 阮一峰 语雀 静觅丨崔庆才的个人博客 软件测试从业者综合能力提升 - isTester IBM Java 开发 使用开放 Java 生态系统开发现代应用程序 pengdai 一个强大的博主 HTML5资源教程 | 分享HTML5开发资源和开发教程 蘑菇博客 - 专注于技术分享的博客平台 个人博客-leapMie 流星007 CSDN博客 - 舍其小伙伴 稀土掘金 Go 技术论坛 | Golang / Go 语言中国知识社区
最新评论