Administrator
Published on 2025-09-19 / 1 Visits
0
0

基于深度学习的神经网络算法来进行音频分类任务环境部署

环境部署

一、 Anaconda安装

1.软件下载清华下载站

1

2.一路next

2

3.勾选上(免得后期手动添加环境变量)

3
注意:软件安装路径最好不要有中文或者空格(后期可能会引起很多奇怪的问题)

4.虚拟环境创建,打开cmd,输入conda create -n catmeows python=3.9

4
等待安装结束
5

二、 Pytorch安装

1.软件下载官网(尽量选择老的版本)

image
打开英伟达控制面板,查看支持的最高的cuda版本
image
回到pytorch官网,根据自己的情况选择(A卡或轻薄本请选择CPU版本)
image

2.使用pip命令进行安装pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

安装需要一定时间,耐心等待

3.检验是否安装成功

在cmd输入

python
>>> import torch  
>>> torch.ones(3).cuda()  
tensor([1., 1., 1.], device='cuda:0')  

若输出tensor([1., 1., 1.], device='cuda:0')则pytorch安装成功

至此,环境部分准备完毕。

训练模型

一、进入虚拟环境

控制台输入conda activate catmeows
image
左侧会有括号提示你已经进入虚拟环境

二、将dataset.zip解压到和train.py同目录

文件目录如下
catmeows/
|-- dataset/
| |-- B_ANI01_MC_FN_SIM01_101.wav
| |-- B_ANI01_MC_FN_SIM01_102.wav
| |-- B_ANI01_MC_FN_SIM01_103.wav
| |-- …
|-- train.py
|-- detect.py
|-- wav/
| |-- 1.wav
| |-- 2.wav
| |-- …
在控制台输入python train.py
image

使用训练好的模型进行预测

一、进入虚拟环境

控制台输入conda activate catmeows
image
左侧会有括号提示你已经进入虚拟环境

二、选择保存的模型

image
路径改为你保存模型的路径

三、选择要分类的音频位置

image

四、进行分类

在控制台输入python detect.py


Comment