1、Librosa
import librosa filepath = "/Users/birenjianmo/Desktop/learn/librosa/mp3/in.wav"y,sr = librosa.load(filepath)mfcc = librosa.feature.mfcc( y,sr,n_mfcc=13 )
返回結(jié)構(gòu)為(13,None)的np.Array,None表示任意數(shù)量
2、python_speech_features
from python_speech_features import mfcc as pmfccfilepath = "/Users/birenjianmo/Desktop/learn/librosa/mp3/in.wav"(rate,sig) = wav.read(filepath)amfcc = pmfcc( sig, rate ).T
返回結(jié)構(gòu)為(None,13)的np.Array,通過(guò) .T 可轉(zhuǎn)為(13,None)
3、這兩種方式的mfcc還是有明顯的區(qū)別的,上面兩個(gè)子圖是從(1)Librosa得到的 mfcc[0] 和 mfcc[1],下面的是(2)python_speech_features得到的 amfcc[0] 和 amfcc[1]

以上這篇對(duì)Python使用mfcc的兩種方式詳解就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持武林站長(zhǎng)站。
新聞熱點(diǎn)
疑難解答
圖片精選