Klasifikasi Genre Musik Menggunakan Metode Deep Learning Convolutional Neural Network dan Mel- Spektrogram

Danny Lionel, Rudy Adipranata, Endang Setyati

Abstract


Pertumbuhan  database  musik  yang  berkembang  secara  sangat pesat  menyebabkan  sukarnya  proses  pengelompokkan  musik dalam kategori tertentu, sehingga dapat berakibat sulitnya pencarian suatu kategori musik dalam jumlah banyak dan skala yang besar. Dengan perkembangan jaman, sekarang telah mulai dikembangkan metode agar suatu audio file dapat dikenali secara otomatis dari fitur-fitur yang telah diekstrak sebelumnya dengan bantuan MFCC (Mel Frequency Cepstral Coefficients) dan ANN (Artificial Neural Network).

 

Dalam penelitian  ini akan digunakan metode Mel-spectrogram. Dimana Mel spektrogram merupakan hasil pemetaan fitur yang telah diambil oleh metode MFCC, yang akan diklasifikasikan dan dimasukkan kedalan Convolutional Neural Network. Yang akan dibedakan activation function nya yaitu ReLU dan ELU.

 

Penelitian ini menunjukkan bahwa pengambilan fitur dari audio dengan menggunakan MFCC merupakan metode yang benar, dan dalam hasil pengujian, banyaknya dataset, iterasi  training, dan spesifikasi  komputer  sangat  mempengaruhi  tingkat  akurasi dan lama pembuatan neural network model yang optimal. Dalam hasil penelitian ini telah diuji beberapa kali didapatkan hasil akurasi yang paling optimal yaitu 99%.


Keywords


Digital Image Processing;Artificial Neural Network;Audio Processing;Mel cepstral coefficients

Full Text:

PDF

References


Huzaifah, M. 2017. Comparison of Time-Frequency Representations for Environmental Sound Classification using Convolutional Neural Network. arXiv:1706.07156.

Ilyas Ozer, Z. O. 2016. Lanczos Kernel Based Spectrogram

Image Features for Sound Classification.

Politis & Dionysios. 2016. Digital Tools for Computer

Music Production and Distribution.

S Lalitha, D. G. 2015. Emotion Detection using MFCC and

Cepstrum Features. Procedia Computer Science 70, 29-35.

Shikha Gupta, J. J. 2013. Feature Extraction Using MFCC.

An International Journal (SIPIJ) Vol.4, No.4.

Wanli, G. 2013. The research of feature extraction based on

MFCC for speaker recognition.

Wolfe, J. 2014. What is a Sound Spectrum? .Diambil kembali dari unsw.edu.au: http://newt.phys.unsw.edu.au/jw/sound.spectrum.html


Refbacks

  • There are currently no refbacks.


Jurnal telah terindeks oleh :