Rancang Bangun Kunci Berbasis Suara Pada Pintu Pintar Dengan Menggunakan Metode Mel Frequency Cepstral Coefficient (mfcc) Dan K-nearest Neighbor (k-nn)

Authors

  • Muhammad Afif Ridwansyah Telkom University
  • Achmad Rizal Telkom University
  • Sugondo Hadiyoso Telkom University

Abstract

Abstrak Automatic Speech Recognition (ASR) adalah suatu sistem yang dapat mengenali, membandingkan dan mencocokkan pola suara masukan sistem tersebut dengan pola suara yang telah disimpan dalam memori. ASR terbagi menjadi dua jenis, yaitu Speech Recognition dan Speaker Recognition. Speaker Recognition adalah pengenalan identitas berdasarkan suara yang dikeluarkan (berupa intonasi suara, kedalaman suara, dan sebagainya). Pada penelitian ini dibangun sistem kunci berbasis suara dengan memanfaatkan Speaker Recognition. Pada penelitian ini digunakan metode Mel-Frequency Cepstral Coefficient (MFCC) sebagai ekstraksi ciri dan metode K-Nearest Neighbor (K-NN) sebagai klasifikasi ciri. Alat ini bekerja melalui dua tahapan, yaitu tahap pelatihan (training) dan tahap pengujian (testing). Hasil pengujian menunjukkan MFCC dan K-NN berhasil diimplementasikan dengan jumlah filterbank terbaik berjumlah 20 dan nilai koefisien terbaik sebanyak 13 koefisien dengan akurasi 100%. Hasil pengujian menunjukkan bahwa jumlah filterbank dan nilai koefisien mempengaruhi akurasi dari sistem. Kata kunci: Automatic Speech Recognition (ASR), biometrik suara, K-Nearest Neighbor (K-NN), MelFrequency Cepstral Coefficient (MFCC) . Abstract Automatic Speech Recognition (ASR) is a system that can identify, compare and match the system input voice patterns with the voice patterns that has been stored in memory. ASR is divided into two types, namely Speech Recognition and Speaker Recognition. Speaker Recognition is the introduction of the issued voice character (intonation of sound, depth of voice, etc.). The key system based on voice using Speaker Recognition was build in this study. In this research, the methods used were Mel-Frequency Cepstral Coefficient (MFCC) as feature extraction and K-Nearest Neighbor (K-NN) as characteristic classification. This tool worked through two stages, namely training stage and testing stage. The results showed that the MFCC and K-NN were successfully implemented with best filter bank at number 20 filter, best coefficient value at 13 coefficient with 100% accuracy. The results showed that filter bank and coefficient affect the accuracy of the system. Keywords : Automatic Speech Recognition (ASR) , Biometric, K-Nearest Neighbor (K-NN), MelFrequency Cepstral Coefficient (MFCC).

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Teknik Elektro