Pengklasifikasian Topik Hadits Terjemahan Bahasa Indonesia Menggunakan Latent Semantic Indexing dan Support Vector Machine

Authors

  • Hafizh Fauzan Telkom University
  • Adiwijaya Adiwijaya Telkom University
  • Said Al Faraby Telkom University

Abstract

Abstrak Hadits dijadikan sumber hukum dalam agama Islam selain Al-Qur’an, Ijma dan Qiyas, dimana dalam hal ini, hadits merupakan sumber hukum kedua setelah Al-Qur’an. Penelitian ini bertujuan untuk membangun suatu sistem yang dapat mengkategorikan kelas dari hadits shahih Bukhari terjemahan Bahasa Indonesia. Topik ini dipilih untuk membantu masyarakat Islam yang ingin memahami dari setiap hadits merupakan berupa informasi, larangan atau anjuran. Support Vector Machine digunakan karena dapat melakukan klasifikasi dengan memberikan performansi yang baik untuk dataset yang memiliki fitur yang sangat banyak. Latent Semantic Indexing sebagai metode pemilihan fitur digunakan karena dapat mereduksi fitur dengan menghilangkan fitur yang tidak penting (noise term). Penelitian ini juga memanfaatkan metode Bootstrap Aggregating (Bagging) untuk meningkatkan akurasi. Hasil akurasi yang didapatkan dengan menggunakan Latent Semantic Indexing dan Bagging pada klasifikasi Support Vector Machine sebesar 84.67% pada data hadits single label. Kata kunci : hadits, support vector machine, pemilihan fitur, latent semantic indexing, bootstap aggregating, klasifikasi teks, single label Abstract Hadith is used as the source of Islamic law other than Qur’an, Ijma and Qiyas, hadith is the second of Islamic law after the Qur’an. This study attempted to build a system than can classify shahih hadith of Bukhari in Indonesian Translation. This topic was chosen to help Muslims who want to understand from each hadith is in the form of informations, prohibitions or suggestions. Support Vector Machine was chosen because it can perform classification by providing good performance for dataset with a large number of features. Latent Semantic Indexing as a feature selection method was chosen because it can reduce features by eliminating unimportant features (noise term). This study also using Bootstrap Aggregating (Bagging) method to improve accuracy. The accuracy results show that by using Latent Semantic Indexing and Bagging on Support Vector Machine classification is 84.67% of single label hadith data. Keywords: hadith, support vector machine, feature selection, latent semantic indexing, bootstrap aggregating, text classification, single labe

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Informatika