Sistem Pencarian Ayat Untuk Perbedaan Bunyi Pada Al-qur’an Berdasarkan Teks Kemiripan Fonetis

Authors

  • Agni Octavia Telkomuniversity
  • Moch Arif Bijaksana Telkomuniversity
  • Kemas Muslim Lhaksmana Telkomuniversity

Abstract

Abstrak Al-Qur’an memiliki isi kandungan yang sangat banyak, sehingga sistem pencarian ayat Al-Qur’an diper- lukan karena jika dilakukan secara manual akan menyulitkan. Salah satu sistem pencarian ayat Al-Qur’an yang sesuai dengan pelafalan orang Indonesia adalah Lafzi. Sistem Lafzi dapat mencari potongan ayat Al- Qur’an menggunakan kata kunci dalam aksara Latin. Lafzi telah dikembangkan menjadi Lafzi +, dimana sistem Lafzi + dapat menangani pencarian potongan ayat Al-Qur’an dengan perbedaan bunyi pada tanda berhenti. Namun, pada sistem Lafzi + belum dapat diterapkan di seluruh Al-Qur’an. Berdasarkan masa- lah ini, sistem perlu dikembangkan agar dapat diterapkan di seluruh Al-Qur’an. Metode yang digunakan dalam proses pencarian ayat adalah metode N-gram. N-gram yang digunakan dalam penelitian ini ada- lah trigram. Alur proses sistem ini pertama kali dinormalisasi dalam proses pengkodean fonetis setelah dinormalisasi kemudian tokenisasi trigram dan kemudian trigram dicocokkan antara kueri dan korpus dan dimasukkan ke dalam proses pemeringkatan untuk mendapatkan kandidat output. Hasil penelitian ini memperoleh nilai MAP (Mean Average Precision) 87% dan recall 100%.

Kata kunci : pencarian fonetis, trigram, al-qur’an

Abstract Al-Qur’an has a lot of content, so the system of searching for verses of the Al-Qur’an is needed because if it is done manually it will be difficult. One of the search systems for the verses of the Al-Qur’an in accordance with Indonesia’s pronunciation is Lafzi. The Lafzi system can search for verse fragments using keywords in Latin characters. Lafzi has been developed into Lafzi +, wherein the Lafzi + system can be used to search verses of the Al-Qur’an with different sounds on stop signs. However, the Lafzi + system cannot yet be applied throughout the Qur’an. Based on this problem, the system needs to be developed so that it can be applied throughout the Qur’an. The method used in the process of searching for the verse is the N-gram method. The N-gram used in this research is trigram. The process flow of this system is first normalized in the phonetic coding process after normalized then tokenization of trigrams and then trigrams are matched between the query and the corpus and entered into the ranking process to get an output candidate. The results of this research obtained a MAP (Mean Average Precision) value of 87% and recall of 100% .

Keywords: phonetic search, trigram, al-qur’an

Downloads

Published

2020-08-01

Issue

Section

Program Studi S1 Informatika