Identifikasi Tweet Hoax Yang Berhubungan Dengan Pemilihan Presiden 2019 Menggunakan Naïve Bayes Classifier

Authors

  • Azizah Zain Telkom University
  • Anisa Herdiani Telkom University
  • Indra Lukmana Sardi Telkom University

Abstract

Abstrak Hoaks merupakan berita yang tersebar tanpa tahu kebenarannya atau faktanya. Hoaks biasanya tersebar melalui media yang mudah diakses seperti media sosial facebook, twitter dan lain-lain. Terutama pada masa pemilihan presiden (pilpres), para pasangan calon presiden dan wakil presiden tersebut memanfaatkan media sosial untuk melakukan kampanye. Hal ini tentu dimanfaatkan oleh orang-orang yang tidak bertanggung jawab untuk menyebarkan berita hoaks. Oleh karena itu perlu adanya pengidentifikasian tweet-tweet hoaks yang berhubungan dengan pemilihan presiden 2019 agar masyarakat dapat terhindar dari berita hoaks. Metode yang digunakan untuk identifikasi hoaks adalah Naïve Bayes Classifier (NBC). Metode NBC dipilih karena telah terbukti efektif untuk kategorisasi teks, prosesnya sederhana, cepat dan akurasi klasifikasi yang tinggi. Data tweet yang digunakan sebanyak 500 tweet dengan 143 tweet hoaks dan 357 tweet bukan hoaks. Hasil menunjukkan bahwa NBC dengan tambahan seleksi fitur Mutual Information (MI) dan Information Gain (IG) dapat menghasilkan nilai precision sebesar 0.9146, recall sebesar 0.9146, dan F1 score sebesar 0.9433 sedangkan NBC tanpa seleksi fitur menghasilkan nilai precision sebesar 0.6932, recall sebesar 0.9531, dan F1 score sebesar 0.8026, dengan kata lain seleksi fitur dapat menambah nilai F1- score sebesar 0.1408. Kata kunci: hoaks, pemilihan presiden, tweet, Naïve Bayes Classifier. Abstract Hoax are news that is spread without knowing the truth or the facts. Hoax are usually spread through easily accessible media such as Facebook, Twitter and others. Especially during the presidential election, the pair of candidates for president and vice president used social media to carry out campaigns. This is certainly used by people who are not responsible for spreading hoax news. Therefore, it is necessary to identify hoax tweets related to the 2019 presidential election so that people can avoid hoax. The method used for hoax identification is Naïve Bayes Classifier (NBC). The NBC method was chosen because it has been proven effective for text categorization, the process is simple, fast and has high classification accuracy. The tweet data used was 500 tweets with 143 hoax tweets and 357 non-hoax tweets. The results show that NBC with additional Mutual Information (MI) and Information Gain (IG) feature selection can produce a precision value of 0.974, a recall of 0.9146, and an F1 score of 0.9433 while an NBC without a feature selection produces a precision value of 0.6932, a recall of 0.9531, and F1 score of 0.8026, in other words feature selection can increase the value of F1-score of 0.1408. Keywords: hoaks, presidential elections, tweets, Naïve Bayes Classifier.

Downloads

Published

2020-04-01

Issue

Section

Program Studi S1 Informatika