Analisis Trending Topik Pada Twitter Menggunakan Metode Naive Bayes Dengan Pembobotan Tf-idf

Authors

  • Saut Sihol Ritonga Telkom University
  • Erwin Budi Setiawan Telkom University
  • Isman Kurniawan Telkom University

Abstract

Abstrak Twitter adalah salah satu media sosial yang banyak sekali para penggunanya menceritakan berbagai macam banyak kejadian oleh karena itu perlu megklasifikasi topik menjadi dengan akurasi tinggi untuk lebih baik pengambilan informasi. Oleh karena itu penulis melakukan penelitian untuk mengatasi masalah ini dengan membagi beberapa tren topik twitter. Pembobotan yang digunakan adalah TF-IDF dengan menggunakan Naïve Bayes. Akurasi terbaik pada pembobotan TF-IDF menggunakan klasifikasi Naïve Bayes didapat pada skenario data training, data tesing 80:20 adalah 57.08% dan memiliki nilai f-measure 0.52. Trending pertama yang terdeteksi dari pengambilan data dari bulan 25 Juli sampai 28 Agustus adalah politik dengan persentase 26.88% lalu kedua senbud persentase 8.65% dan yang ketiga hukam 8.27%. Kata Kunci: Twitter, Naive Bayes, TF-IDF, Topik. Abstract Twitter is one of the many social media users who tell a wide variety of events so it is necessary to classify topics into high accuracy for better information retrieval. Therefore, the authors conducted research to overcome this problem by dividing a number of Twitter topic trends. The weighting used is TF-IDF by using Naïve Bayes. The best accuracy on TF-IDF weighting using the Naïve Bayes classification is obtained in the training data scenario, the 80:20 testing data is 57.08% and has an f-measure value of 0.52. The first trend detected from data collection from July 25 to August 28 is politic with a percentage of 26.88%, then second senbud with a percentage of 8.65% and a third with 8.27% hukam. Keyword: Twitter, Naive Bayes, TF-IDF, Topic

Downloads

Published

2020-04-01

Issue

Section

Program Studi S1 Ilmu Komputasi