Analisis Perbandingan Tingkat Performa Algoritma SVM, Random Forest, dan Naïve Bayes untuk Klasifikasi Cyberbullying pada Media Sosial

Naufal, Mohammad Farid and Theofilus, Arifin and Wirjawan, Hans (2023) Analisis Perbandingan Tingkat Performa Algoritma SVM, Random Forest, dan Naïve Bayes untuk Klasifikasi Cyberbullying pada Media Sosial. Jurnal Riset Sistem Informasi Dan Teknik Informatika (JURASIK), 8 (1). pp. 82-90. ISSN 2527-5771; Online ISSN 2549-7839

[thumbnail of Mohammad Farid Naufal_Analisis Perbandingan Tingkat Performa Algoritma SVM.pdf] PDF
Mohammad Farid Naufal_Analisis Perbandingan Tingkat Performa Algoritma SVM.pdf

Download (1MB)
Official URL / DOI: https://tunasbangsa.ac.id/ejurnal/index.php/jurasi...

Abstract

Pada Januari 2022, terdapat 4,95 miliar pengguna internet di seluruh dunia dengan waktu akses rata-rata sebanyak 135 hingga 193 menit per hari. Kemajuan teknologi di bidang informasi dan komunikasi tidak sejalan dengan perilaku masyarakat di sosial media. Pada tahun 2017, tercatat sebagian besar kasus cyberbullying berasal dari sosial media. Sosial media adalah sebuah platform digital yang digunakan untuk bersosialisasi dengan orang lain secara online. Sosial media yang paling sering digunakan di dunia pada tahun 2017 adalah Facebook, Youtube, Whatsapp, Instagram, dan Twitter. Menurut data statistik yang pernah diperoleh, 54% dari 10000 peserta survei The Annual Bullying telah mengalami tindak kekerasan cyberbullying. Pada penelitian ini dilakukan sebuah proses analisis sentimen cyberbullying yang disampaikan dari berbagai sosial media yang ada di dunia. Analisis sentimen ini digunakan untuk menentukan apakah teks tersebut memiliki emosional cyberbullying atau tidak. Jumlah data yang digunakan sebanyak 46000 teks yang berbeda dengan rincian kurang lebih 8000 teks untuk setiap kategori yang ada yaitu cyberbullying usia, cyberbullying etnis, cyberbullying jenis kelamin, cyberbullying agama, cyberbullying lainnya dan bukan cyberbullying dan paling tidak ditemukan 1000 teks lebih yang mengandung “fuck”. Metode penelitian ini menggunakan fitur TF-IDF (Term Frequency-Inverse Document Frequency) dan 3 model untuk mengklasifikasikannya yaitu SVM (Support Vector Machine), RF (Random Forest), dan Naive Bayes. Berdasarkan hasil penelitian yang dilakukan Algoritma SVM dan Random Forest memiliki performa yang terbaik dengan evaluation matrix mencapai precision 82%, recall 83%, accuracy 83% dan precision 83%, recall 82%, accuracy 82%.

Item Type: Article
Uncontrolled Keywords: cyberbullying, svm, random forest, naïve bayes, social media
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Faculty of Engineering > Department of Informatic
Depositing User: MOHAMMAD FARID NAUFAL
Date Deposited: 27 Feb 2023 07:59
Last Modified: 14 Oct 2024 03:10
URI: http://repository.ubaya.ac.id/id/eprint/43505

Actions (login required)

View Item View Item