Sistem Deteksi Spam dengan Algoritma Naive Bayes

Candra, Arnold Jerome (2026) Sistem Deteksi Spam dengan Algoritma Naive Bayes. [Undergraduate thesis]

PDF
Abstrak_TI-2708.pdf
Download (111kB)

Official URL / DOI: http://digilib.ubaya.ac.id/pustaka.php/277478

Abstract

Perkembangan teknologi komunikasi digital yang pesat telah meningkatkan penggunaan email sebagai media komunikasi utama dalam aktivitas pendidikan, pekerjaan, dan layanan digital. Namun, peningkatan tersebut juga diiringi dengan tingginya penyebaran pesan spam yang dapat mengganggu kenyamanan dan berpotensi membahayakan keamanan data pengguna. Berdasarkan hasil penyebaran kuesioner kepada 71 responden, sebanyak 95,8% responden menyatakan pernah menerima email spam, dan 60,6% mengaku mengalami kesulitan dalam membedakan email spam dan non-spam. Selain itu, 39,4% responden pernah mengklik tautan dalam email spam, yang menunjukkan adanya risiko keamanan yang nyata. Temuan ini mengindikasikan bahwa spam bukan hanya gangguan komunikasi, tetapi juga ancaman terhadap keamanan informasi digital masyarakat. Penelitian ini bertujuan untuk mengembangkan sistem deteksi spam berbasis teks menggunakan algoritma Naive Bayes yang diimplementasikan dalam bentuk aplikasi web. Dataset yang digunakan berasal dari SpamAssassin dan data email hasil crawling Gmail. Tahapan preprocessing meliputi case folding, cleaning, tokenisasi, stopword removal, serta ekstraksi fitur menggunakan metode TF-IDF dengan variasi n-gram. Model klasifikasi dibangun menggunakan Gaussian Naive Bayes dan diuji menggunakan metode stratified split dengan perbandingan data 80:20. Hasil pengujian menunjukkan bahwa konfigurasi terbaik diperoleh pada ngram_range (1,2), dengan akurasi sebesar 99,17% dan F1-score kelas spam sebesar 0,9875. Evaluasi pengalaman pengguna yang melibatkan 33 responden menunjukkan bahwa mayoritas responden menyatakan sistem mudah dipahami, bermanfaat, dan berpotensi dikembangkan sebagai referensi penelitian lanjutan di bidang klasifikasi spam email. Meskipun sistem menunjukkan performa yang sangat baik, terdapat beberapa keterbatasan, yaitu sistem belum dapat melakukan penghapusan email secara langsung pada akun Gmail pengguna serta belum mampu menampilkan penjelasan rinci mengenai kata atau fitur yang mempengaruhi hasil klasifikasi secara otomatis. Penelitian ini membuktikan bahwa algoritma Naive Bayes dengan pembobotan TF-IDF efektif dalam mendeteksi spam email berbasis teks dan memiliki potensi untuk dikembangkan menjadi sistem yang lebih terintegrasi dan interpretatif di masa mendatang.

Item Type:	Undergraduate thesis
Uncontrolled Keywords:	deteksi spam, klasifikasi teks, Naive Bayes, TF-IDF, machine learning, email spam
Subjects:	Q Science > QA Mathematics > QA76 Computer software
Divisions:	Faculty of Engineering > Department of Informatic
Depositing User:	KARYONO - 196022
Date Deposited:	25 Jun 2026 03:22
Last Modified:	25 Jun 2026 03:22
URI:	http://repository.ubaya.ac.id/id/eprint/50614

Actions (login required)

View Item