DETEKSI BERITA HOAKS BAHASA INDONESIA MENGGUNAKAN KOMBINASI TF-IDF DAN K-NEAREST NEIGHBOR

Isi Artikel Utama

Ari Rizkita
Johanes Terang Kita Perangin Angin
Robet Robet
Octara Pribadi
Iqbal Giffari Ritonga

Abstrak

Penyebaran berita hoaks di media digital Indonesia telah menjadi tantangan serius yang mengancam stabilitas sosial dan ketertiban publik. Berdasarkan data Kementerian Komunikasi dan Informatika, jumlah isu hoaks terus meningkat secara signifikan setiap tahunnya, sehingga diperlukan sistem deteksi otomatis yang cepat dan akurat. Penelitian ini bertujuan untuk mengimplementasikan dan menganalisis performa kombinasi metode ekstraksi fitur Term Frequency-Inverse Document Frequency (TF-IDF) dan algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan berita hoaks berbahasa Indonesia. Dataset yang digunakan berjumlah 1.000 entri seimbang yang bersumber dari TurnBackHoax.id sebagai representasi hoaks, serta Antaranews, Kompas, dan Detik sebagai representasi berita valid. Eksperimen dilakukan dengan pembagian data latih dan uji sebesar 80:20 serta pengujian iteratif pada nilai parameter K ganjil (3, 5, 7, 9, dan 11). Hasil penelitian menunjukkan bahwa model mencapai performa maksimal dengan nilai akurasi, presisi, dan recall sebesar 100% pada seluruh skenario nilai K. Hal ini mengindikasikan bahwa pembobotan statistik TF-IDF mampu membedakan pola kosakata antara klarifikasi hoaks dan teks jurnalistik secara sempurna. Kesimpulannya, algoritma KNN terbukti sangat efektif dan efisien secara komputasi untuk digunakan sebagai sistem penyaring misinformasi pada media digital di Indonesia.

Rincian Artikel

Cara Mengutip
[1]
A. Rizkita, J. T. K. Perangin Angin, R. Robet, O. Pribadi, dan I. G. Ritonga, “DETEKSI BERITA HOAKS BAHASA INDONESIA MENGGUNAKAN KOMBINASI TF-IDF DAN K-NEAREST NEIGHBOR”, JTM, vol. 15, no. 1, Jun 2026.
Bagian
Articles

Referensi

[1] N. Agustina, A. Adrian, and M. Hermawati, “Implementasi Algoritma Naïve Bayes Classifier untuk Mendeteksi Berita Palsu pada Sosial Media,” Faktor Exacta, vol. 14, no. 4, p. 206, Jan. 2022, doi: 10.30998/faktorexacta.v14i4.11259.

[2] I. Gede Bagus Surya Wibawa et al., “PENERAPAN METODE INDOBERT UNTUK DETEKSI BERITA HOAKS PADA MEDIA DIGITAL BERBAHASA INDONESIA,” Jurnal Riset dan Aplikasi Mahasiswa Informatika (JRAMI), vol. 07, 2026, [Online]. Available: https://www.kaggle.com/datasets/mochamadabdulazis/deteksi-berita-hoaks-indo-dataset

[3] F. N. Rozi and D. H. Sulistyawati, “KLASIFIKASI BERITA HOAX PILPRES MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR DAN PEMBOBOTAN MENGGUNAKAN TF-IDF,” KONVERGENSI, vol. 15, no. 1, Oct. 2019, doi: 10.30996/konv.v15i1.2828.

[4] H. Dwi, “Klasifikasi Berita Hoax Menggunakan Algoritma K-Nearest Neigbhor.” [Online]. Available: www.dinus.ac.id

[5] K. Pradana and F. Budiman, “OPTIMIZATION ACCURACY VALUE OF AGRICULTURAL LAND FERTILITY CLASSIFICATION USING SOFT VOTING METHOD,” Sinkron, vol. 9, no. 1, pp. 152–164, Jan. 2024, doi: 10.33395/sinkron.v9i1.13159.

[6] R. DickiPrabowo, I. Widaningrum, and J. Karaman, “SISTEM DETEKSI BERITA HOAX PEMILU 2024 INDONESIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR (KNN) DAN SUPPORT VECTOR MACHINE (SVM),” JIKO (Jurnal Informatika dan Komputer), vol. 9, no. 1, p. 93, Feb. 2025, doi: 10.26798/jiko.v9i1.1424.

[7] A. Fardhina, R. M. Siregar, M. R. W. Br Sibarani, I. C. Br Ginting, and A. Pratama, “Sistem Deteksi Berita Hoaks berbasis Algoritma Natural Language Processing (NLP) menggunakan BERT,” Jurnal Manajemen Informatika, Sistem Informasi dan Teknologi Komputer (JUMISTIK), vol. 4, no. 1, pp. 450–461, Jun. 2025, doi: 10.70247/jumistik.v4i1.156.

[8] M. Diki Hendriyanto and N. Sari, “Muhammad Diki Hendriyanto Penerapan Algoritma K-Nearest Neighbor Penerapan Algoritma K-Nearest Neighbor dalam Klasifikasi Judul Berita Hoax.”

[9] Z. Abbas Khan, “International Journal of INTELLIGENT SYSTEMS AND APPLICATIONS IN ENGINEERING Fake News Detection Using TF-IDF Weighted with Word2Vec: An Ensemble Approach.” [Online]. Available: www.ijisae.org

[10] A. Rino Prasetyo and P. Pandu Adikara, “Klasifikasi Hoax Pada Berita Kesehatan Berbahasa Indonesia Dengan Menggunakan Metode Modified K-Nearest Neighbor,” 2018. [Online]. Available: http://j-ptiik.ub.ac.id

[11] Sahar, “Analisis Perbandingan Metode K-Nearest Neighbor dan Naïve Bayes Classiffier pada Data Set Penyakit Jantung,” Indonesian Journal of Data and Science (IJODAS), vol. 1, no. 3, pp. 79–86, 2020.

[12] M. Kurniawan Khamdani, N. Hidayat, and R. K. Dewi, “Implementasi Metode K-Nearest Neighbor Untuk Mendiagnosis Penyakit Tanaman Bawang Merah,” 2021. [Online]. Available: http://j-ptiik.ub.ac.id