DETEKSI BERITA HOAKS BAHASA INDONESIA MENGGUNAKAN KOMBINASI TF-IDF DAN K-NEAREST NEIGHBOR

Ari Rizkita; Johanes Terang Kita Perangin Angin; Robet Robet; Octara Pribadi; Iqbal Giffari Ritonga

Diterbitkan: Jun 3, 2026

Kata Kunci:

Berita Hoaks, K-Nearest Neighbor, Klasifikasi Teks, TF-IDF

Ari Rizkita

Johanes Terang Kita Perangin Angin

STMIK TIME

Robet Robet

Octara Pribadi

Iqbal Giffari Ritonga

Abstrak

Penyebaran berita hoaks di media digital Indonesia telah menjadi tantangan serius yang mengancam stabilitas sosial dan ketertiban publik. Berdasarkan data Kementerian Komunikasi dan Informatika, jumlah isu hoaks terus meningkat secara signifikan setiap tahunnya, sehingga diperlukan sistem deteksi otomatis yang cepat dan akurat. Penelitian ini bertujuan untuk mengimplementasikan dan menganalisis performa kombinasi metode ekstraksi fitur Term Frequency-Inverse Document Frequency (TF-IDF) dan algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan berita hoaks berbahasa Indonesia. Dataset yang digunakan berjumlah 1.000 entri seimbang yang bersumber dari TurnBackHoax.id sebagai representasi hoaks, serta Antaranews, Kompas, dan Detik sebagai representasi berita valid. Eksperimen dilakukan dengan pembagian data latih dan uji sebesar 80:20 serta pengujian iteratif pada nilai parameter K ganjil (3, 5, 7, 9, dan 11). Hasil penelitian menunjukkan bahwa model mencapai performa maksimal dengan nilai akurasi, presisi, dan recall sebesar 100% pada seluruh skenario nilai K. Hal ini mengindikasikan bahwa pembobotan statistik TF-IDF mampu membedakan pola kosakata antara klarifikasi hoaks dan teks jurnalistik secara sempurna. Kesimpulannya, algoritma KNN terbukti sangat efektif dan efisien secara komputasi untuk digunakan sebagai sistem penyaring misinformasi pada media digital di Indonesia.

Cara Mengutip

[1]

A. Rizkita, J. T. K. Perangin Angin, R. Robet, O. Pribadi, dan I. G. Ritonga, “DETEKSI BERITA HOAKS BAHASA INDONESIA MENGGUNAKAN KOMBINASI TF-IDF DAN K-NEAREST NEIGHBOR”, JTM, vol. 15, no. 1, Jun 2026.

Terbitan

Vol 15 No 1 (2026): Jurnal TIMES

Bagian

Articles

Artikel ini berlisensiCreative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Copyright (c) STMIK TIME

Referensi

[1] N. Agustina, A. Adrian, and M. Hermawati, “Implementasi Algoritma Naïve Bayes Classifier untuk Mendeteksi Berita Palsu pada Sosial Media,” Faktor Exacta, vol. 14, no. 4, p. 206, Jan. 2022, doi: 10.30998/faktorexacta.v14i4.11259.

[2] I. Gede Bagus Surya Wibawa et al., “PENERAPAN METODE INDOBERT UNTUK DETEKSI BERITA HOAKS PADA MEDIA DIGITAL BERBAHASA INDONESIA,” Jurnal Riset dan Aplikasi Mahasiswa Informatika (JRAMI), vol. 07, 2026, [Online]. Available: https://www.kaggle.com/datasets/mochamadabdulazis/deteksi-berita-hoaks-indo-dataset

[3] F. N. Rozi and D. H. Sulistyawati, “KLASIFIKASI BERITA HOAX PILPRES MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR DAN PEMBOBOTAN MENGGUNAKAN TF-IDF,” KONVERGENSI, vol. 15, no. 1, Oct. 2019, doi: 10.30996/konv.v15i1.2828.

[4] H. Dwi, “Klasifikasi Berita Hoax Menggunakan Algoritma K-Nearest Neigbhor.” [Online]. Available: www.dinus.ac.id

[5] K. Pradana and F. Budiman, “OPTIMIZATION ACCURACY VALUE OF AGRICULTURAL LAND FERTILITY CLASSIFICATION USING SOFT VOTING METHOD,” Sinkron, vol. 9, no. 1, pp. 152–164, Jan. 2024, doi: 10.33395/sinkron.v9i1.13159.

[6] R. DickiPrabowo, I. Widaningrum, and J. Karaman, “SISTEM DETEKSI BERITA HOAX PEMILU 2024 INDONESIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR (KNN) DAN SUPPORT VECTOR MACHINE (SVM),” JIKO (Jurnal Informatika dan Komputer), vol. 9, no. 1, p. 93, Feb. 2025, doi: 10.26798/jiko.v9i1.1424.

[7] A. Fardhina, R. M. Siregar, M. R. W. Br Sibarani, I. C. Br Ginting, and A. Pratama, “Sistem Deteksi Berita Hoaks berbasis Algoritma Natural Language Processing (NLP) menggunakan BERT,” Jurnal Manajemen Informatika, Sistem Informasi dan Teknologi Komputer (JUMISTIK), vol. 4, no. 1, pp. 450–461, Jun. 2025, doi: 10.70247/jumistik.v4i1.156.

[8] M. Diki Hendriyanto and N. Sari, “Muhammad Diki Hendriyanto Penerapan Algoritma K-Nearest Neighbor Penerapan Algoritma K-Nearest Neighbor dalam Klasifikasi Judul Berita Hoax.”

[9] Z. Abbas Khan, “International Journal of INTELLIGENT SYSTEMS AND APPLICATIONS IN ENGINEERING Fake News Detection Using TF-IDF Weighted with Word2Vec: An Ensemble Approach.” [Online]. Available: www.ijisae.org

[10] A. Rino Prasetyo and P. Pandu Adikara, “Klasifikasi Hoax Pada Berita Kesehatan Berbahasa Indonesia Dengan Menggunakan Metode Modified K-Nearest Neighbor,” 2018. [Online]. Available: http://j-ptiik.ub.ac.id

[11] Sahar, “Analisis Perbandingan Metode K-Nearest Neighbor dan Naïve Bayes Classiffier pada Data Set Penyakit Jantung,” Indonesian Journal of Data and Science (IJODAS), vol. 1, no. 3, pp. 79–86, 2020.

[12] M. Kurniawan Khamdani, N. Hidayat, and R. K. Dewi, “Implementasi Metode K-Nearest Neighbor Untuk Mendiagnosis Penyakit Tanaman Bawang Merah,” 2021. [Online]. Available: http://j-ptiik.ub.ac.id

JTM : Jurnal TIMES [ISSN Print 2337-3601] [ISSN Online 2549-015X]
	Dipublikasikan oleh Lembaga Penelitian dan Pengabdian Kepada Masyarakat (LPPM) STMIK TIME Jalan Merbabu No. 32 AA-BB, Medan Kota, Kota Medan, Sumatera Utara. Kode Pos: 20212 \| Telp : 061-4561932 \| Contact : [email protected]

Bilah Samping Artikel

Isi Artikel Utama

Abstrak

Rincian Artikel

Referensi

Artikel paling banyak dibaca berdasarkan penulis yang sama