Klasifikasi Hoax Vs Non-Hoax Pada Berita Bencana Alam Berbahasa Indonesia Menggunakan Word Embedding
DOI:
https://doi.org/10.53697/jkomitek.v5i1.2338Keywords:
Hoaks, Word Embedding, LSTM, FastText, Word2Vec, GloVe, Klasifikasi BeritaAbstract
Hoaks atau berita palsu terkait bencana alam dapat menyebabkan kepanikan dan disinformasi yang berdampak luas pada masyarakat. Oleh karena itu, diperlukan metode otomatis untuk mengklasifikasikan berita hoax dan non-hoax secara efektif. Penelitian ini mengimplementasikan metode Word Embedding dan algoritma Long Short-Term Memory (LSTM) dalam klasifikasi berita hoax bencana alam berbahasa Indonesia. Tiga model Word Embedding yang digunakan adalah Word2Vec, FastText, dan GloVe. Proses penelitian melibatkan tahap preprocessing data, pembagian dataset, implementasi model LSTM, hingga analisis kinerja model dengan menggunakan metrik akurasi, precision, recall, serta F1-score. Hasil dari penelitian ini menyatakan bahwa model FastText dengan LSTM memberikan akurasi tertinggi sebesar 99%, diikuti oleh Word2Vec-LSTM dan GloVe-LSTM. Model FastText mampu menangkap informasi dari kata-kata yang jarang muncul, meningkatkan efektivitas dalam mendeteksi berita hoax. Selain itu, teknik augmentasi data menggunakan metode Random Synonym Replacement terbukti meningkatkan variasi dan keseimbangan dataset, yang berdampak positif pada performa model. Dengan penelitian ini, diharapkan dapat menjadi acuan bagi peneliti selanjutnya dalam pengembangan sistem deteksi berita hoax yang lebih akurat dan efisien, khususnya dalam konteks berita bencana alam.
References
Adrian, M. G., Prasetyowati, S. S., & Sibaroni, Y. (2023). Effectiveness of Word Embedding GloVe and Word2Vec within News Detection of Indonesian uUsing LSTM. Jurnal Media Informatika Budidarma, 7(3), 1180. https://doi.org/10.30865/mib.v7i3.6411
Amalia, J., Pakpahan, J., Pakpahan, M., Panjaitan, Y., Informatika dan Teknik Elektro, F., & Teknologi Del, I. (2022). Model Klasifikasi Berita Palsu Menggunakan Bidirectional LSTM Dan Word2Vec Sebagai Vektorisasi. Jurnal Teknik Informatika Dan Sistem Informasi, 9(4).
David Rhman, A. D. dan F. M. (2021). Penerapan Weighted Word Embedding pada Pengklasifikasian Teks Berbasis Recurrent Neural Network untuk Layanan Pengaduan Perusahaan Transportasi.
Ellaky, Z., Benabbou, F., Matrane, Y., & Qaqa, S. (2024). A Hybrid Deep Learning Architecture for Social Media Bots Detection Based on BiGRU-LSTM and GloVe Word Embedding. IEEE Access, 12, 100278–100294. https://doi.org/10.1109/ACCESS.2024.3430859
Farhan, S., Shoukat, R., & Aslam, A. (2024). Automatic Sarcasm Detection on Cross-Platform Social Media Datasets: A GLoVe and Bi-LSTM Based Approach. Journal of Universal Computer Science, 30(5), 674–693. https://doi.org/10.3897/jucs.104790
Fauzy, A. R. I., & Erwin Budi Setiawan. (2023). Detecting Fake News on Social Media Combined with the CNN Methods. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 7(2), 271–277. https://doi.org/10.29207/resti.v7i2.4889
Ginting, I. (2024). Pentingnya Daya Kritis Masyarakat Tangkal HOAX . Https://Babelprov.Go.Id/Artikel_detil/Pentingnya-Daya-Kritis-Masyarakat-Tangkal-Hoax%C2%A0.
Kominfo. (2024). Siaran Pers No. 02/HM/KOMINFO/01/2024 tentang Hingga Akhir Tahun 2023, Kominfo Tangani 12.547 Isu Hoaks. Https://Www.Kominfo.Go.Id/Berita/Siaran-Pers/Detail/Siaran-Pers-No-02-Hm-Kominfo-01-2024-Tentang-Hingga-Akhir-Tahun-2023-Kominfo-Tangani-12-547-Isu-Hoaks.
Nurdin, A., Anggo, B., Aji, S., Bustamin, A., & Abidin, Z. (2020). Perbandingan Kinerja Word Embedding Word2vec, Glove, Dan Fasttext Pada Klasifikasi Teks. Jurnal TEKNOKOMPAK, 14(2), 74.
Pilehvar, M. T., & Camacho-Collados, J. (2020). Embeddings in Natural Language Processing Theory and Advances in Vector Representation of Meaning. Morgan publisher.
Raheem, M., & Chong, Y. C. (2024). E-Commerce Fake Reviews Detection Using LSTM with Word2Vec Embedding. Journal of Computing and Information Technology, 32(2), 65–80. https://doi.org/10.20532/cit.2024.1005803
Reddy, J., Mundra, S., & Mundra, A. (2024). Ensembling Deep Learning Models for Fake News Classification. Procedia Computer Science, 235, 2766–2774. https://doi.org/10.1016/j.procs.2024.04.261
Sabri, T., Bahassine, S., El Beggar, O., & Kissi, M. (2024a). An improved Arabic text classification method using word embedding. International Journal of Electrical and Computer Engineering, 14(1), 721–731. https://doi.org/10.11591/ijece.v14i1.pp721-731
Sabri, T., Bahassine, S., El Beggar, O., & Kissi, M. (2024b). An improved Arabic text classification method using word embedding. International Journal of Electrical and Computer Engineering, 14(1), 721–731. https://doi.org/10.11591/ijece.v14i1.pp721-731
Sastrawan, I. K., Bayupati, I. P. A., & Arsa, D. M. S. (2022). Detection of fake news using deep learning CNN–RNN based methods. ICT Express, 8(3), 396–408. https://doi.org/10.1016/j.icte.2021.10.003
Setiawan, E., & Lestari, I. (2021). Stance Classification Pada Berita Berbahasa Indonesia Berbasis Bidirectional LSTM. Journal Of Intelligent Systems And Computation.
Shaker, N. H., & Dhannoon, B. N. (2024a). Word embedding for detecting cyberbullying based on recurrent neural networks. IAES International Journal of Artificial Intelligence, 13(1), 500–508. https://doi.org/10.11591/ijai.v13.i1.pp500-508
Shaker, N. H., & Dhannoon, B. N. (2024b). Word embedding for detecting cyberbullying based on recurrent neural networks. IAES International Journal of Artificial Intelligence, 13(1), 500–508. https://doi.org/10.11591/ijai.v13.i1.pp500-508
Sunan, R. A., K., H. F. E., & Aditya, C. S. K. (2024). Klasifikasi Hoax Berita Politik Menggunakan Algoritma Long Short-Term Memory (LSTM) dengan Penambahan Fitur Embedding Global Vector (GloVe). Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 10(2), 287. https://doi.org/10.26418/jp.v10i2.76042
Vinit, B. S. (2020). An efficient fake news detector. 2020 International Conference on Computer Communication and Informatics, ICCCI 2020. https://doi.org/10.1109/ICCCI48352.2020.9104177
Zahra, A., & Fauzan, M. N. (2022). Sistem Identifikasi “Fake News” menggunakan Metode Multinomial Naïve Bayes. Jurnal Sistem Dan Teknologi Informasi (JustIN), 10(4), 489. https://doi.org/10.26418/justin.v10i4.52441
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Rangga Saputra Hari Pratama , Setio Basuki

This work is licensed under a Creative Commons Attribution 4.0 International License.