Klasifikasi Hoax Vs Non-Hoax Pada Berita Bencana Alam Berbahasa Indonesia Menggunakan Word Embedding

Rangga Pratama; Setio Basuki

doi:10.53697/jkomitek.v5i1.2338

Authors

Rangga Saputra Hari Pratama Universitas Muhammadiyah Malang
Setio Basuki Universitas Muhammadiyah Malang

DOI:

https://doi.org/10.53697/jkomitek.v5i1.2338

Keywords:

Hoaks, Word Embedding, LSTM, FastText, Word2Vec, GloVe, Klasifikasi Berita

Abstract

Hoaks atau berita palsu terkait bencana alam dapat menyebabkan kepanikan dan disinformasi yang berdampak luas pada masyarakat. Oleh karena itu, diperlukan metode otomatis untuk mengklasifikasikan berita hoax dan non-hoax secara efektif. Penelitian ini mengimplementasikan metode Word Embedding dan algoritma Long Short-Term Memory (LSTM) dalam klasifikasi berita hoax bencana alam berbahasa Indonesia. Tiga model Word Embedding yang digunakan adalah Word2Vec, FastText, dan GloVe. Proses penelitian melibatkan tahap preprocessing data, pembagian dataset, implementasi model LSTM, hingga analisis kinerja model dengan menggunakan metrik akurasi, precision, recall, serta F1-score. Hasil dari penelitian ini menyatakan bahwa model FastText dengan LSTM memberikan akurasi tertinggi sebesar 99%, diikuti oleh Word2Vec-LSTM dan GloVe-LSTM. Model FastText mampu menangkap informasi dari kata-kata yang jarang muncul, meningkatkan efektivitas dalam mendeteksi berita hoax. Selain itu, teknik augmentasi data menggunakan metode Random Synonym Replacement terbukti meningkatkan variasi dan keseimbangan dataset, yang berdampak positif pada performa model. Dengan penelitian ini, diharapkan dapat menjadi acuan bagi peneliti selanjutnya dalam pengembangan sistem deteksi berita hoax yang lebih akurat dan efisien, khususnya dalam konteks berita bencana alam.

References

Adrian, M. G., Prasetyowati, S. S., & Sibaroni, Y. (2023). Effectiveness of Word Embedding GloVe and Word2Vec within News Detection of Indonesian uUsing LSTM. Jurnal Media Informatika Budidarma, 7(3), 1180. https://doi.org/10.30865/mib.v7i3.6411

Amalia, J., Pakpahan, J., Pakpahan, M., Panjaitan, Y., Informatika dan Teknik Elektro, F., & Teknologi Del, I. (2022). Model Klasifikasi Berita Palsu Menggunakan Bidirectional LSTM Dan Word2Vec Sebagai Vektorisasi. Jurnal Teknik Informatika Dan Sistem Informasi, 9(4).

David Rhman, A. D. dan F. M. (2021). Penerapan Weighted Word Embedding pada Pengklasifikasian Teks Berbasis Recurrent Neural Network untuk Layanan Pengaduan Perusahaan Transportasi.

Ellaky, Z., Benabbou, F., Matrane, Y., & Qaqa, S. (2024). A Hybrid Deep Learning Architecture for Social Media Bots Detection Based on BiGRU-LSTM and GloVe Word Embedding. IEEE Access, 12, 100278–100294. https://doi.org/10.1109/ACCESS.2024.3430859

Farhan, S., Shoukat, R., & Aslam, A. (2024). Automatic Sarcasm Detection on Cross-Platform Social Media Datasets: A GLoVe and Bi-LSTM Based Approach. Journal of Universal Computer Science, 30(5), 674–693. https://doi.org/10.3897/jucs.104790

Fauzy, A. R. I., & Erwin Budi Setiawan. (2023). Detecting Fake News on Social Media Combined with the CNN Methods. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 7(2), 271–277. https://doi.org/10.29207/resti.v7i2.4889

Ginting, I. (2024). Pentingnya Daya Kritis Masyarakat Tangkal HOAX . Https://Babelprov.Go.Id/Artikel_detil/Pentingnya-Daya-Kritis-Masyarakat-Tangkal-Hoax%C2%A0.

Kominfo. (2024). Siaran Pers No. 02/HM/KOMINFO/01/2024 tentang Hingga Akhir Tahun 2023, Kominfo Tangani 12.547 Isu Hoaks. Https://Www.Kominfo.Go.Id/Berita/Siaran-Pers/Detail/Siaran-Pers-No-02-Hm-Kominfo-01-2024-Tentang-Hingga-Akhir-Tahun-2023-Kominfo-Tangani-12-547-Isu-Hoaks.

Nurdin, A., Anggo, B., Aji, S., Bustamin, A., & Abidin, Z. (2020). Perbandingan Kinerja Word Embedding Word2vec, Glove, Dan Fasttext Pada Klasifikasi Teks. Jurnal TEKNOKOMPAK, 14(2), 74.

Pilehvar, M. T., & Camacho-Collados, J. (2020). Embeddings in Natural Language Processing Theory and Advances in Vector Representation of Meaning. Morgan publisher.

Raheem, M., & Chong, Y. C. (2024). E-Commerce Fake Reviews Detection Using LSTM with Word2Vec Embedding. Journal of Computing and Information Technology, 32(2), 65–80. https://doi.org/10.20532/cit.2024.1005803

Reddy, J., Mundra, S., & Mundra, A. (2024). Ensembling Deep Learning Models for Fake News Classification. Procedia Computer Science, 235, 2766–2774. https://doi.org/10.1016/j.procs.2024.04.261

Sabri, T., Bahassine, S., El Beggar, O., & Kissi, M. (2024a). An improved Arabic text classification method using word embedding. International Journal of Electrical and Computer Engineering, 14(1), 721–731. https://doi.org/10.11591/ijece.v14i1.pp721-731

Sabri, T., Bahassine, S., El Beggar, O., & Kissi, M. (2024b). An improved Arabic text classification method using word embedding. International Journal of Electrical and Computer Engineering, 14(1), 721–731. https://doi.org/10.11591/ijece.v14i1.pp721-731

Sastrawan, I. K., Bayupati, I. P. A., & Arsa, D. M. S. (2022). Detection of fake news using deep learning CNN–RNN based methods. ICT Express, 8(3), 396–408. https://doi.org/10.1016/j.icte.2021.10.003

Setiawan, E., & Lestari, I. (2021). Stance Classification Pada Berita Berbahasa Indonesia Berbasis Bidirectional LSTM. Journal Of Intelligent Systems And Computation.

Shaker, N. H., & Dhannoon, B. N. (2024a). Word embedding for detecting cyberbullying based on recurrent neural networks. IAES International Journal of Artificial Intelligence, 13(1), 500–508. https://doi.org/10.11591/ijai.v13.i1.pp500-508

Shaker, N. H., & Dhannoon, B. N. (2024b). Word embedding for detecting cyberbullying based on recurrent neural networks. IAES International Journal of Artificial Intelligence, 13(1), 500–508. https://doi.org/10.11591/ijai.v13.i1.pp500-508

Sunan, R. A., K., H. F. E., & Aditya, C. S. K. (2024). Klasifikasi Hoax Berita Politik Menggunakan Algoritma Long Short-Term Memory (LSTM) dengan Penambahan Fitur Embedding Global Vector (GloVe). Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 10(2), 287. https://doi.org/10.26418/jp.v10i2.76042

Vinit, B. S. (2020). An efficient fake news detector. 2020 International Conference on Computer Communication and Informatics, ICCCI 2020. https://doi.org/10.1109/ICCCI48352.2020.9104177

Zahra, A., & Fauzan, M. N. (2022). Sistem Identifikasi “Fake News” menggunakan Metode Multinomial Naïve Bayes. Jurnal Sistem Dan Teknologi Informasi (JustIN), 10(4), 489. https://doi.org/10.26418/justin.v10i4.52441