Ekstraksi Wawasan Dari Platform X (Twitter): Aplikasi Crisp-Dm Dan Visualisasi Tableau Dalam Analisis Sentimen Debat Capres Dan Cawapres Pertama 2024 Di Indonesia

  • Marastrika Farhan Nur Haiban Universitas Gunadarma
  • Nur Sultan Salahuddin Universitas Gunadarma

Abstract

Analisis sentimen publik terkait debat capres-cawapres pertama tahun 2024 di Indonesia menggunakan data dari Platform X (Twitter). Penelitian ini menggunakan metodologi CRISP-DM yang meliputi tahapan Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, dan Deployment. Data dikumpulkan menggunakan teknik crawling Tweet-Harvest API, kemudian diolah menggunakan teknik Natural Language Processing (NLP) untuk mengelompokkan sentimen ke dalam tiga kategori, yaitu positif, negatif, dan netral. Pemodelan dilakukan menggunakan Random Forest dengan pembagian dataset sebesar 70% untuk data training dan 30% untuk data testing. Meskipun model menunjukkan akurasi yang tinggi pada data training, namun terdapat indikasi overfitting dan oversampling pada data testing. Untuk mengatasi hal tersebut, diterapkan teknik undersampling dan hyperparameter tuning yang menghasilkan akurasi model sebesar 62%. Hasil analisis sentimen divisualisasikan menggunakan Tableau sehingga menghasilkan dashboard yang interaktif sehingga mudah dipahami oleh audiens teknis maupun non-teknis. Analisis Sentimen ini memberikan wawasan mendalam tentang dinamika opini publik selama debat presiden dan wakil presiden pertama di Indonesia pada tahun 2024, dengan rekomendasi untuk pengembangan lebih lanjut guna meningkatkan kinerja model dan kualitas visualisasi.

Kata kunci— Analisis Sentimen, CRISP-DM, Tableau, Debat Capres Cawapres Pertama, X (Twitter)

References

[1] Haryanto, A. T. (2024). APJII: Jumlah Pengguna Internet Indonesia Tembus 221 Juta Orang Baca artikel detikinet. Detikinet, February, 1–3.
[2] Kominfo. (2024). Pengguna Internet Meningkat, Kominfo Galang Kolaborasi Tingkatkan Kualitas Layanan. Kominfo, 80.
[3] Dean, B. (2024). X (Twitter) Statistics: How Many People Use X? (2024). Backlinko, November 2013. https://backlinko.com/twitter-users
[4] Manullang, O., Prianto, C., & Harani, N. H. (2023). Analisis Sentimen Untuk Memprediksi Hasil Calon Pemilu Presiden Menggunakan Lexicon Based Dan Random Forest. Jurnal Ilmiah Informatika, 11(02), 159–169. https://doi.org/10.33884/jif.v11i02.7987
[5] Putra, S. A., & Wijaya, A. (2023). Analisis Sentimen Artificial Intelligence (Ai) Pada Media Sosial Twitter Menggunakan Metode Lexicon Based. JuSiTik : Jurnal Sistem Dan Teknologi Informasi Komunikasi, 7(1), 21–28. https://doi.org/10.32524/jusitik.v7i1.1042
[6] Al Malik, M. H., Andrian, R., & Utami, Y. T. (2023). Analisis Visualisasi Data Prestasi Mahasiswa Universitas Lampung Menggunakan Tableau. Jurnal Pepadun, 4(2), 158–165. https://doi.org/10.23960/pepadun.v4i2.172
[7] Yonada Nancy. (2024). Rangkuman Hasil debat Capres-Cawapres 1-5, Siapa Pilihan Rakyat? Tirto.Id.
[8] Mutiarasari, K. A. (2024). Tema dan Jadwal Debat Keempat Pilpres 2024, Cek di Sini. Detik.Com. https://news.detik.com/pemilu/d-7134224/tema-dan-jadwal-debat-keempat-pilpres-2024-cek-di-sini
[9] Hadna, N. M. S., Paulus, I. S., & Winarno, W. (2016). Studi Literatur Tentang Perbandingan Metode Untuk Proses Analisis Sentimen Di Twitter. Seminar Nasional Teknologi Informasi Dan Komunikasi, March, 1–8.
[10] Riama santy sitorus, b. junedi hutagaol. (2023). Solusi DesainArsitekturSistem Informasi TerintegrasiDengan Pemanfaatan Media Sosial Untuk Strategi Peningkatan Kualitas Daya Tarik Wisata. Journal of Tourism and Education, 1–17.
[11] Budiarto, J. (2024). Identifikasi Kebutuhan Masyarakat Nusa Tenggara Barat pada Pandemi Covid-19 di Media Sosial dengan Metode Crawling.pdf. Jurnal Teknologi Informasi Dan Multimedia.
[12] Priansyah, E., & Sutabri, T. (2024). IJM: Indonesian Journal of Multidisciplinary Analisis Sentimen Berbasis Naïve Bayes Pada Media Sosial Twitter Terhadap Hasil Pemilu Indonesia 2024. IJM: Indonesian Journal of Multidisciplinary, 2, 128–138. https://journal.csspublishing/index.php/ijm
[13] Papakyriakou, D., & Barbounakis, I. S. (2022). Data Mining Methods: A Review. International Journal of Computer Applications, 183(48), 5–19. https://doi.org/10.5120/ijca2022921884
[14] Schröer, C., Kruse, F., & Gómez, J. M. (2021). A systematic literature review on applying CRISP-DM process model. Procedia Computer Science, 181(2019), 526–534. https://doi.org/10.1016/j.procs.2021.01.199
[15] Lauriola, I., Lavelli, A., & Aiolli, F. (2022). An introduction to Deep Learning in Natural Language Processing: Models, techniques, and tools. Neurocomputing, 470(xxxx), 443–456. https://doi.org/10.1016/j.neucom.2021.05.103
[16] Angreini, S. dan supratman edi. (2021). Visualisasi Data Lokasi Rawan Bencana Di Provinsi Sumatera Selatan Menggunakan Tableau | Jurnal Nasional Ilmu Komputer. Jurnal Nasional Ilmu Komputer.http://journal.jisinstitute.org/index.php/jnik/article/view/528
[17] Kohli, S., & Joshi, P. (2021). “ A Brief Study on Random Forest Using Python .” International Journal of Advances in Engineering and Management, 3(6), 2063–2069. https://doi.org/10.35629/5252-030620632069
Published
2025-02-15
Abstract viewed = 0 times
PDF downloaded = 0 times