Association Rule untuk Menghasilkan Kata Populer dari Judul Berita Online
Abstract
Situs berita online memegang peranan penting dalam penyebaran informasi melalui platform digital. Terdapat banyak situs berita online yang tersebar di dunia. Situs berita online ini telah menghasilkan berita dalam jumlah yang sangat besar. Berita-berita ini dapat dimanfaatkan untuk menggali informasi penting dan populer. Penerapan data mining melalui frequent itemset mining dan algoritma apriori dapat menghasilkan informasi berita yang sedang hangat setiap harinya. Penerapan algoritma apriori memungkinkan pembaca dapat mengetahui keterkaitan setiap kata. Penelitian ini menerapkan frequent itemset mining untuk menghasilkan kata-kata populer yang diambil dari judul berita. Keterkaitan kata populer diolah dengan menggunakan algoritma apriori yang kemudian divisualisasikan dengan menggunakan library javascript. Nilai minimum support yang digunakan dalam penelitian ini adalah besar dari 13. Nilai ini dipilih berdasarkan waktu komputasi yang digunakan saat pemrosesan data. Penelitian ini berhasil mengembangkan suatu pendekatan dalam menghasilkan kata-kata populer dan keterkaitan antar kata tersebut dalam bentuk visualisasi yang menarik.
References
Azam, M., Ahmed, T., Sabah, F., & Hussain, M. I. (2018). Feature Extraction based Text Classification using K-Nearest Neighbour Algorithm. IJCSNS International Journal of Computer Science and Network Security, 18(12), 95-101.
Borglet, C. (2012). Frequent Itemset Mining. Wires Data Mining and Knowledge Discovery, 2(6), 437 - 456.
Chistol, M., & Danubianu, M. (2021). Survey of Text Mining Research Methods and Their Innovative Applicability. Journal of Danubian Studies and Research, 11(1), 225-233.
Fuad, R. G., & Syamsuardi. (2019). Penentuan Trending Topic Berdasarkan Text Stream Menggunakan Suffix Tree Clustering. Pelambang: Universitas Sriwijaya.
Han, J., Kamber, M., & Pei, J. (2012). Data Mining Concept and Techniques 3rd Edition. Waltham USA: Morgan Kaufmann Publishers.
Han, J., Pei, J., & Kamber, M. (2012). Data Mining: Concepts and Techniques. Waltham, USA: Morgan Kaufmann.
Ladani, D. J., & Desai, N. P. (2020). Stopword Identification and Removal Techniques on TC and IR applications: A Survey. 6th International Conference on Advanced Computing and Communication Systems (ICACCS). Coimbatore, India.
Nasreen, S., Azamb, M. A., Shehzada, K., Naeemc, U., & Ghazanfara, M. A. (2014). Frequent Pattern Mining Algorithms for Finding Associated Frequent Patterns for Data Streams: A Survey. The 5th International Conference on Emerging Ubiquitous Systems and Pervasive Networks (EUSPN-2014) (pp. 109-116). Elsevier B.V.
Okumura, N., & Miura, T. (2016). Generating Headline Candidates for News Articles . IEEE 17th International Conference on Information Reuse and Integration. Las Vegas USA.
Shah, A., & Patel, P. A. (2014). A Collaborative Approach of Frequent Item Set Mining: A Survey. International Journal of Computer Applications , 107(8), 34-36.
Song, J.-W. (2018). Design and Implementation of Real-Time News App using RSS of the Internet Newspaper. Journal of Digital Contents Society, 19(4), 631-637.
Sukarto, K. A. (2017). Konjungsi Bahasa Indonesia: Suatu Tinjauan. Pujangga: Jurnal Bahasa dan Sastra, 3(1), 98-112.
Thu, Y., & Pa, W. P. (2020). Myanmar News Headline Generation with Sequence-to-sequence Model. The 23th Conference of The Oriental (COCOSDA). Myanmar: -.
Ãœnvan, Y. A. (2021). Market Basket Analysis with Association rules. Communications in Statistics - Theory and Methods , 50(7), 1615-1628.
Zul, M. I., Yulia, F., & Nurmalasari, D. (2018). Social Media Sentiment Analysis using K-Means and Naïve Bayes Algorithm. 2nd International Conference on Electrical Engineering and Informatics (ICon EEI). Batam, Indonesia.