Perbaikan Performa Cluster K-Means Menggunakan Sum Squared Error (SSE) Pada Analisis Online Customer Review Terhadap Produk Toko Online

Rena Nainggolan, Eviyanti Novita Purba

Abstract


Salah satu teknik dalam Data Mining yaitu clustering. Clustering adalah pengelompokan sejumlah data atau objek ke dalam cluster (group) sehingga setiap dalam cluster tersebut akan berisi data yang semirip mungkin dan berbeda dengan objek dalam cluster yang lainnya. K-means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang relatif cepat dan efisien. Namun, K-means mempunyai mempunyai kelemahan yang diakibatkan oleh penentuan pusat awal cluster. Hasil cluster yang terbentuk dari metode K-means ini sangatlah tergantung pada inisiasi nilai pusat awal cluster yang diberikan.Ini menyebabkan hasil clusternya berupa solusi yang sifatnya local optimal. Penelitian ini melakukan pencarian pusat cluster yang paling optimum berbasis Sum Of Squared Error (SSE), diharapkan pusat cluster yang diperoleh nantinya akan menghasilkan cluster - cluster, dimana antar anggota cluster memiliki tingkat kemiripan yang tinggi. Perbaikan performa cluster K-Means akan diterapkan pada Analisis Penilaian Online Customer Review dan Rating pada Online Marketplace.

References


Yoviriska, I. U & Wahjoedi (2018). Trend keputusan Belanja Online Mahasiswa Fakultas Ekonomi UM Angkatan 2014

Sidharta, S. & Suzanto, B. (2015). Pengaruh kepuasan transaksi online shopping dan kepercayaan konsumen terhadap sikap serta perilaku konsumen pada e-commerce. Jurnal computech & Bisnis. 9(1) : 23-36

Berry, M.W. and Browne, M., 2006. Lecture notes in data mining. World Scientific. [4] Susanto, S. and Suryadi, D., 2010. Pengantar data mining: mengagali pengetahuan dari bongkahan data.

Mardiana, T., Adji, T. B., & Hidayah, I. (2016). Stemming Influence on Similarity Detection of Abstract Written in Indonesia. TELKOMNIKA (Telecommunication Computing Electronics and Control), 14(1), 219-227

Agusta, Y., 2007. K-Means Penerapan, Permasalahan dan Metode Terkait. Jurnal Sistem dan Informatika, 3(1), pp.47-60.

Lloyd, S., 1982. Least squares quantization in PCM. IEEE transactions on information theory, 28(2), pp.129-137.

Lee, E.-J. & Shin, S.Y. (2014). When do consumers buy online product reviews? Effects of review quality, product type, and reviewer’s photo. Computers in Human Behavior, 31, 356–366.

Arthur, D. and Vassilvitskii, S., 2006, June. How slow is the k-means method?. In Proceedings of the twenty-second annual symposium on Computational geometry (pp. 144- 153). ACM.

Ganjisaffar, Y. (2013). Crawler4j v. 3.5. URL http://code.google.com/p/crawler4j/.[dikutip 2017-05-13]. [10] Kumar, L., & Bhatia, P. K. (2013). Text Mining: Concepts, Process and Applications. Journal of Global Research in Computer Science, 4(3), 36-39


Refbacks

  • There are currently no refbacks.