Association Rule Integrasi Pendekatan Metode Custom Hashing dan Data Partitioning untuk Mempercepat Proses Pencarian Frekuensi Item-set pada Algoritma Apriori
DOI:
https://doi.org/10.30812/matrik.v20i1.833Keywords:
Apriori, Aturan Asosiasi, FP-Growth, Hashing, Data PartisiAbstract
Data mining dengan peran asosiasi sudah banyak digunakan oleh dunia usaha, salah satu algoritma yang sering digunakan untuk aturan asosiasi adalah apriori. Namun apriori memiliki kelemahan dalam hal performa, karena pada setiap penentuan frequent k-itemset harus melakukan scan database. Hal ini akan menjadi masalah apabila kandidat k-itemset memiliki dimensi yang banyak. proses scan database yang besar akan memakan waktu yang lama dan berpengaruh pada penggunaan memori dan prosesor. Apriori sudah sering dikembangkan, salah satu yang populer adalah Frequent Pattern (fp-growth), apriori dan fp-growth sama-sama merupakan algoritma untuk aturan asosiasi, hanya saja fp-growth menggunakan pendekatan yang berbeda dengan apriori yakni menggunakan pendekatan Frequent Pattern Tree (fp-tree). Meski fp-growth memiiki performa yang bagus ketika scan database namun rules yang di hasilkan oleh fp-growth tidak sebaik yang di hasilkan oleh apriori. Alternatif lain yang bisa digunakan adalah metode hashing, hal ini bisa menjadi solusi untuk mengatasi masalah dalam proses pencarian dan penentuan frequent k-itemset, sehingga proses scan database bisa lebih cepat. Tujuan penelitian adalah memperbaiki kinerja apriori dalam proses pencarian frekuensi itemset sehingga waktu scan database bisa lebih cepat
Downloads
References
[2] R. M. Chezian and K. S. Kumar, “A Survey on Association Rule Mining using Apriori Algorithm,†International Journal of Computer Applications, vol. 45, no. 5, 2012.
[3] M. North, Data Mining for the Messes. Utah: CreateSpace Independent Publishing Platform, 2016.
[4] L. Jian-ping, W. Ying, and Y. Fan-ding, “Incremental Mining Alogorithm Pre-FP in Association Rules Based on FP-tree,†in First International Conference on Networking and Distributed Computing, 2010, pp. 199–203.
[5] J. Pieprzyk and B. Sadeghiyan, Design of Hashing Algorithms. Berlin: Springer Berlin Heidelberg, 2006.
[6] V. Kashyp and A. K. Gupta, “A Review on Modern Approach: New Parameter for Recent Improvement of Apriori Algorithm,†International Journal of Computer Science and Mobile Computing, vol. 4, no. 12, 2015.
[7] C. C. Aggarwal, Data Mining: The Textbook. Switzerland: Springer, 2015.
[8] J. Han and M. Kamber, Data Mining: Concepts and Techniques, 2nd ed. San Fransisco: Elsevier Science & Technology, 2006.
[9] D. T. Larose, Data Mining Method and Model. Canada: Wiley, 2007.
[10] V. Kotu and B. Deshpande, Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner. Burlington: Morgan Kaufmann, 2014.
[11] R. Rathinasabapathy and R. Bhaskaran, “Performance Comparison of Hashing Algorithm with Apriori,†in International Conference on Advances in Computing, Control, and Telecommunication Technologies, 2009, pp. 729–733.
[12] J. S. Park, M.-S. Chen, and P. S. Yu, “An effective hash-based algorithm for mining association rules,†ACM SIGMOD Record, vol. 24, no. 2, pp. 175–186, May 1995.
[13] A. Bhandari, A. Gupta, and D. Das, “Improvised Apriori Algorithm Using Frequent Pattern Tree for Real Time Applications in Data Mining,†Procedia Computer Science, vol. 46, pp. 644–651, 2015.
[14] B. M. Rao and S. Aguru, “A Hash Based Frequent Itemset Mining using Rehashing,†International Journal on Recent and Innovation Trends in Computing and Communication, vol. 2, no. 12, 2014.
[15] A. M. J. M. Z. Rahman, P. Balasubramanie, and P. V. Krihsna, “A Hash based Mining Algorithm for Maximal Frequent Item Sets using Linear Probing,†Journal of Computer Science, vol. 8, no. 1, pp. 14–19, 2009.
Downloads
Published
Issue
Section
How to Cite
Similar Articles
- Yully Sofyah Waode, Anang Kurnia, Yenni Angraini, K-Means Optimization Algorithm to Improve Cluster Quality on Sparse Data , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 23 No. 3 (2024)
- Denny Indrajaya, Adi Setiawan, Bambang Susanto, Comparison of k-Nearest Neighbor and Naive Bayes Methods for SNP Data Classification , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 1 (2022)
- Firda Yunita Sari, Maharani sukma Kuntari, Hani Khaulasari, Winda Ari Yati, Comparison of Support Vector Machine Performance with Oversampling and Outlier Handling in Diabetic Disease Detection Classification , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 3 (2023)
- Susandri Susandri, Ahmad Zamsuri, Nurliana Nasution, Yoyon Efendi, Hiba Basim Alwan, The Mitigating Overfitting in Sentiment Analysis Insights from CNN-LSTM Hybrid Models , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 2 (2025)
- Nurdin Nurdin, Erni Susanti, Hafizh Al-Kautsar Aidilof, Dadang Priyanto, Comparison of Naive Bayes and Dempster Shafer Methods in Expert System for Early Diagnosis of COVID-19 , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 1 (2022)
- Desi Vinsensia, Siskawati Amri, Jonhariono Sihotang, Hengki Tamando Sihotang, New Method for Identification and Response to Infectious Disease Patterns Based on Comprehensive Health Service Data , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 23 No. 3 (2024)
- Vivin Nur Aziza, Utami Dyah Syafitri, Anwar Fitrianto, Optimizing Currency Circulation Forecasts in Indonesia: A Hybrid Prophet- Long Short Term Memory Model with Hyperparameter Tuning , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 1 (2024)
- Lalu Ganda Rady Putra, Anthony Anggrawan, Pengelompokan Penerima Bantuan Sosial Masyarakat dengan Metode K-Means , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 1 (2021)
- Fadhilah Dwi Ananda, Yoga Pristyanto, Analisis Sentimen Pengguna Twitter Terhadap Layanan Internet Provider Menggunakan Algoritma Support Vector Machine , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 2 (2021)
- Amir Ali, Klasterisasi Data Rekam Medis Pasien Menggunakan Metode K-Means Clustering di Rumah Sakit Anwar Medika Balong Bendo Sidoarjo , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 1 (2019)
You may also start an advanced similarity search for this article.