ANALISIS KLASTER PADA DATASET BESAR DENGAN ALGORITMA CLARANS (Studi Kasus : Tingkat Kemiskinan di 221 Kota/Kabupaten di Indonesia Tahun 2020)

Analisis klaster merupakan salah satu teknik multivariat yang mempunyai tujuan utama yaitu mengelompokkan objek - objek pengamatan ke dalam beberapa klaster/kelompok berdasarkan karakteristik yang dimilikinya, sehingga objek - objek yang berada di klaster yang sama memiliki tingkat kemiripan yang le...

Full description

Saved in:
Bibliographic Details
Main Author: Fitri Nurkholifah, - (Author)
Format: Book
Published: 2021-08-25.
Subjects:
Online Access:Link Metadata
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 repoupi_64474
042 |a dc 
100 1 0 |a Fitri Nurkholifah, -  |e author 
245 0 0 |a ANALISIS KLASTER PADA DATASET BESAR DENGAN ALGORITMA CLARANS (Studi Kasus : Tingkat Kemiskinan di 221 Kota/Kabupaten di Indonesia Tahun 2020) 
260 |c 2021-08-25. 
500 |a http://repository.upi.edu/64474/1/S_MAT_1700014_Title.pdf 
500 |a http://repository.upi.edu/64474/2/S_MAT_1700014_Chapter1.pdf 
500 |a http://repository.upi.edu/64474/3/S_MAT_1700014_Chapter2.pdf 
500 |a http://repository.upi.edu/64474/4/S_MAT_1700014_Chapter3.pdf 
500 |a http://repository.upi.edu/64474/5/S_MAT_1700014_Chapter4.pdf 
500 |a http://repository.upi.edu/64474/6/S_MAT_1700014_Chapter5.pdf 
500 |a http://repository.upi.edu/64474/7/S_MAT_1700014_Appendix.pdf 
520 |a Analisis klaster merupakan salah satu teknik multivariat yang mempunyai tujuan utama yaitu mengelompokkan objek - objek pengamatan ke dalam beberapa klaster/kelompok berdasarkan karakteristik yang dimilikinya, sehingga objek - objek yang berada di klaster yang sama memiliki tingkat kemiripan yang lebih tinggi dibandingkan dengan objek yang berada di klaster yang berbeda. Secara umum, metode analisis klaster dibagi menjadi dua yaitu metode hierarki dan partisi. Metode partisi dapat dibagi menjadi dua yaitu k-means dan k-medoid (PAM/CLARA). Kelemahan metode - metode tersebut yaitu kurang efektif dan efisien dalam melakukan analisis klaster pada dataset besar. Untuk mengatasi permasalahan ini maka digunakanlah algoritma CLARANS (Clustering Large Application based on RANdomized Search). CLARANS merupakan algoritma yang mengkombinasikan teknik sampling dan algoritma PAM. Pada studi kasus tingkat kemiskinan di 221 kota/kabupaten di Indonesia tahun 2020, algoritma CLARANS terbukti efektif dan efisien dalam melakukan analisis klaster pada dataset besar. Hal ini terlihat dari kualitas hasil klasterisasi yang cukup baik dengan nilai silhouette coefficient sebesar 0,6009 untuk jumlah klaster sebanyak 4 klaster. Setiap klaster memiliki jumlah anggota dan pusat klaster yang berbeda - beda dengan total cost sebesar 366,4794. Karakteristik yang terbentuk dari setiap klaster yaitu klaster 1 memiliki tingkat kemiskinan tertinggi, klaster 2 memiliki tingkat kemiskinan cukup tinggi, klaster 3 dan 4 masing - masing memiliki tingkat kemiskinan sedang dan rendah. Karena klaster 1 didominasi oleh kota/kabupaten di provinsi Nusa Tenggara Timur, maka kota/kabupaten di provinsi tersebut memerlukan perhatian yang lebih dibandingkan dengan kota/kabupaten di provinsi yang lain. Kata Kunci : Analisis Klaster, Sampling, PAM, CLARANS, Kemiskinan Cluster analysis is one of the multivariate techniques that has the main goal of grouping objects of observation into several clusters/groups based on their characteristics, so that objects in the same cluster have a higher similarity than objects in different cluster. Cluster analysis method are divided into two, hierarchical and partition. Partition method are k-means and k-medoids (PAM/CLARA). The Weakness of these algorithms are the ineffective and efficient in performing cluster analysis on large datasets. Therefore, to solve this problem the CLARANS (Clustering Large Application based on RANdomized Search) is used. CLARANS is an algorithm that combine sampling technique and PAM algorithm. In a case study of poverty rates in 221 cities/districts in Indonesia on 2020, the CLARANS algorithm has proven to be effective and efficient in performing cluster analysis on large datasets. This can be seen from the quality of the clustering results which are good enough with a silhouette coefficient value 0,6009 for 4 clusters. Each cluster has a different number of members and medoids with total cost 366,4794. The characteristics formed from each cluster are that cluster 1 has the highest proverty rate, cluster 2 has a rather high poverty rate, clusters 3 and 4 each have moderate and low poverty rates. Because cluster 1 is dominated by cities/districts in the Province of East Nusa Tenggara, so the cities/districts in that province require more attention than cities/districts in other provinces. Keywords : Cluster Analysis, Sampling, PAM, CLARANS, Poverty 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
690 |a L Education (General) 
690 |a QA Mathematics 
655 7 |a Thesis  |2 local 
655 7 |a NonPeerReviewed  |2 local 
787 0 |n http://repository.upi.edu/64474/ 
787 0 |n http://repository.upi.edu 
856 |u https://repository.upi.edu/64474  |z Link Metadata