METODE RANDOM SURVIVAL FOREST DENGAN ATURAN PEMISAHAN LOG-RANK DAN LOG-RANK SCORE UNTUK PREDIKSI DELAY PENERBANGAN AKIBAT CUACA

Metode Random Survival Forest (RSF) merupakan metode penggabungan analisis survival dengan klasifikasi. Metode ini menjadi alternatif dari model Cox Proportional Hazard ketika asumsi proportional hazard tidak terpenuhi dalam menganalisis data tersensor. Metode RSF sangat fleksibel untuk mengatasi da...

Full description

Saved in:
Bibliographic Details
Main Author: Jihan Kautsarina, - (Author)
Format: Book
Published: 2022-12-21.
Subjects:
Online Access:Link Metadata
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 repoupi_87313
042 |a dc 
100 1 0 |a Jihan Kautsarina, -  |e author 
245 0 0 |a METODE RANDOM SURVIVAL FOREST DENGAN ATURAN PEMISAHAN LOG-RANK DAN LOG-RANK SCORE UNTUK PREDIKSI DELAY PENERBANGAN AKIBAT CUACA 
260 |c 2022-12-21. 
500 |a http://repository.upi.edu/87313/1/S_MAT_1801457_Title.pdf 
500 |a http://repository.upi.edu/87313/2/S_MAT_1801457_Chapter1.pdf 
500 |a http://repository.upi.edu/87313/3/S_MAT_1801457_Chapter2.pdf 
500 |a http://repository.upi.edu/87313/4/S_MAT_1801457_Chapter3.pdf 
500 |a http://repository.upi.edu/87313/5/S_MAT_1801457_Chapter4.pdf 
500 |a http://repository.upi.edu/87313/6/S_MAT_1801457_Chapter5.pdf 
500 |a http://repository.upi.edu/87313/7/S_MAT_1801457_Appendix.pdf 
520 |a Metode Random Survival Forest (RSF) merupakan metode penggabungan analisis survival dengan klasifikasi. Metode ini menjadi alternatif dari model Cox Proportional Hazard ketika asumsi proportional hazard tidak terpenuhi dalam menganalisis data tersensor. Metode RSF sangat fleksibel untuk mengatasi data berdimensi tinggi dengan banyak kovariat. Dengan pendekatan seperti metode klasifikasi Random Forest, metode ini diawali dengan membuat sampel bootstrap, kemudian dilakukan random selection pada variabel untuk menumbuhkan pohon demi pohon hingga simpul terakhir. Performansi pembuatan RSF sangat bergantung pada aturan pemisahan. Aturan ini akan memecah node induk menjadi beberapa node anak hingga menghasilkan variabel penting (VIMP) yang paling berkontribusi. Aturan pemisahan yang digunakan dalam penelitian ini adalah Log-Rank dengan Log-Rank Score, kemudian membandingkan hasil keduanya. Indikator yang digunakan untuk membandingkan performansi kedua aturan pemisahan ini adalah dengan error rate atau nilai kesalahan prediksi. Studi kasus dilakukan pada data delay penerbangan akibat cuaca di rute bandara Soekarno Hatta menuju bandara I Gusti Ngurah Rai. Metode ini diterapkan untuk menentukan variabel yang berkontribusi pada lamanya delay penerbangan apakah lebih dari 30 menit atau kurang dari 30 menit. Hasil penelitian ini menunjukkan bahwa metode RSF dengan aturan pemisahan Log-Rank adalah pilihan terbaik untuk memprediksi delay penerbangan akibat cuaca dengan nilai error rate yang lebih kecil yaitu sebesar 0,3590 atau 35,90%. Ukuran hutan yang dibangun adalah terdiri dari 500 pohon. Urutan variabel penting yang berkontribusi di antaranya airlines, kecepatan angin, arah angin, suhu, curah hujan, dan kelembaban. Setelah performa RSF dengan Log-Rank dikatakan baik, dibuat web app sederhana untuk melakukan pengotomatisan prediksi delay penerbangan akibat cuaca. The Random Survival Forest (RSF) method is a method that combining survival analysis with classification. This method is an alternative to the Cox Proportional Hazard model when proportional hazard assumption is not fullfiled in analyzing the censored data. The RSF method is very flexible for handling high-dimensional data with many covariates. Using the approach of classification method such as the Random Forest, this method begins with drawing a bootstrap sample, then selecting variables randomly to grow tree by tree until the terminal node. Generated RSF performance is highly depends on splitting rules. This rule will split the parent node into several daughter nodes to show the most contributing variable importance (VIMP). The splitting rule that used for this research is Log-Rank and Log-Rank Score. We compare these two splitting rules. The indicator that used to compare the performance of the two splitting rules is the error rate or prediction error value. A case study was applied on flight delay data due to weather on the route of Soekarno Hatta airport to I Gusti Ngurah Rai airport. This method is applied to determine the variables that contributing in flight delays time, whether more than 30 minutes or less than 30 minutes. The results of this study indicate that the RSF method with Log-Rank splitting rules is the best choice for predicting flight delays due to weather with a smaller error rate value of 0.3590 or 35.90%. The size of the forest consists 500 trees. The sequence of important contributing variables are airlines, wind speed, wind direction, temperature, precipitation and humidity. After RSF with Log-Rank's performance was qualified as good, a simple web app is created to automate flight delay predictions due to weather. 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
690 |a L Education (General) 
690 |a QA Mathematics 
655 7 |a Thesis  |2 local 
655 7 |a NonPeerReviewed  |2 local 
787 0 |n http://repository.upi.edu/87313/ 
787 0 |n http://repository.upi.edu 
856 |u https://repository.upi.edu/87313  |z Link Metadata