Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib

Pendiskritan data merupakan kaedah pra-pemprosesan yang penting dalam membangunkan model pengelasan. Teknik pendiskritan data digunakan untuk menukarkan atribut selanjar kepada atribut diskrit. Ia sangat penting dalam membangunkan model berasaskan petua seperti pepohon keputusan dan set kasar. Pengg...

Full description

Saved in:
Bibliographic Details
Main Author: Mohd Shuib, Nor Liyana (Author)
Format: Book
Published: Universiti Teknologi MARA, Perlis, 2010-12.
Subjects:
Online Access:Link Metadata
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 repouitm_32042
042 |a dc 
100 1 0 |a Mohd Shuib, Nor Liyana  |e author 
245 0 0 |a Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib 
260 |b Universiti Teknologi MARA, Perlis,   |c 2010-12. 
500 |a https://ir.uitm.edu.my/id/eprint/32042/1/32042.pdf 
520 |a Pendiskritan data merupakan kaedah pra-pemprosesan yang penting dalam membangunkan model pengelasan. Teknik pendiskritan data digunakan untuk menukarkan atribut selanjar kepada atribut diskrit. Ia sangat penting dalam membangunkan model berasaskan petua seperti pepohon keputusan dan set kasar. Penggunaan teknik pendiskritan dapat meningkatkan ketepatan pengelas dan menjadikan pembelajaran lebih tepat dan laju. Objektif kajian ini ialah untuk mengaplikasikan teknik pendiskritan data yang terpilih ke atas empat set data daripada UCI Machine Learning dan membuat perbandingan prestasi berdasarkan ketepatan pengelas, bilangan petua dan panjang petua. Teknik pendiskritan yang digunakan ialah teknik Taakulan Boolean, Equal Frequency Binning dan Entropi. Setiap teknik ini diaplikasikan ke atas empat set data dari domain yang berbeza untuk mendapatkan satu teknik yang terbaik. Set data tersebut ialah Iris, Glass, Pima dan Wine. Model pengelasan perlombongan data dibangunkan menggunakan kaedah pengelas set kasar melalui beberapa proses seperti pra-pemprosesan data, pembahagian set data latihan dan ujian, perlombongan data, pengujian dan perbandingan. Satu analisis perbandingan ke atas teknik pendiskritan yang digunakan dihasilkan. Hasil analisis mendapati penggunaan teknik Taakulan Boolean menggeneralisasikan purata ketepatan yang tertinggi jika dibandingkan dengan dua teknik yang lain. 
546 |a en 
690 |a Electronic Computers. Computer Science 
690 |a Data mining 
655 7 |a Article  |2 local 
655 7 |a PeerReviewed  |2 local 
787 0 |n https://ir.uitm.edu.my/id/eprint/32042/ 
787 0 |n https://jurnalintelek.uitm.edu.my/index.php/main 
856 4 1 |u https://ir.uitm.edu.my/id/eprint/32042/  |z Link Metadata