IMPLEMENTASI APACHE SPARK PADA ALGORITMA BOYER-MOORE HORSPOOL UNTUK STUDI KASUS INTERNAL TRANSCRIBED SPACER & RESTRICTION ENZYME

Peningkatan jumlah data yang sangat besar menjadi permasalahan saat ini. Peningkatan jumlah data yang besar membuat penyimpanan sangat besar dan proses data menjadi sangat lama. Sedangkan, kecepatan proses sangat diperlukan untuk mengefisienkan waktu. Penelitian ini ditujukan untuk menyelesaikan per...

Full description

Saved in:
Bibliographic Details
Main Author: Fidela Zhafirah, - (Author)
Format: Book
Published: 2019-07-31.
Subjects:
Online Access:Link Metadata
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 repoupi_38771
042 |a dc 
100 1 0 |a Fidela Zhafirah, -  |e author 
245 0 0 |a IMPLEMENTASI APACHE SPARK PADA ALGORITMA BOYER-MOORE HORSPOOL UNTUK STUDI KASUS INTERNAL TRANSCRIBED SPACER & RESTRICTION ENZYME 
260 |c 2019-07-31. 
500 |a http://repository.upi.edu/38771/8/S_KOM_1406424_Tittle.pdf 
500 |a http://repository.upi.edu/38771/2/S_KOM_1406424_Chapter1.pdf 
500 |a http://repository.upi.edu/38771/3/S_KOM_1406424_Chapter2.pdf 
500 |a http://repository.upi.edu/38771/4/S_KOM_1406424_Chapter3.pdf 
500 |a http://repository.upi.edu/38771/5/S_KOM_1406424_Chapter4.pdf 
500 |a http://repository.upi.edu/38771/6/S_KOM_1406424_Chapter5.pdf 
500 |a http://repository.upi.edu/38771/7/S_KOM_1406424_Appendix.pdf 
520 |a Peningkatan jumlah data yang sangat besar menjadi permasalahan saat ini. Peningkatan jumlah data yang besar membuat penyimpanan sangat besar dan proses data menjadi sangat lama. Sedangkan, kecepatan proses sangat diperlukan untuk mengefisienkan waktu. Penelitian ini ditujukan untuk menyelesaikan permasalahan penyimpanan dan proses sebagai solusi pengolahan data besar dengan membuat model komputasi string matching dengan menggunakan algoritma Boyer-Moore Horspool menggunakan Big Data platform yaitu Apache Spark dimana Hadoop Distributed File System sebagai penyimpanan data pada cluster. Pada penelitian ini dilakukan perbandingan waktu proses pecocokan string antara stand alone, penggunaan Apache Spark single node, penggunaan Apache Spark 3 nodes, 5 nodes, 11 nodes dan 16 nodes dengan menggunakan penyimpanan Hadoop Distributed File System pada cluster di Google Cloud Platform. Studi kasus yang digunakan adalah bioinformatika dengan menyelesaikan dua permasalahan dalam bidang biologi yaitu pencarian motif terkait dengan penentuan kelompok tanaman berbunga dengan golongan tanaman lainnya dan pencarian motif sebagai deteksi terhadap gejala begomovirous sebagai sebab dari penyakit daun keriting. Pada hasil penelitian, diperoleh waktu yang tidak signifikan karena data yang digunakan masih dapat diproses oleh program klasik sehingga waktu eksekusi tidak jauh berbeda. Akurasi dari program yang dijalankan pada Apache Spark ini adalah 83,5%. 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
546 |a en 
690 |a L Education (General) 
690 |a QA76 Computer software 
655 7 |a Thesis  |2 local 
655 7 |a NonPeerReviewed  |2 local 
787 0 |n http://repository.upi.edu/38771/ 
787 0 |n http://repository.upi.edu 
856 |u https://repository.upi.edu/38771  |z Link Metadata