IMPLEMENTASI APACHE SPARK PADA ALGORITMA BOYER-MOORE HORSPOOL UNTUK STUDI KASUS INTERNAL TRANSCRIBED SPACER & RESTRICTION ENZYME

Peningkatan jumlah data yang sangat besar menjadi permasalahan saat ini. Peningkatan jumlah data yang besar membuat penyimpanan sangat besar dan proses data menjadi sangat lama. Sedangkan, kecepatan proses sangat diperlukan untuk mengefisienkan waktu. Penelitian ini ditujukan untuk menyelesaikan per...

Full description

Saved in:
Bibliographic Details
Main Author: Fidela Zhafirah, - (Author)
Format: Book
Published: 2019-07-31.
Subjects:
Online Access:Link Metadata
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Peningkatan jumlah data yang sangat besar menjadi permasalahan saat ini. Peningkatan jumlah data yang besar membuat penyimpanan sangat besar dan proses data menjadi sangat lama. Sedangkan, kecepatan proses sangat diperlukan untuk mengefisienkan waktu. Penelitian ini ditujukan untuk menyelesaikan permasalahan penyimpanan dan proses sebagai solusi pengolahan data besar dengan membuat model komputasi string matching dengan menggunakan algoritma Boyer-Moore Horspool menggunakan Big Data platform yaitu Apache Spark dimana Hadoop Distributed File System sebagai penyimpanan data pada cluster. Pada penelitian ini dilakukan perbandingan waktu proses pecocokan string antara stand alone, penggunaan Apache Spark single node, penggunaan Apache Spark 3 nodes, 5 nodes, 11 nodes dan 16 nodes dengan menggunakan penyimpanan Hadoop Distributed File System pada cluster di Google Cloud Platform. Studi kasus yang digunakan adalah bioinformatika dengan menyelesaikan dua permasalahan dalam bidang biologi yaitu pencarian motif terkait dengan penentuan kelompok tanaman berbunga dengan golongan tanaman lainnya dan pencarian motif sebagai deteksi terhadap gejala begomovirous sebagai sebab dari penyakit daun keriting. Pada hasil penelitian, diperoleh waktu yang tidak signifikan karena data yang digunakan masih dapat diproses oleh program klasik sehingga waktu eksekusi tidak jauh berbeda. Akurasi dari program yang dijalankan pada Apache Spark ini adalah 83,5%.
Item Description:http://repository.upi.edu/38771/8/S_KOM_1406424_Tittle.pdf
http://repository.upi.edu/38771/2/S_KOM_1406424_Chapter1.pdf
http://repository.upi.edu/38771/3/S_KOM_1406424_Chapter2.pdf
http://repository.upi.edu/38771/4/S_KOM_1406424_Chapter3.pdf
http://repository.upi.edu/38771/5/S_KOM_1406424_Chapter4.pdf
http://repository.upi.edu/38771/6/S_KOM_1406424_Chapter5.pdf
http://repository.upi.edu/38771/7/S_KOM_1406424_Appendix.pdf