Analisis Big Data Berbasis Stream Processing Menggunakan Apache Spark

Authors

  • Claudia Zefanya Tumbel Institut Teknologi Harapan Bangsa
  • Herry Sitepu Institut Teknologi Harapan Bangsa
  • Maclaurin Hutagalung Institut Teknologi Harapan Bangsa

DOI:

https://doi.org/10.61769/telematika.v11i1.145

Keywords:

Big Data, Real-Time, Stream Processing, Apache Spark, Open-source software

Abstract

Teknologi big data memiliki 3 ciri utama yaitu volume, kecepatan tinggi dan kompleks. Pengolahan big data bukanlah hal yang mudah karena harus diolah secara real-time. Banyak perusahaan mengalami kendala dalam mengolah big data. Kendala tersebut berupa penyimpanan data yang tidak terstruktur, tidak lengkap, dan sulit diakses. Oleh karena itu, ada beberapa metode untuk mengolah big data, yaitu Tupel, Micro Batching, dan Widowed Real-Time Stream Processing. Metode yang digunakan dalam penelitian ini adalah windowed real-time stream processing. Penerapan stream processing membutuhkan perangkat lunak tertentu, yaitu Apache Spark. Apache Spark merupakan salah satu open-source software yang digunakan untuk menganalisis dan mengolah streaming data. Penerapan Apache Spark untuk big data dimulai dengan tahap pengintegrasian yang bertujuan agar Apache Spark dapat memperoleh data-data yang akan dianalisis. Hasil akhir dari penerapan metode ini berupa suatu sistem yang dapat membantu perusahaan untuk mengolah big data.

Author Biographies

Claudia Zefanya Tumbel, Institut Teknologi Harapan Bangsa

Claudia Zefanya Tumbel, lahir di Manado, pada tanggal 6 April 1994. Tahun 2012 menempuh pendidikan S1 di Institut Teknologi Harapan Bangsa (ITHB), Prodi Teknologi Informasi jurusan Teknik Elektro. Dan lulus pada bulan July 2016 dengan gelar Sarjana Teknik. Bidang yang diminati adalah networking. Untuk itu, penulis mengambil topik tugas akhir yang bersangkutan dengan bidang networking yang berjudul “Analisis Big Data Berbasis Stream Processing Menggunakan Apache Spark”.

Herry Sitepu, Institut Teknologi Harapan Bangsa

Herry Imanta Sitepu, menempuh pendidikan S1 di Teknik Elektro ITB dan lulus tahun 1999, dan memperoleh gelar magister dan doktor di jurusan yang sama di ITB. Sejak tahun 2006 aktif sebagai pengajar di Prodi Sistem Komputer ITHB. Minat penelitian: computer networking, programming dan distributed system.

Maclaurin Hutagalung, Institut Teknologi Harapan Bangsa

Maclaurin Hutagalung, menerima gelar Sarjana Teknik dari Institut Teknologi Bandung jurusan Teknik Elektro, gelar Magister Sains dari University of Twente Belanda di bidang Sinyal, Sistem, dan Kendali, dan gelar Doktor dari Tokyo Institute of Technology di bidang Sistem Kendali Nonlinear. Sejak tahun 2012 aktif sebagai pengajar di Departemen Sistem Komputer ITHB di Bandung. Minat penelitian pada Kendali Sistem Dinamis, Robotika, dan Penerbangan.

References

H. John. ”Definition Real-Time.” Internet: http://whatis.techtarget.com/definition/real-time, Apr. 2006 [Oct. 20, 2015].

K. Wahner. ”Real-Time Stream Processing as Game Changer in a Big Data World with Hadoop and Data Warehouse.” Internet: http://www.infoq.com/articles/stream-processing-hadoop, Sept. 10, 2014 [Oct. 20, 2015].

M. Barlow. (2013, February 25). Real-Time Big Data Analytics. (1st edition). [Online]. [Oct 20, 2015].

N. Idoudi, N. Louati, C. Duvallet, at all. (2009, January). "A Framework to Model Real-Time Databases." International Journal of Computing and Information Sciences. [Online]. 7(1), pp. 1-8. Available: http://www.ijcis.info/Vol7N1/Vol7P1N1-PP-1-11.pdf [Oct. 20, 2015].

N. Chetan. “Real-Time Event Stream Processing.” Internet:

https://www.datatorrent.com/real-time-event-stream-processing-what-are-your-choices/, March. 9, 2015 [Oct. 20, 2015].

P. Srini. ”Big Data Processing with Apache Spark.” Internet:

http://www.infoq.com/articles/apache-spark-introduction, Jan. 30, 2015 [Oct. 20, 2015].

T. Das. “Faster Stateful Stream Processing in Apache Spark Streaming.” Internet: https://databricks.com/blog/2016/02/01/faster-stateful-stream-processing-in-apache-spark-streaming.html/, Feb.1, 2016 [Jun. 20, 2016].

W. Kai. “Real-Time Stream Processing as Game Charger in a Big Data World with Hadoop and Data Warehouse.” Internet: http://www.infoq.com/articles/stream-processing-hadoop, Sept. 10, 2014 [Oct. 20, 2015].

Published

2017-02-22

Issue

Section

Articles