Text
Arsitektur Big Data untuk Real-Time Prediction pada Streaming Data Sensor Boiler
ABSTRAK
Kebutuhan terhadap sistem waktu nyata yang mampu mengatasi karakteristik ”Velocity” pada big data adalah salah satu tantangan dalam big sensor data. Boiler atau ketel uap adalah salah satu alat yang dapat merasakan manfaat dari penerapan sistem waktu nyata tersebut. Mengintegrasikan sistem waktu nyata pada sensor tertanam yang ada di pipa-pipa boiler dapat membantu menghindari masalah pada boiler yang dapat menyebabkan kerugian besar dari segi materi. Penelitian ini bertujuan untuk membangun arsitektur big data untuk meramalkan data sensor boiler secara waktu nyata yang dirancang menggunakan perangkat lunak Apache Kafka, Apache Hadoop dan Apache Spark. Dalam penelitian ini Apache Kafka dimanfaatkan untuk menghubungkan sistem sensor tertanam dengan arsitektur big data. Data yang berhasil disalurkan dapat disimpan pada sistem file terdistribusi oleh Apache Hadoop. Lalu data yang sudah disimpan dapat diolah menjadi model forecasting dengan algoritma LSTM untuk satu langkah kedepan. Apache Spark yang menggunakan RDD mampu memproses data dengan kecepatan tinggi, seratus kali lebih cepat dari pada pemroses data bawaan hadoop, mapReduce. Sehingga waktu yang dibutuhkan dalam tahap pelatihan model forecasting menjadi lebih efisien. Hasil penelitian ini adalah sebuah model forecasting data sensor boiler yang memiliki nilai galat sebesar 0.11 (data latih) dan 0.07 (data uji) derajat celcius untuk data dari sensor suhu, dan galat sebesar 0.01 (data latih) dan 0.01 (data uji) bar untuk data dari sensor tekanan. Arsitektur yang diusulkan berhasil dikembangkan dan ditambahkan dengan user interface dashboard berbasis web untuk keperluan visualisasi. Pengujian performa pada arsitektur menunjukkan bahwa arsitektur mampu memvisualisasikan data secara realtime dengan rata-rata waktu eksekusi query Spark SQL sebesar 71 milidetik.
Kata Kunci : Big Data Forecasting, Ketel Uap, LSTM, Prediksi Waktu Nyata.
ABSTRACT
The need for a real-time system that is able to overcome the “Velocity” characteristics of big data is one of the challenges in big sensor data. Boilers or steam boilers are one of the tools that can benefit from implementing this real time system. Integrating real-time systems with embedded sensors in boiler pipes can help avoid problems that can cause huge material losses. This study aims to build a big data architecture to predict real-time boiler sensor data designed using Apache Kafka, Apache Hadoop and Apache Spark software. In this study, Apache Kafka is used to connect embedded sensor systems with big data architectures. Data that is successfully distributed can be stored on a distributed file system by Apache Hadoop. Then the data that has been saved can be processed into a forecasting model with the LSTM algorithm for one step forward. Apache Spark that uses RDD is capable of processing data at high speed, one hundred times faster than hadoop’s default data processing framework, MapReduce. So that the time needed in the forecasting model training phase becomes more efficient. The results of this study is the creation of a boiler sensor data forecasting model which has an error value of 0.11 (training data) and 0.07 (test data) degrees Celsius for data from temperature sensors, and an error of 0.01 (training data) and 0.01 (test data) bar for data from the pressure sensor. The proposed architecture was successfully developed and added with a web-based dashboard user interface for visualization purposes. Performance testing on the architecture shows that the architecture is able to visualize data in real-time with an average Spark SQL query execution time of 71 milliseconds.
Keywords: Big Data Forecasting, Boiler, Long Short Term Memory, Real-time Prediction.
902F20IV | 902 F 20-iv | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain