Implementasi ETL dan Perbandingan Performa Column- Oriented Database dan Relational Database sebagai Data Warehouse

Aaron Dwi Caesar Oktaviano(1*), Silvia Rostianingsih(2), Henry Novianus Palit(3),


(1) Program Studi Teknik Informatika
(2) Program Studi Teknik Informatika
(3) Program Studi Teknik Informatika
(*) Corresponding Author

Abstract


Implementasi Non-Relational Database sebagai Data
Warehouse dengan menggunakan Relational Data Warehouse
sebagai sumber menjadi dasar dalam pengerjaan skripsi ini.
Non-Relational dan Relational Database memiliki asumsi yang
berbeda dari segi model datanya, sehingga transformasi dari
Relational Data Warehouse tidak akan membawa hasil yang
maksimal. Dalam pengerjaan implementasi ini, Non-Relational
Database yang akan digunakan bertipe Column-Oriented/Wide-
Column Database, yaitu Cassandra. Perbandingan dengan
Relational Data Warehouse akan dilakukan dari segi latency
query, memory usage, dan cpu usage.
Implementasi ini akan dilakukan dengan membuat terlebih
dahulu model data yang sesuai dengan tiap database yang
digunakan, serta dilakukan ETL untuk memasukkan data.
Kemudian, akan diujikan 7 query atau permasalahan untuk
menjawab kebutuhan reporting perspustakaan Universitas
Kristen Petra.
Berdasarkan hasil pengujian, didapat beberapa kesimpulan.
Pemodelan data untuk Column-Oriented Database
membutuhkan perhatian lebih, karena kebutuhan pengubahan
data dapat mempengaruhi desain dari tabel. ETL juga perlu
perhatian, karena dengan tidak adanya fungsi commit, maka
perlu diulang dari awal jika gagal. Column-Oriented Database
menunjukkan hasil yang lebih baik pada query dengan kondisi
yang banyak, karena data bisa semakin cepat ditemukan dan
dikembalikan.


Keywords


Data Warehouse; NoSQL; Cassandra; Column-Oriented Database; Query processing

Full Text:

PDF

References


Bicevska, Z, Oditis, I. 2016. Towards NoSQL-based Data

Warehousing Solutions. Procedia Computer Science. Vol.

; p. 104-111

Dehdouh, K., Boussaid, O., Bentayeb, F., Kabachi, N.

Using the Column Oriented NoSQL Model for

Implementing Big Data Warehouse. Proceedings of the

st International Conference on Parallel and Distibuted

Processing Techniques and Applications, pp. 469-47

Hobbs, T. 2015. Basic Rules of Cassandra Data Modeling.

from https://www.datastax.com/dev/blog/basic-rules-ofcassandra-

data-modeling

Lane, P. 2013. Oracle Database Data Warehousing Guides.

Oracle Inc

McFadin, P. 2016. The Most Important Thing to Know in

Cassandra Data Modeling: The Primary Key. Retrieved

September 22, 2018. from

https://www.datastax.com/dev/blog/the-most-importantthing-

to-know-in-cassandra-data-modeling-the-primarykey

Vorries, B. 2014. Lesson 7: Column Oriented Databases

(AKA Big Table or WideColumn). Retrieved July 24,

from http://data-magnum.com/lesson-7-columnoriented-

databases-aka-big-table-or-wide-column

Woodey A. 2014. Forrester Ranks the NoSQL Database

Vendors. Retrieved October 15, 2018.

http://www.datanami.com/2014/10/03/forrrester-ranksnosql-

database-vendors

Yangui, R, Nabli, A, Gargouri, F. 2016. Automatic

Transformation of Data Warehouse Schema to NoSQL

Data Base: Comparative Study. Procedia Computer

Science. Vol. 9 5; p. 255-264 (2016)


Refbacks

  • There are currently no refbacks.


Jurnal telah terindeks oleh :