Implementasi ETL dan Perbandingan Performa Column- Oriented Database dan Relational Database sebagai Data Warehouse

Authors

  • Aaron Dwi Caesar Oktaviano Program Studi Teknik Informatika
  • Silvia Rostianingsih Program Studi Teknik Informatika
  • Henry Novianus Palit Program Studi Teknik Informatika

Keywords:

Website, Customer Relationship Management, CRM, Sales Force Automation, Sales Representative, Sales Manager, Sales, Pareto Analysis

Abstract

Implementasi Non-Relational Database sebagai Data
Warehouse dengan menggunakan Relational Data Warehouse
sebagai sumber menjadi dasar dalam pengerjaan skripsi ini.
Non-Relational dan Relational Database memiliki asumsi yang
berbeda dari segi model datanya, sehingga transformasi dari
Relational Data Warehouse tidak akan membawa hasil yang
maksimal. Dalam pengerjaan implementasi ini, Non-Relational
Database yang akan digunakan bertipe Column-Oriented/Wide-
Column Database, yaitu Cassandra. Perbandingan dengan
Relational Data Warehouse akan dilakukan dari segi latency
query, memory usage, dan cpu usage.
Implementasi ini akan dilakukan dengan membuat terlebih
dahulu model data yang sesuai dengan tiap database yang
digunakan, serta dilakukan ETL untuk memasukkan data.
Kemudian, akan diujikan 7 query atau permasalahan untuk
menjawab kebutuhan reporting perspustakaan Universitas
Kristen Petra.
Berdasarkan hasil pengujian, didapat beberapa kesimpulan.
Pemodelan data untuk Column-Oriented Database
membutuhkan perhatian lebih, karena kebutuhan pengubahan
data dapat mempengaruhi desain dari tabel. ETL juga perlu
perhatian, karena dengan tidak adanya fungsi commit, maka
perlu diulang dari awal jika gagal. Column-Oriented Database
menunjukkan hasil yang lebih baik pada query dengan kondisi
yang banyak, karena data bisa semakin cepat ditemukan dan
dikembalikan.

References

[1] Bicevska, Z, Oditis, I. 2016. Towards NoSQL-based Data

Warehousing Solutions. Procedia Computer Science. Vol.

104; p. 104-111

[2] Dehdouh, K., Boussaid, O., Bentayeb, F., Kabachi, N.

2015. Using the Column Oriented NoSQL Model for

Implementing Big Data Warehouse. Proceedings of the

21st International Conference on Parallel and Distibuted

Processing Techniques and Applications, pp. 469-47

[3] Hobbs, T. 2015. Basic Rules of Cassandra Data Modeling.

from https://www.datastax.com/dev/blog/basic-rules-ofcassandra-

data-modeling

[4] Lane, P. 2013. Oracle Database Data Warehousing Guides.

Oracle Inc

[5] McFadin, P. 2016. The Most Important Thing to Know in

Cassandra Data Modeling: The Primary Key. Retrieved

September 22, 2018. from

https://www.datastax.com/dev/blog/the-most-importantthing-

to-know-in-cassandra-data-modeling-the-primarykey

[6] Vorries, B. 2014. Lesson 7: Column Oriented Databases

(AKA Big Table or WideColumn). Retrieved July 24,

2018 from http://data-magnum.com/lesson-7-columnoriented-

databases-aka-big-table-or-wide-column

[7] Woodey A. 2014. Forrester Ranks the NoSQL Database

Vendors. Retrieved October 15, 2018.

http://www.datanami.com/2014/10/03/forrrester-ranksnosql-

database-vendors

[8] Yangui, R, Nabli, A, Gargouri, F. 2016. Automatic

Transformation of Data Warehouse Schema to NoSQL

Data Base: Comparative Study. Procedia Computer

Science. Vol. 9 5; p. 255-264 (2016)

Downloads

Published

2019-07-15

Issue

Section

Articles