Definisi, Arsitektur dan Sumber Data pada Data Warehouse
NIM : 1905551025
Matkul : Data Warehouse
Dosen : I Putu Agus Eka Pratama,ST.MT
Jurusan : Teknologi Informasi
Fakultas : Teknik
Universitas : Universitas Udayana
Definisi Data Warehouse
Menurut Bill Inmon : Data Warehouse merupakan sebuah konsep database untuk menggudangkan sejumlah data dari berbagai sumber data dengan format yang berbeda-beda yang memiliki 6 sifat utama yakni subject oriented, integreted, process oriented, time variant, accesible dan non volatile.
Menurut Ralph Kimball : Data Warehouse mengumpulkan data dari sumber-sumber transaksional (OLTP) untuk kebutuhan query dan analisa data kemudian akan masuk kedalam OLAP
OLTP : On Line Transactional Processing
OLAP : On Line Analytical Processing
Perbedaan Data Warehouse dengan Database : Data Warehouse sebenarnya sama seperti database pada umumnya, pada database maupun data warehouse menyimpan datanya secara terstruktur, namun data pada database berasal dari satu sumber , sementara pada data warehouse sumber datanya tidak hanya berasal dari satu atau dua buah sumber yang berbeda tetapi dapat berasal dari berbagai sumber yang berbeda.
Arsitektur Data Warehouse
Terdapat 3 jenis arsitektur pada data warehouse yakni basic architecture, staging area architecture serta staging area dan data mart architecture. Berikut penjelasan dari masing-masing arsitektur tersebut.
1. Basic Architecture Data Warehouse
Basic architecture data warehouse diperkenalkan oleh Oracle yang terdiri atas 3 bagian. Berikut penjelasan dari masing-masing bagian.
Gambar ilustrasi basic architecture DW :
- Data Source (sumber data) yang berasal dari data transaksional sistem, file, berkas, dokumen yang didigitalkan, flat file, dll. Data source ini akan menjadi sumber-sumber dari data transaksional yang kemudian akan menjadi data-data yang bersifat historis analisis untuk kebutuhan analisa data pada data warehouse. Data-data dari berbagai sumber dengan format file yang berbeda akan disimpan di summary data.
- Warehouse yakni tempat data transaksional digudangkan untuk kebutuhan analisa data. Data-data yang telah disimpan di summary data akan dikumpulkan kembali bagian-bagian penting dari sebuah data yang mecakup bagian metadata, summary data dan raw datanya. Setelah data-data transaksional telah diambil bagian-bagian pentingnya, dilanjutkan proses dari OLPT ke OLAP (transaksional ke historis analisis), disinilah akan terjadi perubahan dengan menggunakan proses ETL/ELT.
- User (pengguna) yang dibagi menjadi 3 yakni analyst, mining dan reporting. Analyst bertugas menganalisa data berdasarkan historisnya, mining akan memperoleh knowledge dari data sesuai pola, reporting bertugas menyampaikan laporan berdasarkan hasil analisa dan mining.
2. Staging Area Architecture Data Warehouse
Konsep dasar staging area architecture data warehouse adalah penambahan staging area untuk menampung sementara data-data dari sumber data transaksional sebelum diteruskan ke warehouse. Ketika data transaksional dikumpulkan dari berbagai sumber data data ini akan dilakukan proses penyeragaman berupa perapian data sesuai konteks akan mudah ditemukan, data dibersihkan dari hal-hal yang tidak relevan akan kebutuhan, lalu data disesuaikan dengan kebutuhan.
Implementasi staging area architecture dapat secara pragmatically (pemrograman) maupun dengan penambahan modul pada sistem Data Warehouse.
Konsep staging area architecture ini diperkenalkan oleh Oracle.
Gambar ilutrasi staging area architecture pada basic architecture DW :
Konsep Dasar arsitektur ini adalah penambahan Data Mart untuk dikombinasikan dengan Staging Area.
Data Mart adalah bagian kecil dari Data Warehouse untuk tujuan khusus misalnya marketing analysis oleh bagian marketing.
Konsep arsitektur ini diperkenalkan oleh Oracle dan merupakan arsitektur yang paling banyak digunakan.
Alasannya :
- Kemampuan untuk memilah data sesuai kebutuhan.
- Kemampuan kostumisasi sesua kebutuhan.
Gambar diatas merupakan ilutrasi dari arsitektur staging area + data mart, dapat dilihat pada bagian kanan terdapat beberapa contoh data mart yakni purchasing, sales dan inventory yang akan membantu user misalnya user akan membuat laporan maka user hanya akan terhubung ke data mart sales dan purchasing tanpa perlu ke inventory.
Sumber-sumber Data pada Data Warehouse
Sumber data pada Data Warehouse dibedakan menjadi 2 yakni sumber internal dan eksternal. Beikut ini penjelasannya.
Ilustrasi Sumber-sumber Data pada Data Warehouse |
- Sumber Internalsumber yang berasal dari data-data sistem transaksional misalnya sistem informasi dan point of sale, dapat berasal pula dari file scan, dokumen office, file teks, flat file di jaringan internal (intranet) perusahaan.
- Sumber Eksternalsumber yang berasal dari komputer/server yang terhubung melalui jaringan publik (internet) untuk kemudian digudangkan ke dalam sistem Data Warehouse di jaringan lokal (intranet) perusahaan. Pada arsitektur staging area atau arsitektur staging area + data mart sumber datanya dapat dikombinasikan dengan cloud.
Referensi : I Putu Agus Pratama. Handbook Data Warehouse. Penerbit Infomatika. Bandung. 2007
Komentar
Posting Komentar