TUJUAN PEMBELAJARAN
Pertemuan ini membahas tentang arsitektur Data Warehause
diantara nya :
Pemanfaatan Data Warehause,
Sumber data,
Enviroment pada Data Warehause,
Data Warehause Lifecycle,
Data Warehause Framework,
serta megenal Operation System dan Informational System.
MANAJEMEN DATA DAN INFORMASI PADA ORGANISASI
Sebelum membahas mengenai arsitektur
pada Data Warehause, perlu diketahui terlebih
dahulu bagaimana manajemen data dan
informasi pada organisasi berkaitan dengan
bagaimana organisasi tersebut melakukan
penyimpanan, pemanfaatan, pengolahan data,
serta sejauh mana kebutuhan organisasi tersebut
terhadap informasi (dan juga data).
Penyimpanan, Pemanfaatan, dan Pengolahan Data
Di dalam sebuah organisasi yang memanfaatkan teknologi
informasi, keberadaan data digital disebabkan oleh
adanya digitalisasi dari data-data pada:
Berkas fisik (misalkan scanning berkas dokumen),
Inputan pengguna, dan
Komunikasi antarmesin (komputer).
Secara umum, di dalam sebuah organisasi, terdapat 2buah
cara untuk memperoleh data. Yaitu:
Operational
Pada Operational, organisasi memperoleh data berdasarkan kepada
bagaimana organisasi bersangkutan menjalankan proses bisnis yang
telah ada di dalam internal organisasi bersangkutan.
Informational
Informational merupakan cara organisasi memperoleh data
berdasarkan kepada pemantauan jalannya suatu proses. Dalam hal
ini, kemampuan untuk menganalisis dan pengambilan keputusan
(Decision making) sangat diperlukan. Sebagai contoh, perusahaan jual
beli saham
Apabila organisasi menggunakan cara yang pertama (Operational)
untuk memperoleh data, maka data-data tersebut disimpan kedalam
database, baik pada server (komputer) maupun tersebar pada
beberapa sumber penyimpanan data (Data Storage).
Pemanfaatan dan pengolahan data oleh
organisasi terhadap 2 cara yang ada tersebut
(Operational dan Informational) pun juga
berbeda.
Data yang diperoleh dari Operational,
merupakan data transaksional yang umumnya
menjadi sumber data bagi Informational System.
Sedangkan data yang diperoleh dari data
Informational, akan dimanfaatkan untuk
mendukung kebutuhan analisis data dan
Pengambilan keputusan ( Decision making )
tahap selanjutnya pada masa selanjutnyam
berdasarkan kepada analisis, pemantuan, dan
pengambilan keputusan yang telah dilakukan
sebelumnya.
KARAKTERISTIK STRATEGI INFORMASI PADA ORGANISASI
Tindakan, cara , upaya, dan langkah-langkah yang
dilakukan oleh organisasi untuk memperoleh informasi,
dikenal dengan nama strategi informasi.
Strategi informasi bukan saja bertujuan untuk membantu
organisasi untuk memperoleh informasi yang dibutuhkan,
tapi juga menjadikan informasi tersebut bernilai.
5 karakteristik untuk strategi informasi, meliputi: Credible,
Integrated, Accessible, Timely, dan Integrity.
Credibble
Credibble diartikan bahwa informasi (dan juga data)
yang diperoleh haruslah terpercaya, benar, akurat, dan
dapat dipertanggung jawabkan isi di dalamnya.
Data yang tidak memiliki kredibilitas yang baik, tentu
akan menghasilkan informasi yang juga memiliki
kredibilitas yang baik.
Integrated
Integrated diartikan bahwa informasi disajikan kepada
pengguna melalui sebuah sistem yang terintegrasi, serta
dan informasi itu sendiri telah Terintegrasi ke dalam
sebuah sistem yang besar dan kompleks. Sebuah
organisasi dapat memiliki sejumlah sumber data dan
sejumlah sistem infomasi dengan fungsi masing-masing.
Accesible
Secara harfiah, Accesible berarti bahwa informasi dapat
diakses dengan cepat dan mudah oleh pengguna.
Kapanpun dan dimanapun, melalui perangkat terhubung
dan hak akses yang telah diberikan, pengguna dapat
mengakses informasi sesuai dengan kebutuhan masing-
masing.
Timely
Timely berarti bahwa informasi disajikan bukan saja
secara cepat dan mudah serta kepada pengguna yang
tepat, tapi juga ada waktu dan situasi yang tepat,
sehingga nilainya menjadi tinggi.
Sebagai contoh: informasi mengenai kondisi jalan raya pada saat
musim mudik Lebaran bagi para pemudik, akan memiliki nilai
sangat tinggi apabila disajikan saat proses mudik akan dimulai.
Integrity
Integrity merupakan kekonsistenan dan akurasi dari
data informasi yang dihasilkan oleh data tersebut tetap
terjaga sebagaimana aslinya,
Tanpa adanya perubahan oleh pihak yang tidak
bertanggung jawab. Suatu data digital akan rentan
terhadap adanya perubahan di dalamnya, misalkan
dalam bentuk serangan Man In The Middle Attrack (MITM),
virus, trojan, dan spyware.
ARSITEKTUR DATA WAREHOUSE
Arsitektur Data Warehouse atau disebut juga dengan Data Warehouse
Architecture (DWA), didefinisikan pertama kali oleh Ken Orr di
dalam paper publikasinya di tahun 1999 berjudul Data Warehouse
Technology.
Ken Orr berpendapat bahwa Data Warehouse
Architecture merupakan sebuah cara yang dilakukan
oleh arsitek Data Warehouse atau SDM yang
berkaitan dengan perancangan dan desain Data
Warehouse di dalam sebuah organisasi, untuk
mempresentasikannya ke dalam bentuk
bagan/gambar/desain, yang memuat segala hal
mengenai struktur data, komunikasi, pemrosesan, dan
presentasi dari komputasi End to End antarkomputer di
dalam sistem Data Warehouse.
TUJUAN DAN MANFAAT ARSITEKTUR DATA WAREHOUSE
Memudahkan pengembang di dalam implementasi sistem Data
Warehouse,
Memudahkan pemeliharaan sistem oleh bagian IT,
serta memudahkan pengguna di dalam memahami dan
menggunakan sistem
Meminimalisir kesalahan yang mungkin terjadi, serta menghemat
waktu, biaya, dan tenaga.
Data Warehouse Architecture juga berkaitan dengan strategi di
dalam pengembangan Data Warehouse, yang meliputi desain,
pengembangan, pengelolaan, dan pemeliharaan sistem.
DELAPAN LAYER PADA ARSITEKTUR DATA WAREHOUSE
Ken Orr menyajikan delapan buah layer pada arsitektur
Data Warehouse, yang hingga saat ini masih menjadi
acuan di dalam kajian mengenai Data Warehouse
Architecture (DWA) bagi sejumlah organisasi yang
mengimplementasikan Data Warehouse. Masing-masing
layer memiliki fungsi dan perannya masing-masing.
TIGA JENIS ARSITEKTUR PADA DATA WAREHOUSE VERSI
ORACLE
Arsitektur dari Data Warehouse juga mengalami
perkembangan. Sejumlah organisasi menyediakan
versinya sendiri.
Salah satunya adalah versi Oracle, yang
menyajikan kepada publik mengenai tiga jenis arsitektur
pada Data Warehouse, ketiga jenis arsitektur tersebut
meliputi arsitektur dasar (Basic), arsitektur dengan
menggunakan Staging Area, serta arsitektur dengan
menggunakan Staging Area dan Data Mart.
1. ARSITEKTUR DASAR (BASIC)
Arsitektur yang paling sederhana pada Data Warehouse
adalah arsitekturr Basic (dasar). Pada arsitektur ini,
pengguna mengakses data secara langsung pada Data
Warehouse, dimana data-data berasal dari berbagai
sumber data yang terkumpul menjadi satu. Dalam
arsitektur ini, terdapat tiga bagian utama, yaitu :
1.Data Source
2. Warehouse
3. Users
2. ARSITEKTUR MENGGUNAKAN STAGING AREA
Staging area merupakan sebuah lokasi pada arsitektur data
warehouse yang bertindak sebagai penampungan sementara
(Temp) untuk data-data operasional yang berasal dari
sumber-sumber data (data sources), sebelum diteruskan ke
Warehouse.
Data-data operasional yang berasal dari operational system
dan flat files pada data sources, perlu dirapikan dan diproses
terlebih dahulu, sebelum diteruskan ke warehouse. Tujuannya
adalah untuk memastikan data-data yang masuk ke warehouse
adalah data yang benar-benar diperlukan di dalam proses
analisis, sesuai tujuan digunakannya data warehouse tersebut.
3. ARSITEKTUR MENGGUNAKAN STAGGING AREA DAN
DATA MART
Arsitektur ini menawarkan kelebihan berupa kemampuan
untuk melakukan pemilahan data dan kostumisasi sesuai
dengan kebutuhan pengguna.
Arsitektur jenis ini lebih cocok digunakan pada organisasi
yang terdiri atas sejumlah unit kerja, dimana setiap unit
kerja memiliki kebutuhan masing-masing didalam
pemanfaatan Data Warehouse berserta dengan data
didalamnya.
KONSEP PADA
DATA WAREHOUSE
A. Prinsip kerja data warehouse
Pada dasar nya prinsip kerja data warehouse tidak lah rumit, data
warehouse hanya bertindak sebagai sebuah tempat yang
menampung semua data yang berasal dari berbagai sumber data.
Data Warehouse akan menjadi penyimpanan data-data historis,
yang berbeda dengan data transaksional yang dianut oleh sumber-
sumber data lainnya.
Pada Data Warehouse tidak diperbolehkan adanya manipulasi data
dalam bentuk Edit, Delete, Update, hanya View dan Insert saja.
Selanjutnya, data-data mentah yang digudangkan tersebut, diubah
ke dalam format yang seragam, dengan memanfaatkan ETL
(Extraction, Transformation Loading maupun ELT (extraction Loading,
Transformation), Keluaran dari tahapan ini adalah data yang telah
memiliki format seragam.
Proses terakhir yang dilakukan pada Data Warehouse adalah
melakukan analisis data, di mana data diubah ke dalam bentuk
data multi dimensi. Di sini, digunakanlah OLAP (On Line Analytical
Processing) untuk membantu di dalam pemrosesan analisis data.
B. Data Warehouse Environment
Data Warehouse Environment atau lingkungan kerja dari Data
Warehouse, merupakan seperangkat sistem yang membentuk
lingkungan untuk setiap proses yang dijalankan oleh komponen-
komponen pada Data Warehouse.
Untuk mencapai tujuan dari implementasi Data Warehouse tersebut
pada organisasi yang menerapkannya (misalkan membantu di dalam
pengambilan keputusan berdasarkan analisis sejumlah data. Data
warehouse environment berhubungan dengan empat bagian
berikut. Yaitu:
Operational Application dan Staging Area
ETL/ELT
Cube dan Data Mart
Aplikasi tatap muka ke pengguna
C. Data Warehouse Life Cycle
Data Warehouse life Cycle merupakan siklus hidup (Life Cycle) dari
pengembangan perangkat lunak (software) untuk kebutuhan sistem
data Warehouse.
Data Warehouse diimplementasikan dalam bentuk sistem, yang
meliputi perangkat keras komputer (Hardware) dan perangkat lunak
komputer (Software). Terdapat lima buah tahapan di dalamm Life
Cycle pada perangkat lunak (Software) untuk Data Warehouse.
Tahap pertama adalah Design. Tahapan ini merupakan
tahapan yang paling penting di dalam Data Warehouse Life
Cycle. Pada tahap ini, pengembang harus mampu
memahami kebutuhan dari pengguna akan adanya
sebuah Software ubtuk Data Warehouse.
Tahapan kedua adalah Prototype, yang merupakan
tahapan lanjutan dari tahapan Design, dimana desain dari
perangkat lunak (Software) yang telah di kerjakan tersebut,
diwujudkan ke dalam bentuk perangkat lunak (Software),
dengan memanfaatkan bahasa pemrograman.
Tahapan ketiga adalah Deploy, yang merupakan tahapan di mana
proses deployment atau implementasi pada sistem, dilakukan untuk
menciptakan ruang kerja dan lingkungan bagi perangkat lunak data
Warehouse ini.
Tahap keempat adalah Operate. Tahapan ini adalah tahapan untuk
mengoperasikan perangkat lunak Data Warehouse, sekaligus
melakukan Pengujian. Hal ini dilakukan untuk mengetahui apakah
aplikasi berjalan dengan baik dan benar.
Tahapan kelima adalah Enhance adalah tahapan untuk menambah
fitur,komponen,kemampuan, yang dirasa perlu untuk disertakan di
dalam perangkat lunak (Software) Data Warehouse, berdasarkan
kepada peroses pengujian yang dilakukan.
DATA WEREHOUSE FRAMEWORK
Hal terakhir yang perlu diketahui terkait dengan
konsep pada Data Werehouse adalah Data
Werehouse Framework.
Berbicara mengenai Data Werehouse Framework,
maka tidak dapat lepas dari peranan DBMS
(Data Base Management System) serta vendor
yang menyediakan layanan untuk DBMS tersebut
Sebagai contoh: Data Werehouse Framework
dengan menggunakan DBMS MySQL, Framework
ini, salah satunya dikeluarkan olhe perusahaan
Microsoft.
Meskipun demikian, DBMS MySQL juga bersifat
multiplaform, sehingga dapat dijalankan pada
plaform dan sistem operasi selain Microsoft
Windows.
SELESAI
TUGAS
Silakan buat rancangan arsitektur data warehouse dengan studi
kasus bebas dalam bidang apapun.