Data Warehouse

hallo welcome back to my ordinary blog..
so in this time I want to share my weekly quiz..so keep reading ok !
jadi bermula saat hari ini baru inget kalo kuis yang udah dibuka dari hari jumat bakalan close sore nanti dan aku belum nyentuh itu kuis sama sekali..ahahah
kebiasaan dari jaman smk jadi anak SKS alias Sistem Kebut Semalam  #gubrak
dan topik yang dibahas dalam forum,kuis itu adalah tentang data Warehouse yang jujur aku masi ngga ngeh itu mata kuliah apa,padahal semester 6 udah ma lewat huhuuh

Data Warehouse: Arsitektur Data Warehouse
Definisi
Arsitektur adalah sekumpulan atau struktur yang memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk.Arsitektur Data adalah menyediakan kerangka dengan mengidentifikasi dan memahami bagaimana data akan pindah melalui sistem dan digunakan dalam perusahaan.
Karakteristik
Data diambil dari source system, database, dan file Data dari source system diintegrasikan dan ditransformasikan sebelum disimpan ke dalam Database Management System (DBMS) seperti : Oracle, SQL Server, Sy Base DWH adalah database read only yang terpisah yang dibuat khusus untuk pengambilan keputusan User mengakses DWH melalui tool front end atau aplikasi

Menurut Poe, arsitektur adalah sekumpulan atau struktur yang memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk. Ada arsitektur client-server, arsitektur networking dan masih banyak arsitektur lainnya. Arsitektur data menyediakan kerangka dengan mengidentifikasikan dan memahami bagaimana data akan pindah melalui sistem dan digunakan dalam perusahaan. Arsitektur data untuk data warehouse mempunyai komponen utama yaitu read-only database.
Karakterisitik arsitektur data warehouse (Poe):
1.Data diambil dari sistem asal (sistem informasi yang ada), database dan file.
2.Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle, Ms SQL Server, Sybase dan masih banyak yang lainnya.
3.Data warehouse merupakan sebuah database terpisah bersifat hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan.
4.Pemakai mengakses data warehouse melalui aplikasi front end tool.

Aristektur dasar:



Arsitektur dengan staging area:


Arsitektur dengan data mart:


Komponen Data Warehouse Menurut Connoly And Begg
Arsitektur data warehouse terdiri dari struktur dan komponen yang saling berhubungan satu sama lain dalam membangun data warehouse.


1.Operational Data
Sumber data dari data warehouse dapat diambil langsung dari mainframe, basis data relasional seperti Oracle, Ms SQL server dan sebagainya. Selain itu dapat melaluo Operational Data Source (ODS). ODS menampung data yang diekstrak dari sistem utama atau sumber-sumber data yang ada dan kemudian data hasil ekstrasi tersebut dibersihkan.
- Berfokus pada fungsi-fungsi transaksional
- Merupakan bagian dari infrastruktur perusahaan
- Detail, tidak ada redudansi, dapat diupdate
- Merefleksikan nilai sekarang

2.Operasional Data Store

Tempat penyimpanan sementara dari data operasional saat ini
Menyuplai data yang sudah diekstrak dari sistem sumber dan   dibersihkan
Menyederhanakan proses integrasi dan restrukturisasi data di  data warehouse

3.Load manager
Load manager juga disebut sebagai komponen front-end yang bertugas melakukan seluruh operasi yang berhubungan dengan ekstrasi dan me-load data ke warehouse.
Menampilkan semua operasi yang terkait dengan ekstrak dan load   data ke dalam data warehouse
Data bisa diekstrak langsung dari sumber data atau ODS

4.Warehouse Manager
Warehouse manager melakukan seluruh operasi-operasi yang berhubungan dengan kegiatan manajemen data di dalam warehouse. Operasi-operasi tersebut meliputi:
•Analisis terhadap data untuk memastikan konsistensi
•Transformasi dan penggabungan sumber data dari tempat penyimpanan sementara menjadi tabel-tabel data warehouse.( Transformasi dan penggabungan sumber data dari ODS ke table data warehouse)
•Penciptaan indeks-indeks dan view berdasarkan tabel-tabel dasar
•Melakukan denormalisasi dan agregasi jika diperlukan
•Backing-Up dan mengarsipkan data

5.Query manager
Query manager juga disebut komponen back-end, melakukan operasi-operasi yang berhubungan dengan manajemen user queries. Operasi-operasi yang dilakukan oleh komponen ini termasuk mengarahkan query kepada tabel-tabel yang tepat dan menjadwalkan eksekusi dari query tersebut.

6.End-user Access Tools
Prinsip atau tujuan utama dari dibangunnya data warehouse adalah untuk menyediakan informasi bisnis kepada user-user untuk dapat melakukan pengambilan keputusan secara cepat dan tepat.User ini berinteraksi dengan warehouse melalui end-user access tools. Data warehouse harus secara efisien mendukung secara khusus kebutuhan user serta secara rutin melakukan analisis. Performa yang baik dapat dicapai dengan merencanakan dahulu keperluan-keperluan untuk melakukan joins, summations dan laporan-laporan per periode dengan end-users.
Komponen yang menyediakan informasi dari data warehouse   yang   ada bagi user dalam membantu mengambil keputusan
Tools mencakup :
 - Reporting dan Query Tool
 - Reporting : Menghasilkan laporan operasional yang teratur
 - Query : Relasi data warehouse untuk dapat menerima SQL atau untuk menghasilkan pernyataan SQL agar dapat melakukan query pada data  yang disimpan dalam data warehouse
Application Development Tools
 - Dirancang untuk kebutuhan Client Server
Executive Information System (EIS) Tool
 - Mendukung pengambilan tingkat tinggi
OLAP Tool
 - Konsep multidimensi
 - Mengizinkan pengguna untuk menganalisis data menggunakan view yang kompleks
Data Mining Tool
 -Proses menemukan korelasi, pola, dan gaya baru yang bermanfaat dengan ‘menggali’ data dalam jumlah yang banyak dengan menggunakan teknik statistika dan matematika

7.Detailed Data
Komponen yang menyimpan detail data dalam skema database
Current Detail Data adalah Langsung dari operasional database dan mengacu pada data perusahaan sekarang
contoh : profil pelanggan, data aktivitas pelanggan, data sales, data demografis
Old Detail Data à Current Detail Data yang berumur atau histori dari   subyek area

8. Lightly dan Highly Summarized Data
Menyimpan semua data Lightly dan Highly Summarized yang sudah terdefinisi sebelumnya yang dibuat oleh Warehouse Manager
Tujuan : meningkatkan performance query

9. Back Up Data/Archive Data
Menyimpan Detailed Data dan Summarized Data dengan tujuan   mengarsip dan melakukan backup

10. Metadata
Digunakan untuk membangun, memelihara, mengatur, dan   menggunakan data warehouse
Mengandung lokasi dan deskripsi :
Komponen data warehouse (nama, definisi, struktur, dan isi dari data warehouse dan end user view)
Identifikasi dari pembuat sumber data (record system)
Aturan-aturan integrasi dan transformasi yang digunakan untuk mempopulasikan data warehouse
Histori dari update dan refresh data warehouse
Pola-pola matriks yang digunakan untk performa menganalisa data warehouse


Berdasarkan kategori yang dikemukakan oleh Berson dan Smith terdapat lima grup utama dari tools tersebut, antara lain:
1.Reporting and query tools
2.Application development tools
3.Executive information System (EIS) tools
4.Online Analytical Processing (OLAP) tools
5.Data mining tools

Arsitektur dan infrastruktur dari data warehouse sangat erat hubungannya dan satu dengan lainnya saling berkaitan.
Strukrutur Data Warehouse
Seperti yang kita lihat sebelumnya pada arsitektur data warehouse, ada beberapa struktur yang spesifik terdapat pada bagian warehouse manager. Bagian tersebut merupakan struktur data warehouse.

Menurut Poe, Vidette, data warehouse memiliki struktur yang spesifik dan mempunyai perbedaan dalam tingkatan detail data dan umur data. Komponen dari struktur data warehouse adalah: 
1.Current detail data
Current detail data merupakan data detil yang aktif saat ini, mencerminkan keadaan yang sedang berjalan dan merupakan level terendah dalam data warehouse. Didalam area ini warehouse menyimpan seluruh detail data yang terdapat pada skema basis data. Jumlah data sangat besar sehingga memerlukan storage yang besar pula dan dapat diakses secara cepat. Dampak negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal.

Berikut ini beberapa alasan mengapa current detail data menjadi perhatian utama:
•Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama
•Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan terendah.
•Hampir selalu disimpan dalam storage karena cepat di akses tetapi mahal dan kompleks dalam pengaturannya.
•Bisa digunakan dalam membuat rekapitulasi sehingga current detail data harus akurat.
2.Older detail data
Data ini merupakan data historis dari current detail data, dapat berupa hasil cadangan atau archive data yang disimpan dalam storage terpisah. Karena bersifat back-up (cadangan), maka biasanya data disimpan dalam storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang rendah. Penyusunan file atau directory dari data ini di susun berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan kembali.

3.Lighlty summarized data
Data ini merupakan ringkasan atau rangkuman dari current detail data. Data ini dirangkum berdasar periode atau dimensi lainnya sesuai dengan kebutuhan.
Ringkasan dari current detail data belum bersifat total summary.Data-data ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse pada tingkat departemen. Tingkatan data ini di sebut juga dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.

4.Highly summarized data
Data ini merupakan tingkat lanjutan dari Lightly summarized data, merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan analisis menggunakan data multidimensi.

5.Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat jenis data diatas. Menurut Poe, metadata adalah ‘data tentang data’ dan menyediakan informasi tentang struktur data dan hubungan antara struktur data di dalam atau antara storage (tempat penyimpanan data).
Metadata berisikan data yang menyimpan proses perpindahan data meliputi database structure, contents, detail data dan summary data, matrics, versioning, aging criteria, versioning, transformation criteria. Metadata khusus dan memegang peranan yang sangat penting dalam data warehouse.

Metadata sendiri mengandung:
•Struktur data
Sebuah direktori yang membantu user untuk melakukan analisis Decission Support System dalam pencarian letak/lokasi dalam data warehouse.

•Algoritma
Algoritma digunakan untuk summary data. Metadata sendiri merupakan panduan untuk algoritma dalam melakukan pemrosesan summary data antara current detail data dengan lightly summarized data dan antara lightly summarized data dengan hightly summaried data.

•Mapping
Sebagai panduan pemetaan (mapping) data pada saat data di transform/diubah dari lingkup operasional menjadi lingkup data warehouse.
Kegunaan Data Warehouse
Ada empat tugas yang bisa dilakukan dengan adanya data warehouse. Menurut Williams, keempat tugas tersebut yaitu:
a.Pembuatan laporan
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari, perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.

b.On-Line Analytical Processing (OLAP)
Dengan adanya data warehouse, semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat. OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya.

c.Data mining
Data mining merupakan proses untuk menggali (mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.
Beberapa solusi yang diberikan data mining antara lain:
1.Menebak target pasar
Data mining dapat mengelompokkan (clustering) model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli dan melakukan klasifikasi terhadap setiap pemebeli sesuai dengan karakteristik yang diinginkan.
2.Melihat pola beli dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli dari waktu ke waktu.
3.Cross-market analysis
Data mining dapat dimanfaatkan untuk melihat hubungan antara satu produk dengan produk lainnya.
4.Profil pelanggan
Data mining bisa membantu pengguna untuk melihat profil pembeli sehingga dapat diketahui kelompok pembeli tertentu cenderung kepada suatu produk apa saja.
5.Informasi summary
Data mining dapat membuat laporan summary yang bersifat multi dimensi dan dilengkapi dengan informasi statistik lainnya.
d.Proses informasi executive
Data warehouse dapat membuat ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi target informative bagi user.
Contoh Kasus Data Warehouse
PT. Astra Honda Motor merupakan sebuah perusahaan yang bergerak di bidang tranportasi dan sparepart nya. Sejak pertengahan 1990 tahun, perusahaan ini membangun cabang di kota-kota besar di Indonesia. Karena perusahaan mempunyai banyak cabang yang tersebar dan dimana tiap cabang mengembangkan database yang disesuaikan dengan kebutuhan masing-masing, mengakibatkan data perusahaan sulit untuk diolah menjadi satu kesatuan informasi.


Pertanyaan yang timbul:
1.Apa strategi pemasaran yang baik untuk seluruh cabang?
2.Apakah dalam proses layanan sudah memadai dan memuaskan?
3.Model kendaraan seperti apakah yang di inginkan konsumen?

Manfaat data warehouse:
1.Dapat mengetahui model motor seperti apa yang banyak terjual di pasaran.
2.Cabang mana yang banyak memasarkan produk dari perusahaan.
3.Mampu menggabungkan seluruh database yang berasal dari berbagai sumber data atau pun cabang – cabang nya.
4.Melalui data warehouse ini, seluruh database tersebut dapat terintegrasi secara lengkap  dan digunakan untuk kebutuhan penyediaan informasi pemasaran baik itu penjualan per  tahun, penjualan suku cadang,  penjualan  motor, dan lain sebagainya.
Perbandingan Model Skema Bintang dan Model Skema Snowflake Pada Data Warehouse
Model yang sering digunakan di dalam data warehouse saat ini adalah skema bintang dan skema snowflake. Masing-masing model tentunya memiliki kelebihan dan kekurangannya masing-masing. Dalam artikel ini dijelaskan dengan detil mengenai perbedaan kedua skema tersebut. Selain itu dijelaskan pula kondisi-kondisi yang sesuai di dalam mengimplementasikan skema bintang maupun skema snowflake.
Skema bintang dan skema snowflake adalah sarana untuk mengorganisir data mart – data mart atau gudang-gudang data dengan menggunakan basis data relasional. Kedua skema tersebut menggunakan tabel-tabel dimensi untuk mendeskripsikan data-data yang terdapat di dalam tabel fakta.
Setiap perusahaan pada umumnya menjual produk, pengetahuan, maupun jasa. Sehingga sistem penjualan adalah sebuah sistem yang terdapat di sebagian besar perusahaan. Berikut ini dijelaskan mengenai model penjualan baik skema bintang maupun skema snowflake.
Skema Bintang

Karakteristik utama dari skema bintang adalah bahwa tabel dimensinya tidak dinormalisasi. Pada model di atas, tabel fakta fact_sales (warna merah muda)berisi data-data yang diekstrakdari database operasional. Sedangkan tabel yang berwarna biru muda adalah tabel dimensi. Pada gambar di atas terdapat lima tabel dimensi yaitu dim_sales_type, dim_store, dim_employee, dim_product, dan dim_time.

Dari model ini, kita dapat dengan mudah melihat mengapa skema ini disebut ‘skema bintang’, karena model tersebut terlihat seperti bintang, dengan tabel dimensi yang mengelilingi tabel fakta.

SkemaSnowflake
Skema snowflakejuga menyimpan data yang sama seperti pada skema bintang. Tabel fakta yang digunakan pada skema bintang maupun pada skema snowflake berisi field-field yang sama. Perbedaan utama antara skema bintang dan skema snowflake adalah semua tabel dimensi pada skema snowflake telah dinormalisasi. Proses normalisasi tabel-tabel dimensi pada skema snowflake ini disebut dengan proses snowflaking,sehingga tampilan tabel-tabel pada skema snowflake bentuknya menyerupai snowflake.

Selain itu, perbedaan lainnya adalah dalam hal kompleksitas query-nya. Skema snowflake memiliki kompleksitas query yang lebih kompleks dibandingkan dengan skema bintang. Penjelasan mengenai kedua perbedaan tersebut adalah sebagai berikut:

1.Normalisasi
Seperti yang telah disebutkan di atas, normalisasi adalah perbedaan utama antara skema bintang dengan skema snowflake. Beberapa hal yang harus diperhatikan adalah sebagai berikut:
•Skema snowflake menggunakan ruang penyimpanan yang lebih kecil dibandingkan ruang penyimpanan pada skema bintang. Hal ini disebabkan karena tabel-tabel dimensi yang telah dinormalisasi memiliki record-record yang efisien karena tidak terjadi pengulangan data-data yang sama.
•Tabel dimensi yang tidak dinormalisasi dapat menyebabkan masalah integritas data. Karena data-data yang sama bisa muncul berulang-ulang, bahkan bisa juga terjadi kesalahan pengetikan pada data-data yang sama tersebut. Sehingga pada skema bintang harus dilakukan pengecekan dan maintenance secara berkala.
•Penyimpanan data pada skema snowflake lebih terorganisir dan lebih rapi dibandingkan dengan skema bintang.

2.Kompleksitas Query
Sebelum masuk ke dalam penjelasan mengenai perbandingan kompleksitas query antara skema bintang dan skema snowflake, terlebih dahulu diberikan contoh perintah query yang digunakan untuk menghitung jumlah telepon yang terjual di toko-toko di kota Berlin sepanjang tahun 2016. Perintah query-nya adalah sebagai berikut:
•Skema Bintang
SELECT
dim_store.store_address,
SUM(fact_sales.quantity) ASquantity_sold
FROM
fact_sales

INNERJOINdim_product ONfact_sales.product_id = dim_product.product_id
INNERJOINdim_time ONfact_sales.time_id = dim_time.time_id
INNERJOINdim_store ONfact_sales.store_id = dim_store.store_id
WHERE
dim_time.action_year = 2016
ANDdim_store.city = ‘Berlin’
ANDdim_product.product_type = ‘phone’
GROUPBY
dim_store.store_id,
dim_store.store_address

•Skema Snowflake
SELECT
  dim_store.store_address,
  SUM(fact_sales.quantity) ASquantity_sold
FROM
  fact_sales
  INNERJOINdim_product ONfact_sales.product_id = dim_product.product_id
  INNERJOINdim_product_type ONdim_product.product_type_id = dim_product_type.product_type_id
  INNERJOINdim_time ONfact_sales.time_id = dim_time.time_id
  INNERJOINdim_year ONdim_time.year_id = dim_year.year_id
  INNERJOINdim_store ONfact_sales.store_id = dim_store.store_id
  INNERJOINdim_city ONdim_store.city_id = dim_city.city_id
WHERE
  dim_year.action_year = 2016
  AND dim_city.city = ‘Berlin’
  AND dim_product_type.product_type_name = ‘phone’
GROUPBY
  dim_store.store_id,
  dim_store.store_address

Seperti terlihat dari dua perintah query di atas, query pada skema snowflake lebih kompleks dibandingkan dengan query yang digunakan pada skema bintang. Hal ini disebabkan karena pada skema snowflake melibatkan lebih banyak tabel sebagai akibat dari proses normalisasi, sehingga menggunakan perintah JOIN yang lebih banyak dibandingan dengan skema bintang.
Pada skema bintang,hanya ada satu perintah JOIN untuk setiap tabel dimensi. Namun jika tidak melibatkan tabel dimensi, maka perintah JOIN tidak perlu digunakan. Sedangkan pada skema snowflake, jumlah perintah JOIN yang digunakan bisa bervariasi tergantung kebutuhan.
Menggabungkan dua tabel memerlukan waktu karena Database Management System (DBMS) memerlukan waktu yang lebih lama untuk memproses permintaan query tersebut. Sebagai contoh tabel dim_store dan dim_city terlihat berdekatan pada gambar skema di atas, namun secara fisik kedua tabel tersebut mungkin tidak terletak berdekatan dalam media penyimpanan. Akan tetapi data-data yang terletak pada satu tabel, kemungkinan besar secara fisik data-data tersebut terletak berdekatan dalam media penyimpanan.
Umumnya, sebuah query yang berjalan dalam data mart dengan skema snowflake akan dieksekusi lebih lambat. Namun hal ini tidak menimbulkan masalah yang besar jika hasil yang ditampilkan hanya dalam waktu antara 1 mili detik sampai dengan 1 detik. Hal ini dapat menjadi masalah yang serius jika hasil yang ditampilkan memerlukan waktu 5 detik atau lebih.

Cara-Cara Mempercepat Eksekusi Query
Hal-hal yang dapat dilakukan untuk mempercepat proses query dalam laporan adalah sebagai berikut:
•Menyimpan data ke dalam level yang kita perlukan dalam laporan. Hal ini dapat memampatkan ukuran data secara signifikan. Untuk itu diperlukan prosedur-prosedur ETL (Extract, Transform, Load) yang dapat mentransformasi data ke dalam struktur dengan tepat dan efisien.
•Membuat sebuah tempat penyimpanan data yang terpusat untuk semua data perusahaan, tidak hanya untuk data-data bagian tertentu saja.
•User hanya mengakses data-data yang diperlukan saja untuk analisa dan laporan, tidak perlu semua data yang dapat memperlambat proses eksekusi query.

Kelebihan dan Kekurangan Snowflake Schema
Kelebihan Snowflake Schema
Snowflake Skema dalam keluarga yang sama sebagai skema bintang model logis. Bahkan, skema bintang ini dianggap sebagai kasus khusus dari skema snowflake. Kepingan salju skema memberikan beberapa keunggulan dibandingkan dengan skema bintang dalam situasi tertentu, termasuk:
•Beberapa OLAP alat pemodelan database multidimensi dioptimalkan untuk skema kepingan salju.
•Normalisasi hasil atribut penghematan penyimpanan, tradeoff menjadi kompleksitas tambahan dalam sumber permintaan bergabung.

Kekurangan Snowflake Schema
Kerugian utama dari skema snowflake adalah bahwa tingkat tambahan atribut normalisasi menambah kompleksitas sumber permintaan bergabung, jika dibandingkan dengan skema bintang .

Skema snowflake, berbeda dengan datar dimensi tabel tunggal, telah banyak dikritik. Tujuan mereka diasumsikan penyimpanan yang efisien dan kompak data dinormalisasi tapi ini adalah pada biaya yang signifikan kinerja yang buruk ketika browsing bergabung diperlukan dalam dimensi ini. Kerugian ini mungkin telah berkurang dalam tahun sejak pertama kali diakui, karena kinerja query yang lebih baik dalam alat browsing.

Bila dibandingkan dengan sangat normal skema transaksional, kepingan salju skema ini denormalization menghapus jaminan integritas data yang disediakan oleh skema normal data beban ke dalam skema snowflake harus sangat dikontrol dan dikelola untuk menghindari update dan memasukkan anomali.

Kelebihan Dan Kekurangan Star Schema
Kelebihan Star Schema
Skema bintang yang denormalized , yang berarti aturan normal normalisasi diterapkan pada database relasional transaksional santai selama desain skema bintang dan implementasi. Manfaat skema bintang denormalization adalah
•Pertanyaan sederhana – skema bintang bergabung logika umumnya lebih sederhana daripada bergabung logika yang diperlukan untuk mengambil data dari sangat normalskema transaksional.
•Sederhana pelaporan bisnis logika – bila dibandingkan dengan sangat normal skema, skema bintang menyederhanakan umum logika pelaporan bisnis, seperti-selama periode-periode dan as-pelaporan.
•Keuntungan kinerja query – Bintang skema dapat memberikan peningkatan kinerja untuk aplikasi read-only pelaporan bila dibandingkan dengan sangat normal skema.
•Cepat agregasi – query sederhana terhadap skema bintang dapat menghasilkan peningkatan kinerja untuk operasi agregasi.
•Feeding kubus – Bintang skema yang digunakan oleh semua OLAP sistem untuk membangun proprietary kubus OLAP secara efisien; pada kenyataannya, sebagian besar OLAPsistem menyediakan ROLAP modus operasi yang dapat menggunakan skema bintang langsung sebagai sumber tanpa membangun struktur kubus proprietary.

Kekurangan Star Schema
Yang saya ketahui kerugian utama dari skema bintang adalah bahwa integritas data tidak ditegakkan serta berada dalam database yang sangat normal. Satu-off menyisipkan dan update dapat mengakibatkan anomali Data yang dinormalisasi skema dirancang untuk menghindari. Secara umum, bintang skema dimuat dalam mode yang sangat dikontrol melalui batch processing atau dekat-real time “trickle feed”, untuk mengkompensasi kurangnya perlindungan yang diberikan oleh normalisasi .
Skema bintang juga tidak fleksibel dalam hal kebutuhan analitis sebagai model data dinormalisasi. Model Normalisasi memungkinkan setiap jenis pertanyaan analitis untuk dieksekusi selama mereka mengikuti logika bisnis yang didefinisikan dalam model. Skema bintang cenderung lebih tujuan-dibangun untuk pandangan tertentu dari data, sehingga tidak benar-benar memungkinkan analisis yang lebih kompleks. Skema bintang tidak mendukung banyak-ke-banyak hubungan antara entitas bisnis – setidaknya tidak sangat alami.Biasanya hubungan ini disederhanakan dalam skema bintang untuk menyesuaikan model dimensi sederhana.

sumber:
https://mti.binus.ac.id/2017/04/10/perbandingan-model-skema-bintang-dan-model-skema-snowflake-pada-data-warehouse/



You May Also Like

0 comments