#jakarta#SEDULUR20#wikusamacup #jakartaA little OF NewsCerita Pribadievent PASKIBRAMokletMy happiness
Data Warehouse
hallo welcome back to my ordinary blog..
so in this time I want to share my weekly quiz..so keep reading ok !
jadi bermula saat hari ini baru inget kalo kuis yang udah dibuka dari hari jumat bakalan close sore nanti dan aku belum nyentuh itu kuis sama sekali..ahahah
kebiasaan dari jaman smk jadi anak SKS alias Sistem Kebut Semalam #gubrak
dan topik yang dibahas dalam forum,kuis itu adalah tentang data Warehouse yang jujur aku masi ngga ngeh itu mata kuliah apa,padahal semester 6 udah ma lewat huhuuh
Data Warehouse: Arsitektur Data Warehouse
Definisi
Arsitektur adalah sekumpulan atau struktur yang memberikan
kerangka untuk keseluruhan rancangan suatu sistem atau produk.Arsitektur Data
adalah menyediakan kerangka dengan mengidentifikasi dan memahami bagaimana data
akan pindah melalui sistem dan digunakan dalam perusahaan.
Karakteristik
Data diambil dari source system, database, dan file Data
dari source system diintegrasikan dan ditransformasikan sebelum disimpan ke
dalam Database Management System (DBMS) seperti : Oracle, SQL Server, Sy Base DWH
adalah database read only yang terpisah yang dibuat khusus untuk pengambilan
keputusan User mengakses DWH melalui tool front end atau aplikasi
Menurut Poe, arsitektur adalah sekumpulan atau struktur yang
memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk. Ada
arsitektur client-server, arsitektur networking dan masih banyak arsitektur
lainnya. Arsitektur data menyediakan kerangka dengan mengidentifikasikan dan
memahami bagaimana data akan pindah melalui sistem dan digunakan dalam
perusahaan. Arsitektur data untuk data warehouse mempunyai komponen utama yaitu
read-only database.
Karakterisitik arsitektur data warehouse (Poe):
1.Data diambil dari sistem asal (sistem informasi yang ada),
database dan file.
2.Data dari sistem asal diintegrasikan dan ditransformasi
sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle, Ms
SQL Server, Sybase dan masih banyak yang lainnya.
3.Data warehouse merupakan sebuah database terpisah bersifat
hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan.
4.Pemakai mengakses data warehouse melalui aplikasi front
end tool.
Aristektur dasar:
Arsitektur dengan staging area:
Arsitektur dengan data mart:
Komponen Data Warehouse Menurut Connoly And Begg
Arsitektur data warehouse terdiri dari struktur dan
komponen yang saling berhubungan satu sama lain dalam membangun data warehouse.
1.Operational Data
Sumber data dari data warehouse dapat diambil langsung dari
mainframe, basis data relasional seperti Oracle, Ms SQL server dan sebagainya.
Selain itu dapat melaluo Operational Data Source (ODS). ODS menampung data yang
diekstrak dari sistem utama atau sumber-sumber data yang ada dan kemudian data
hasil ekstrasi tersebut dibersihkan.
- Berfokus pada fungsi-fungsi transaksional
- Merupakan bagian dari infrastruktur perusahaan
- Detail, tidak ada redudansi, dapat diupdate
- Merefleksikan nilai sekarang
2.Operasional Data Store
Tempat penyimpanan sementara dari data operasional saat ini
Menyuplai data yang sudah diekstrak dari sistem sumber
dan dibersihkan
Menyederhanakan proses integrasi dan restrukturisasi data
di data warehouse
3.Load manager
Load manager juga disebut sebagai komponen front-end yang
bertugas melakukan seluruh operasi yang berhubungan dengan ekstrasi dan me-load
data ke warehouse.
Menampilkan semua operasi yang terkait dengan ekstrak dan
load data ke dalam data warehouse
Data bisa diekstrak langsung dari sumber data atau ODS
4.Warehouse Manager
Warehouse manager melakukan seluruh operasi-operasi yang
berhubungan dengan kegiatan manajemen data di dalam warehouse. Operasi-operasi
tersebut meliputi:
•Analisis terhadap data untuk memastikan konsistensi
•Transformasi dan penggabungan sumber data dari tempat
penyimpanan sementara menjadi tabel-tabel data warehouse.( Transformasi dan
penggabungan sumber data dari ODS ke table data warehouse)
•Penciptaan indeks-indeks dan view berdasarkan tabel-tabel
dasar
•Melakukan denormalisasi dan agregasi jika diperlukan
•Backing-Up dan mengarsipkan data
5.Query manager
Query manager juga disebut komponen back-end, melakukan
operasi-operasi yang berhubungan dengan manajemen user queries. Operasi-operasi
yang dilakukan oleh komponen ini termasuk mengarahkan query kepada tabel-tabel
yang tepat dan menjadwalkan eksekusi dari query tersebut.
6.End-user Access Tools
Prinsip atau tujuan utama dari dibangunnya data warehouse
adalah untuk menyediakan informasi bisnis kepada user-user untuk dapat
melakukan pengambilan keputusan secara cepat dan tepat.User ini berinteraksi
dengan warehouse melalui end-user access tools. Data warehouse harus secara
efisien mendukung secara khusus kebutuhan user serta secara rutin melakukan
analisis. Performa yang baik dapat dicapai dengan merencanakan dahulu
keperluan-keperluan untuk melakukan joins, summations dan laporan-laporan per
periode dengan end-users.
Komponen yang menyediakan informasi dari data warehouse yang ada bagi user dalam membantu mengambil keputusan
Komponen yang menyediakan informasi dari data warehouse yang ada bagi user dalam membantu mengambil keputusan
Tools mencakup :
- Reporting dan Query
Tool
- Reporting :
Menghasilkan laporan operasional yang teratur
- Query : Relasi data
warehouse untuk dapat menerima SQL atau untuk menghasilkan pernyataan SQL agar
dapat melakukan query pada data yang
disimpan dalam data warehouse
Application Development Tools
- Dirancang untuk
kebutuhan Client Server
Executive Information System (EIS) Tool
- Mendukung
pengambilan tingkat tinggi
OLAP Tool
- Konsep multidimensi
- Mengizinkan
pengguna untuk menganalisis data menggunakan view yang kompleks
Data Mining Tool
-Proses menemukan
korelasi, pola, dan gaya baru yang bermanfaat dengan ‘menggali’ data dalam
jumlah yang banyak dengan menggunakan teknik statistika dan matematika
7.Detailed Data
Komponen yang menyimpan detail data dalam skema database
Current Detail Data adalah Langsung dari operasional
database dan mengacu pada data perusahaan sekarang
contoh : profil pelanggan, data aktivitas pelanggan, data
sales, data demografis
Old Detail Data à Current Detail Data yang berumur atau
histori dari subyek area
8. Lightly dan Highly Summarized Data
Menyimpan semua data Lightly dan Highly Summarized yang
sudah terdefinisi sebelumnya yang dibuat oleh Warehouse Manager
Tujuan : meningkatkan performance query
9. Back Up Data/Archive Data
Menyimpan Detailed Data dan Summarized Data dengan
tujuan mengarsip dan melakukan backup
10. Metadata
Digunakan untuk membangun, memelihara, mengatur, dan menggunakan data warehouse
Mengandung lokasi dan deskripsi :
Komponen data warehouse (nama, definisi, struktur, dan isi
dari data warehouse dan end user view)
Identifikasi dari pembuat sumber data (record system)
Aturan-aturan integrasi dan transformasi yang digunakan
untuk mempopulasikan data warehouse
Histori dari update dan refresh data warehouse
Pola-pola matriks yang digunakan untk performa menganalisa
data warehouse
Berdasarkan kategori yang dikemukakan oleh Berson dan Smith
terdapat lima grup utama dari tools tersebut, antara lain:
1.Reporting and query tools
2.Application development tools
3.Executive information System (EIS) tools
4.Online Analytical Processing (OLAP) tools
5.Data mining tools
Arsitektur dan infrastruktur dari data warehouse sangat erat
hubungannya dan satu dengan lainnya saling berkaitan.
Strukrutur Data Warehouse
Seperti yang kita lihat sebelumnya pada arsitektur data
warehouse, ada beberapa struktur yang spesifik terdapat pada bagian warehouse
manager. Bagian tersebut merupakan struktur data warehouse.
Menurut Poe, Vidette, data warehouse memiliki struktur yang
spesifik dan mempunyai perbedaan dalam tingkatan detail data dan umur data.
Komponen dari struktur data warehouse adalah:
1.Current detail data
Current detail data merupakan data detil yang aktif saat
ini, mencerminkan keadaan yang sedang berjalan dan merupakan level terendah
dalam data warehouse. Didalam area ini warehouse menyimpan seluruh detail data
yang terdapat pada skema basis data. Jumlah data sangat besar sehingga
memerlukan storage yang besar pula dan dapat diakses secara cepat. Dampak
negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi meningkat
dan biaya yang diperlukan menjadi mahal.
Berikut ini beberapa alasan mengapa current detail data
menjadi perhatian utama:
•Menggambarkan kejadian yang baru terjadi dan selalu menjadi
perhatian utama
•Sangat banyak jumlahnya dan disimpan pada tingkat
penyimpanan terendah.
•Hampir selalu disimpan dalam storage karena cepat di akses
tetapi mahal dan kompleks dalam pengaturannya.
•Bisa digunakan dalam membuat rekapitulasi sehingga current
detail data harus akurat.
2.Older detail data
Data ini merupakan data historis dari current detail data,
dapat berupa hasil cadangan atau archive data yang disimpan dalam storage
terpisah. Karena bersifat back-up (cadangan), maka biasanya data disimpan dalam
storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang
rendah. Penyusunan file atau directory dari data ini di susun berdasarkan umur
dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan kembali.
3.Lighlty summarized data
Data ini merupakan ringkasan atau rangkuman dari current
detail data. Data ini dirangkum berdasar periode atau dimensi lainnya sesuai
dengan kebutuhan.
Ringkasan dari current detail data belum bersifat total
summary.Data-data ini memiliki detil tingkatan yang lebih tinggi dan mendukung
kebutuhan warehouse pada tingkat departemen. Tingkatan data ini di sebut juga
dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view
suatu kondisi yang sedang atau sudah berjalan.
4.Highly summarized data
Data ini merupakan tingkat lanjutan dari Lightly summarized
data, merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal
untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu
dan analisis menggunakan data multidimensi.
5.Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat
jenis data diatas. Menurut Poe, metadata adalah ‘data tentang data’ dan
menyediakan informasi tentang struktur data dan hubungan antara struktur data
di dalam atau antara storage (tempat penyimpanan data).
Metadata berisikan data yang menyimpan proses perpindahan
data meliputi database structure, contents, detail data dan summary data,
matrics, versioning, aging criteria, versioning, transformation criteria.
Metadata khusus dan memegang peranan yang sangat penting dalam data warehouse.
Metadata sendiri mengandung:
•Struktur data
Sebuah direktori yang membantu user untuk melakukan analisis
Decission Support System dalam pencarian letak/lokasi dalam data warehouse.
•Algoritma
Algoritma digunakan untuk summary data. Metadata sendiri
merupakan panduan untuk algoritma dalam melakukan pemrosesan summary data
antara current detail data dengan lightly summarized data dan antara lightly
summarized data dengan hightly summaried data.
•Mapping
Sebagai panduan pemetaan (mapping) data pada saat data di
transform/diubah dari lingkup operasional menjadi lingkup data warehouse.
Kegunaan Data Warehouse
Ada empat tugas yang bisa dilakukan dengan adanya data
warehouse. Menurut Williams, keempat tugas tersebut yaitu:
a.Pembuatan laporan
Pembuatan laporan merupakan salah satu kegunaan data
warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana
didapatkan laporan perhari, perbulan, pertahun atau jangka waktu kapanpun yang
diinginkan.
b.On-Line Analytical Processing (OLAP)
Dengan adanya data warehouse, semua informasi baik detail
maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat. OLAP
mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai
menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal
ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta
yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain
yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down
adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah
kebalikannya.
c.Data mining
Data mining merupakan proses untuk menggali (mining)
pengetahuan dan informasi baru dari data yang berjumlah banyak pada data
warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence),
statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat
menjembatani komunikasi antara data dan pemakainya.
Beberapa solusi yang diberikan data mining antara lain:
1.Menebak target pasar
Data mining dapat mengelompokkan (clustering) model-model
pembeli dan melakukan klasifikasi terhadap setiap pembeli dan melakukan
klasifikasi terhadap setiap pemebeli sesuai dengan karakteristik yang diinginkan.
2.Melihat pola beli dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli dari
waktu ke waktu.
3.Cross-market analysis
Data mining dapat dimanfaatkan untuk melihat hubungan antara
satu produk dengan produk lainnya.
4.Profil pelanggan
Data mining bisa membantu pengguna untuk melihat profil
pembeli sehingga dapat diketahui kelompok pembeli tertentu cenderung kepada
suatu produk apa saja.
5.Informasi summary
Data mining dapat membuat laporan summary yang bersifat
multi dimensi dan dilengkapi dengan informasi statistik lainnya.
d.Proses informasi executive
Data warehouse dapat membuat ringkasan informasi yang
penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi
keseluruhan data. Dengan menggunakan data warehouse segala laporan telah
diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga
mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data
warehouse menjadi target informative bagi user.
Contoh Kasus Data Warehouse
PT. Astra Honda Motor merupakan sebuah perusahaan yang
bergerak di bidang tranportasi dan sparepart nya. Sejak pertengahan 1990 tahun,
perusahaan ini membangun cabang di kota-kota besar di Indonesia. Karena
perusahaan mempunyai banyak cabang yang tersebar dan dimana tiap cabang
mengembangkan database yang disesuaikan dengan kebutuhan masing-masing,
mengakibatkan data perusahaan sulit untuk diolah menjadi satu kesatuan
informasi.
Pertanyaan yang timbul:
1.Apa strategi pemasaran yang baik untuk seluruh cabang?
2.Apakah dalam proses layanan sudah memadai dan memuaskan?
3.Model kendaraan seperti apakah yang di inginkan konsumen?
Manfaat data warehouse:
1.Dapat mengetahui model motor seperti apa yang banyak
terjual di pasaran.
2.Cabang mana yang banyak memasarkan produk dari perusahaan.
3.Mampu menggabungkan seluruh database yang berasal dari
berbagai sumber data atau pun cabang – cabang nya.
4.Melalui data warehouse ini, seluruh database tersebut
dapat terintegrasi secara lengkap dan
digunakan untuk kebutuhan penyediaan informasi pemasaran baik itu penjualan
per tahun, penjualan suku cadang, penjualan
motor, dan lain sebagainya.
Perbandingan Model Skema Bintang dan Model Skema Snowflake
Pada Data Warehouse
Model yang sering digunakan di dalam data warehouse saat ini
adalah skema bintang dan skema snowflake. Masing-masing model tentunya memiliki
kelebihan dan kekurangannya masing-masing. Dalam artikel ini dijelaskan dengan
detil mengenai perbedaan kedua skema tersebut. Selain itu dijelaskan pula kondisi-kondisi
yang sesuai di dalam mengimplementasikan skema bintang maupun skema snowflake.
Skema bintang dan skema snowflake adalah sarana untuk
mengorganisir data mart – data mart atau gudang-gudang data dengan menggunakan
basis data relasional. Kedua skema tersebut menggunakan tabel-tabel dimensi
untuk mendeskripsikan data-data yang terdapat di dalam tabel fakta.
Setiap perusahaan pada umumnya menjual produk, pengetahuan,
maupun jasa. Sehingga sistem penjualan adalah sebuah sistem yang terdapat di
sebagian besar perusahaan. Berikut ini dijelaskan mengenai model penjualan baik
skema bintang maupun skema snowflake.
Skema Bintang
Karakteristik utama dari skema bintang adalah bahwa tabel
dimensinya tidak dinormalisasi. Pada model di atas, tabel fakta fact_sales
(warna merah muda)berisi data-data yang diekstrakdari database operasional.
Sedangkan tabel yang berwarna biru muda adalah tabel dimensi. Pada gambar di
atas terdapat lima tabel dimensi yaitu dim_sales_type, dim_store, dim_employee,
dim_product, dan dim_time.
Dari model ini, kita dapat dengan mudah melihat mengapa
skema ini disebut ‘skema bintang’, karena model tersebut terlihat seperti
bintang, dengan tabel dimensi yang mengelilingi tabel fakta.
SkemaSnowflake
Skema snowflakejuga menyimpan data yang sama seperti pada
skema bintang. Tabel fakta yang digunakan pada skema bintang maupun pada skema
snowflake berisi field-field yang sama. Perbedaan utama antara skema bintang
dan skema snowflake adalah semua tabel dimensi pada skema snowflake telah
dinormalisasi. Proses normalisasi tabel-tabel dimensi pada skema snowflake ini
disebut dengan proses snowflaking,sehingga tampilan tabel-tabel pada skema
snowflake bentuknya menyerupai snowflake.
Selain itu, perbedaan lainnya adalah dalam hal kompleksitas
query-nya. Skema snowflake memiliki kompleksitas query yang lebih kompleks
dibandingkan dengan skema bintang. Penjelasan mengenai kedua perbedaan tersebut
adalah sebagai berikut:
1.Normalisasi
Seperti yang telah disebutkan di atas, normalisasi adalah
perbedaan utama antara skema bintang dengan skema snowflake. Beberapa hal yang
harus diperhatikan adalah sebagai berikut:
•Skema snowflake menggunakan ruang penyimpanan yang lebih
kecil dibandingkan ruang penyimpanan pada skema bintang. Hal ini disebabkan
karena tabel-tabel dimensi yang telah dinormalisasi memiliki record-record yang
efisien karena tidak terjadi pengulangan data-data yang sama.
•Tabel dimensi yang tidak dinormalisasi dapat menyebabkan
masalah integritas data. Karena data-data yang sama bisa muncul berulang-ulang,
bahkan bisa juga terjadi kesalahan pengetikan pada data-data yang sama
tersebut. Sehingga pada skema bintang harus dilakukan pengecekan dan
maintenance secara berkala.
•Penyimpanan data pada skema snowflake lebih terorganisir
dan lebih rapi dibandingkan dengan skema bintang.
2.Kompleksitas Query
Sebelum masuk ke dalam penjelasan mengenai perbandingan kompleksitas
query antara skema bintang dan skema snowflake, terlebih dahulu diberikan
contoh perintah query yang digunakan untuk menghitung jumlah telepon yang
terjual di toko-toko di kota Berlin sepanjang tahun 2016. Perintah query-nya
adalah sebagai berikut:
•Skema Bintang
SELECT
dim_store.store_address,
SUM(fact_sales.quantity) ASquantity_sold
FROM
fact_sales
INNERJOINdim_product ONfact_sales.product_id =
dim_product.product_id
INNERJOINdim_time ONfact_sales.time_id = dim_time.time_id
INNERJOINdim_store ONfact_sales.store_id =
dim_store.store_id
WHERE
dim_time.action_year = 2016
ANDdim_store.city = ‘Berlin’
ANDdim_product.product_type = ‘phone’
GROUPBY
dim_store.store_id,
dim_store.store_address
•Skema Snowflake
SELECT
dim_store.store_address,
SUM(fact_sales.quantity) ASquantity_sold
FROM
fact_sales
INNERJOINdim_product
ONfact_sales.product_id = dim_product.product_id
INNERJOINdim_product_type ONdim_product.product_type_id =
dim_product_type.product_type_id
INNERJOINdim_time
ONfact_sales.time_id = dim_time.time_id
INNERJOINdim_year
ONdim_time.year_id = dim_year.year_id
INNERJOINdim_store
ONfact_sales.store_id = dim_store.store_id
INNERJOINdim_city
ONdim_store.city_id = dim_city.city_id
WHERE
dim_year.action_year
= 2016
AND dim_city.city =
‘Berlin’
AND
dim_product_type.product_type_name = ‘phone’
GROUPBY
dim_store.store_id,
dim_store.store_address
Seperti terlihat dari dua perintah query di atas, query pada
skema snowflake lebih kompleks dibandingkan dengan query yang digunakan pada
skema bintang. Hal ini disebabkan karena pada skema snowflake melibatkan lebih
banyak tabel sebagai akibat dari proses normalisasi, sehingga menggunakan
perintah JOIN yang lebih banyak dibandingan dengan skema bintang.
Pada skema bintang,hanya ada satu perintah JOIN untuk setiap
tabel dimensi. Namun jika tidak melibatkan tabel dimensi, maka perintah JOIN
tidak perlu digunakan. Sedangkan pada skema snowflake, jumlah perintah JOIN
yang digunakan bisa bervariasi tergantung kebutuhan.
Menggabungkan dua tabel memerlukan waktu karena Database
Management System (DBMS) memerlukan waktu yang lebih lama untuk memproses
permintaan query tersebut. Sebagai contoh tabel dim_store dan dim_city terlihat
berdekatan pada gambar skema di atas, namun secara fisik kedua tabel tersebut
mungkin tidak terletak berdekatan dalam media penyimpanan. Akan tetapi
data-data yang terletak pada satu tabel, kemungkinan besar secara fisik
data-data tersebut terletak berdekatan dalam media penyimpanan.
Umumnya, sebuah query yang berjalan dalam data mart dengan
skema snowflake akan dieksekusi lebih lambat. Namun hal ini tidak menimbulkan
masalah yang besar jika hasil yang ditampilkan hanya dalam waktu antara 1 mili
detik sampai dengan 1 detik. Hal ini dapat menjadi masalah yang serius jika
hasil yang ditampilkan memerlukan waktu 5 detik atau lebih.
Cara-Cara Mempercepat Eksekusi Query
Hal-hal yang dapat dilakukan untuk mempercepat proses query
dalam laporan adalah sebagai berikut:
•Menyimpan data ke dalam level yang kita perlukan dalam
laporan. Hal ini dapat memampatkan ukuran data secara signifikan. Untuk itu
diperlukan prosedur-prosedur ETL (Extract, Transform, Load) yang dapat
mentransformasi data ke dalam struktur dengan tepat dan efisien.
•Membuat sebuah tempat penyimpanan data yang terpusat untuk
semua data perusahaan, tidak hanya untuk data-data bagian tertentu saja.
•User hanya mengakses data-data yang diperlukan saja untuk
analisa dan laporan, tidak perlu semua data yang dapat memperlambat proses
eksekusi query.
Kelebihan dan Kekurangan Snowflake Schema
Kelebihan Snowflake Schema
Snowflake Skema dalam keluarga yang sama sebagai skema
bintang model logis. Bahkan, skema bintang ini dianggap sebagai kasus khusus
dari skema snowflake. Kepingan salju skema memberikan beberapa keunggulan
dibandingkan dengan skema bintang dalam situasi tertentu, termasuk:
•Beberapa OLAP alat pemodelan database multidimensi dioptimalkan
untuk skema kepingan salju.
•Normalisasi hasil atribut penghematan penyimpanan, tradeoff
menjadi kompleksitas tambahan dalam sumber permintaan bergabung.
Kekurangan Snowflake Schema
Kerugian utama dari skema snowflake adalah bahwa tingkat
tambahan atribut normalisasi menambah kompleksitas sumber permintaan bergabung,
jika dibandingkan dengan skema bintang .
Skema snowflake, berbeda dengan datar dimensi tabel tunggal,
telah banyak dikritik. Tujuan mereka diasumsikan penyimpanan yang efisien dan
kompak data dinormalisasi tapi ini adalah pada biaya yang signifikan kinerja
yang buruk ketika browsing bergabung diperlukan dalam dimensi ini. Kerugian ini
mungkin telah berkurang dalam tahun sejak pertama kali diakui, karena kinerja
query yang lebih baik dalam alat browsing.
Bila dibandingkan dengan sangat normal skema transaksional,
kepingan salju skema ini denormalization menghapus jaminan integritas data yang
disediakan oleh skema normal data beban ke dalam skema snowflake harus sangat
dikontrol dan dikelola untuk menghindari update dan memasukkan anomali.
Kelebihan Dan Kekurangan Star Schema
Kelebihan Star Schema
Skema bintang yang denormalized , yang berarti aturan normal
normalisasi diterapkan pada database relasional transaksional santai selama
desain skema bintang dan implementasi. Manfaat skema bintang denormalization
adalah
•Pertanyaan sederhana – skema bintang bergabung logika
umumnya lebih sederhana daripada bergabung logika yang diperlukan untuk
mengambil data dari sangat normalskema transaksional.
•Sederhana pelaporan bisnis logika – bila dibandingkan
dengan sangat normal skema, skema bintang menyederhanakan umum logika pelaporan
bisnis, seperti-selama periode-periode dan as-pelaporan.
•Keuntungan kinerja query – Bintang skema dapat memberikan
peningkatan kinerja untuk aplikasi read-only pelaporan bila dibandingkan dengan
sangat normal skema.
•Cepat agregasi – query sederhana terhadap skema bintang
dapat menghasilkan peningkatan kinerja untuk operasi agregasi.
•Feeding kubus – Bintang skema yang digunakan oleh semua
OLAP sistem untuk membangun proprietary kubus OLAP secara efisien; pada
kenyataannya, sebagian besar OLAPsistem menyediakan ROLAP modus operasi yang
dapat menggunakan skema bintang langsung sebagai sumber tanpa membangun
struktur kubus proprietary.
Kekurangan Star Schema
Yang saya ketahui kerugian utama dari skema bintang adalah
bahwa integritas data tidak ditegakkan serta berada dalam database yang sangat
normal. Satu-off menyisipkan dan update dapat mengakibatkan anomali Data yang
dinormalisasi skema dirancang untuk menghindari. Secara umum, bintang skema
dimuat dalam mode yang sangat dikontrol melalui batch processing atau
dekat-real time “trickle feed”, untuk mengkompensasi kurangnya perlindungan
yang diberikan oleh normalisasi .
Skema bintang juga tidak fleksibel dalam hal kebutuhan
analitis sebagai model data dinormalisasi. Model Normalisasi memungkinkan
setiap jenis pertanyaan analitis untuk dieksekusi selama mereka mengikuti
logika bisnis yang didefinisikan dalam model. Skema bintang cenderung lebih
tujuan-dibangun untuk pandangan tertentu dari data, sehingga tidak benar-benar
memungkinkan analisis yang lebih kompleks. Skema bintang tidak mendukung
banyak-ke-banyak hubungan antara entitas bisnis – setidaknya tidak sangat
alami.Biasanya hubungan ini disederhanakan dalam skema bintang untuk
menyesuaikan model dimensi sederhana.
sumber:
https://mti.binus.ac.id/2017/04/10/perbandingan-model-skema-bintang-dan-model-skema-snowflake-pada-data-warehouse/
0 comments