search
Giriş
Merhabalar arkadaşlar, Sitemizi programlama ile ilgilenen bütün arkadaşlarımızın Türkçe içerik konusunda çektiği sıkıntılar düşünülerek soru/cevap şeklinde bir etkileşimde bulunabilmesi için kurduk. Umuyoruz hepimiz için güzel bir deneyim olur. Hasscript Ekibi
0 oy
1.6k gösterim
Veri hazırlaması anında tabloların fact ve dim önekleriyle oluşturulduğunu gördüm.
Tabloların aslında iki farklı türde toplandığını gördük. Fact ve dimension kavramlarını açıklayabilir misiniz?
Veri Bilimi kategorisinde 6.2k puan

1 cevap

0 oy

Önce kelime anlamlarına bakalım:

Fact: gerçek
Dimension: boyut

Bir rapor hazırlamamız gerektiği zaman üreteceğimiz/görselleştireceğimiz bilgileri birden fazla tablodan almamız kuvvetle muhtemel. Eğer tek tablodan alıyorsak da sorun değil tabii ki. Aradığımız asıl bilgiyi veren tabloya fact tablosu diyoruz veya kavramsal olarak bizim gerçeklermiz diyoruz. Mesela bir muhasebe sisteminde geçtiğimiz yılın para giriş çıkışlarını almak için bu bilgiyi tutan tabloyu almamız yetecektir. Bu tabloya fact tablosu diyoruz. Bunun yanında alınan miktarı farklı boyutlara göre yorumlamak istersek farklı tabloları da hesap içine bir şekilde almamız gerekir. Mesela hangi müşteriden ne kadar ödeme geldiğini anlamak istersek işlem tablomuza müşteri tablosunu da bağlamamız (join) gerekir. Ya da hangi şehirlerden ödeme alındığını göstermek istersek muhtemelen şehir/bölge bilgileri işlem tablomuzda olmayacak ve bu bilgilerin olduğu tabloları da işleme katmamız gerekecektir. İşte bu yapıda asıl iş olan işlem tablosu bizim gerçekliğimiz, müşteri, şehir gibi asıl gerçekliği destekleyen tablolar da bizim boyutlarımız (dimension) oluyor.

Daha iyi anlamak için aşağıdaki Diğer uçuş örneğine bakabiliriz.

Örneğin uçuşlar için bir tablomus olduğunu düşünürsek ve amacımız uçuşlar üzerinden bir hesaplama yapmak ise uçuş tablosu bizim gerçekliğimiz olur. Bu uçuşu destekleyen kişi ve şehir tabloları da bizim boyutlarımız yani dimension tablolarımız oluyor.

Peki asıl amacımız insanlar üzerinden bir rapor hazırlamaksa hiç uçuş ile işimiz yoksa ne olur?

O zaman kişi tablosu da bizim için bir fact (gerçeklik) tablosu olur. İsimlendirmeler raporlara ait asıl bilgilerin hangi tablolar üzerinden olduğu anlaşılsın diye yapılıyor. Tablomuzun adını tabii ki fact_person yapabiliriz.

 

6.2k puan

İlgili sorular

0 oy
0 cevap 367 gösterim
367 gösterim
Bir veri üzerinde çalışırken temel iki işlem olduğunu öğrendim. Bunlar fit ve transform kavramlarıymış. Bu kavramların neler olduğunu açıklayabilir misiniz?
4 Şubat 2019 Veri Bilimi kategorisinde kenan 6.2k puan sordu
0 oy
1 cevap 142 gösterim
142 gösterim
Pyspark kullanırken fitting ve transformation kavramları var. Bunları biraz açıklayabilir misiniz?
14 Kasım 2018 Veri Bilimi kategorisinde kenan 6.2k puan sordu
0 oy
0 cevap 74 gösterim
1 oy
1 cevap 422 gösterim
422 gösterim
Veri analizinde bahsi geçen 3 farklı problem var - Dummification (one hot encoding) - Overfitting - Imputing Bu problemleri biraz anlatabilecek kimse var mı?
14 Kasım 2018 Veri Bilimi kategorisinde kenan 6.2k puan sordu
0 oy
1 cevap 361 gösterim
361 gösterim
Java OOP'de soyutlama yeteneğini kazandıran Interface'ler ve Abstract Class'lar nedir ? Farkları nedir? Hangi durumlarda hangisi kullanılmalıdır? Bu kavramları bir örnek ile açıklarsak cevabı okuyan insanların aklında kalıcı bir yere sahip olur.
24 Temmuz 2020 Genel Kavramlar kategorisinde furkankahveci 167 puan sordu