search
Giriş
Merhabalar arkadaşlar, Sitemizi programlama ile ilgilenen bütün arkadaşlarımızın Türkçe içerik konusunda çektiği sıkıntılar düşünülerek soru/cevap şeklinde bir etkileşimde bulunabilmesi için kurduk. Umuyoruz hepimiz için güzel bir deneyim olur. Hasscript Ekibi
1 oy
424 gösterim
Veri analizinde bahsi geçen 3 farklı problem var

- Dummification (one hot encoding)
- Overfitting
- Imputing

Bu problemleri biraz anlatabilecek kimse var mı?
Veri Bilimi kategorisinde 6.2k puan

1 cevap

0 oy
One Hot Encoding; Bildiğim kadarıyla kategorisel değişkenlerin ikili (binary) olarak temsil edilmesi anlamına gelmektedir. Örneğin Kediler=0, Köpekler=1 gibi.

(Underfitting) Yetersiz Uyum; Modelimizde veri setimizdeki önemli özellikleri yakalayamayıp gerekli öğrenmeyi yapamamamız demektir. Daha fazla veri kullanılarak ya da daha karmaşık bir model kullanılarak çözülebilir bir durumdur.

(Overfitting) Aşırı Uyum; Modelimiz, veri setinin üzerinde gereğinden fazla çalışıp ezber yapmaya başlamışsa aşırı uyumluluktan dolayı düşük skor alabiliriz. Çünkü model veri setindeki (datasetteki) verilerin bire bir kopyalarını arar.

Imputing; Eksik verilerin yerine uygun veriler üretilmesi durumudur diyebiliriz. Örneğin bir veri setimizdeki maas değeri bilinmeyen "a" elemanı olduğunu varsayalım. Yapacağımız Imputing işlemine göre "a" elemanına şirketin ortalama maaş değerini ya da belirlediğimiz maas değerini atıyabiliriz.
334 puan

İlgili sorular

0 oy
1 cevap 222 gösterim
222 gösterim
En çok tercih ettiğiniz veri yapıları hangileridir? Neden tercih edersiniz?
14 Mayıs 2017 Veri Tabanı kategorisinde tolgacelik.art 2.0k puan sordu
0 oy
1 cevap 254 gösterim
0 oy
1 cevap 1.6K gösterim
1.6K gösterim
Merhaba iyi çalışmalar , en çok kullanılan Java teknolojileri ve bu teknolojilerin ne amaçla kullanıldığını öğrenmek istiyorum,yardımcı olabilir misiniz ?
8 Nisan 2019 Java kategorisinde furkankahveci 167 puan sordu
0 oy
1 cevap 204 gösterim
204 gösterim
Selam, Spring boot projesi kurmaya calışıyorum. Standart bir tasarım şablonu kullanmak istiyorum. Hangisini veya hangilerni önerebilirsiniz?
5 Şubat 2017 Java kategorisinde tolgacelik.art 2.0k puan sordu
0 oy
1 cevap 1.6K gösterim
1.6K gösterim
Veri hazırlaması anında tabloların fact ve dim önekleriyle oluşturulduğunu gördüm. Tabloların aslında iki farklı türde toplandığını gördük. Fact ve dimension kavramlarını açıklayabilir misiniz?
17 Şubat 2020 Veri Bilimi kategorisinde kenan 6.2k puan sordu