Veri Temizleme Neden Önemli?

Ham anket verisi hata, eksiklik ve tutarsızlık içerir. Temizlenmemiş veri ile yapılan analiz yanıltıcı sonuçlar üretir. Veri temizleme analiz öncesi zorunlu adımdır.

Veri Temizleme Adımları

1. Veri Setini İnceleyin

Değişken isimlerini, veri tiplerini ve genel yapıyı kontrol edin. Beklenmeyen değerler var mı?

2. Eksik Verileri Tespit Edin

Her değişkende eksik veri oranını hesaplayın. Eksikliğin rastgele mi sistematik mi olduğunu değerlendirin.

3. Sahte Yanıtları Filtreleyin

Dikkat sorularını kontrol edin. Çok kısa tamamlama süresi, düz çizgi yanıtlama gibi kalıpları tespit edin.

4. Tutarsızlıkları Kontrol Edin

Mantıksal tutarsızlıkları bulun. Örneğin: yaş ile mezuniyet yılı uyumsuzluğu.

5. Aykırı Değerleri İnceleyin

İstatistiksel yöntemlerle aykırı değerleri tespit edin. Gerçek mi hata mı belirleyin.

6. Ters Kodlanmış Maddeleri Dönüştürün

Ters yönlü maddelerin puanlarını çevirin.

7. Değişkenleri Yeniden Kodlayın

Gerekirse kategorileri birleştirin veya sürekli değişkenleri kategorileştirin.

8. Temizleme Sürecini Belgeleyin

Kaç kayıt çıkarıldı, neden çıkarıldı, hangi dönüşümler yapıldı kaydedin.

Eksik Veri Yönetimi

  • Listwise Deletion: Eksik olan satırı tamamen çıkarma.
  • Pairwise Deletion: Sadece ilgili analizde eksik olanı çıkarma.
  • Ortalama/Medyan İkame: Eksik değeri merkezi eğilim ile doldurma.
  • Çoklu İkame: İstatistiksel yöntemlerle birden fazla tahmin oluşturma.

Sık Yapılan Hatalar

  • Temizleme yapmadan analize geçmek: Kirli veri hatalı sonuç üretir.
  • Aykırı değerleri düşünmeden silmek: Gerçek uç değerler kaybolabilir.
  • Temizleme sürecini belgelememek: Şeffaflık ve tekrarlanabilirlik sağlanamaz.
  • Dikkat sorularını kontrol etmemek: Kalitesiz yanıtlar veri setinde kalır.
  • Ters kodlamayı unutmak: Toplam puanlar yanlış hesaplanır.

Kontrol Listesi

  • Veri seti yapısı incelendi
  • Eksik veri oranları hesaplandı
  • Sahte yanıtlar filtrelendi
  • Tutarsızlıklar kontrol edildi
  • Aykırı değerler incelendi
  • Ters kodlama yapıldı
  • Temizleme süreci belgelendi
  • Final veri seti oluşturuldu