Veri Temizleme Neden Önemli?
Ham anket verisi hata, eksiklik ve tutarsızlık içerir. Temizlenmemiş veri ile yapılan analiz yanıltıcı sonuçlar üretir. Veri temizleme analiz öncesi zorunlu adımdır.
Veri Temizleme Adımları
1. Veri Setini İnceleyin
Değişken isimlerini, veri tiplerini ve genel yapıyı kontrol edin. Beklenmeyen değerler var mı?
2. Eksik Verileri Tespit Edin
Her değişkende eksik veri oranını hesaplayın. Eksikliğin rastgele mi sistematik mi olduğunu değerlendirin.
3. Sahte Yanıtları Filtreleyin
Dikkat sorularını kontrol edin. Çok kısa tamamlama süresi, düz çizgi yanıtlama gibi kalıpları tespit edin.
4. Tutarsızlıkları Kontrol Edin
Mantıksal tutarsızlıkları bulun. Örneğin: yaş ile mezuniyet yılı uyumsuzluğu.
5. Aykırı Değerleri İnceleyin
İstatistiksel yöntemlerle aykırı değerleri tespit edin. Gerçek mi hata mı belirleyin.
6. Ters Kodlanmış Maddeleri Dönüştürün
Ters yönlü maddelerin puanlarını çevirin.
7. Değişkenleri Yeniden Kodlayın
Gerekirse kategorileri birleştirin veya sürekli değişkenleri kategorileştirin.
8. Temizleme Sürecini Belgeleyin
Kaç kayıt çıkarıldı, neden çıkarıldı, hangi dönüşümler yapıldı kaydedin.
Eksik Veri Yönetimi
- Listwise Deletion: Eksik olan satırı tamamen çıkarma.
- Pairwise Deletion: Sadece ilgili analizde eksik olanı çıkarma.
- Ortalama/Medyan İkame: Eksik değeri merkezi eğilim ile doldurma.
- Çoklu İkame: İstatistiksel yöntemlerle birden fazla tahmin oluşturma.
Sık Yapılan Hatalar
- Temizleme yapmadan analize geçmek: Kirli veri hatalı sonuç üretir.
- Aykırı değerleri düşünmeden silmek: Gerçek uç değerler kaybolabilir.
- Temizleme sürecini belgelememek: Şeffaflık ve tekrarlanabilirlik sağlanamaz.
- Dikkat sorularını kontrol etmemek: Kalitesiz yanıtlar veri setinde kalır.
- Ters kodlamayı unutmak: Toplam puanlar yanlış hesaplanır.
Kontrol Listesi
- Veri seti yapısı incelendi
- Eksik veri oranları hesaplandı
- Sahte yanıtlar filtrelendi
- Tutarsızlıklar kontrol edildi
- Aykırı değerler incelendi
- Ters kodlama yapıldı
- Temizleme süreci belgelendi
- Final veri seti oluşturuldu