Bu yazımızda verilerin SPSS’de verilerin nasıl düzenleneceği, veri dosyasındaki verinin doğruluğu ve kayıp verinin miktarı, dağılımı ve kayıp veri için geliştirilen çözümleri görsellerle anlatacağız.
1. Veri Dosyasındaki Verinin Doğruluğu
- Veri toplandıktan sonra analize başlamadan önce, veri setinde hata olup olmadığının kontrol edilmesi ve ön analizlerin yapılması gerekir.
- Verinin bilgisayarda veri dosyasına girilmesi sırasında hata yapılabilir. Ör: “3” yerine “35” girilmesi bir korelasyon analizinin sonuçlarını etkileyebilir.
- Hatalı değerin hangi bireye ait olduğunu bulmak için değişken büyükten-küçüğe ya da küçükten-büyüğe sıralanabilir.
- Eğer orijinal veriye ulaşmak mümkünse bu değer düzeltilir, eğer orijinal veriye ulaşmak mümkün değilse ilgili değer boş bırakılır ve kayıp veri olarak değerlendirilir.
"ANALYZE>DESCRIBTIVE STATISTICS>FREQUENCIES"
yolu kullanılarak veri dosyasına girilen verinin doğruluğunu kontrol etmek için betimleyici istatistikleri incelemek üzere aşağıdaki basamaklar takip edilir:
Ekranın en üstündeki ana menüden “Analyze” - “Descriptive Statistics” - “Frequencies” tıklayınız.
- Kontrol etmek istediğiniz değişken(ler)i seçiniz (Örneğin, Total_FCV, DASS_Stress, DASS_Anxiety, DASS_Depression gibi).
- Seçilen değişken(ler)i “Variable(s)” kutusuna taşımak için “OK” düğmesine tıklayınız.
- “Statistics” düğmesine tıklayınız. “Central Tendency” bölümünde “Mean” kutusuna “Dispersion” bölümündeyse “Std. deviation”, “Minimum” ve “Maximum” kutularına tıklayınız.
- “Continue” - “OK”e tıklayınız.
- “Statistics” tablosunda her bir değişken için ortalama, standart sapma, minimum ve maksimum değerleri incelenir. Total_FCV, DASS_Stress, DASS_Anxiety ve DASS_Depression gibi değişkenler için elde edilen değerlerin makul olduğu söylenebilir.
2. Kayıp Verinin Miktarı ve Dağılımı
Bir değişkene ait beklenmeyen miktarda kayıp veri varsa, ilk olarak bunun nedeni araştırılmalıdır. Daha sonra kayıp verinin örüntüsüne bakılarak, rastgele mi yoksa sistematik bir örüntü mü gösterdiği belirlenmelidir.
- Örneğin, 30 yaşın üstündeki birçok kadın yaş ile ilgili soruyu cevaplamak istemezler.
- Genellikle kayıp verinin örüntüsü miktarından daha önemlidir. Rastlantısal dağılmayan kayıp veriler sonuçların genellenebilirliğini etkileyeceğinden miktarları az da olsa, rastlantısal dağılan kayıp verilere oranla daha ciddi problemlere yol açarlar.
- Büyük bir veri setinde, verinin %5’i veya daha azı rastlantısal olarak kayıpsa çok ciddi problemlerle karşılaşılmaz ve kayıp veri ile ilgili problemleri çözmek için kullanılan herhangi bir yöntem benzer sonuçlar verir.
- Küçük veya orta büyüklükteki bir veri setinde çok sayıda veri kaybı varsa ciddi problemler ortaya çıkabilir.
3. Kayıp Veri Analizi
MISSING VALUE ANALYSIS (MVA) seçeneğini kullanarak kayıp değerlerin örüntüsünü incelemek üzere aşağıdaki basamaklar takip edilir:
- Ekranın en üstündeki ana menuden “Analyze” - “Missing Value Analysis” tıklayınız.
- İncelemek istediğiniz sürekli değişken(ler)i seçiniz (Örneğin, Total_FCV, DASS_Anxiety, DASS_Stress, DASS_Depression gibi)
- Seçilen değişken(ler)i “Quantitative Variables” kutusuna taşımak için ok düğmesine tıklayınız.
- Kategorik değişken(ler)i seçiniz (Örneğin, Gender, Marital_Status, Job gibi)
- Seçilen değişken(ler)i “Categorical Variables” kutusuna taşımak için ok düğmesine tıklayınız.
- “Patterns” düğmesine tıklayınız. “Display” bölümünde “Cases with missing values, sorted by missing value patterns”kutusuna tıklayınız.
- “Continue” tıklayınız.
- “Descriptives” düğmesine tıklayınız. “Indicator Variable Statistics” bölümünde “t tests with groups formed by indicator variables” ve “Include probabilites in table” kutularını tıklayınız.
- “Continue” - “OK”e tıklayınız.
- “Univariate Statistics” tablosunda, veri setinde Total_FCV değişkeni için 227 bireyden 1 bireyin, DASS_Stress değişkeni için 227 bireyden 1 bireyin, DASS_Anxiety değişkeni için 227 bireyden 1 bireyin ve DASS_Depression değişkeni için 227 bireyden 1 bireyin kayıp değere sahip olduğu görülmektedir.
- Hemen altındaki “Missing patterns” tablosunda kayıp veri olan katılımcı numaraları görülmektedir.
4. Kayıp Veri için Geliştirilen Çözümler
- Liste bazında veri silme: Liste bazında veri silme (listwise deletion) yönteminde bir veya birden fazla değişkende kayıp değer(ler)e sahip bireyler analizden çıkarılır diğer bir ifadeyle tam veriye sahip bireyler analize dahil edilir.
- Kayıp verinin tahmin edilmesi: Bu yöntemde bir değişkene ilişkin mevcut değerlerden değişkenin ortalama değeri hesaplanır ve analize başlamadan önce kayıp değer yerine ortalama değer yerleştirilir.
- Örneğin, “Total_FCV” değişkeni için ortalama “22.59” olduğu için “Total_FCV” puanı hesaplanmayan birey için “Total_FCV” puanı “22.59” olarak kabul edilir.
Bu yazımızda verilerin SPSS’de verilerin nasıl düzenleneceği, veri dosyasındaki verinin doğruluğu ve kayıp verinin miktarı, dağılımı ve kayıp veri için geliştirilen çözümleri görsellerle anlatacağız.