Bir aşçı için yemek yapacağı malzemelerin kalitesi ne kadar önemliyse, araştırmacılar için analiz edilecek verinin kalitesi o kadar önemlidir. Hazırlanış aşamasında gösterilen emek, yemeğin lezzetini büyük ölçüde etkileyecektir. İşte araştırmanın sonucunda elde edilen bulguların kuvveti, daha planlama aşamasından başlayan bir dizi emek ve özen ile kendini gösterir.

Çalışmanın “ilk cemresi” olan araştırma sorusu akla düştüğü andan itibaren hangi verinin ne şekilde toplanacağının tasarlanmaya başlanması, bu emeğin ilk adımı sayılabilir.

Araştırma planlanırken yapılan ön çalışmalarda; yani (1) Amaç, hedef, araştırma sorularının belirlenmesi, (2) Literatür taraması ile benzer araştırmaların incelenmesi, (3) Süre, maliyet ve örneklem sayısının belirlenmesi aşamalarında bir gizli özne varsa o da toplanacak veridir.

Veriyi amaca uygun seçme, bu seçimi yaparken literatürden destek alma, çalışmanın süre ve maliyet kısıtlarına göre verinin enlemine (değişken sayısına) veya boylamına (örneklem sayısına) karar verme işlemlerinde en önemli aktör şüphesiz ki veridir.

Kaliteli çalışmalar üreten bilim insanlarının ortak özelliği; tasarım ve planlama aşamasına maksimum özeni gösterirken verinin kalitesine odaklanmalarıdır.

Doğru veri yönetimi ile verinin kalitesi artacak ve çalışmanın önlenebilir kısıtlılıkları azalacaktır. Aynı zamanda yapılan istatistiksel analizi de etkinleştirecektir.

Doğru analizin ilk kuralı doğru veriyle çalışmaktır.

Bunu kaos teorisindeki “başlangıç koşullarına hassas bağımlılık” olgusuyla açıklayabiliriz. Çalışmanın en başında yapılan ufak değişimler, öngörülemeyen sonuçların bir nedeni olabilir. Bunun için “erken tanı hayat kurtarır” deyimini kullanmak hiç de yanlış olmaz.

Peki veri yönetimi neyi ifade ediyor?

Veri yönetimi ile şu sorulara yanıt bulmayla çalışıyoruz: Çalışmaya dahil edeceğim değişkenlerim neler, bu değişkenlerin türleri (niteliksel veya niceliksel) nedir, verilerimi nasıl sınıflayabilirim (kesim noktalarına göre ayırma veya grupları birleştirme), hangi analitik hesapları yapacağım, eksik veya hatalı verilere nasıl bir işlem uygulayacağım, minimum örneklem sayım kaç olmalıdır, kontrol grubu seçmeli miyim?..

Bu sorulara çok fazla kafa yormanın meyveleri,  araştırmanın bilimsel zemine yaklaşması, sonuçların güvenilir ve geçerliliğinin artması olacaktır. Bunun somut çıktısı ise bir tez için jürinin beğenisi, bir yayın için hakemin onayı olabilir. Veri yönetiminde neler yapılması gerektiğini anlatmak için, karşılaşılabilecek hatalar üzerinden örnek vermek daha etkili olacaktır:

1. Hipotez ve araştırma sorularını verileri topladıktan sonra nerobet belirleme. Hatta belirlememe!

Her araştırma sorusuna uygun veri çalışmada bulunmalı, araştırma sorularımıza uygun olmayan veri gereksiz yere dâhil edilmemelidir. Çalışma tanımlayıcı bir araştırma dahi olsa hipotezi veya sorusu olmayan bir çalışma olamaz. Ve elbette ki hipotezler çalışmanın sonunda değil, başında belirlenmelidir.

2. Literatüre hakim olmadan çalışmaya başlama/Yetersiz istatistik okur yazarlığı

Bu yolda ilk giden biz değilsek eğer, patikaları takip etmek işe yarar. Akıl akıldan üstündür. Bazen bizim aklımıza gelmeyen bir değişkeni başka yayında görerek önemli bir açığı kapatabiliriz. Tabii ki bunu keşfetmek için istatistik analizinden “kendimize yetecek kadar” anlamak gibi bir koşulumuz var. Yazı yazmak için önce alfabeyi bilmeli.

3. Kritik değişkenleri dahil etmeme

Bu tuzağa düşmemek için bkz: 1. ve 2. madde.

4. «Her şeyi toplayalım, gerekirse kullanırız» mantığı-Fishing

Bunun yarattığı iki tehlike var, araştırmacının anlamlı sonuç bulma konusundaki ısrarı, çalışmayı odaktan saptırıp zaman kaybına neden olur ve daha da kötüsü yanlılık yaratır.

5. Kontrol grubu almama

Bazen bu duruma son anda çözüm bulunabilir, bazen de artık çok geçtir. Çalışmanın kalitesini ciddi oranda düşürür ve yayınlanması için seçilen mecranın özelliklerini kısıtlar.

6. Deney ve kontrol gruplarının benzer olmaması

Yaşın etkili olduğu bir çalışmada deney ve kontrol grubunun yaşlarının eşit seçilmemesi, sonuçların doğruluğunu maskeleyecektir. Sonucun yaştan dolayı mı oluştuğunu yoksa gerçekten grupların farklı mı olduğunu ayırt edemeyiz.

7. Uygun örneklem büyüklüğü hesaplamama

Bu konu o kadar mühim ki üzerine nice kitaplar yazılmıştır. Gerçekte anlamlı bir sonuca anlamsız demeyi kim ister ki? Yapılan benzer çalışmalardan elde edilen sonuçların kullanıldığı güç (power) analizi ile çalışmanın etki büyüklüğüne (effect size) uygun örneklem sayısı belirlenmelidir.

8. Uygun örneklem yöntemini seçememe

Sadece yeterli örneklem sayısına ulaşmak yetmez, kitleyi temsil etmek de bir o kadar mühim bir mevzudur.

9. Verilerin ham hali yerine özet haliyle analiz edileceğini düşünme (ortalama, frekans)

“Nasıl olsa istatistikte bunlar kullanılıyor” diyerek sadece ortalama veya frekansları işleme almak yerine her deneğin verisini tek tek giriyoruz. Örneğin zamana bağlı değişimde her zaman noktasında deneklerin değeri bilinmediği sürece artış veya azalıştan bahsedemeyiz.

10. Verileri bilinçsiz olarak sınıflandırma

Deneklerin gerçek yaşını öğrenmek yerine gereksiz yere gruplama yapma ve eşitlik olduğu durumda eşitliğin nereye dahil olduğunu belirtmeme. Seçenekler 20-25 ve 25-30 olarak belirtildiğinde 25 yaşındaki bir kişi hangisini seçmelidir?

11. Yanlış anlaşılmaya açık sorular belirleme

Bu tür sorular çalışmadan çıkarılır. Bu yanlış, çalışma için önemli bir soruda yapılmış ise çalışma büyük sıkıntıyla karşı karşıya demektir. Veri formu, her zaman ikinci bir göz tarafından incelenmelidir.

12. Veri formunu birden fazla kişinin oluşturması nedeniyle standardizasyon hataları

Veri formundaki soruları oluştururken veya alınacak yanıtların forma nasıl aktarılacağı ile ilgili ortak kararlar alınmalıdır. Bu kısım atlandıysa veri formunun son hali kontrol edilmeli, tek elden hazırlanmış hale getirilmelidir.

Peki ola ki bu hatalardan en az birini yaptığımızda sonuç ne olur?

Çalışmanın kalitesi düşebilir, çalışmanın süresi uzayabilir ve maliyeti artabilir, araştırmacının bildiği/bilmediği hatalı sonuçlar üretilebilir ve en kötüsü de çalışma iptal edilebilir.

Bu gibi istenmeyen sonuçlarla karşılaşmamak için ilk önerim, çalışmanın üzerine en çok kafa yorulması gereken kısmının planlama aşaması olduğunu, bu aşamanın aceleye getirilmemesi gerektiğini bilmek olacaktır. Biz araştırmacıların kafasını en çok kurcalayan soru, “analizlerimi nasıl yapacağım” oluyor. Fakat sanılanın aksine, verilerin hazırlanması analiz edilmesinden daha uzun soluklu bir süreç olmalıdır. Veri yönetimine ayırdığınız sürenin ve verinin uygunluğuna emin olmak için gösterdiğiniz çabanın artması hem analiz süresini kısaltacak, hem de araştırmanız doğrulukta 1-0 önde başlayacaktır.

Bir sonraki yazımız; veri hijyeni (Verilerin doğruluğunu nasıl artırabiliriz? Verileri analize nasıl hazırlarız?) olacaktır.

Sen de Topluluğumuzun Bir Parçası Ol

Yazarlık başvurusunu ile ilgili açıklayıcı bilgilere buradan ulaşabilir.
Direkt başvuruyu ise aşağıdaki linkten yapabilirsiniz.
https://goo.gl/forms/7gtKei53ddxYgTfG3

2 YORUMLAR

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

This site uses Akismet to reduce spam. Learn how your comment data is processed.