Başarı Testleri ve Eğitim

Eğitim kurumları öğrencilere, sistematik olarak planlanmış programlanmış bilgi, beceri ve duygu kazandırma faaliyeti içindedirler. İnsan, eğitime muhtaç bir varlık olup ne eğitimin ne de bilginin bitiş çizgisi yoktur, yaşam boyu devam eder. Böylelikle hem birey hem toplum gelişim-tekâmül süreçlerine teslim aldığı yerden devam ederek daha ileriye götürür, sonraki nesillere emanet eder.

İnsan, doğası gereği, doğduğu andan başlamak üzere yaşamının sonuna kadar yeni birtakım bilgiler, özellikler ya da davranışlar kazanmaktadır ya da daha önceden sahip olduğu hatalı davranışların düzeltilmesi gayreti içindedir. Davranış ya da özellikler aile eğitimi ile başlar, arkadaşlıklar gibi sosyal çevre ile genişler ve okul ortamında sistematik bir şekilde gelişme gösterir.

Okullarda verilen eğitim bir yandan ülkenin uzak hedefleri ile aynı doğrultuda olacak şekilde ve ülkeyi daha gelişmiş ülkeler düzeyine çıkartacak insan gücü yetiştirmek üzere verilirken öte yandan birey olarak kişinin varlığını devam ettirecek gerekli bilgi ve becerilerin kazandırılması doğrultusundadır (Demirel, 2003, s.84).

Okullar, öğrencilerin yaşlarına uygun olarak insanlık-millet-aile ve birey düzeylerinde hiyerarşik eğitim amaçlarının kazandırılmaya çalışıldığı organizasyonlardır. Her düzeyde, belirli amaçların gerçekleştirilmesi hedeflenir. Amaçların gerçekleşip gerçekleşmediği sınavlar yoluyla kontrol edilir.

Bu yazının ana teması, okullardan meydana gelen örgün eğitim siteminde uygulanan sınavlar-testlerdir. Bu konu, eğitimde ölçme ve değerlendirme alanı içinde değerlendirilir.

Ölçme ve değerlendirme amaç değil, amaçlara ulaşılıp ulaşılmadığının kontrolünü gerçekleştiren süreçlerden oluşur. Ne yazık ki, öğrenciler ve veliler örgün eğitim sistemlerinde haftalar aylar süren öğrenme-öğretme süreçlerinden çok, bir ders saati içinde gerçekleştirilen sınavlara ve onların sonuçlarına odaklanır. Böyle bir yöneliş eğitim öğretim süreçlerinin de sınav odaklı şekillenmesine yol açar. Bu durum, eğitim amaçlarının gerçekleşmesi bakımından önemli bir problem alanıdır.

  • Eğitim bir ömür sürer, sınav bir dakika- sevmek bir ömür sürer, sevişmek bir dakika!
  • Sınavlar eğitimi değil, eğitim sınavları şekillendirsin!

Sınavlardan vazgeçilmesinden söz edilemez. Ancak, sınavların süreci bozmayacak, aksine destekleyecek şekilde hazırlanması ve uygulanması ölçme ve değerlendirme alanında tartışılan, uğraşılan, geliştirilen en önemli konudur. Sınavların iyi hazırlanması ilk pratik çözümdür. Örgün eğitim kurumlarında uygulanan sınavlara başarı testleri adı verilir.

Başarı testlerini diğer testlerle karşılaştırdığımızda, bu testlerin diğer testlerden farklı olarak eğitim süreci ile iç içe olduğunu görmekteyiz. Bu yüzden başarı testleri eğitim ile birlikte ele alınmalı, eğitimin bir parçası olarak görülmelidir.

Özçelik’in (1997, s.1-5) başarı ve izleme testlerinin eğitim sürecindeki yeri konusunda belirttiği hususlar şemalaştırılarak aşağıda sunulmuştur.

Başarı ve İzleme Testleri

Öğrencilere yeni birtakım davranışlar kazandırmada etkililik ve ekonomi sağlayabilmek için okullarda, önceden hazırlanarak geliştirilmiş öğretim programları uyarınca hareket edilir. Bu amaçla, bir okulda ne yapılacağını gösteren programlara okul programları denir.

Öğrencilerin, dersin her ünitesinde öğrenmeleri gereken tüm yeni davranışları eksiksiz olarak öğrenmeleri ve onların, ders bittiği zaman bu dersin özel hedeflerinde kapsanmış olan bütün devimsel beceri, bilişsel güç ve duyuşsal özellikleri beklenen düzeylerde kazanmış olmaları gerekir. Her ünite bittiğinde öğrencilerin bu ünitedeki öğrenme eksiklerinin tek tek belirlenmesi ve bu eksiklerin bir sonraki üniteye geçmeden önce tamamlanması; buna ek olarak bir de, birkaç üniteyi kapsayan her dönem sonunda öğrencilerin, dersin özel hedefleri doğrultusundaki gelişmeleri yoklanarak görülebilecek gelişme yetersizliklerini giderici önlemlerin alınması, böylece eksiksiz bir ürünün alınmasını sağlayabilmektedir. Böyle bir izleme ve denetim ile öğretme-öğrenme sürecinden de istenen ürünler tam olarak alınabilmektedir.

Son yıllarda özellikle eğitim süreçlerinde çoktan seçmeli maddelerden oluşan testler yerine gerçek hayatla irtibatlı olarak hazırlanan projelerden oluşan "portfolyo" uygulamaları yaygınlaşmaktadır. Bununla birlikte değerlendirme güçlüklüleri, standardizasyon beklentileri vb. sorunlar nedeniyle çoktan seçmeli testler hem eğitimi değerlendirme hem öğrenciyi değerlendirme (seçme, ders-sınıf geçme kararlarında) amaçlı kullanılmaktadır ve kullanılmaya devam edilecektir.

Yukarıda belirtilen gerekçeler dikkate alınarak, uygulanacak testlerin çok iyi hazırlanması gerekir. Aşağıda test geliştirme işlem basamakları açıklanmıştır. Bir öğretmenin veya küçük bir okulun, bilinen kısıtlılıklar nedeniyle bu aşamaları tam olarak uygulaması zordur. Ancak, aşamaların bilinmesi ve olabildiğince uygun testler hazırlama çabası gösterilmesi gerekir.


Test Geliştirme İşlem Basamakları

Crocker ve Algina (1986, s.66-84) test geliştirme sürecini aşağıda özetlenen işlem basamakları ile açıklamışlardır.

Test geliştirme basamakları şunlardır:

1. Test Puanlarının Kullanılacağı Temel Amaçları Tanımlamak

Test sonuçları, giriş, yerleştirme, tanılama (diagnostic, decisions) gibi amaçlar için kullanılabilir. Tüm bu amaçları yeterince karşılayabilecek tek bir test geliştirilemeyeceği için test geliştirme sürecinde test sonuçlarının kullanım alanının göz önüne alınması gerekir. Örneğin ayırt etme amacıyla kullanılacak bir testin maddelerinin orta güçlükte olması ve buna bağlı olarak varyansın yüksek olması gerekir. Tanı amaçlı testlerde belirli alanlarda güçlülüğü ve zayıflığı ortaya çıkarabilecek maddelerin yeterli sayıda olması önemlidir. Bu durumda bazı maddeler popülasyonun büyük bir kısmı için kolay olabilir. Benzer şekilde, minimum yeterliliği ortaya çıkarmayı amaçlayan bir test ile çok başvurunun olduğu bir programa seçim için yapılacak bir test farklı olacaktır.

Test puanlarının kullanılacağı temel amaçların belirlenmesi ve testin bu doğrultuda hazırlanması, son formun bu amaçlara uygun olma olasılığını yükseltir.

2. Psikolojik Özelliği Ya Da Bu Özelliği Temsil Eden Davranışları Tanımlamak

Ölçülmek istenen psikolojik özelliği temsil eden davranışlar, test geliştiricisinin kendi düşüncesine göre ürettiği davranışlardan oluşturulmaz. Psikolojik özelliği temsil eden davranışların belirlenmesinde içerik analizi (deneklere açık uçlu maddeler verilmesi, alınan tepkilerin sınıflandırılması ya da önceden elde edilmiş olan içeriğin sınıflandırılması), araştırmaların taranması ve incelenmesi, kritik olayların belirlenmesi (performansın sınır noktaları), doğrudan gözlem, uzman yorumlarının alınması, eğitim hedeflerinden yaralanması (özellikle başarı testlerinde) gibi yöntemlerden test amacına uygun olanlar kullanılır.

Psikolojik yapının temel öğeleri (components, taksonomik yapı), üretilecek maddeler ve son olarak performansta gözlenmesi beklenen değişim (varyans) temel alınarak maddeler seçilir. Bireyin performansı diğer bireylerin performansına göre değerlendirilecekse norm referanslı, yalnızca bireyin yeterliliği değerlendirilecekse ölçüt referanslı maddeler oluşturulacaktır.

Bu aşamada son olarak, madde içeriğinin kaynağı belirlenir, uyarıcı ya da uyarıcı problem ve tüm doğru tepkilerin nitelikleri tanımlanır, çoktan seçmeli maddeler için yanlış tepkiler belirlenir. Böylece, hedef ve madde belirtke setleri hazırlanmış olur.

3. İkinci Basamakta Tanımlanan Davranışların Tiplerine (Taksonomilerine) Odaklanan Madde Oranlarını Gösteren Test Belirtke Setlerini (Tablolarını) Hazırlamak

Ölçülmek istenen psikolojik yapının öğelerine ilişkin maddelerin test içinde dengeli olması için psikolojik yapı içeriği ve alt alanlarına atanacak madde oranları belirlenir. Örneğin bilişsel alana ait sık kullanılan Bloom taksonomisinde bilgi, kavrama, uygulama, analiz, sentez ve değerlendirme alt alanları bulunmaktadır. Testin kapsadığı içeriğin alt konuları (örneğin bir ünitenin konuları) satır, Bloom taksonomisi alt alanları sütun olacak şekilde bir tablo hazırlanır.  Tablonun kesişen hücrelerine testte yer alacak madde oranları yazılır. Bu tablo yardımıyla her alt konuya ait çeşitli düzeylerdeki davranışları yoklayacak madde oranları planlanmış olur. Test belirtke tablosu olarak adlandırılan bu tablonun son satır ve sütunları toplam madde oranlarını verecek şekilde hazırlanır. Böylece testin ölçeceği içerik ve taksonomik alan ile ilgili madde oranları test bütünü içinde denetlenir.

4. İlk Madde Havuzunu Oluşturmak

Testin amacı dikkate alınarak madde sayısı belirlenir ve belirtke tablosundaki oranlara göre ilk madde havuzu oluşturulur. İlk madde havuzu için testin son madde sayısının 3 katından fazla madde hazırlanır. Madde havuzu oluşturulması; uygun madde formatının seçilmesi, seçilen formata testin uygunluğunun doğrulanması, madde yazıcılarının seçimi ve eğitilmesi, maddelerin yazımı, maddelerin niteliğini ve madde yazımındaki ilerlemeyi gözlem etkinliklerini içerir.

Madde formatları test tiplerine (maksimum performans, tipik tepki) göre değişir. Madde formatları testi alanın bir seçim yapmasını ya da tepki üretmesini gerektirmesi bakımından ikiye ayrılır. Tipik tepki testlerinde, onaylama-onaylamama, likert, sıfat listesi gibi madde formatları kullanılabilir.

5. Maddelerin Gözden Geçirilmesini Sağlamak

Hazırlanan maddelerin, informal olarak çevredeki uzmanlara doğruluk, test belirtkelerine uygunluk ve bağlılık, madde teknik yapı kusurları, gramer, yansızlık ve okunabilirlik bakımından kontrol ettirilmesi önerilir. Madde gözden geçirme işlemleri yukarıda belirtilen farklı gözden geçirme alanları için bu alanlarda yetişmiş farklı bireylere yaptırılmalıdır.

6. Madde Ön Denemesi

Maddelerin son forma aktarılıp basımından önce en az 15-30 denek üzerinde ön deneme yapılması gerekir. Ön deneme informal bir uygulama olup test geliştiricisi bu olanağı test süresince, test edilenlerin tepkilerini (reaksiyonlarını), uzun duraklamalarını, karalamalarını, yanıt değiştirmelerini gözleyerek belirli maddelerde karışıklık olup olmadığını anlamak amacıyla kullanır. Ön deneme sonrası test edilenlerle görüşülür ve her maddeye ilişkin yorumları ve geliştirme önerileri alınır. Bu sonuçlar üzerinden madde betimleyici istatistiklerinin hesaplanması önerilir.

7. Maddeleri, Test Popülasyonunu Temsil Eden Büyüklükte Bir Örneklem Grup Üzerinde Denenmek

Ön denemeden geçen ve tekrar gözden geçirilip düzeltilen maddeler için deneme formu hazırlanır. Deneme uygulaması, testin uygulanması tasarlanan bireyleri temsil edecek büyüklükte bir gruba son şekli verilmiş olarak uygulanır.

8. Madde İstatistiklerini Hesaplanmak, Önceden Belirlenmiş Olan Ölçütleri Karşılayamayan Maddeleri Elemek

Deneme uygulamasında gözlenen madde puanları, madde analizi denilen istatistiksel işlemlerle yoklanır. Her maddeye ilişkin madde güçlüğü, ayırt edicilik, madde varyansı hesaplanır. Test maddeleri çoktan seçmeli maddelerden oluşmuşsa çeldiricilerin işlerliğine ilişkin istatistikler hesaplanır. Norm referanslı testler için bu sonuçların yoklanması ile işlerliği olmadığı görülen maddeler ve/veya seçenekler düzeltilir, elenir ya da değiştirilir.

9. Testin Son Formu İçin Güvenilirlik ve Geçerlilik Çalışmalarını Tasarlanmak ve Yürütmek

Teste son şekli verilir, geçerlilik ve güvenilirlik hesaplamaları yapılır. Deneme örnekleminden elde edilen madde istatistiklerine dayanarak, denenmiş maddelerden oluşan yeni testin, deneme örneklemini temsil eden gruba/gruplara uygulanarak belirlenen güvenilirlik ve geçerlilik yöntemlerine göre hesaplamamalar yapılır.

10. Testin Uygulanması, Puanlanması ve Puanların Yorumlanmasına İlişkin Kılavuz İlkeler Geliştirilmek

Testin amacını, kimlere uygulanacağını, nasıl uygulanacağını, nasıl puanlanacağını, elde edilen ham puanların nasıl dönüştürüleceğini, puanların ne anlama geldiğini, nasıl yorumlanacağını açıklayan bunlarla ilgili yönergeleri de içeren bir kılavuz hazırlanır. Bu aşama bir bakıma test el kitabının oluşturulması aşaması olarak da görülebilir.


Kaynaklar

Baykul, Y. (2000). Eğitimde ve psikolojide ölçme. ÖSYM Yayınları.

Cohen, R. J., Montague, P., Nathanson, L. S., & Swerdlik, M. E. (1988). Psychological testing, an introduction to tests & measurement. California: Mayfield Publishing Company.

Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory. CBS College Publishing Company.

Cronbach, L. J. (1990). Essentials of psychological testing. Harper & Row.

Demirel, Ö. (2003). KPSS hazırlık kılavuzu ölçme ve değerlendirme. PEGEM.

Haladayna, M. T. (1997). Writing test items to evaluate higher order thinking. Allyn & Bacon.

Moore, K. D. (1989). Classroom teaching skills. Random House.

Özçelik, D. A. (1992). Ölçme ve değerlendirme. ÖSYM Yayınları.

Özçelik, D. A. (1992). Test hazırlama kılavuzu. ÖSYM Yayınları.

Çok Okunanlar:

Kabullenme Enerjisi

Meslek ve Kariyer Planlamasında İlgi ve Mesleki İlgi Ölçekleri

Olumsuz Öğrenmeleri Anlamak ve Söndürmek