Validitas dari Hasil Penilaian
Secara umum validitas merupakan kekuatan dari hasil interpretasi dalam menggunakan hasil penilaian (asesmen). Nitko (2007:38) menyatakan “Validity is the soundness of your interpretations and uses of students assessment results”. Ini menyiratkan sebuah makna bahwa validitas adalah sebuah kekuatan dalam interpretasi hasil penilaian siswa.
Menurut Ebel (2007:89) menyatakan istilah validitas, bila diterapkan pada sebuah tes, mengacu pada presisi dengan tes yang mengukur beberapa kemampuan kognitif
Jadi validitas atau kesahihan menunjukkan pada kemampuan suatu instrument (alat pengukur) mengukur apa yang harus diukur.
Misalkan: seseorang yang ingin mengukur tinggi harus memakai meteran, mengukur berat dengan timbangan. Meteran & timbangan merupakan alat ukur yang valid dalam kasus tersebut
Terdapat dua aspek penting terkait dengan validitas, yaitu: Apa yang diukur dan bagaimana mengukurnya dengan tepat. Secara tradisional, validitas menekankan pada karakteristik tes, yang pada umumnya mementingkan kualitas tes. Namun, pemikiran terbaru tentang pengukuran menekankan bahwa validitas harus dikaitkan dengan kegunaannya dalam membuat skor dari sebuah tes (Joint Technical Standars for Educational and Psychological Testing dalam Ebel, 2007:90).
SIFAT UMUM VALIDITAS
Ketika membahas validitas hasil penilaian, ingatlah hal-hal berikut:
- Konsep validitas berlaku pada cara kita menafsirkan dan menggunakan hasil penilaian dan bukan pada prosedur penilaian itu sendiri
- Hasil penilaian memiliki derajat keabsahan yang berbeda untuk tujuan dan situasi yang berbeda
- Dalam membuat penilaian mengenai validitas interpretasi atau menggunakan hasil penilaian, hanya setelah mempelajari dan menggabungkan beberapa jenis bukti yang valid.
EMPAT PRINSIP VALIDITAS
Menurut Nitko & Brookhart (1996: 36), terdapat empat prinsip pada validitas yang dapat membantu kita dalam memutuskan apakah hasil penilaian valid atau tidak, adalah sebagai berikut:
- Interpretations (Penafsiran/maksud); Hal ini dapat anda berikan pada hasil penilaian siswa menjadi valid, hanya dengan menggunakan suatu tingkatan atau ukuran yang dapat dibuktikan dengan didukung oleh kebenaran dan kelayakan dari hasil penilaian tersebut.
Ada beberapa hal yang perlu kita tafsirkan dari hasil penaksiran tersebut tidak terpisah satu sama lain. (kelayakan interpretasi)
- Penggunaan; Membuat hasil penilaian menjadi valid, hanya dengan menggunakan suatu tingkatan atau ukuran yang dapat dibuktikan dengan didukung oleh kebenaran dan kelayakan dari hasil penilaian tersebut.
Artinya di sini adalah kegiatan atau aktivitas apa yang mendasari penilaian atau penskoran. Untuk memvalidasi kegunaan hasil penilaian (asesmen), anda juga dapat menggunakan kevalidan dari penaksiran (interpretations) hasil penilaian.(kelayakan penggunaan)
- Penafsiran dan penggunaan hasil penilaian menjadi valid, hanya ketika nilai (values) yang diberikan diimplikasikan oleh kelayakan atau kepantasan dari hal tersebut.
Artinya bahwa kita harus mempertimbangkan penaksiran yang tepat, penggunaan yang relevan dan kelayakan nilai ketika menanyakan bagaimana kevalidan dari hasil penilaian yang anda lakukan (Kelayakan Nilai)
- Penafsiran dan penggunaan hasil penilaian menjadi valid, ketika konsekuensi dari penafsiran dan penggunaan selalu konsisten dengan kelayakan nilai.
Setiap tindakan yang dilakukan memiliki konsekuensi. Oleh karena itu harus mempertimbangkan konsekuensi-konsekuensi yang ada ketika menilai apakah hasil penilaian dapat digunakan secara sah. (Nitko & Brookhart, 1996:39). (Kelayakan konsekuensi)
KEAHLIAN GURU DALAM VALIDITAS PENILAIAN KELAS
Meskipun validitas kriteria berlaku untuk semua jenis penilaian kelas, termasuk tugas singkat, tugas jangka panjang, dan kuis, disini menggambarkan penerapan kriteria ini dengan hanya satu contoh. Alasannya melakukan hal ini adalah bahwa keabsahan penilaian tergantung pada interpretasi tertentu, penggunaan, nilai, dan konsekuensi dari penilaian. Satu contoh menyatakan bahwa fokus khusus kita gunakan untuk menggambarkan ide.
Contoh Penilaian Interpretasi dan Penggunaan
Contohnya di bagian ini mengasumsikan tiga hal. Pertama, diasumsikan bahwa seorang guru akan menginterpretasikan hasil penilaian kelas sebagai salah satu tes sumatif siswa dalam penguasaan materi. Tujuan penilaian meliputi menggunakan hasil untuk menetapkan nilai siswa. Kedua, mengasumsikan bahwa guru akan menggunakan hasil penilaian ini hanya sebagai salah satu dari beberapa informasi penting dalam menentukan nilai siswa. ketiga, diasumsikan bahwa penilaian meliputi sejumlah besar "chunk" pembelajaran, seperti unit, sebuah periode, atau satu semester.
Kriteria Validitas dalam Penilaian Peningkatan Kelas
Beberapa kriteria dapat digunakan untuk meningkatkan validitas menggunakan hasil penilaian untuk menilai siswa.
- Keterwakilan dan Relevansi Isi
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v menekankan pada apa yang diajarkan
v menyatakan isi dari kurikulum sekolah
v mewakili pemikiran terkini tentang subjek
v berisi pelajaran yang bernilai
- Penggambaran Proses Berfikir dan Keterampilan
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v mengharuskan siswa untuk mengintregasikan dan menggunakan beberapa keterampilan berfikir
v menyatakan proses berfikir dan keterampilan yang ditetapkan oleh krikulum sekolah
v berisi tugas-tugas yang tidak lengkap tanpa menggunakan keterampilan berfikir yang diharapkan
v cukup waktu bagi siswa untuk menggunakan keterampilan dan proses yang kompleks
- Konsistensi dengan Penilaian kelas lainnya
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v menghasilkan pola hasil yang konsisten dengan penilain lain di sebuah kelas
v berisi tugas individu (soal) yang tidak terlalu mudah/terlalu sulit
- Keakuratan dan objetivitas
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v menggunakan prosedur yang sistematik untuk setiap siswa untuk menetapkan kualitas peringkat atau tanda
v memberikan kesempatan kepada siswa untuk menunjukkan kompetensinya pada target pembelajaran yang dinilai
- Keadilan untuk tipe siswa yang berbeda
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v berisi tugas-tugas yang ditafsirkan secara tepat oleh siswa dengan latar belakang yang berbeda
v mengakomodasi siswa penyandang cacat/kesulitan belajar jika perlu
v bebas dari etnis, ras dan bias gender
- Ekonomi, efisiensi, kepraktisan, fitur instruksional
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v memerlukan cukup banyak waktu untuk membentuk dan mengelola
v menyatakan dengan tepat penggunaan waktu di kelas pada siswa
v menyatakan dengan tepat penggunaan waktu di kelas
- Penilaian beberapa penggunaan
Untuk mencapai kriteria, maka penilaian yang dilakukan adalah
v digunakan sebagai penghubung dengan hasil penilain lain untuk kepastian yang penting
Bukti Validitas Tes
Dalam Popham (1995: 43) menyatakan dalam proses penilaian, terdapat tiga jenis bukti validitas yang dapat digunakan dalam menunjukkan kevalidan suatu hasil penilaian, diantaranya: validitas isi, validitas berdasarkan kriteria, dan validitas konstruk. Pokok dari ketiga bukti validitas tersebut disajikan dalam tabel berikut
| Tipe Bukti Validitas | Tipe Deskripsi Singkat |
| Validitas Isi | Menggambarkan bahwa prosedur penilaian cukup mewakili domain yang diukur dari sampel yang digunakan |
| Validitas Berdasarkan Kriteria | Merupakan tingkat dimana penampilan prosedur penilaian akurat dalam mengukur penampilan peserta tes diukur dari kriteria baku yang telah ditetapkan. |
| Validitas Konstruk | Menggambarkan bahwa bukti empiris dapat menunjukkan kesimpulan yang telah dibuat dan prosedur penilaian yang diberikan dapat mengukur secara akurat bentuk dari kesimpulan tersebut. |
Sementara menurut Kenneth Bailey mengelompokan tiga jenis utama validitas yaitu: Face validity, Criterion Validity, dan construct Validity, dengan catatan Face Validity cenderung dianggap sama dengan Content Validity.
- Validitas Isi
Validitas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang hendak diukur.
Validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini maka validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
Salah satu tipe dalam penentuan kesimpulan harus dikaitkan dengan intisari dari validitas tes. Dalam hal ini, dalam menulis suatu tes, kita ingin mengambil kesimpulan bahwa siswa yang mendapat skor tinggi dalam tes akan hati-hati dan lebih bertanggung jawab daripada siswa yang mendapatkan skor rendah. Untuk mengerjakan semua itu, isi tes harus berdasarkan pada definisi lain dari ”safe driving ability” yang dapat menggambarkan pengetahuan, keterampilan, dan pengertian dari kehati-hatian harus diberikan petunjuk.
Berikut ini, para pembuat tes kemampuan kognitif biasanya menghasilkan bukti validitas dalam prosesnya jika:
v Mendefinisikan secara eksplisit kemampuan yang akan diukur
v Menjelaskan secara detail tugas-tugas yang termasuk dalam tes
v Menjelaskan alasan untuk menggunakan beberapa tugas untuk mengukur kemampuan dalam suatu pertanyaan.
Menulis dokumen yang berisikan komponen-komponen tersebut menghasilkan suatu rasional eksplisit yang mengindikasikan apa sebenarnya yang diukur oleh tes dan ini merupakan bukti untuk Validitas Rasional Intrinsik. Namun permasalahanya, para pembuat tes termasuk guru, bertujuan untuk menghsilkan tes yang mengandung validitas intrinsik, tetapi mereka jarang menyatakan secara eksplisit tujuan tersebut. Mereka jarang memperhatikan proses pengkonstruksian tes sebagai proses validasi tes: Jarang dokumen mereka menuliskan alasan untuk membuat keputusan dalam pengembangan tes. Dan pada dasarnya, siapapun yang mempersiapkan diri untuk membuat tes yang memuat validitas instrinsik harus menunjukkan jawaban dari pertanyaan-pertanyaan berikut:
v Tentang apa sekumpulan keputusan yang akan dibuat?
v Apa domain yang akan diukur, apakah pengetahuan, keterampilan, atau tugas yang menunjukkan dasar dari pengambilan keputusan?
v Apa kepentingan relatif dari subdomain yang teridiri dari definisi domain?
v Jenis kekayaan atau isi apa yang dimiliki oleh item tes yang akan memberikan jaminan bahwa prestasi yang diukur merupakan elemen dari domain?
v Apakah item tes cukup menggambarkan domain pengetahuan, keterampilan, dan tugas?
v Apakah bagian dari item-item tes cukup mewakili bentuk dari kepentingan relatif sub domainnya?
v Domain atau subdomain apa yang berada di luar domain yang menarik ditunjukkan dalam tes?
Ketujuh garis besar tersebut menekankan bahwa apa yang diukur oleh tes atau bermaksud untuk diukur. Cronbach (dalam Ebel) menganjurkan bahwa apa yang diukur oleh tes kurang penting dibandingkan dengan apa yang seharusnya diukur.
- Validitas Berdasarkan Kriteria
Korelasi antara skor tes dan kriteria pengukuran menghargai beberapa jenis bukti-bukti yang baik dalam mendukung kevalidan suatu tes yang digunakan. Ini kelihatannya memberikan suatu kebebasan, tujuan validasi berdasarkan keputusan dan kesimpulan yang dibuat selama pengembangan tes. Tetapi, ada sebagian kecil tes yang digunakan untuk kemampuan kognitif telah didukung dengan kriteria yang cukup menarik sebagai bukti validitasnya.
Dalam beberapa kasus dilapangan, kriteria pengukuran tidak tersedia (Ebel, 1961a). Apa yang seharusnya dijadikan kriteria pengukuran untuk kemampuan aritmatik siswa kelas lima (5) atau kemampuan untuk memahami sebuah perkara? Tes tersebut biasanya secara langsung mengukur kemampuan dengan maksimal apabila sudah direncanakan dengan baik. Jika diperoleh hasil pengukuran yang lebih baik, tes bersangkutan akan tidak diperlukan lagi.
Validitas berdasarkan Kriteria secara umum dibedakan menjadi dua macam, diantaranya: Validitas Prediksi (predictive) dan validitas Konkuren (concurrent). Ketika skor tes digunakan untuk memprediksi kriteria skor di masa yang akan datang, bukti yang dihasilkan dapat dianggap sebagai suatu prediksi. Sementara itu, validitas konkuren menunjukkan bahwa sekumpulan tes yang diberikan ”secara konkuren” mengukur kemampuan yang sama yang dispesifikasikan sebagai sekumpulan kriteria skor.
Validitas Prediksi
Lebih jauh Sukardi (2008:35) menyatakan bahwa validitas prediksi sebagai derajat yang menunjukkan suatu tes dapat memprediksi tentang bagaimana seorang akan melakukan suatu prospek tugas atau pekerjaan yang direncanakan. Sebagai contoh, tes kemampuan Aljabar dapat dikatakan mempunyai validitas prediksi jika hasil tes tersebut dapat menduga anak yang mempunyai kemampuan dan anak yang tidak mempunyai kemampuan. Validitas prediksi suatu tes pada umumnya ditentukan dengan membangun hubungan antara skor tes dan beberapa ukuran keberhasilan dalam siituasi tertentu yang digunakan untuk memprediksi keberhasilan, yang selanjutnya disebut sebagai Prediktor. Sedangkan tingkah laku hendak diprediksi pada umumnya disebut sebagai kriterion.
Ketika kriteria telah ditentukan, prosedur selanjutnya adalah menentukan validitas prediksi suatu tes dengan cara (Sukardi, 2008:37):
v Buat item tes sesuai dengan tujuan yang hendak dicapai
v Tentukan kelompok yang dijadikan subjek dalam pilot study
v Identifikasi kriterion prediksi yang hendak dicapai
v Tunggu sampai tingkah laku yang diprediksi atau variabel kriterion muncul dan terpenuhi dalam kelompok yang telah ditetentukan
v Capai ukuran-ukuran kriterion tersebut
v Korelasikan dua set skor yang dihasilkan
Validitas Konkuren
Validitas konkuren adalah derajat dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Tes dengan validasi konkuren biasanya diadministrasi dalam waktu yang sama atau dengan kriteria valid yang sudah ada. Sering terjadi bahwa tes dibuat atau dikembangkan untuk pekerjaan sama seperti beberapa tes lainnya, tetapi dengan cara yang lebih mudah dan lebih cepat. Validitas konkuren ditentukan dengan membangun analisis korelasi atau pembedaan. Cara-cara membuat tes dengan validitas konkuren dapat dilakukan dengan beberapa langkah, diantaranya:
v Berikan tes yang baru dibuat pada suatu kelompok tertentu
v Catat/sediakan tes baku yang ada disertai dengan koefisin validitasnya
v Korelasikan dua skor tes tersebut.
Hasil yang diperoleh sebagai koefisien korelasi menunjukkan derajat korelasi antar kedua tes. Jika koefisien tinggi, berarti tes yang baru tersebut mempunyai validitas konkuren baik (valid) karena tes baku dianggap sudah valid.
- Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara. Secara definit, konstruk merupakan suatu sifat yang tidak dapat diobservasi, tetapi kita dapat dirasakan pengaruhnya melalui salah satu atau dua indera kita. Dalam bidang pendidikan anak, contoh konstruk Intelegency Quotient (IQ), melalui penelitian melalui penelitian menghasilkan bahwa seorang yang memiliki IQ lebih tinggi, ada kecendrungan dapat mengerjakan tugas-tugas sekolah dengan lebih baik. Contoh lain dalam bidang pendidikan misalnya ketakutan, kreativitas, semangat, kepemimpinan, dan lain sebagainya.
Lebih lanjut, Ebel (hal.96) menyatakan ”The term construct refers to psychological construct, each theoretical conceptualization about an aspect of human behavior that cannot be measured or observed directly” Ini memberikan makna bahwa bentuk konstruk lebih banyak berkaitan dengan masalah psikologi yang tidak dapat diukur atau diobservasi secara langsung misalnya bentuk intelegensi, prestasi, motivasi, kecemasan, kekuasaan, dan pemahaman membaca. Validitas konstruk dan tes yang digunakan untuk mengukurnya, dapat ditunjukkan dengan derajat skornya yang mana skor dari tes konstruk dikorelasikan dengan skor dari konstruk yang lain dalam satu jalan dan menunjukkan bahwa teori kepribadiannya akan terprediksi.
Karena validitas konstrak adalah validitas yang menunjukkan sejauhmana suatu tes mengukur trait atau konstrak teoritik yang hendak diukurnya maka untuk pengujian validitas konstrak, diperlukan analisis statistic yang kompleks seperti prosedur analisis factor. Salah satu prosedur pengujian validitas konstrak yang lebih sederhana adalah dengan melalui pendekatan multi-trait multi-method. Validitas ini digunakan lebih dari satu macam metode (Djemari M., 2007;21)
| | A1 | B1 | A2 | B2 |
| A1 | rA1A1(T) | rA1B1(R) | rA1A2(T) | rA1B2(R) |
| B1 | | rB1B1(T) | rB1A2(R) | rB1A2(T) |
| A2 | | | rA2A2(T) | rA2B2(T) |
| B2 | | | | RB2B2(T) |
Gambar 1 Matriks ideal multi-trait multi-method
Keterangan:
A1 dan A2 adalah dua metode yang berbeda yang mengukur satu macam trait yang sama, yaitu A
A1 dan B1 adalah dua macam trait berbeda yang diukur oleh satu metode yang sama, yaitu metode 1
T adalah tinggi dan R adalah rendah
Gambar satu menunjukkan dua tipe validitas, yaitu validitas konvergen dan diskriminan.
Secara teknis pengujian validitas konstruk dan validitas isi dapat dibantu dengan menggunkan kisi-kisi instrument atau matrik pengembangan istrumen. Dalam kisi-kisi itu terdapat variabel yang diteliti, indikator sebagai tolak ukur, dan nomor butir soal (item) atau pernyataan yang telah dijabarkan dari indikator. Dengan kisi-kisi instrument itu maka pengujian validitas dilakukan dengan mudah dan sistematis.
Tidak ada komentar:
Posting Komentar