17
Teori Reliabilitas Asumsi Teoritik Mengenai Skor Performansi individu, yang diungkap oleh suatu skala pengukuran atau tes psikologis, dinyatakan dalam bentuk angkayang disebut skor (scores). Skor tidak lain daripada harga suatu jawaban terhadap pertanyaan dalam tes dan meskipun tidak sempurna merupakan representasi dari suatu atribut laten. Skor kuantitatif yang langsung diperoleh dari pengukuran dan belum diolah atau belum diderivasikan ini merupakan skor perolehan (obtained scores atau observed scores) yang selanjutnya kita sebut skor tampak dan kita beri simbol huruf X. Bersamaan dengan itu, bagi setiap individu yang mendapat skor-tampak X, terdapat pula angka lain yang merupakan skor sesungguhnya. Skor sesungguhnya adalah angka performansi yang benar dan merupakan representasi murni dari atribut laten, yang tidak pernah dapat diketahui besarnya oleh karena tidak dapat diungkap secara langsung oleh tes. Skor sesungguhnya ini selanjutnya kita sebut skor murni dan dilambangkan oleh huruf T. Kemudian, menyertai setiap hasil pengukuran, diteorikan pula adanya komponen error yang besarnya bagi setiap individu dalam setiap tes juga tidak dapat diketahui. Komponen error dalam pengukuran ini kita simbolkan dengan huruf E. Hubungan antara error pengukuran dan skor murni diuraikan oleh Allen & Yen (1979) dalam beberapa asumsi berikut: 1. X = T + E Asumsi ini mengatakan bahwa terdapat sifat aditif yang berlaku bagi hubungan diantara skor tampak, skor murni dan Teori Reliabilitas dan Validitas 1

Rangkuman Teori Reliabilitas Dan Validitas

Embed Size (px)

Citation preview

Page 1: Rangkuman Teori Reliabilitas Dan Validitas

Teori Reliabilitas

Asumsi Teoritik Mengenai Skor

Performansi individu, yang diungkap oleh suatu skala pengukuran atau tes psikologis, dinyatakan dalam bentuk angkayang disebut skor (scores). Skor tidak lain daripada harga suatu jawaban terhadap pertanyaan dalam tes dan meskipun tidak sempurna merupakan representasi dari suatu atribut laten. Skor kuantitatif yang langsung diperoleh dari pengukuran dan belum diolah atau belum diderivasikan ini merupakan skor perolehan (obtained scores atau observed scores) yang selanjutnya kita sebut skor tampak dan kita beri simbol huruf X.

Bersamaan dengan itu, bagi setiap individu yang mendapat skor-tampak X, terdapat pula angka lain yang merupakan skor sesungguhnya. Skor sesungguhnya adalah angka performansi yang benar dan merupakan representasi murni dari atribut laten, yang tidak pernah dapat diketahui besarnya oleh karena tidak dapat diungkap secara langsung oleh tes. Skor sesungguhnya ini selanjutnya kita sebut skor murni dan dilambangkan oleh huruf T.

Kemudian, menyertai setiap hasil pengukuran, diteorikan pula adanya komponen error yang besarnya bagi setiap individu dalam setiap tes juga tidak dapat diketahui. Komponen error dalam pengukuran ini kita simbolkan dengan huruf E.

Hubungan antara error pengukuran dan skor murni diuraikan oleh Allen & Yen (1979) dalam beberapa asumsi berikut:

1. X = T + E

Asumsi ini mengatakan bahwa terdapat sifat aditif yang berlaku bagi hubungan diantara

skor tampak, skor murni dan error. Besarnya skor tampak ditentukan oleh besarnya skor

murni dan pengukuran error. Misalnya, Ano yang diukur kecerdasannya mendapatkan

skor 112. Skor ini adalah X. Bila diperkirakan skor murni Ano adalah 110, maka

hubungan X, T, dan E pada Ano adalah 112 = 110 + 2. Nilai 112 yang didapatkan Ano

pada pengukuran yang lain bisa jadi berubah, tetapi nilai T-nya akan selalu tetap.

Misalnya, pada pengukuran kedua, Ano mendapatkan skor 108, sehingga hubungan

antara ketiga skor adalah 108 = 110 - 2. Bila pada pengukuran berikutnya iddapatkan 105,

maka 105 = 110 – 5.

2. (X) = T

Asumsi kedua ini menyatakan bahwa skor murni (T) merupakan harapan dari skor

tampak (expected value of X). Jadi skor murni merupakan harga rata-rata dari distribusi

teoretik skor tampak apabila dilakukan pengukuran berulang kali pada atribut yang sama,

Teori Reliabilitas dan Validitas 1

Page 2: Rangkuman Teori Reliabilitas Dan Validitas

responden yang sama dan pada kondisi yang sama tetapi pengukurannya terpisah satu

sama lain.

Kelemahan dari asumsi kedua ini berkenaan dengan ada tidaknya skor murni, dan bila

ada, berapa skor murni yang dimuliki oleh seseorang dalam sutau pengukuran psikologi?

Untuk menentukan ada tidaknya skor murni, dapat digunakan endekatan filsafat (Plato)

yang menyatakan bahwa jika kita berpikir sesuatu itu ada, maka sesuatu itu adalah ada.

Sehingga, jika kita berpikir bahwa skor murni ada, maka skor murni itu memang ada.

Kemudian, berapa skor murni seseorang? Untuk ini dapat digunakan pendekatan statistik,

yaitu dengan mengambil skor rata-rata dari berulang kali (tak terbatas) pengukuran

psikologis pada atribut yang sama, dengan catatan pengukuran yang berulang kali

tersebut dilakukan secara independen antara pengukuran yang satu dengan pengukuran

lainnya. Jadi misalnya, Ano diukur sebanyak 6 kali, dan X yang didapatkan mempunyai

rata-rata 110, maka 110 inilah yang dianggap sebagai skor murni Ano. Jadi sekali lagi,

skor murni adalah nilai rata-rata dari obtained score yang didapatkan melalui sejumlah

pengukuran psikologi. Penguruan sekian kali yang independen antara pengukuran yang

satu dan lainnya mustahil dilakukan, maka pada dasarnya skor murni dianggap sebagai

suatu bangunan teoritik yang bersifat hipotetik.

3. et = 0

Asumsi ketiga ini menyatakan bahwa Bahwa pada satu pengukuran kepada sekelompok

subjek, maka nilai-nilai kesalahan atau distribusi error pada sekelompok subjek itu tidak

mempunyai korelasi dengan nilai-nilai skor murni atau distribusi true score.

4. e1e2 = 0

Asumsi keempat menyatakan bahwa tibak ada hubungan antara error pada pengukuraa 1

dengan error pada pengukuran 2 dan seterusnya pada 1 subjek. Asumsi ini berlaku dengan

pangertian bahwa pada tes yang pertama dan pada tes yang kedua tidak terjadi pengaruh

kelelahan, pada latihan dan semacamnya. Adanya faktor-faktor luar yang secara

sistematik sama mempengarehi kedua pengukiran dan akan menyebabkan adanya korelasi

antara error dari kedua pengukuran yang bersangkutan.

5. e1t2 = 0

Asumsi kelima menyakan bahwa tidak ada korelasi antara error pada I pengukuran (1 alat

ukur) dengan true score pada alat ukur yang lain. Asumsi ini bisa batal, karena atribut

Teori Reliabilitas dan Validitas 2

Page 3: Rangkuman Teori Reliabilitas Dan Validitas

yang diukur oleh salah satu alat tes itu merupakan faktor yang mempengaruhi atribut

yang diukur oleh alat lain. Misalnya, pengukuran yang pertama mengukur tentang

inteligensi sedangkan pengukuran yang kedua mengukur tentang hasil belajar. Secara

teoritis, inteligensi adalah faktor yang mempengaruhi prestasi belajar, akibatnya asumsi

kelima batal.

Kelima asumsi diatas digunakan sebagai landasan dalam pembahasan tentang tes yang

bersifat paralel dan tes yang bersifat ekuivalen. Tes yang paralel adalah dua tes yang berbeda

tetapi dianggap sama, dalam pengertian bisa saling menggantikan atau bersifat substitutif

(alat ukur berbeda, atribut yang diukur sama). Dua tes bisa disebut paralel bila mempunyai

skor perolehan X1 dan X2 yang memenuhi asumsi-asumsi 1 sampai 5, serta memenuhi tiga

persyaratan, yaitu:

1) T = T1

Dua perangkat tes merupakan tes paralel jika suatu populasi yang menempuh kedua tes

itu menghasilkan skor murni yang sama.

2) σ e2=σe

12

Pada satu pengukuran kepada sekelompok subjek akan menghasilkan varians error yang

sama. Varians adalah nilai yang menunjukkan berapa besarnya suatu nilai menyimpang

dari nilai rata-rata.

3) X=X1

Rata-rata obtained score subjek pada suatu alat ukur harus sama dengan rata-rata

obtainaed score pada alat ukur yang lain.

Dua tes disebut bersifat ekuivalen jika dua perangkat tes (untuk mengukur atribut

yang sama) mempunyai skor perolehan X1 dan X2 yang memenuhi asumsi-asumsi 1 sampai 5,

serta memenuhi persyaratan T1 = T2 + C, dimana C adalah suatu konstanta, yaitu apabila

skor murni dari satu alat ukur mempunyai perbedaan yang tetap dengan skor murni yang

dihasilkan oleh alat ukur yang lain.

Teori tes klasik yang dirumuskan dalam bentuk asumsi-asumsi seperti di atas,

menghasilakn sejumlah kesimpulan. Diantaranya yang berkaitan langsung dengan

pengembangan alat ukur psikologis antara lain:

Teori Reliabilitas dan Validitas 3

Page 4: Rangkuman Teori Reliabilitas Dan Validitas

Kesimpulan 1 : = (E) = 0

Nilai harapan skor-skor kesalahan seseorang subjek sama dengan nol. Jika seseorang dites

dengan suatu tes yang sama berulang-ulang (sampai tak terhingga), maka rata-rata skor

kesalahannya akan sama dengan nol. Karena skor-skor kesalahan terjadi secara acak, maka

yang meleset ke atas dan kebawah akan meniadakan satu sama lain.

Kesimpulan 2 : (E T) = σ ET = 0

Nilai harapan hasil kali skor-skor kesalahan dan skor-skor murni sama dengan nol. Kovarians

antara skor kesalahan dan skor murni, yang sama dengan (ET) - (E) (T) juga sama

dengan nol.

Kesimpulan 3 : σ X2 =σT

2 +σ E2

Varians skor-skor perolehan sama dengan varians skor-skor murni ditambah varians skor-

skor kesalahan. Jika skor perolehan, skor murni dan skor kesalahan suatu populasi pada suatu

tes dapat diperoleh, maka varians skor-skor perolehan (varians total) akan sama dengan

varians skor-skor murni ditambah varians skor-skor kesalahan.

Kesimpulan 4 :ρXT

2 =σTT

2

σ X2

Kuadrat korelasi antara skor-skor perolehan dan skor-skor murni sama dengan nisbah antara

varians skor-skor murni dan varians skor-skor perolehan. Kesimpulan ini kemudian menjadi

sangat penting dalam pembicaraan tentang reliabilitas tes.

Kesimpulan 5 :ρXT

2 =1−σ E

2

σ X2

Kuadrat korelasi antara skor-skor perolehan dengan skor-skor murni sama dengan satu

dikurangi nisbah antara varians skor-skor kesalahan dengan varians skor-skor perolehan.

Teori Reliabilitas dan Validitas 4

Page 5: Rangkuman Teori Reliabilitas Dan Validitas

Kesimpulan 6 :ρXX=

σ TT2

σ X2

=σT

2

σ X2

Korelasi antara skor-skor pada dua tes paralel sama dengan nisbah antar varians skor-skor

murni dan skor-skor perolehan ditentukan berdasar tes yang manapun.

Kesimpulan 7 :ρXX=1−

σ E2

σ X2

Korelasi antara skor-skor pada dua tes paralel sama dengan nisbah antara varians

skor-skor kesalahan dengan varians skor-skor perolehan.

Walaupun diakui bahwa teori tes klasik mengandung keterbatasan, namun dalam

kenyataannya teori ini masih bertahan sebagai dasar pengembangan tes di berbagai kalangan.

Asumsi-asumsi teori klasik sebagaimana disebutkan di atas memungkinkan untuk

dikembangkan dalam rangka pengembangan berbagai formula yang berguna dalam

melakukan pengukuran psikologis. Daya beda, indeks kesukaran, efektifitas distraktor,

reliabilitas dan validitas adalah formula penting yang disarikan dari teori tes klasik.

Teori Validitas

Konsep Validitas

Menurut Azwar (1986) para ahli psikometri telah menetapkan kriteria bagi suatu alat ukur psikologis untuk dapat dinyatakan sebagai alat ukur yang baik dan mampu memberikan informasi yang tidak menyesatkan. Kriteria itu antara lain adalah valid, reliabel, norma dan praktis.

Sifat reliabel dan valid diperlihatkan oleh tingginya reliabilitas dan validitas hasil ukur suatu tes. Suatu alat ukur yang tidak reliabel atau tidak valid akan memberikan informasi yang keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila informasi yang keliru itu dengan sadar atau tidak dengan sadar digunakan sebagai dasar pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu tentu bukan merupakan suatu keputusan yang tepat.

Seringkali pula keputusan itu tidak menyangkut individu secara langsung akan tetapi mengenai suatu kelompok. Dalam berbagai studi dan penelitian tidak jarang dipergunakan alat ukur untuk mengetahui keadaan atau status psikologis sekelompok individu tertentu.

Berikut ini akan dibahas antara lain adalah pengertian validitas, koefisien validitas, tipe-tipe umum pengukuran validitas, dan konsep pengukuran validitas.

Teori Reliabilitas dan Validitas 5

Page 6: Rangkuman Teori Reliabilitas Dan Validitas

a. Pengertian Validitas

Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986).

Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.

Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B (Azwar 1986).

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.

Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.

Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.

Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar 1986).

Teori Reliabilitas dan Validitas 6

Page 7: Rangkuman Teori Reliabilitas Dan Validitas

Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini valid" adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi kelompok subjek yang mana?

Istilah validitas ternyata memiliki keragaman kategori. Ebel (dalam Nazir 1988) membagi validitas menjadi concurrent validity, construct validity, face validity, factorial validity, empirical validity, intrinsic validity, predictive validity, content validity, dan curricular validity.

§ Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.

§ Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat dapat menyebabkan kinerja yang baik dalam pengukuran.

§ Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.

§ Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor.

§ Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.

§ Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur.

§ Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang.

§ Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.

§ Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.

Sementara itu, Kerlinger (1990) membagi validitas menjadi tiga yaitu content validity (validitas isi), construct validity(validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).

Teori Reliabilitas dan Validitas 7

Page 8: Rangkuman Teori Reliabilitas Dan Validitas

b. Koefisien Validitas

Bila skor pada tes diberi lambang x dan skor pada kriterianya mempunyai lambang y maka koefisien antara tes dan kriteria itu adalah rxy inilah yang digunakan untuk menyatakan tinggi-rendahnya validitas suatu alat ukur.

Koefisien validitas pun hanya punya makna apabila apalagi mempunyai harga yang positif. Walaupun semakin tinggi mendekati angka 1 berarti suatu tes semakin valid hasil ukurnya, namun dalam kenyataanya suatu koefisien validitas tidak akan pernah mencapai angka maksimal atau mendekati angka 1. Bahkan suatu koefisien validitas yang tinggi adalah lebih sulit untuk dicapai daripada koefisien reliabilitas. Tidak semua pendekatan dan estimasi terhadap validitas tes akan menghasilkan suatu koefisien. Koefisien validitas diperoleh hanya dari komputasi statistika secara empiris antara skor tes dengan skor kriteria yang besarnya disimbolkan oleh rxytersebut. Pada pendekatan-pendekatan tertentu tidak dihasilkan suatu koefisien akan tetapi diperoleh indikasi validitas yang lain.

c. Tipe-tipe Umum Pengukuran Validitas

Tipe validitas sebagaimana disajikan sebelumnya, pada umumnya digolongkan dalam tiga kategori, yaitucontent validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).

1). Validitas Isi

Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan.

Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur.

Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.

Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.

Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity(validitas logis).

Teori Reliabilitas dan Validitas 8

Page 9: Rangkuman Teori Reliabilitas Dan Validitas

Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah terpenuhi.

Dengan alasan kepraktisan, banyak alat ukur yang pemakaiannya terbatas hanya mengandalkan validitas muka. Alat ukur atau instrumen psikologi pada umumnya tidak dapat menggantungkan kualitasnya hanya pada validitas muka. Pada alat ukur psikologis yang fungsi pengukurannya memiliki sifat menentukan, seperti alat ukur untuk seleksi karyawan atau alat ukur pengungkap kepribadian (asesmen), dituntut untuk dapat membuktikan validitasnya yang kuat.

Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur.

Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur yang bersangkuatan.

Validitas logis memang sangat penting peranannya dalam penyusunan tes prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau tabel spesifikasi.

2). Validitas Konstruk

Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam Azwar 1986).

Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenaitrait yang diukur.

Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal.

Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal.

3). Validitas Berdasar Kriteria

Teori Reliabilitas dan Validitas 9

Page 10: Rangkuman Teori Reliabilitas Dan Validitas

Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor alat ukur.

Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur yang bersangkutan, yaitu rxy, dimana x melambangkan skor alat ukur dan y melambangkan skor kriteria.

Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan validitas konkuren (concurrent validity).

Validitas Prediktif. Validitas prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya.

Contohnya adalah sewaktu kita melakukan pengujian validitas alat ukur kemampuan yang digunakan dalam penempatan karyawan. Kriteria yang terbaik antara lain adalah kinerjanya setelah ia betul-betul ditempatkan sebagai karyawan dan melaksanakan tugasnya selama beberapa waktu. Skor kinerja karyawan tersebut dapat diperoleh dari berbagai cara, misalnya menggunakan indeks produktivitas atau rating yang dilakukan oleh atasannya.

Koefisien korelasi antara skor alat ukur dan kriteria merupakan petunjuk mengenai saling hubungan antara skor alat ukur dengan skor kriteria dan merupakan koefisien validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa datang.

Prosedur validasi prediktif pada umumnya memerlukan waktu yang lama dan mungkin pula beaya yang tidak sedikit dikarenakan prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah melakukan sekali tembak, melainkan lebih merupakan kontinuitas dalam proses pengembangan alat ukur. Sebagaimana prosedur validasi yang lain, validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha peningkatan kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar dan bukan sekedar pengujian secara deskriptif saja.

Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren.

Suatu contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun suatu skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya, yaitu dengan alat ukur TMAS (Tylor Manifest Anxiety Scale).

Teori Reliabilitas dan Validitas 10

Page 11: Rangkuman Teori Reliabilitas Dan Validitas

Validitas konkuren merupakan indikasi validitas yang memadai apabila alat ukur tidak digunakan sebagai suatu prediktor dan merupakan validitas yang sangat penting dalam situasi diagnostik. Bila alat ukur dimaksudkan sebagai prediktor maka validitas konkuren tidak cukup memuaskan dan validitas prediktif merupakan keharusan.

Konsep Pengukuran Validitas

Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang bersangkutan.

Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara empiris dengan langsung.

Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu.

Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.

Referensi

Teori Reliabilitas dan Validitas 11

Page 12: Rangkuman Teori Reliabilitas Dan Validitas

Azwar, Saifuddin. 2012. Dasar-Dasar Psikometri. Yogyakarta: Pustaka Pelajar.

Teori Reliabilitas dan Validitas 12