63
BAB I PENDAHULUAN A. LATAR BELAKANG Kurikulum mempunyai kedudukan yang sangat penting dalam lembaga pendidikan, yaitu sebagai salah satu penentu keberhasilan pendidikan. Perubahan kurikulum selalu mengarah pada perbaikan sistem pendidikan dan perubahan tersebut dilakukan dengan didasari pada permasalahan pelaksanaan kurikulum sebelumnya yang dianggap kurang maksimal baik secara materi maupun sistem pembelajarannya sehingga perlu adanya revitalisasi kurikulum. Usaha perbaikan kurikulum tersebut mesti dilakukan demi menciptakan perubahan yang lebih baik untuk sistem pendidikan di indonesia.Semakin maju suatu bangsa maka semakin maju pula ilmu pengetahuan. Oleh karena itu kini diperlukan pendidikan dengan kurikulum yang mampu menghasilkan generasi penerus bangsa yang berakhlakul karimah, berketerampilan, dan berpengetahuan yang luas agar mampu bersaing di dunia internasional. Kurikulum yang ditetrapkan pada saat ini adalah kurikulum 2013 yang merupakan perangkat mata pelajaran dan program pendidikan berbasia sains yang diberikan oleh suatu lembaga penyelenggara pendidikan dengan tujuan untuk mempersiapkan lahirnya generasi emas bangsa indonesia, dengan sistem dimana siswa lebih aktif dalam kegiatan belajar mengajar. Titik beratnya, kurikulum 2013 ini bertujuan untuk mendorong peserta didik atau siswa agar lebih baik dalam melakukan observasi, bertanya, bernalar, dan mempresentasikan apa yang mereka peroleh atau mereka ketahui setelah meneerima materi pembelajaran. Adapun obyek yang menjadi pembelajaran dalam penataan dan penyempurnaan kurikulum 2013 menekankan pada fenomena alam, sosial, seni, dan budaya. Berbeda dengan kurikulum sebelumnya, kurikulum 2013 lebih menekankan pada ketiga aspek, yaitu menghasilkan peserta didik berakhlak mulia (afektif), berketerampilan (psikomotorik), dan berpengetahuan (kognitif) yang berkesinambungan. Sehingga diharapkan agar siswa lebih kreatif, inovatif dan lebih produktif. 1

tugas penilaian, pengukuran, asessmen, dan evaluasi

Embed Size (px)

DESCRIPTION

Penilaian, pengukuran,asessmen, evaluasi, validasi,reabilitas, bias, standar error

Citation preview

Page 1: tugas penilaian, pengukuran, asessmen, dan evaluasi

BAB IPENDAHULUAN

A. LATAR BELAKANGKurikulum mempunyai kedudukan yang sangat penting dalam lembaga pendidikan,

yaitu sebagai salah satu penentu keberhasilan pendidikan. Perubahan kurikulum selalu mengarah pada perbaikan sistem pendidikan dan perubahan tersebut dilakukan dengan didasari pada permasalahan pelaksanaan kurikulum sebelumnya yang dianggap kurang maksimal baik secara materi maupun sistem pembelajarannya sehingga perlu adanya revitalisasi kurikulum. Usaha perbaikan kurikulum tersebut mesti dilakukan demi menciptakan perubahan yang lebih baik untuk sistem pendidikan di indonesia.Semakin maju suatu bangsa maka semakin maju pula ilmu pengetahuan. Oleh karena itu kini diperlukan pendidikan dengan kurikulum yang mampu menghasilkan generasi penerus bangsa yang berakhlakul karimah, berketerampilan, dan berpengetahuan yang luas agar mampu bersaing di dunia internasional.

Kurikulum yang ditetrapkan pada saat ini adalah kurikulum 2013 yang merupakan perangkat mata pelajaran dan program pendidikan berbasia sains yang diberikan oleh suatu lembaga penyelenggara pendidikan dengan tujuan untuk mempersiapkan lahirnya generasi emas bangsa indonesia, dengan sistem dimana siswa lebih aktif dalam kegiatan belajar mengajar. Titik beratnya, kurikulum 2013 ini bertujuan untuk mendorong peserta didik atau siswa agar lebih baik dalam melakukan observasi, bertanya, bernalar, dan mempresentasikan apa yang mereka peroleh atau mereka ketahui setelah meneerima materi pembelajaran. Adapun obyek yang menjadi pembelajaran dalam penataan dan penyempurnaan kurikulum 2013 menekankan pada fenomena alam, sosial, seni, dan budaya. Berbeda dengan kurikulum sebelumnya, kurikulum 2013 lebih menekankan pada ketiga aspek, yaitu menghasilkan peserta didik berakhlak mulia (afektif), berketerampilan (psikomotorik), dan berpengetahuan (kognitif) yang berkesinambungan. Sehingga diharapkan agar siswa lebih kreatif, inovatif dan lebih produktif.

Untuk melihat keberhasilan peserta didik dapat dilihat dengan penilaian hasil belajar oleh pendidik. Penilaian ini memiliki peran antara lain untuk membantu peserta didik mengetahui ketercapaian pembelajaran (learning outcomes). Berdasarkan penilaian hasil belajar oleh pendidik, pendidik dan peserta didik dapat memperoleh informasi tentang kelemahan dan kekuatan pembelajaran dan belajar. Dengan mengetahui kelemahan dan kekuatannya pendidik dan peserta didik memiliki arah yang jelas mengenai apa yang harus diperbaiki dan dapat melakukan refleksi mengenai apa yang dilakukannya dalam pembelajaran dan belajar.Selain itu bagi peserta didikmemungkinkan melakukanproses transfer cara belajar tadi untuk mengatasi kelemahannya (transfer of learning).

Perubahan paradigma pendidikan dalam kurikulum 2013 dari behavioristik ke konstruktivistik tidak hanya menuntut adanya perubahan dalam proses pembelajaran, tetapi juga perubahan dalam melaksanakan penilaian. Dalam paradigma lama, penilaian pembelajaran lebih ditekankan pada hasil  yang cenderung  menilai kemampuan aspek kognitif, dan kadang-kadang direduksi sedemikian rupa melalui bentuk tes seperti pilihan ganda, benar atau salah, menjodohkan yang telah gagal mengetahui kinerja peserta didik yang sesungguhnya. Tes tersebut belum bisa mengetahui gambaran yang utuh mengenai sikap,

1

Page 2: tugas penilaian, pengukuran, asessmen, dan evaluasi

keterampilan, dan pengetahuan peserta didik dikaitkan dengan kehidupan nyata mereka di luar sekolah atau masyarakat. Aspek afektif dan psikomotorik juga diabaikan.

Dalam pembelajaran berbasis konstruktivisme,  penilaian pembelajaran tidak hanya ditujukan untuk mengukur tingkat kemampuan kognitif semata, tetapi mencakup seluruh aspek kepribadian siswa, seperti perkembangan moral, perkembangan emosional, perkembangan sosial dan aspek-aspek kepribadian individu lainnya. Demikian pula, penilaian tidak hanya bertumpu pada penilaian produk, tetapi juga mempertimbangkan segi proses. Dalam makalah ini akan kami bahas lebih lanjut mengenai penilaian dalam kurikulum 2013.

B.RUMUSAN MASALAHDari penjelasan latar belakang di atas maka dapat dirumuskan masalah sebagai berikut :

1. Bagaimana matriks perbandingan evaluasi,penilaian (assesmen),pengukuran dan testing?2. Bagaimana bentuk-bentuk penilaian kurikulum 2013?3. Bagaimana mekanisme penilaian kurikulum 2013?4. Apa fungsi penilaian kurikulum 2103?5. Bagaiamana matriks perbandingan validitas dan reabilitas?6. Apa pengertian bias dan standar error measurement?

C. TUJUAN PENULISANDari perumusan masalah di atas tujuan penulisan makalah ini sebagai berikut :

1. Untuk memahami matriks perbandingan evaluasi,penilaian (assesmen),pengukuran dan testing

2. Untuk memahami bentuk-bentuk penilaian kurikulum 20133. Untuk memahami mekanisme penilaian kurikulum 20134. Untuk mengetahui fungsi penilaian kurikulum 21035. Untuk memahami matriks perbandingan validitas dan reabilitas6. Untuk mengetahui pengertian bias dan standar error measurement

D.MANFAAT PENULISANAdapun manfaat dalam pembuatan makalah ini adalah :

1. Dapat dijadikan pengalaman dan bekal ilmu pengetahuan bagi pembaca khususnya untuk tenaga pendidik kedepannya.

2. Membantu mahasiswa memahami tentang kurikulum 2013.

2

Page 3: tugas penilaian, pengukuran, asessmen, dan evaluasi

3

Page 4: tugas penilaian, pengukuran, asessmen, dan evaluasi

BAB II PEMBAHASAN

A. MATRIKS PERBANDINGAN EVALUASI, PENILAIAN (ASSESMEN), PENGUKURAN, DAN TESTING

Tabel 1. Matriks Perbandingan Evaluasi, Penilaian (Assesmen), Pengukuran, dan Testing

PERBANDINGAN

EVALUASI PENILAIAN (ASSESMEN) PENGUKURAN TESTING

PENGERTIAN MENURUT AHLI

1. Daniel L. Stufflebeam dan Anthony J. Shinkfield (1985) secara singkat merumuskan evaluasi sebagai berikut; “evaluation is the systemic assessment of the worth or merit of some objects”. Dengan demikian maka evaluasi antara lain merupakan kegiatan membandingkan tujuan dengan hasil dan juga merupakan studi mengkombinasikan penampilan dengan suatu nilai tertentu.

2. Robert L. Thordike dan Elizabeth Hagen (1961)

1. Adams (1964) dalam bukunya “measurement and evaluation in education, psychiology, and guidance” menjelaskan bahwa kita mengukur berbagai kemampuan anak didik.

2. Menurut Djemari Mardapi ( 2008:5) kualitas pembelajaran dapat dilihat dari penilaiannya.

3. The Task Group on Assessment and Testing (TGAT) mendeskripsikan asesmen sebagai semua cara yang digunakan untuk menilai unjuk kerja individu atau kelompok (Griffin & Nix, 1991 :3)

1. Richard H.Linderman (1967) merumuskan pengukuran sebagai “the asssigment of one or a set of numbers to each of a set of person or objects according to certain established rules”

2. Norman E. Gronlund (1971) secara sederhana merumuskan pengukuran sebagai berikut “measurement is limited to quantitative descriptions of pupil behavior”

3. Georgia S. Adams (1964) merumuskan pengukuran sebagai “nothing more than careful observations of

1. Tes menurut Mehrens dan Lehmann (2003) adalah menyatakan pemberian suatu daftar pertanyaan yang standar untuk dijawab.

2. tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dengan cara dan aturan yang sudah ditentukan.(Sudaryono,2012)

3. Sudijono (2006) menjelaskan test adalah alat atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian;testing berarti

1

Page 5: tugas penilaian, pengukuran, asessmen, dan evaluasi

menjelaskan evaluasi tersebut dengan mengatakan bahwa evaluasi itu berhubungan dengan pengukuran.(ilyas : 2006)

3. Menurut Stufflebeam, dkk (1971) mendefinisikan evaluasi sebagai “The process of delineating, obtaining, and providing useful information for judging decision alternatives”. Artinya evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan informasi yang berguna untuk merumuskan suatu alternatif keputusan.

4. Viviane dan Gilbert de Lansheere (1984) menyatakan bahwa evaluasi adalah proses penentuan apakah materi dan metode pembelajaran telah sesuai dengan tujuan

4. Groundlund (1971:6) mengungkapkan bahwa penilaian merupakan deskripsi kualitatif dari tingkah laku siswa baik yang didasarkan pada hasil pengukuran (tes) maupun bukan hasil pengukuran (nontes: catatan anekdot, observasi, wawancara dll). Menurut Buana (www.fajar.co.id/news.php). assessment adalah alih-bahasa dari istilah penilaian. Penilaian digunakan dalam konteks yang lebih sempit daripada evaluasi dan biasanya dilaksanakan secara internal. Penilaian atau assessment adalah kegiatan menentukan nilai suatu objek, seperti baik-buruk, efektif-tidak efektif, berhasil-tidak berhasil, dan semacamnya sesuai dengan kriteria atau tolak ukur yang telah ditetapkan sebelumnya.

actual performance under standar conditions.”

4. Victor H, Noll (1975) mengemukakan dua karakteristik utama pengukuran, yaitu “quantitativeness” dan “constancy of units”. Atas dasar dua karakteristik ini ia menyatakan “ since measurement is a quantitative process, result of measurement are always expressed in numbers.

5. William A. Mehrens dan Irven J. Lehmann (1973) mendefenisikan pengukuran sebagai berikut “using observation, rating scales, or any other divice that allows us to obtain information in a quantitative form a measurement”.

6. Robert L. Ebel dan David A. Frisbie (1986) merumuskan pengukuran sebagai, “ measurement is

saat dilaksanakannya atau peristiwa berlangsungnya pengukuran dan penilaian ; tester artinya orang yang melaksanakan tes, atau pembuat tes, dan testee adalah pihak yang sedang dikenai tes (peserta tes atau peserta ujian).

4. Anne Anastasi (1997) yang dimaksud dengan tes adalah alat pengukur yang mempunyai standar yang objektif sehingga dapat digunakan secara meluas, serta dapat betul-betul digunakan untuk mengukur dan membandingkan keadaan psikis atau tingkah laku individu.

5. Lee J. Cronbach (1984), tes merupakan prosedur yang sistematis untuk membandingkan tingkah laku dua orang atau lebih.

6. Menurut Riduwan ( 2006: 37) tes sebagai instrumen

2

Page 6: tugas penilaian, pengukuran, asessmen, dan evaluasi

yang diharapkan.5. Menurut Sridadi (2007)

evaluasi : suatu proses yang dirancang secara sistematis dan terencana dalam rangka untuk membuat alternatif-alternatif keputusan atas dasar pengukuran dan penilaian yang telah dilakukan sebelumnya.

Process of a signing numbers to the individual members of a set of objects or person for the purpose of indicating differenciss among them in the degree to which they process the characteristic being measured.

7. Gilbert Sax (1980) menyatakan “ measurement” The assignment of numbers to attributes of characteristic of person, event, or objects accorting to explicit formulations or rules.

8. Pengukuran (measurement) merupakan suatu deskripsi kuantitatif tentang keadaan suatu hal sebagaimana adanya, atau tentang perilaku yang tampak pada seseorang, atau tentang prestasi yang diberikan oleh seorang siswa.

9. Popham (1995) menyatakan bahwa

pengumpulan data adalah serangkaian pertanyaan / latihan yang digunakan untuk mengukur ketrampilan pengetahuan, intelegensi, kemampuan atau bakat yang dimiliki individu / kelompok.

7. Menurut Rusli Lutan (2000:21) tes adalah sebuah instrument yang dipakai untuk memperoleh informasi tentang seseorang atau obyek. Tes adalah cara penilaian yang dirancang dan dilaksanakan kepada peserta didik pada waktu dan tempat tertentu serta dalam kondisi yang memenuhi syarat-syarat tertentu yang jelas.

3

Page 7: tugas penilaian, pengukuran, asessmen, dan evaluasi

pengukuran dalam pendidikan hanyalah sekedar penemuan derajat yang dimiliki oleh seseorang mengenai suatu cirri tertentu.

10. Menurut Guilford (1983) pengukuran adalah proses penetapan angka terhadap suatu gejala menurut aturan tertentu.(Eko:2009)

evaluasi lebih ditekankan pada hasil belajar.

evaluasi menurut Rustaman (2003) lebih berpihak kepada kepentingan evaluator.

Yulaelawati (2004) mengungkapkan bahwa terdapat perbedaan antara evaluasi dengan asesmen. Evaluasi (evaluation) merupakan penilaian

1Rustaman (2003) mengungkapkan bahwa asesmen lebih ditekankan pada penilaian proses.menurut Stiggins (1993) 2asesmen lebih berpihak kepada kepentingan siswa. Siswa dalam hal ini menggunakan hasil asesmen untuk merefleksikan kekuatan, kelemahan, dan perbaikan belajar.

asesmen merupakan penilaian dalam scope yang lebih sempit (lebih mikro)

4

Page 8: tugas penilaian, pengukuran, asessmen, dan evaluasi

program pendidikan secara menyeluruh. Evaluasi pendidikan lebih bersifat makro, meluas, dan menyeluruh. Evaluasi program menelaah komponen-komponen yang saling berkaitan tentang perencanaan, pelaksanaan, dan pemantauan.

Evaluasi dinyatakan menggunakan kriteria dan metode yang bervariasi. Asesmen dalam hal ini hanya merupakan salah satu dari metode yang dipilih untuk evaluasi tersebut.

subyek evaluasi lebih luas dan beragam seperti siswa, guru, materi, organisasi

Ruang

bila dibandingkan dengan evaluasi. Seperti dikemukakan oleh Kumano (2001) asesmen hanya menyangkut kompetensi siswa dan perbaikan program pembelajaran.

, subyek untuk asesmen hanya siswa,

Yulaelawati (2004) menekankan kembali bahwa scope asesmen hanya mencakup kompetensi lulusan dan perbaikan cara belajar siswa. Jadi hubungannya lebih pada peserta didik.

5

Page 9: tugas penilaian, pengukuran, asessmen, dan evaluasi

lingkup evaluasi yang lebih luas ditunjukkan dengan cakupannya yang meliputi isi atau substansi, proses pelaksanaan program pendidikan, kompetensi lulusan, pengadaan dan peningkatan tenaga kependidikan, manajemen pendidikan, sarana dan prasarana, dan

pembiayaan.

PENGERTIAN

Kegiatan yang meliputi dua unsur yaitu pengukuran dan penilaian.

Mengambil keputusan terhadap sesuatu dengan ukuran baik atau buruk.

Proses untuk menentukan kuantitas sesuatu yang menghasilkan angka.

Alat ukur untuk mengukur kemampuan seseorang

PROSES Pengambilan keputusan terhadap hasil penilaian lulus/tidak

Pemberian atribut terhadap hasil pengukuran

Membandingkan hasil tes dengan standar ukuran tertentu

Testing

HASIL Keputusan atau Justifikasi DeskripsiBersifat kualitatif

Angka atau skorBersifat kuantitat

Hasil tes atau lembar kerja

KRITERIA . Kriteria Evaluasi1.        Evaluasi adalah

suatu proses bukan

Kkriteria Penilaian

  Penilaian dilakuakn

2. Kriteria Pengukuran         Pengukuran harus

jelas parameternya.

1. Kriteria Tes yang Baik   Validitas (Ketepatan);

Suatu alat pengukur

6

Page 10: tugas penilaian, pengukuran, asessmen, dan evaluasi

suatu hasil ( produk ). Hasil yang diperoleh dari kegiatan evaluasi adalah kualitas sesuatu, baik yang menyangkut tentang nilai atau arti, sedangkan kegiatan untuk sampai pada pemberian nilai dan arti itu adalah evaluasi. Membahas tentang evaluasi berarti mempelajari bagaimana proses pemberian pertimbangan mengenai kualitas sesuatu.

2.        Tujuan evaluasi adalah untuk menentukan kualitas sesuatu, terutama yang berkenaan dengan “nilai dan arti”.

3.        Dalam proses evaluasi harus ada

selama dan sesudah proses pembelajaran berlangsung

  Aspek yang diukur adalah keterampilan dan performasi, bukan mengingat fakta apakah peserta didik belajar? Atau apa yang sudah diketahui peserta didik?

  Penilaian dilakukan secara berkelanjutan, yaitudilakukan dalam beberapa tahapan dan periodik, sesuai dengan tahapan waktu dan bahasanya, baik dalam bentuk formatif maupun sumatif.

  Penilaian dilakukan secara integral, yaitu menilai berbagai aspek pengetahuan, sikap, dan keterampilan peserta didik sebagai satu kesatuan utuh.

  Hasil penilain digunakan

         Memiliki sasaran yang terukur

         Mudah dipahami cara pengkurannya.

         Dapat diukur setiap waktu dan simple.

dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat.

   Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika diuji ulang dengan tes yang sama pada kesepatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen yang berbeda, atau pada kondisi pengujian yang berbeda

   Objektivitas; Suatu tes dikatakan obyektif jika tes tersebut diajukan kepada beberapa penilai, tetapi memberikan skor yang sama, untuk disiapkan kunci

7

Page 11: tugas penilaian, pengukuran, asessmen, dan evaluasi

pemberian pertimbangan ( judgement ) yang merupakan konsep dasar dari evaluasi. Melalui pertimbangan inilah ditentukan nilai dan arti / makna dari sesuatu yang dievaluasi.

4.        Pemberian pertimbangan tentang nilai dan arti haruslah berdasarkan kriteria tertentu. Tanpa kriteria yang jelas, pertimbangan nilai dan arti yang diberikan bukanlah suatu proses yang dapat diklasifikasikan sebagai evaluasi. Kriteria ini penting dibuat oleh evaluator dengan pertimbangan:

         Hasil evaluasi dapat dipertanggungjawabk

sebagai feedback, yaitu untuk keperluan pengayaan (enrichment) standart minimal telah tercapai atau mengulang (remedial) jika standart minimal belum tercapai.

jawaban (scorring key).

   Memiliki discrimination power (daya pembeda); Tes yang dikatakan baik apabila mampu membedakan anak yang pandai dan anak yang bodoh.

   Mencakup ruang lingkup (scope) yang sangat luas dan menyeluruh; Tes yang baik harus memiliki komphrehensi veenes, ini akan menyisihkan siswa yang berspekulasi dalam menempuh tes.

  Praktis; mencakup :o   Mudah dipakai/

diperiksao   Hemat biayao   Mudah

diadministrasikano   Tidak menyulitkan

guru dan sekolah.

8

Page 12: tugas penilaian, pengukuran, asessmen, dan evaluasi

an secara ilmiah.         Evaluator lebih

percaya diri.         Menghindari

adanya unsur subjektivitas.

         Memungkinkan hasil evaluasi akan sama, sekalipun dilakukan pada waktu dan orang yang berbeda.

         Memberikan kemudahan bagi evaluator dalam melakukan penafsiran hasil evaluasi.

Berdasarkan pengertian di atas penulis menyimpulkan bahwa penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pengukuran adalah membandingkan hasil tes dengan standar yang ditetapkan. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah kegiatan mengukur dan mengadakan estimasi terhadap hasil pengukuran atau membanding-bandingkan dan tidak sampai ke taraf pengambilan keputusan.Penilaian bersifat kualitatif.

Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing :1.  Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai, kriteria-judgment atau tindakan dalam pembelajaran.

9

Page 13: tugas penilaian, pengukuran, asessmen, dan evaluasi

2.  Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai informasi secara berkala, berkesinambungan, dan menyeluruh tentang proses dan hasil dari pertumbuhan dan perkembangan yang telah dicapai oleh anak didik melalui program kegiatan belajar.

3. Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan kuantitas sesuatu yang bersifat numerik. Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana disampaikan Cangelosi (1995: 21) adalah proses pengumpulan data melalui pengamatan empiris.

10

Page 14: tugas penilaian, pengukuran, asessmen, dan evaluasi

Gambar 1. Diagram hubungan Tes, Testing, Pengukuran, Penilaian, dan Evaluasi

Gambar 2. Kedudukan istilah Evaluasi, Penilaian, Pengukuran, Asesmen, dan Tes

B. BENTUK DAN JENIS PENILAIAN (ASSESMEN)

1. Teknik Asesmen Proses dan Hasil BelajarUntuk mengumpulkan informasi tentang kemajuan belajar siswa dapat dilakukan

dengan teknik tes maupun non tes, baik untuk mengases proses belajar maupun hasil belajar. Teknik mengumpulkan informasi tersebut pada prinsipnya adalah cara asesmen kemajuan belajar peserta didik terhadap pencapaian standar kompetensi dan kompetensi dasar. Asesmen suatu kompetensi dasar dilakukan berdasarkan indikator-indikator pencapaian hasil belajar, baik berupa domain kognitif, afektif, maupun psikomotor. Setidaknya ada tujuh ragam teknik yang dapat digunakan, yaitu penilaian unjuk kerja, penilaian sikap, penilaian tertulis, penilaian proyek, penilaian produk, penggunaan portofolio, dan penilaian diri.

9

Page 15: tugas penilaian, pengukuran, asessmen, dan evaluasi

Tabel 2. Bentuk-Bentuk Penilaian

Unjuk Kerja Penugasan Portofolio Penilaian Sikap.

Teknik Tes Asesmen Produk

Asesmen diri (self assessment)

Jurnal Penilaian antar teman

Penilaian unjuk kerja (Performance assessment atau performance-based assessment) merupakan jenis penilaian yang memberikan kesempatan kepada para siswa untuk mendemonstrasikan pengetahuan, dan keterampilan yang mereka miliki dalam berbagai konteks. Seperti

Penugasan adalah penilaian yang berbentuk pemberian tugas yang mengandung penyelidikan (investigasi) yang harus selesai dalam waktu tertentu. Penyelidikan tersebut dilaksanakan secara bertahap yakni perencanaan, pengumpulan data, pengolahan data, dan

Portofolio merupakan penilaian berkelanjutan yang didasarkan pada kumpulan informasi yang menunjukkan perkembangan kemampuan peserta didik dalam satu periode tertentu. Informasi tersebut dapat berupa karya peserta didik dari proses

Sikap bermula dari perasaan (suka atau tidak suka) yang terkait dengan kecenderungan seseorang dalam merespon sesuatu/objek. Sikap dapat dibentuk, sehingga terjadinya perilaku atau tindakan yang diinginkan. Sikap terdiri dari tiga komponen, yakni: afektif,

Teknik tes meliputi tes lisan, tes tertulis dan tes perbuatan. Khusus tes tertulis, ragamnya meliputi : tes  essay atau disebut juga tes subyektif dan tes obyektif, yang terdiri dari tes isian, salah-benar, menjodohkan dan pilihan ganda.

Tes essay atau tes

Asesmen produk merupakan ragam penilaian untuk menilai kemampuan siswa dalam membuat produk tertentu, seperti : teknologi tepat guna, karya seni, keramik, lukisan dan lain-lain. Asesmen produk dapat digunakan untuk menilai proses maupun

Asesmen diri adalah suatu teknik penilaian dimana siswa diminta untuk menilai dirinya sendiri berkaitan dengan status, proses dan tingkat pencapaian kompetensi yang dipelajarinya dalam mata pelajaran tertentu didasarkan atas kriteria

Jurnal merupakan catatan pendidik selama proses pembelajaran yang berisi informasi kekuatan dan kelemahan peserta didik yang berkait dengan kinerja sikap peserta didik yang dipaparkan secara deskriptif

Penilaian antar teman merupakan teknik penilaian dengan cara meminta peserta didik untuk mengemukakan kelebihan dan kekurangan temannya dalam berbagai hal, Untuk itu ada pedoman penilaian antarteman yang memuat indicator

10

Page 16: tugas penilaian, pengukuran, asessmen, dan evaluasi

berbicara, berpidato, membaca puisi, dan berdiskusi; kemampuan peserta didik dalam memecahkan masalah dalam kelompok; partisipasi peserta didik dalam diskusi; ketrampilan menari; ketrampilan memainkan alat musik; kemampuan berolah raga; ketrampilan menggunakan peralatan laboratorium; praktek sholat, bermain peran, bernyanyi, dan ketrampilan

penyajian data. Penilaian penugasan ini bermanfaat untuk menilai keterampilan menyelidiki secara umum, pemahaman dan pengetahuan dalam bidang tertentu, kemampuan mengaplikasi pengetahuan dalam suatu penyelidikan, dan kemampuan menginformasikan subjek secara jelas. Penugasan dapat dilakukan secara individual

pembelajaran yang dianggap terbaik oleh peserta didik, pekerjaan-pekerjaan yang sedang dilakukan, beberapa contoh tes yang telah selesai dilakukan, berbagai keterangan-keterangan yang diperoleh peserta didik, keselarasan antara pembelajaran dan tujuan spesifik yang telah dirumuskan, contoh-contoh hasil

kognitif, dan konatif. Komponen afektif adalah perasaan yang dimiliki oleh seseorang atau penilaiannya terhadap sesuatu objek. Komponen kognitif adalah kepercayaan atau keyakinan seseorang mengenai objek. Adapun komponen konatif adalah kecenderungan untuk berperilaku atau berbuat dengan cara-cara tertentu berkenaan dengan kehadiran

uraian  adalah bentuk tes berupa soal-soal yang masing-masing mengandung permasalahan dan menuntut penguaraian sebagai jawabannya. Materi tes yang dipilih adalah materi yang sekiranya cocok untuk tes essay. Tes ini dibedakan menjadi 2 yaitu: tes uraian jawaban singkat yaitu tes yang meminta jawaban

hasil belajar siswa.

Pengembangan produk meliputi tiga tahap, yaitu tahap persiapan, tahap pembuatan produk dan tahap penilaian produk.

yang telah ditetapkan. Tujuan utama asesmen diri adalah untuk mendukung atau memperbaiki proses pembelajaran. Ada beberapa jenis asesmen diri, diantaranya adalah : a) penilaian langsung dan spesifik, yaitu penilaian langsung pada saat atau setelah siswa melakukan tugas tertentu, b) penilaian tidak

perilaku yang dinilai.

11

Page 17: tugas penilaian, pengukuran, asessmen, dan evaluasi

mengoperasikan suatu alat.

maupun kelompok.

pekerjaannya sehari-hari, evaluasi diri terhadap perkembangan pembelajaran dan hasil observasi guru.

objek sikap. Secara umum, objek sikap yang perlu dinilai dalam proses pembelajaran berbagai mata pelajaran adalah sebagai berikut. Sikap terhadap materi pelajaran, sikap terhadap guru/pengajar, sikap terhadap proses pembelajaran, sikap berkaitan dengan nilai atau norma yang berhubungan dengan suatu materi pelajaran.

panjangnya sekitar satu dua kalimat dan tes uraian jawaban luas/panjang.

Tes obyektif terdiri dari pertanyaan-pertanyaan atau pernyataan-pernyataan yang harus dijawab atau dipilih dari beberapa alternatif jawaban dengan cara menulisnya, atau mengisi jawaban pendek tanpa menguraikan. Tes ini disebut obyektif

langsung dan holistik, yaitu penilaian yang dilakukan dalam kurun waktu yang panjang, misalnya satu semester untuk memberikan penilaian secara keseluruhan, dan c) penilaian sosia-afektif, yaitu penilaian terhadap unsur-unsur afektif atau emosional. Misalnya siswa diminta untuk membuat

12

Page 18: tugas penilaian, pengukuran, asessmen, dan evaluasi

Asesmen sikap dapat dilakukan dengan beberapa cara antara lain: observasi perilaku, pertanyaan langsung, dan laporan pribadi, daftar chek, skala sikap, buku harian, angket, ungkapan perasaan, catatan anekdot, dan lain lain.

karena skor yang diberikan  relatif tidak dipengaruhi oleh faktor subyektif penilai. Ragam tes obyektif meliputi tes isian (Completion Test), Tes Salah-Benar (True False Test), Tes Menjodohkan (Matching Test), dan Tes Pilihan Ganda (Multiple Choice Test).

tulisan yang memuat curahan perasaannya terhadap obyek tertentu.

13

Page 19: tugas penilaian, pengukuran, asessmen, dan evaluasi

Tabel 3. Contoh Instrumen penilaian unjuk kerja dalam mengukur volume air dengan menggunakan gelas ukurNo. Aspek yang dinilai Skor

4 3 2 11 Gelas ukur diletakkan di atas tempat yang datar,

skala menghadap  pengamat       

2 Menuang air ke dalam gelas ukur sampai hampir mencapai 100 ml, penuangan dihentikan.

       

3 Volume air ditambah setetes demi setetes menggunakan pipet sampai mencapai 100 ml.

       

4 Permukaan air didalam gelas dibaca dengan posisi sejajar  mata.

       

5 Hasil pengukuran dicatat dengan benar.        

14

Page 20: tugas penilaian, pengukuran, asessmen, dan evaluasi

Berilah skor:

4 bila aspek tersebut dilakukan dengan benar dan cepat

3 bila aspek tersebut dilakukan dengan benar tapi lama

2 bila aspek tersebut dilakukan selesai tapi salah

1 bila dilakukan tapi tidak selesai

Penilaian Autentik dalam Pembelajaran Fisika

Penilaian autentik memiliki relevansi kuat terhadap pendekatan ilmiah (scientific

approach) dalam pembelajaran sesuai dengan tuntutan Kurikulum 2013. Karena penilaian

semacam ini mampu menggambarkan peningkatan hasil belajar peserta didik, baik dalam

rangka mengobservasi, menalar, mencoba, membangun jejaring, dan lain-lain. Penilaian

autentik cenderung fokus pada tugas-tugas kompleks atau kontekstual, memungkinkan

peserta didik untuk menunjukkan kompetensi mereka yang meliputi sikap, pengetahuan, dan

keterampilan.

Penilaian autentik adalah penilaian kinerja, termasuk di dalamnya penilaian

portofolio dan penilaian proyek. Penilaian autentik disebut juga penilaian responsif, suatu

metode untuk menilai proses dan hasil belajar peserta didik yang memiliki ciri-ciri khusus,

mulai dari mereka yang mengalami kelainan tertentu, memiliki bakat dan minat khusus,

hingga yang jenius. Penilaian autentik dapat diterapkan dalam berbagai bidang ilmu seperti

seni atau ilmu pengetahuan pada umumnya, dengan orientasi utamanya pada proses dan hasil

pembelajaran. Hasil penilaian autentik dapat digunakan oleh pendidik untuk merencanakan

program perbaikan (remedial), pengayaan (enrichment), atau pelayanan konseling. Selain itu,

hasil penilaian autentik dapat digunakan sebagai bahan untuk memperbaiki proses

pembelajaran. Penilaian autentik merupakan penilaian yang dilakukan secara komprehensif

untuk menilai mulai dari masukan (input), proses, dan keluaran (output) pembelajaran

mencakup sikap, pengetahuan, dan keterampilan. Penilaian sikap dilakukan melalui

observasi/pengamatan, jurnal, penilaian diri, dan/atau penilaian antar teman. Penilaian

pengetahuan melalui tes tertulis, tes lisan, dan/atau penugasan. Penilaian keterampilan

melalui tes praktik, penilaian proyek, dan penilaian portofolio.

Q.S.Az-Zumar ayat 33.

قون مت ك هم ه أولـٮ ق وصدق ب لص ذ ى جآء ب ل ل�و ٱ ۦ‌� ل� ٱ )٣٣) ٱ

Artinya:

14

Page 21: tugas penilaian, pengukuran, asessmen, dan evaluasi

33. dan orang yang membawa kebenaran (Muhammad) dan membenarkannya, mereka Itulah

orang-orang yang bertakwa.

(http://quran.0pick.com/iframe/?sid=9&aid=119&pid=arabicid)

Penilaian autentik tersebut dapat dijabarkan sebagai berikut;

1. Penilaian Aspek Sikap

Penilaian sikap dilakukan melalui pengamatan, jurnal, penilaian diri, dan penilaian antar

teman.

a. Pengamatan dapat menggunakan lembar pengamatan dalam bentuk ceklis atau skala

likert, dilakukan selama aktivitas pembelajaran berlangsung(dimulai pada kegiatan

pendahuluan sampai kegiatan penutup).

(Permendikbud No.104)

b. Jurnal adalah catatan guru yang sistematis di dalam dan di luar kelas yang berisi

informasi hasil pengamatan tentang kekuatan dan kelemahan peserta didik berkaitan

dengan sikap dan perilaku.Jurnal dapat memuat penilaian peserta didik terhadap

aspek tertentu secara kronologis.

(Permendikbud No.104)

c. Penilaian-diri (self-assessment) termasuk dalam rumpun penilaian kinerja. Penilaian

diri merupakan suatu teknik penilaian di mana peserta didik diminta untuk menilai

dirinya sendiri berkaitan dengan status,  proses dan tingkat pencapaian kompetensi

yang dipelajarinya dalam mata pelajaran tertentu. Teknik penilaian diri dapat

15

Page 22: tugas penilaian, pengukuran, asessmen, dan evaluasi

digunakan untuk mengukur kompetensi kognitif, afektif dan psikomotor. Penilaian

ranah sikap misalnya, peserta didik diminta mengungkapkan curahan perasaannya

terhadap suatu objek tertentu berdasarkan kriteria atau acuan yang telah disiapkan;

Penilaian ranah keterampilan misalnya,  peserta didik diminta untuk menilai

kecakapan atau keterampilan yang telah dikuasainya oleh dirinya berdasarkan kriteria

atau acuan yang telah disiapkan; Penilaian ranah pengetahuan  misalnya, peserta didik

diminta untuk menilai penguasaan pengetahuan dan keterampilan berpikir sebagai

hasil belajar dari suatu mata pelajaran tertentu berdasarkan atas kriteria atau acuan

yang telah disiapkan. Penilaian diri dilakukan sebelum dilaksanakan ulangan harian.

(Permendikbud No.104)

d. Penilaian antar teman adalah penilaian yang dilakukan terhadap sikap seorang

peserta didik oleh seorang (atau lebih) peserta didik lainnya dalam suatu kelas atau

rombongan belajar.Penilaian ini merupakan bentuk penilaian untuk melatih peserta

16

Page 23: tugas penilaian, pengukuran, asessmen, dan evaluasi

didik penilai menjadi pembelajar yang baik.Instrumen sesuai dengan kompetensi dan

indikator yang akan diukur.

(Permendikbud No.104)

2. Penilaian Aspek Pengetahuan

Kompetensi siswa pada aspek pengetahuan dapat diukur melalui tes dan nontes. Bentuk

tes yang digunakan antara lain adalah tes tertulis (uraian, pilihan ganda, isian, benar salah,

dll), tes lisan, dan/atau tes praktik. Sedangkan, bentuk nontes dapat dilakukan melalui

tugas-tugas yang diberikan, baik tugas menjawab soal, atau tugas membuat laporan

tertulis.

a. Tes Tulis

Penilaian tertulis atas hasil pembelajaran tetap lazim dilakukan.Testertulis terdiri dari

memilih atau mensuplai jawaban dan uraian.Memilih jawaban terdiri dari pilihan

ganda, pilihan benar-salah, ya-tidak, menjodohkan, dan sebab-akibat.Mengisijawaban

terdiri dari isian atau melengkapi,  jawaban singkat atau pendek, dan  uraian.

b. Tes Lisan

Tes lisan adalah tes yang menuntut siswa memberikan jawaban secara

lisan.Pelaksanaan Tes lisan dilakukan dengan mengadakan tanya jawab secara

langsung antara pendidik dan peserta didik.

c. Penugasan.

17

Page 24: tugas penilaian, pengukuran, asessmen, dan evaluasi

Instrumen penugasan dapat berupa pekerjaan rumah dan/atau proyek yang harus

dikerjakan oleh peserta didik, baik secara individu atau kelompok, sesuai dengan

karakteristik tugas.

3. Penilaian Aspek Keterampilan

Penilaian aspek keterampilan dapat dilakukan melalui tes praktik, proyek, atau

portofolio.

a. Tes Praktik

Tes praktik dilakukan dengan mengamati kegiatan peserta didik dalam

melakukan sesuatu. Penilaian digunakan untuk menilai ketercapaian kompetensi yang

menuntut peserta didik melakukan tugas tertentu seperti: praktik di laboratorium,

praktik salat, praktik olahraga, bermain peran, memainkan alat musik, bernyanyi,

membaca puisi/deklamasi, dan sebagainya. (Direktorat Pembinaan SMA-Ditjen

Pendidikan Menengah, 2014: 9-13)

b. Penilaian Proyek

Penilaian proyek (project assessment) merupakan kegiatan penilaian terhadap

tugas yang harus diselesaikan oleh peserta didik menurut periode/waktu tertentu.

Penyelesaian tugas dimaksud berupa investigasi yang dilakukan oleh peserta didik,

mulai dari perencanaan, pengumpulan data, pengorganisasian, pengolahan, analisis,

dan penyajian data.Dengan demikian, penilaian proyekbersentuhan dengan aspek

pemahaman, mengaplikasikan, penyelidikan, dan lain-lain.

c. Penilaian Portofolio

Penilaian portofolio merupakan penilaian atas kumpulan artefak yang

menunjukkan kemajuan dan dihargai sebagai hasil kerja dari dunia nyata.Penilaian

portofolio bisa berangkat dari hasil kerja peserta didik secara perorangan atau

diproduksi secara berkelompok, memerlukan refleksi peserta didik, dan dievaluasi

berdasarkan beberapa dimensi. Memalui penilaian portofolio guru akan mengetahui

perkembangan atau kemajuan belajar peserta didik.

Penilaian portofolio dalam kurikulum 2013 harus dilakukan secara utuh dan

berkesinambungan, serta mencakup seluruh kompetensi inti yang dikembangkan.

(Mulyasa, 2014: 148).

18

Page 25: tugas penilaian, pengukuran, asessmen, dan evaluasi

2. Prosedur asesmen proses dan hasil belajarProsedur asesmen proses dan hasil belajar meliputi penetapan indikator pencapaian kompetensi, penetapan kriteria ketuntasan belajar, pemetaan standar kompetensi, kompetensi dasar dan indikator, dan penetapan teknik asesmen.

3. Penetapan Indikator Pencapaian KompetensiIndikator merupakan ukuran, karakteristik, ciri-ciri, perbuatan atau proses yang berkontribusi/menunjukkan ketercapaian suatu kompetensi dasar. Indikator pencapaian kompetensi dirumuskan dengan menggunakan kata kerja operasional yang dapat diukur, seperti: mengidentifikasi, menghitung, membedakan, menyimpulkan, menceritakan kembali, mempraktekkan, mendemonstrasikan, dan mendeskripsikan.

Indikator pencapaian kompetensi dikembangkan oleh guru dengan memperhatikan perkembangan dan kemampuan peserta didik. Setiap kompetensi dasar dapat dikembangkan menjadi dua atau lebih indikator pencapaian kompetensi. Hal ini sesuai dengan keluasan dan kedalaman kompetensi dasar yang terkait. Indikator pencapaian kompetensi, yang menjadi bagian dari silabus, dijadikan acuan dalam merancang penilaian.

Berikut contoh pengembangan indikator mata pelajaran Pendidikan Jasmani, Olah Raga dan Kesehatan tingkat SMA kelas X/1.

 Kompetensi inti Kompetensi Dasar Indikator Pencapaian

Mempraktikkan keterampilan rangkaian senam lantai dan nilai yang terkandung di dalamnya

Mempraktikkan serangkaian senam lantai tanpa alat serta niali percaya diri, kerjasama dan tanggung jawab

1. Melakukan 2 jenis rangkaian gerak senam lantai dengan percaya diri

2. Menjelaskan nilai yang terkandung dalam rangkaian gerakan senam

3. dst.

 

4. Penetapan Kriteria Ketuntasan BelajarPenentuan kriteria ketuntasan belajar (KKB) untuk masing-masing indikator dalam suatu kompetensi dasar (KD) dilakukan dengan mempertimbangkan kondisi sekolah, yakni: tingkat kemampuan rata-rata siswa, kompleksitas kompetensi, serta kemampuan sumber daya pendukung dalam penyelenggaraan pembelajaran.

Berikut contoh penetapan KKB untuk masing-masing indikator.

 

Kompleksitas kompetensi       : – Tinggi          = 1

– Sedang        = 2

– Rendah       = 3

Sumber daya pendukung        : – Tinggi        = 3

– Sedang        = 2

19

Page 26: tugas penilaian, pengukuran, asessmen, dan evaluasi

– Rendah       = 1

Kemampuan Akademis           : – Tinggi          = 3

– Sedang       = 2

– Rendah       = 1

Jika kondisi indikator 1 (pada tabel di bawah) : kompleksitas rendah, daya dukung tinggi dan tingkat kemampuan akademis siswa sedang, maka kriteria ketuntasan belajar menjadi :

(3 + 3 + 2) x 100 = 88.89 %

KI dan Indikator

Kondisi sekolah Kriteria ketuntasan belajar (%)

Kompleksitas Daya dukung Kemampuan akademis

Menganalisis atmosfer dan dampaknya terhadap kehidupan di muka bumi

1. Mengidentifikasi ciri-ciri lapisan atmosfer dan pemanfaatannya

2. …

3 3 2 88.89 %

 

5. Pemetaan Standar Kompetensi, Kompetensi Dasar, dan IndikatorPemetaan standar kompetensi dilakukan untuk memudahkan guru dalam menentukan teknik penilaian. Berikut contoh pemetaan untuk mata pelajaran bahasa Inggris.

 

No

Aspek Standar KompetensiKompetensi Dasar

IndikatorKrit

Ketuntasan

Teknik/ragam asesmen

Tes

Un-kerja

Pro-duk

Pro-yek

Portofolio

1 Mendengarkan

Kemampuan memahami makna dalam teks percakapan, transaksional/interpersonal, sangat sederhana untuk berinteraksi dengan lingkungan terdekat

Merespons percakapan transaksional (to get things done) dan interpersonal untuk

– Merespons sapaan orang yang belum/sudah dikenal

– Merespons perkenalan diri sendiri/orang lain

75 %

 

 

 

 

 

75 %

 

 

 

 

 

 

 

v

 

 

 

 

 

v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

Page 27: tugas penilaian, pengukuran, asessmen, dan evaluasi

bersosialisasi lisan secara akurat, lancar dan bertema,dst

– Merespons perintah/larangan

 

 

 

70 %

 

 

 

 

 

 

v

 

 

 

 

 

 

 

 

 

 

2 Berbicara Dst Dst dst            

3 Membaca   Dst dst            

4 Menulis   Dst dst            

 

6. Penetapan Teknik AsesmenDalam memilih teknik asesmen mempertimbangkan ciri indikator, contoh :

1. Apabila tuntutan indikator melakukan sesuatu, maka teknik penilaiannya adalah unjuk kerja (performance).

2. Apabila tuntutan indikator berkaitan dengan pemahaman konsep, maka teknik penilaiannya adalah tertulis.

3. Apabila tuntutan indikator memuat unsur penyelidikan, maka teknik penilaiannya adalah proyek.

C. FUNGSI PENILAIAN

Fungsi dari penilaian menurut Nana Sudjana, (1995: 4)adalah sebagai berikut :1. Alat untuk mengetahui tercapai tidaknya tujuan intruksional. Dengan demikian penilaian

harus mengacu pada rumusan-rumusan tujuan intruksional.2. Umpan balik bagi perbaikan proses belajar mengajar.3. Perbaikan mungkin dilakukan dalam hal tujuan intruksional, kegiatan belajar siswa,

strategi mengajar guru dan lain-lain.4. Dasar dalam menyusun laporan kemajuan belajar siswa kepada para orang tua. Dalam

laporan tersebut dikemukakan kemampuan dan kecakapan belajar siswa dalam berbagai bidang studi dalam bentuk nilai-nilai prestasi yang dicapainya.

5. Penilaian di sini berfungsi sebagai alat untuk mengetahui seberapa berhasilkah proses belajar mengajar yang terjadi. Selain itu juga sebagai perbaikan dalam melakukan proses belajar mengajar yang dilakukan oleh guru dan siswa. Dan juga sebagai laporan kemauan belajar siswa yang diberikan kepada orang tua agar orang tuanya mengetahui hasil belajar anaknya dalam bentuk raport yang biasanya diberikan pada akhir semester.Fungsi penilaian yang lainnya di sini bukan hanya untuk menentukan kemajuan belajar siswa, tetapi sangat luas. Fungsi penilaian adalah sebagai berikut:

6. Penilaian membantu siswa merealisasikan dirinya untuk mengubah atau mengembangkan perilakunya.

21

Page 28: tugas penilaian, pengukuran, asessmen, dan evaluasi

7. Penilaian membantu siswa mendapat kepuasan atas apa yang telah dikerjakannya.8. Penilaian membantu guru untuk menetapkan apakah metode mengajar yang digunakannya

telah memadai.9. Penilaian membantu guru membuat pertimbangan administrasi. (Cronbach, 1954 dalam

Hamalik, 2002: 204). (Dikmenum:2010)Menurut Eko (2009) fungsi penilaian dalam pendidikan adalah :

10. Dasar mengadakan seleksi11. Dasar penempatan12. Diagnostik13. Umpan balik14. Menumbuhkan motivasi belajar dan mengajar15. Perbaikan kurikulum dan program pendidikan16. Pengembangan ilmu

Penilaian Hasil Belajar oleh pendidik memiliki fungsi untuk memantau kemajuan belajar, memantau hasil belajar, dan mendeteksi kebutuhan perbaikan hasil belajar peserta didik secara berkesinambungan. Berdasarkan fungsinya penilaian hasil belajar oleh pendidik meliputi:1. Formatif yaitu memperbaiki kekurangan hasil belajar peserta didik dalam sikap,

pengetahuan, dan keterampilan pada setiap kegiatan penilaian selama proses pembelajaran dalam satu semester, sesuai dengan prinsip Kurikulum 2013 agar peserta didik tahu, mampu dan mau. Hasil dari kajian terhadap kekurangan peserta didik digunakan untuk memberikan pembelajaran remedial dan perbaikan RPP serta proses pembelajaran yang dikembangkan guru untuk pertemuan berikutnya;

2. Sumatif yaitu menentukan keberhasilan belajar peserta didik pada akhir suatu semester, satu tahun pembelajaran, atau masa pendidikan di satuan pendidikan. Hasil dari penentuan keberhasilan ini digunakan untuk menentukan nilai rapor, kenaikan kelas dan keberhasilan belajar satuan pendidikan seorang peserta didik.

Tujuan dari penilaian adalah sebagai berikut:1. Mengetahui tingkat penguasaan kompetensi dalam sikap, pengetahuan, dan keterampilan

yang sudah dan belum dikuasai seorang/sekelompok peserta didik untuk ditingkatkan dalam pembelajaran remedial dan pengayaan.

2. Menetapkan program perbaikan atau pengayaan berdasarkan tingkat penguasaan kompetensi bagi mereka yang diidentifikasi sebagai peserta didik yang lambat atau cepat dalam belajar dan pencapaian hasil belajar.

3. Menetapkan ketuntasan penguasaan kompetensi belajar peserta didik ditetapkan harian, satu semesteran, satu tahunan, dan masa studi satuan pendidikan.

4. Memperbaiki proses pembelajaran pada pertemuan dan/atau semester berikutnya.5. Memetakan mutu satuan pendidikan.

22

Page 29: tugas penilaian, pengukuran, asessmen, dan evaluasi

D. VALIDITAS DAN REABILITAS

MATRIKS PERBEDAAN JENIS-JENIS VALIDITASPengertian Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan

suatu alat ukur dalam melakukan fungsi ukurnya.Walizer (1987) adalah tingkaat kesesuaian antara suatu batasan konseptual yang diberikan dengan bantuan operasional yang telah dikembangkan.Aritonang R. (2007) validitas suatu instrumen berkaitan dengan kemampuan instrument itu untuk mengukur atu mengungkap karakteristik dari variabel yang dimaksudkan untuk diukur.Masri Singarimbun, validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur.Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa yang akan diukur.Soetarlinah Sukadji, validitas adalah derajat yang menyatakan suatu tes mengukur apa yang seharusnya diukur.Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes.Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai. Suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya lanyak mengukur obyek yang seharusnya diukur dan sesuai dengan kriteria tertentu (Thoha, 1990).Grondlund (Ibrahim & Wahyuni, 2012) validitas mengarah kepada ketepatan interpretasi hasil penggunan suatu prosedur evaluasi sesuai dengan tujuan pengukurannya.

Jenis-Jenis Validitas Ebel (dalam Nazirz 1988) membagi validitas menjadi :1. Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja. 2. Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh

suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat menyebabkan kinerja yang baik dalam pengukuran.

3. Face Validity adalah validitas yang berhuubungan apa yang nampak dalam mengukur sesuatu dan bukan

18

Page 30: tugas penilaian, pengukuran, asessmen, dan evaluasi

terhadap apa yang seharusnya hendak diukur.4. Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang bersamaan

dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, di mana validitas ini diperoleh dengan menggunakan teknik analisis faktor.

5. Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.

6. Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bhwa suatu alat ukur benar-benar mengukur apa yang seharusny diukur.

7. Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerj seorang di msa mendatang.

8. Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.9. Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai

seberapa jauh pungukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.

Kerlinger (1990) membagi validitas menjadi tiga yaitu:1. Content validity (Validitas isi) adalah validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur

dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validitas ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau berhubungan dengan representasi dari keseluruhan kawasan.

Validitas isi suatu instrumen berkaitan dengan kesesuaian antara karakteristik dari variaabel yang dirumuskan pada definisi konseptual dan operasionalnya. Apabila semua karakteristik variabel yang dirumuskan pada definisi konseptualnya dapat diungkap melalui butir-butir suatu instrument, maka instrument itu dinyatakan memiliki validitas isi yang baik. Sayangnya, hal itu mungkin tidak akan pernah tercapai karena sulitnya untuk mendefinisikan keseluruhan karakteristik itu. Selain itu, dari seluruh karakteristik yang dirumuskan pada definisi konseptual suatu variabel seringkali sulit untuk mengembangkan butir-butir yang valid untuk mengungkap atau mengukurnya.

Validitas isi dapat dianalisis dengan cara memperhatikan penampakan luar dari instrument dan dengan

19

Page 31: tugas penilaian, pengukuran, asessmen, dan evaluasi

menganalisis kesesuaian butir-butirnya dengan karakteristik yang dirumuskan pada definisi konseptual variabel yang diukur. Validitas yang dianalisis dengan memperhatikan penampilan luar instrument itu disebut validitas tampang (face validity). Validitas tampang dievaluasi dengan membaca dan menyelidiki butir-butir instrument serta sekaligus membandingkannya dengan definisi konseptual mengenai variabel yang akan diukur. Validitas yang dianalisis dengan memperhatikan kerepresentativan butir-butir instrument disebut validitas penyampelan (sampling validity) atau kuikulum (curriculum validity). Validitas tampang maupun penyampelan disebut juga sebagai validitas teoritis karena penganalisisannya lazim dilakukan tanpa didasarkan pada data empiris. Alat yang digunakan untuk menganalisis validitas itu adalah logika dari orang yang menganalisisnya.

Menurut Saifuddin Azwar, validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat professional judgement. Pertanyaan yang dicari jawabannya dalam validitas ini adalah ”sejauh mana item-item dalam tes mencakup keseluruhan kawasan ini (dengan catatan tidak keluar dari batasan tujuan ukur) objek yang hendak diukur” atau ”sejauh mana isi tes mencerminkan ciri atribut yang hendak diukur”. a. Selanjutnya, validitas isi terbagi lagi menjadi dua tipe (Saifuddin Azwar), yaitu:

Face Validity (Validitas Muka) adalah tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan maka validitas muka telah terpenuhi.

b. Logical Validity (Validitas Logis) disebut juga sebagai Validitas Sampling (Sampling Validity) adalah validitas yang menunjuk pada sejauh mana isi alat ukur merupakan representasi dari aspek yang hendak diukur. Validitas logis sangat penting peranannya dalam penyusunan prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atu table spesifikasi.

2. Construct validity (Validitas konstruk) adalah tipe validitas yang menunjukkan sejauh mana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya. (Allen & Yen, dalam Azwar 1986).Pengujian validitas konstruk merupakan prosesyang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.

Menurut Saifuddin Azwar, validitas konstruk adalah seberapa besar derajat tes mengukur hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai yang tidak dapat diamati, yang menjelaskan

20

Page 32: tugas penilaian, pengukuran, asessmen, dan evaluasi

perilaku. Menguji validitas konstruk mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk tersebut.

3. Criterion-related validity (Validitas berdasar kriteria). Validitas ini menghendaki tersedianya criteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksi oleh skor alat ukur.

Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas (Saifuddinn Azwar), yaitu:1. Validitas Prediktif. Validitas Prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi

sebagai predictor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya. Menurut Saifuddin Azwar, validitas prediktif adalah seberapa besar derajat tes berhasil memprediksi kesuksesan seseorang pada situasi yang akan datang. Validitas prediktif ditentukan dengan mengungkapkan hubungan antara skor tes dengan hasil tes atau ukuran lain kesuksesan dalam satu situasi sasaran.

2. Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren. Menurut Saifuddin Azwar, validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi dengan skor yang diperoleh dari tes lain yang sudah mantap, bila disajikan pada saat yang sama, atau dibandingkan dengan criteria lain yang valid yang diperoleh pada saat yang sama.

Asosiasi Psikologi Amerika (APA) (1974; dalam Anastasia, 1982) membedakan tiga tipe validitas, yaitu validitas isi, yang dikaitkan dengan criteria, dan konnstrak.

Penilaian Validitas Untuk mencari tingkat validitas digunakan rumus product moment metoda Pearson sebagai berikut:

r=∑ xy

√∑ x2∑ y2 dimana x = X – Xrata-rata dan y = Y – Yrata-rata (1)

Keterangan:x = Deviasi penilaian akhiry = Deviasi penilaian awal

21

Page 33: tugas penilaian, pengukuran, asessmen, dan evaluasi

r = Korelasi antara x dan y (dua variabel yang akan dikorelasikan)Dari nilai r yang telah didapatkan maka perlu interpretasi dari nilai tersebut untuk menunjukkan kevalidan

suatu penilaian. Kriteria nilai r yang digunakan untuk menentukan suatu penilaian valid dapat dilihat pada Tabel 1 berikut:

Tabel 1. Kriteria Korelasi Koefisien Validitas No Nilai r antara Klasifikasi

1. 0,000 – 0,200 Korelasi sangat rendah

2. 0,200 – 0,400 Korelasi rendah

3. 0,400 – 0,600 Korelasi cukup

4. 0,600 – 0,800 Korelasi tinggi

5. 0,800 – 1,000 Korelasi sangat tinggi

Sumber: Suharsimi (2008: 221)

MATRIKS PERBEDAAN JENIS-JENIS RELIABILITAS

Pengertian Walizer (1987) menyebutkan pengertian Reliability (Reliabilitas) adalah keajegan pengukuran.John M. Echols dan Hasan Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercayaPopham (1995: 21) menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from error measurement"Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkanBrennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.

22

Page 34: tugas penilaian, pengukuran, asessmen, dan evaluasi

Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya.Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang.Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes yang ekivalen. Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama instrumen pengukuran yang baik. Arifin (1991: 122) menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif samaSuharsimi (2009) “Reliabilitas adalah suatu ukuran yang berhubungan dengan indikasi tetap dan konsisten dari hasil sebuah penilaian”.

Jenis-Jenis Reliabilitas

Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:1. Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap

unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.

2. Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat. Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing

23

Page 35: tugas penilaian, pengukuran, asessmen, dan evaluasi

bagian terseb itu dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

Teknik Pengujian Realibilitas Instrument

Tiga tehnik pengujian realibilitas instrument antara lain :1. Teknik Paralel (Paralel Form atau Alternate Form)

Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).

2. Teknik Ulang (Test Re-test)Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda. Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian yang berbeda dari kuesioner yang panjang. Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih

24

Page 36: tugas penilaian, pengukuran, asessmen, dan evaluasi

yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.

3. Teknik Belah Dua (Split Halve Method)Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian. Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.

Penilaian Reliabilitas Salah satu cara yang bisa dipakai untuk menentukan reliabilitas adalah dengan cara ekuivalen. Metode ekuivalen sering pula dinamakan alternate-forms methods atau doble-test-trial method. Menurut Sumarna (2005: 97), metode ini berkaitan dengan penggunaan dua buah penilaian tertulis yang sama atau relatif sama kepada peserta didik yang sama. Kesamaan yang dimaksud adalah kesamaan tujuan, tingkat kesukaran, dan susunan. Persamaan yang dipakai untuk menentukan reliabilitas penilaian tertulis dengan metode ekuivalen adalah sebagai berikut :

r=N ∑

i=1

n

x1ix2i

− (∑i=1

n

X1i)(∑i=1

n

X 2i)√ [N ∑

i=1

n

X1i

2 −(∑i=1

n

X1i)2][N ∑

i=1

n

X2i

2 − (∑i=1

n

X2i)2]

(2) Keterangan :r = Reliabilitas secara keseluruhan N = Jumlah pesertaX1 = Nilai awalX2 = Nilai akhirTabel 2. Klasifikasi Indeks Reliabilitas

No Indeks Klasifikasi

25

Page 37: tugas penilaian, pengukuran, asessmen, dan evaluasi

1. 0,00 – 0,20 Sangat rendah2. 0,20 – 0,40 Rendah3. 0,40 – 0,60 Sedang4. 0,60 – 0,80 Tinggi5. 0,80 – 1,00 Sangat tinggi

Sumber: Suharsimi (2008: 221)

VALIDITAS RELIABILITAS

Ada dua jenis validitas yang akan dibicarakan, yaitu : pertama menyangkut soal secara keseluruhan dan yang kedua menyangkut butir soal atau item.

Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap

Validitas dapat dikelompokkan menjadi validitas logis dan validitas empiris.

Cara mencari besarnya reliabilitas

 Kriterium yang digunakan untuk mengetahui adanya ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu sendiri (cosistency internal).

      a.Metode bentuk paralel.

b. Metode tes ulang .

c. Metode belah dua atau split-half method

Cara pembelahan yang dapat dilakukan adalah:

26

Page 38: tugas penilaian, pengukuran, asessmen, dan evaluasi

               Pembelahan ganjil –genap

               Pembelahan awal-akhir

dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu: validitas isi dan validitas konstruksi

Ada dua macan validitas empiris, Yaitu validitas “ada sekarang” atau concurrent validity dan validitas predictive.

Cara mengetahui kevaliditasan memakai teknik korelasi product moment yang dikemukan oleh Pearson

Validitas Faktor

 yaitu faktor-faktor atau bagian keseluruhan mater. Butir-butir soal dalam faktor dikatakan valid apabila mempunyai dukungan yang besar terhadap soal-soal secara keseluruhan.

27

Page 39: tugas penilaian, pengukuran, asessmen, dan evaluasi

E. BIAS, STANDARD ERROR MEASUREMENT

  Standard error dari mean (SEM) adalah standar deviasi sampel estimasi mean sebuahpopulasi mean. Ini juga dapat dilihat sebagai standar deviasi kesalahan dalam mean sampel relatif terhadap mean sebenarnya, sejak mean sampel merupakan penduga yang tidak bias. SEM biasanya diperkirakan dengan estimasi sampel penduduk deviasi standar (deviasi standar sampel ) dibagi dengan akar kuadrat dari ukuran sampel (dengan asumsi statistik nilai-nilai kemerdekaan dalam sampel): di mana s adalah deviasi standar sampel(yaitu, sampel perkiraan berdasarkan standar deviasi dari populasi), dan  n adalah ukuran (jumlah pengamatan) sampel.  Standar kesalahan juga dapat didefinisikan sebagai standar deviasi dari kesalahan  

 Standar error memberikan langkah-langkah sederhana ketidakpastian dalam nilai dan sering digunakan karena:

1. Jika error standar kuantitas dari beberapa individu kemudian dikenal standard error dari beberapa fungsi dari kuantitas dapat dengan mudah dihitung dalam banyak kasus;

2. Mana distribusi probabilitas dari nilai yang diketahui, dapat digunakan untuk menghitung pendekatan yang baik untuk yang tepat  dan

3. Mana distribusi probabilitas tidak diketahui, hubungan sepertiChebyshev 's atau ketidaksetaraan Vysochanskiï-Petunin dapat digunakan untuk menghitung interval keyakinan konservatif

4. Sebagai ukuran sampel yang cenderung tak terhingga teorema limit sentral menjamin bahwa distribusi sampling mean asimtotik normal.

Rumus yang diberikan di atas untuk standard error mengasumsikan bahwa ukuran sampel jauh lebih kecil daripada ukuran populasi, sehingga populasi dapat dianggap efektif dalam ukuran tak terbatas. Ketika sampling fraksi besar (sekitar sebesar 5% atau lebih), perkiraan kesalahan harus dikoreksi menggunakan "populasi terbatas koreksi" menjelaskan tambahan diperoleh presisi sampling dekat dengan persentase yang lebih besar dari populasi. Efek dari FPC adalah bahwa kesalahan menjadi nol ketika ukuran sampel nadalah sama dengan ukuran populasi N.

28

Page 40: tugas penilaian, pengukuran, asessmen, dan evaluasi

BAB IIIPENUTUP

A. KESIMPULAN

Penilaian merupakan serangkaian kegiatan untuk memperoleh, menganalisis, dan menafsirkan data tentang proses dan hasil belajar peserta didik yang dilakukan secara sistematis dan berkesinambungan, sehingga menjadi informasi yang bermakna dalam pengambilan keputusan. Dalam kurikulum 2013 terdapat beberapa penilaian yaitu penilaian autentik, penilaian diri, penilaian Projek, ulangan harian , ulangan tengah semester, ulangan akhir semester, ujian tingkat kompetensi, ujian mutu tingkat kompetensi, ujian nasional, ujian sekolah. Ranah penilaian kurikulum meliputi sikap, pengetahuan dan keterampilan.

Dalam ranah sikap penilaian dilakukan dengan cara observasi, penilaian diri, penilaian antarpeserta didik, dan jurnal. Pada ranah pengetahuan penilaian dilakukan dengan cara tes tulis,

tes lisan, dan penugasan.B. SARAN

Penulis mengetahui bahwa makalah ini belum sempurna, untuk itu diharapkan kepada dosen pembimbing serta pembaca ikut memberikan saran agar makalah ini lebih baik untuk selanjutnya.

29

Page 41: tugas penilaian, pengukuran, asessmen, dan evaluasi

DAFTAR PUSTAKA

Anonim.2013.Pengertian Evaluasi, Pengertian Penilaian, Pengertian Pengukuran. www.peneltiantindakankelas.blogspot.co.id.diakses tanggal 14 februari 2016

Dikmenum.2010.Panduan Penilaian.www.dikmenum.go.id.diakses tanggal 14 februari 2016Eko Putro Widoyoko.2012.Evaluasi Program Pembelajaran.Pustaka Pelajar:YogyakartaIlyas, Asnelly. 2006. Evaluasi Pendidikan. STAIN Batusangkar Press : BatusangkarIman.2013.Tes, Pengukuran, Penilaian dan Evaluasi.www.imankoekoeh.blogspot.co.id.diakses

tanggal 14 Februari 2016Mawardi.2011.Asesmen Proses dan Hasil Belajar.www. mawardis3ip.staff.fkip.uns.ac.id.diakses

tanggal 14 Februari 2016

Mulyasa. 2014. Pengembangan dan Implementasi Kurikulum 2013. Bandung. PT. Remaja

Rosdakarya Ofset.

Nurhayati.2010.Penilaian, Asesmen, Pengukuran, Testing. www.nurhayatifisika.blogspot.co.id. diakses tanggal 14 Februari 2016.

Permendikbud No 104.2014. Pedoman Penilaian Hasil Belajar Oleh Pendidik. JakartaSudaryono.2012.Dasar-dasar Evaluasi Pembelajaran.Graha ILmu : YogyakartaZaldizakaria.2015.Hubungan dan Perbedaan Tes Pengukuran. www.zaldizakaria.blogspot.co.id.

Diakses tanggal 14 Februari 2016

30