Evaluasi Pembelajaran TEP

Embed Size (px)

Citation preview

  • 8/2/2019 Evaluasi Pembelajaran TEP

    1/47

    1

    1Sumber: Facebook Melati Kamilatila

    Evaluasi Program Pembelajaran/Kurikulum

    Konsep Dasar Evaluasi ProgramEvaluasi adalah suatu proses yang digunakan untuk mengukur kualitas suatu

    pekerjaan. Evaluasi jika digunakan secara tepat, akan mengadakan kontrol kualitasyang menentukan seberapa jauh gap antara apa yang terjadi dan apa yangseharusnya terjadi....Akhirnya tujuan dari pada evaluasi adalah untuk mengumpulkan data (hasil),mengubah data menjadi informasi ( yang dijadikan alat dalam membuat keputusanyang berguna), dan menggunakan informasi untuk membuat keputusan. Evaluasiadalah suatu bidang yang meliputi bidang yang luas baik pengalaman,

    pertumbuhan, perkembangan, dan perubahan. Hal ini digunakan perhatian terutamahubungan antara tujuan yang diinginkan dan penampilan, tetapi sering kali lebihluas dari pada itu. Dengan perluasan bidang ini, ada beberapa definisi dari istilahdan nama, dan secara jujur, menjadi sangat membingungkan.Evaluasi program yaitu evaluasi yang menaksir kegiatan pendidikan yangmemberikan pelayanan pada suatu dasar yang kontinu dan sering melibatkantawaran-tawaran kurikuler. Beberapa contoh di antaranya ialah evaluasi-evaluasi

    program membaca di suatu sekolah daerah, evaluasi program pendidikan khusus dinegara bagian atau evaluasi program pendidikan berlanjut di suatu universitas.Evaluasi proyek adalah evaluasi yang menaksir kegiatan-kegiatan yangmenyangkut suatu jangka waktu untuk menyajikan suatu tugas khusus. Beberapacontoh, misalnya lokakarya tiga hari tentang tujuan behavioral, percobaan duatahun tentang pengembangan tes atau proyek tiga tahun tentang pendidikan karir.Suatu perbedaan antara program dan proyek adalah bahwa program diharapkan

    berlangsung untuk jangka waktu yang tidak terbatas, sedangkan proyek untuk jangka waktu singkat. Proyek yang diintitusionalkan bisa menjadi program.

    Evaluasi materi yaitu evaluasi yang menaksir nilai soal-soal fisik yang berhubungandengan isi, termasuk buku, pentunjuk kurikuler, film, tape, dan hasil-hasilinstruksional nyata lainnya. Sedangkan evaluasi material ialah evaluasi yangnegukur kebaikan-kebaikan atau nilai-nilai dari butir-butir fisik yang berhubungandengan isi, meliputi buku, panduan kurikulum, film, pita, lain lain-lain (hasil)

    pengajaran.

    Evaluasi kurikulum ialah suatu proses mendeskripsikan suatu nilai dan keputusantentang kurikulum baik dari dimensi konsep, dimensi rencana, dimensi kegiatan dandimensi hasil belajar. Dalam evaluasi program/kurikulum dikenal adanya evaluasiinternal dan evaluasi eksternal. Evaluasi internal ialah evaluasi dilakukan oleh

    seorang anggota staf di dalam organisasi yang sedang diteliti. Sedangkan evaluasieksternal ialah evaluasi yang dilaksanakan oleh evaluator di luar organisasi dalammana objek dari evaluasi ditempatkan.Evaluasi program/kurikulum juga dibedakan dengan evaluasi formatif dan evaluasisumatif. Evaluasi formatif ialah evaluasi yang dirancang dan digunakan untuk memperbaiki suatu objek, khususnya apabila objek itu sedang dikembangkan.Sedangkan evaluasi sumatif ialah evaluasi yang dirancang untuk menyajikankesimpulan-kesimpulan tentang kelebihan atau harga suatu objek, dan saran-saran(anjuran-anjurannya) apakah objek itu harus dipertahankan, diubah atau dibuang.Evaluasi bebas tujuan: evaluasi dari suatu hal (akibat, hasil) di mana evaluator

    berfungsi tanpa tahu tujuan evaluasi itu.Seringkali terjadi pembedaan yang tidak jelas tentang pengertian evaluasi dan

    penelitian dalam pemakaian sehari-hari. Para ilmuwan sudah lama berusahamencari dan menemukan kesepakatan untuk membedakan kedua pengertian

  • 8/2/2019 Evaluasi Pembelajaran TEP

    2/47

    2

    2Sumber: Facebook Melati Kamilatila

    tersebut. Apabila kita membaca secara cermat sesungguhnya antara kedua istilahevaluasi dan penelitian secara prinsip terdapat perbedaan.Ditinjau dari sudut tujuan kegiatan, evaluasi dilaksanakan dengan tujuan untuk menemukan nilai dan makna dari evaluasi. Dengan nilai dan makna tersebutevaluator dapat memberikan informasi kepada pembuat keputusan (decision maker)atau kepada penanggungjawaban program. Evaluator dapat memberikan alternatif

    pemecahan masalah, namun keputusan tetap menjadi wewenang pembuatkeputusan atau penanggungjawab program. Sedangkan penelitian dilaksanakandengan tujuan untuk menjelaskan hubungan empirik antar berbagai variabel.Kegiatan penelitian terutama diarahkan untuk mengembangkan terori dalam disiplnilmu tertentu. Ada jenis penelitian tertentu yang memang dekat hubungannyadengan evaluasi yaitu penelitian tindakan (action research). Gambaran garis besar

    penelitian tindakan dibedakan menjadi penelitian dasar (basic research) dan penelitian praktis (practical research). Penelitian praktis dapat diklasifikasikanmenjadi peneltian evaluasi (evaluation research), penelitian terapan (applicationresearch) dan penelitian tindakan (action research).Penelitian praktis sejak munculnya bermaksud menemukan pemecahan masalah-masalah dalam dunia kerja. Namun dalam pengembangannya mengalami

    perubahan dengan variasi pada sasaran penelitian, keterlibatan sponsor dan peneliti pada saran penelitian. Penelitian evaluasi lazimnya dimaksudkan untuk melakukanevaluasi terhadap suatu aspek atau beberapa aspek dari program serta mengkajiefektivitas program-program yang dirancang untuk melakukan perubahan-

    perubahan program dalam skala yang lebih luas. Prosedur yang lazim dilakukanadalah (a) mengidentifikasi tujuan program, (b) memilih tujuan program yangmenjadi acuan, (c) menetapkan kriteria evaluasi, (d) melakukan pengukuranterhadap sasaran penelitian, (e) membandingkan hasil pengukuran dengan tujuan,dengan menggunakan kriteria yang telah ditetapkan dan (f) merumuskan perbedaan

    antara data dengan tujuan.Ditinjau dari sudut onbjek kegiatan, pelaksanaan evaluasi selalu harus berhubungandengan kegiatan yang memang nyata dan telah terjadi. Sedangkan penelitian, objek kegiatannya lebih luas dan tidak terbatas. Namum hendaknya memperhatikan danmengikuti aturan-aturan atau norma-norma yang telah ditetapkan, yang disebutdengan istilah etika penelitian. Etika ini dijadikan patokan atau pedoman yangsangat penting dalam pelaksanakan penelitian. Penelitian dilaksanakan secarasistematis artinya dilaksanakan berdasarkan suatu sistem, prosedur, aturan tertentusehingga hasil penelitian benar-benar dapat diyakini secara kritis.Antara penelitian dan evaluasi, dua istilah yang secara historis berawal dari

    penelitian-penelitian tentang ilmu-ilmu tingkah laku (behavioral sciences). Mula-

    mula timbulnya psikologi sebagai disiplin ilmu sejak tahun 1800-an. Sebagai ilmu psikologi yang dewasa, hal ini disusun suatu metodologi dan teknik yang dipinjamdari ilmu-ilmu fisika dan biologi. Termasuk prinsip-prinsip penemuan ilmu

    pengetahuan (principles scientific inquiry), pengukuran (measurement) dan analisisdata. Kemudian memasuk-kan model-model statistik yang dikembangkan untuk aplikasi agrikultur, antropologi, sosiologi, pendidikan dan tinjauan bidang ilmutingkah laku yang lain, yang disesuaikan dengan metodologi penelitian dalam

    bidang yang baru.Penelitian memiliki sumber pengetahuan yang merupakan tinjauan terhadap

    pengembangan teori dan paradigma yang sudah lazim dikenal dalam metode penelitian eksperimental. Di mana hipotesis diperoleh atau dirumuskan secara logisdari teori dan melakukan tes di bawah kondisi yang terkontrol. Evaluasi memilikicara teknologi dari pada ilmu. Penekanannya bukan pada pembangunan teori, tetapi

    pada pencapaian hasil atau prestasi dalam melaksanakan tugas (unjuk kerja).

  • 8/2/2019 Evaluasi Pembelajaran TEP

    3/47

    3

    3Sumber: Facebook Melati Kamilatila

    Esensinya adalah memberikan feedback terbimbing untuk mencapai keberhasilan.Menurut Stufflebeam (dalam Isaac, 1984) yang membedakan antara kegiatanevaluasi dan penelitian adalah bahwa tujuan evaluasi antara lain adalah toimprove (meningkatkan atau memperbaiki), bukan to prove (membuktikan).

    B. Kriteria Evaluasi ProgramPada umunya evaluasi program memiliki tiga kerangka pokok, yaitu: (1) deskripsi

    program, (2) adanya kriteria dan (3) pertimbangan. Ketiga komponen tersebutsaling berkaitan. Evaluasi dilaksanakan berdasarkan kriteria tertentu yang disusundengan berpedoman pada deskripsi program. Hasil analisis data selanjutnyadibuatlah suatu pertimbangan dan keputusan terhadap program tersebut.Deskripsi ProgramPengumpulan data pada umumnya didasarkan atas konsep deskripsi program yangdikembangkan sebelumnya dengan menggunakan pendekatan tertentu, programdijabarkan menjadi beberapa unsur atau aspek. Selanjutnya dapat dirumuskan

    beberapa panduan atau pedoman yang berguna untuk pengumpulan data.Ada tiga pendekatan yang dapat dipergunakan dalam rangka penentuan unsur-unsur

    pokok suatu program, yaitu:Pendekatan Struktural Pendekatan Fungsional Pendekatan Sistematis Pendekatanstruktural, pusat perhatian ditujukan kepada komponen-komponen yangmembentuk program. Komponen-komponen tersebut dijadikan panduan dalamrangka pengumpulan data.Contoh unsur-unsur program yang didasarkan atas pendekatan struktural adalah:Tujuan-tujuan program Seleksi dasar rancangan program Seleksi kegiatan-kegiatan

    program Rasional dan pendekatan terhadap evaluasi Karakteristik audiens Sistem penunjang administrasi Karakteristik pelaksana program Implementasi programPendekatan fungsional pusat perhatiannya ditujukan kepada fungsi-fungsi utama

    dalam suatu program.Sebagai contoh, penekatan fungsional terdapat unsur-unsur program, yaitu:Evaluasi dan seleksi program Diagnosis dan remidiasi Community OutreachPenjadwalan Kompetensi Functional literacy Penempatan tenaga Latihan jabatanTesting program Pendekatan sistematis pusat perhatiannya ditujukan kepadakeseluruhan program. Unsur-unsur di dalam program terdiri dari:Komponen masukan (in-put) Komponen proses (process) Komponen hasil(product)C. Manfaat, Peranan, Tujuan dan Fungsi Evaluasi Program

    Manfaat evaluasi program bagi program pendidikan dan pelatihan, maupun proyek

    adalah sebagai berikut:Memungkinkan pengecekan program yang telah disusun, apakah program

    tersebut dapat dilaksanakan (applicable).2. Melakukan pengkajian sejauhmana program yang dilaksanakan relevan dengantujuan program dan membuahkan hasil sebagaimana yang diharapkan.3. Memberikan petunjuk apakah pelaksanan program masih sejalan dengan apayang telah direncanakan semula. Melalui teknik pengamatan dan monitoring,evaluasi dapat dilaksanakan selama pelaksanaan program berlangsung (evaluasi

    proses).4. Memungkinkan pengkoordinasian kegiatan program dengan baik.Peranan dan Tujuan Evaluasi Program

    Peranan evaluasi peogram antara lain:

  • 8/2/2019 Evaluasi Pembelajaran TEP

    4/47

    4

    4Sumber: Facebook Melati Kamilatila

    Menetapkan kebijakan dan pembuatan keputusan. Menilai hasil yang dicapaisetelah prgram dilaksanakan. Mengevaluasi pelaksanaan kurikulum pada salah satu

    jenjang pendidikan tertentu. Memberikan kepercayaan kepada lembaga tertentu(pemerintah atau swasta) yang mempunyai program, proyek atau kursus.Memonitor dana yang dikeluarkan untuk membiayai pelaksanaan program agar tidak terjadi penyalahgunaan. Memperbaiki dan menyempurnakan materi dan

    program yang telah dilaksanakan. Tujuan Evaluasi ProgramEvaluasi program dilaksanakan untuk kepentingan penentuan kebijakan dan

    pengambilan keputusan. Menetukan kebijakan dana pengambilan keputusan dapatdapatdilaksanakan dengan tepat apabila didukung oleh informasi (data ) yanglengkap, benar dan akurat mengenai hal-hal yang berkaitan dengan

    permasalahannya, serta untuk mengukur keberhasilan pelaksanaan program. Bentuk keputusan tersebut dapat berupa angka/nilai tertentu setelah melalui pertimbangantertentu pula. Sedangkan tingkat keterandalan dan keberadaan suatu keputusan padadasarnya ditentukan oleh tingkat kebenaran dan keterandalan informasi (data) yangdiperoleh. Untuk mengumpulkan data yang diperlukan, maka menggunakaninstrumen pengumpul data yang memiliki tingkat keterandalan yang memadai pula.Secara spesifik dapat dijabarkan tujuan evaluasi program adalah untuk

    menetapkan:Apakah program yang telah disusun memenuhi kebutuhan sasaran dan apakahlayak untuk dilaksanakan? Apakah pelaksanaan program berjalan sesuai dengantujuan yang diharapkan? Berapa besar pengaruh program terhadap sararan yangtelah ditetapkan? Seberapa besar program mampu memberikan nilai tambah (plus)apabila dibandingkan dengan biaya, tenaga dan waktu yang telah digunakan?Kelemahan-kelemahan apa yang terdapat dalam program dan bagaimana upaya-upaya yang dilakukan untuk memperbaiki atau menyempurna-kannya?Memberikan bahan pertimbangan bagi pengambil keputusan untuk menetapkan

    apakah program tersebut dapat dilanjutkan penyelenggaraan, diperluas ataudibatalkan/dihentikan. Memberikan bahan pertimbangan bagi penyelenggara program untuk mengadakan perbaikan dan penyempurnaan program, organisasi penyelenggara, komponen-kopmponen program dan aspek-aspek penyelenggara program sepanjang tahap-tahap penyelenggaraan program. Informasi yangdiperoleh dapat dipakai sebagai bahan pertimbangan dalam mengambil keputusanmengenai perlu tidaknya diadakan modifikasi atau revisi guna meningkatkanefisiensi dan efektivitas penyelenggaraan program berikutnya.Berdasarkan tujuan yang dikemukakan di atas selanjutnya dapat ditetapkan dandipilih instrumen pengumpul data yang cocok serta teknik analisis data apaseyogyanya digunakan.

    Fungsi Evaluasi Program

    Para perencana, pengelola dan pelaksana program perlu mengetahui tingkatkeberhasilan dari usahanya menyelenggarakan program, terutama perencana

    program. Untuk merealisasi maksud tersebut pada waktu merencanakan suatu program hendaknya sudah diperkirakan bahwa program tersebut akan baik. Namuntanpa terasa ternyata kurang baik hasilnya. Dalam keadaan demikian evaluasidalam konteks ini sangat penting karena telah berfungsi memberikan informasikepada pelaksana program untuk membantu mengontrol pelaksanaan program agar dapat diketahui kelemahan-kelemahan atau penyimpangan-penyimpangan ataukekeliruan yang tenjadi selama program berjalan sehingga dapat memberikantindak lanjut terhadap pelaksanaan program selanjutnya.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    5/47

    5

    5Sumber: Facebook Melati Kamilatila

    Beberapa kontribusi yang dapat diberikan oleh evaluasi program dalamhubungannya dengan tipe keputusan serta kebijakan yang ditempuh seperti yangditunjukkan berikut ini:Memberikan kontribusi terhadap keputusan tentang instalasi program (programinstallation). Banyak program yang berjalan namun terputus-putus dan bahkangulung tikar karena tidak mampu front-end-analysis kebutuhan dan tuntutan

    program, tersedianya staf dan fasilitas yang dibutuhkan untuk membuahkan hasilyang diharapkan. Memberikan kontribusi terhadap keutusan tentang kelangsungan/kontinuitas program, ekspansi dan sertifikasi. Hal ini termasuk menentu-kan apakah

    progran yang dilaksanakan memberikan suatu keuntungan atau pengaruhsampingan (side effect) yang sangat bermanfaat. Memberikan kontribusi terhadapkeputusan tentang modifikasi program. Sasarannya adalah matapelajaran/bidangstudi, yaitu memberikan informasi bagi pengembang program, pengelola dan

    pelaksana program yang dapat membantu memperbaiki disain program dan pelayanan peralatan. Evaluator mencari dan mengumpulkan informasi tentang pengaruh program atau sumbangan program dalam membantu pengambilankeputusan mengenai ekspansi. Dapat juga menyeleksi data untuk memperbaiki

    program. Memberikan keterangan/informasi kepada rally support tentang program yang telah dilaksanakan. Memberikan keterangan/informasi kepada rallyopposition tentang program yang telah dilaksanakan. Memberikan kontribusi agar memahami dasar kejiwaan (psikologis), sosial dan proses lainnya.D. Prinsip-Prinsip, Syarat-Syarat Evaluasi dan Evaluator ProgramPelaksanaan evaluasi program didasarkan atas tujuan tertentu. Setiap programevaluasi diarahkan untuk mencapai tujuan yang telah ditetapkan secara jelas danspesifik. Tujuan-tujuan itu pulalah yang mengarahkan kegiatan-kegiatan sepanjang

    proses evaluasi dilaksanakan. Evaluasi harus bersifat obyektif. Pelaksanaanevaluasi dan hasil evaluasi harus bersifat obyektif, berpijak pada apa adanya dan

    bersumber dari data yang nyata dan akurat, yang diperoleh melalui pengumpulandata dengan instrumen yang terandalkan. Evaluasi bersifat komprehensif.Pelaksanaan evaluasi hendaknya mencakup semua aspek (dimensi) yang terdapatdalam program. Evaluasi bersifat komprehensif. Tanggungjawab dalam

    perencanaan, pelaksanaan dan keberhasilan suatu program merupakantanggungjawab bersama semua pihak yang terlibat dalam peroses evaluasi. Evaluasihendaknya dilaksanakan secara efisien, khususnya dalam penggunaan waktu,niayadan tenaga serta peralatan yang menajdi unsur penunjang. Evaluasi harusdilaksanakan secara berkesinambungan. Hal ini perlu mengingat tututandiadakannya perbaikan dan poenyempurnaan program dan perbaaikan sistem.Evaluasi program dalam pelaksanaannya hendaknya berpijak pada beberapa

    asumsi:Evaluasi program hendaknya didisain sebaik-baiknya guna memperoleh informasiyang baik dan akurat. Evaluasi program hendaknya dibatasi pada penemuan-

    penemuan yang didukung oleh data kuantitatif, kendatipun tidak dapatmengabaikan informasi (data) kualitatif. Informasi (data) yang diperoleh melalui

    pelaksanaan evaluasi hendaknya dapat menjadi alat yang efisien dan efektif dalamrangka perbaikan, penyempurnaan dan peningkatan program. Evaluasi programdapat dilaksanakan secara berkesinambungan dan mencakup evaluasi terhadapkomponen input, proses dab output (product).Syarat-Syarat Evaluasi Program.Berorientasi pada tujuan. Tujuan program dijadikan patokan/arah dalam melakukankegiatan evaluasi. Sebagai patokan/arah, tujuan program harus dirumuskan secaraoperasional, dapat diukur serta indikator keberhasilannya dapat diamati.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    6/47

    6

    6Sumber: Facebook Melati Kamilatila

    Berorientasi kepada kriteria keberhasilan. Evaluator harus merumuskan indikator-indikator keberhasilan sebagai dasar/ pedoman untuk menetapkan keberhasilan danatau kegagalan pelaksanaan suatu program.Menyeluruh (komprehensif) maksudnya mencakup seluruh kegiatan dalam programdan penyelengaraannya dilaksanakan secara terpadu seluruh komponen program.Serasi dan berkesinambungan. Kegiatan evaluasi hendaknya serasi dengankomponen-komponen dan aspek-aspek yang akan dievaluasi dan dilaksanakansecara berkesinambungan dari langkah penjajagan, perencanaan, persiapan,

    pelaksanaan hingga selesainya kegiatan program.Menggunakan berbagai sumber informasi dan teknik. Penggunaan berbagai sumber informasi dan teknik untuk evalusi program dapat diperoleh dari berbagai sumber antara lain: instruktur/pengajar/pelatih, peserta, lembaga atau instansi yang

    berkepentingan baik milik pemerintah maupun lembaga yang diadakan olehmasyarakat (swasta). Teknik yang digunakan dapat bervariasi, di antaranya: denganmenggunakan daftar pertanyaan (angket), wawancara (interview), pengamatanlangsung (observation), dokumentasi (document), skala sikap, tes (tertulus/lisan)dan sebagainya. Berfungsi ganda. Evaluasi program selain berfungsi untuk memperoleh informasi yang lengkap, teliti, objektif dan akurat sebagai bahan

    pertimbangan dalam menyusun rekomendasi perbaikan atau penyempurnaan; tetapi juga berfungsi sebagai suatu media komunikasi antara pihak penyelenggara program dengan pihak-pihak yang menajdi sumber informasi mengenai komponendan aspek progrtam serta tujuan program yang tidak dievaluasi. Evaluator baik

    perseorangan maupun tim dapat berasal dari dalam (evaluator intern) maupun dariluar (evaluator extern).Evaluator yang berasal dari dalam (evaluator intern) yaitu seseorang atau sebuahtim yang ditunjuk oleh sebuah organisasi profesional, perusahaan ataupun pusat

    pendidikan dan pelatihan (Pusdiklat) yang melaksanakan program, berasal dari

    orang-orang yang menjadi anggota sebuah organisasi atau orang-orang yang terlibatdalam keanggotaan panitia pelaksana Diklat.Contoh: Sebuah Pusat Pendidikan dan Pelatihan atau sebuah Balai Latihan Kerja(BLK), sebuah Diklat Penyuluhan Pertanian, menyelenggarakan kegiatan selamatiga bulan. Pusdiklat/BLK membentuk panitia dan menunjuk beberapa orang yang

    bukan panitia bertugas mengevaluasi atau monitoring selama Diklat berlangsung.Evaluator dari luar (evaluator extern), yakni seseorang atau sebuah tim yangditunjuk oleh pihak penguasa (penanggungjawab dan pengambil keputusan) untuk melaksanaakn evaluasi terhadap efektivitas dan efisiensi sebuah program. Dengandemikian hasil yang diperoleh dapat dipergunakan sebagai bahan pertimbangandalam pengambilan keputusan, untuk menentukan tindak lanjut terhadap

    kelangsungan program (perbaikan, modifikasi atau dihentikan). Evaluator eksternhendaknya berasal dari sekelompok orang atau tim yang sudah profesional, suatutim/kelompok yang berasal dari suatu lembaga/organisasi profesi yang siap dibayar oleh penanggungjawab program. Evaluator ekstern dapat berasal dari perwakilan

    beberapa instansi yang berwenang yang ditunjuk.Contoh: Evaluasi terhadap Diklat BKKBN: penyelenggaran Diklat menunjuk

    perwakilan dari instansi terkait yang tidak menyelenggarakan Diklat sebagaievaluator, namun berkepentingan dengan Diklat tersebut.Sebelum melaksanakan evaluasi terhadap program, evaluator hendaknya menguasai

    prinsip-prinsip dasar evaluasi, yaitu:Evaluator seyogyanya tidak memberikan jawaban terhadap pertanyaan khusus dantidak dapat memberikan pertimbangan kepada pihak lain. Tugas evaluator hanyasebatas memberikan informasi dan beberapa pilihan alternatif. Evaluator tidak terikat pada suatu lembaga/instansi penyelengara Diklat. Evaluasi merupakan suatu

  • 8/2/2019 Evaluasi Pembelajaran TEP

    7/47

    7

    7Sumber: Facebook Melati Kamilatila

    proses yang berlangsung terus-menerus, sehingga dimungkinkan untuk mengadakan perbaikan ataupun modifikasi apabila terjadi hambatan atau kurangefektif ditinjau dari segi tenaga, biaya dan waktu. Hasil evaluasi yang dilaporkankepada pihak pengambil keputusan merupakan tanggungjawab tim dan tidak mempunyai hak untuk memberikan peertimbangan, apakah diperbaiki,dimodifikasi, dihentikan atau dilanjutkannya suatu program. Evaluator hendaknyamerumuskan pertanyaan-pertanyaan yang operasional untuk menggali informasi(data) serta menyelami semua permasalahan yang dihadapi. Evaluator hendaknyamenggunakan variasi metode, teknik dan instrumen dalam pengumpulan datasebanyak mungkin, sehingga dapat mengungkapkan data sebanyak mungkin dariaspek-aspek yang dievaluasi. Evaluasi hendaknya dilakukan dengan teliti, cermatdan obyektif. Kesimpulan hasil evaluasi hendaknya merupakan deskripsi yang tegasdan jelas menunjukkan sebab-akibat. Untuk memperkaya deskripsi, evaluator dapatmengajukan beberapa asumsi yang didukung oleh data yang valid dan reliabel.Persyaratan sebagai Evaluator.Agar memperoleh hasil evaluasi yang sebaik-baiknya dan benar-benar onyektif,maka evaluator program dituntut memenuhi persyaratan-persyaratan berikut.Memahami materi, maksudnya memahami seluk beluk program yang akandievaluasi antaralain: 1) Tujuan program yang telah dirumuskan sebelummemulai program.2) Komponen-komponen program.3) Jangka waktu dan jadwal kegiatan.4) Mekanisme pelaksanaan program.5) Pelaksanaan program.6) Sistem monitoring kegiatan program.Menguasai teknik, yaitu menguasai cara-cara/teknik-teknik yang digunakan dalam

    pelaksanaan evaluasi program. Oleh karena itu evaluator program hendaknya

    menguasai: 1) Cara menyusun desain evaluasi program.2) Teknik penentuan populasi dan sampel.3) Teknik penyusunan instrumen evaluasi program.4) Teknik dan prosedur pelaksanaan evaluasi.5) Prosedur dan teknik pengumpulan data.6) Teknik pengolahan data.7) Teknik menganasisis dan menginterpretasi data.8) Cara menyusun laporan hasil evaluasi.

    Obyektif dan Cermat. Tim evaluator adalah sekelompok orang yang mengemban

    tugas penting dan ditopang oleh data yang dikumpulkan secara cermat, teliti danobyektif. Berdasarkan data yang dikumpulkan, diharapkan tim evaluator dapatmengklasifikasikan, mentabulasikan, mengolah dan menganalisis sertamenginterpretasi data dengan cermat dan obyektif. Di dalam mennentukan strategi

    penyusunan laporan, evaluator tidak diperkenankan untuk membedakan sertamemandang salah satu atau dua asepek sebagai satu hal atau peristiwa yangistimewa atau luar biasa dan tidak boleh memihak.Jujur dan dapat dipercaya. Tim evaluator dalam melaksanakan tugasnya hendaknya

    berlaku jujur dan dapar dipercaya. Jujur artinya, data/informasi yang dikumpulkan benar-benar berasal dari sumber yang dapat dipertanggungjawabkan serta apaadanya. Tidak dimanipulasi, tidak ditambah dan dikurangi serta jujur melaporkanhasilnya kepada pihak pengambil keputusan (penguasa). Kejujuran dalammelaporkan hasil akan mempengaruhi keputusan yang diambil serta tidak lanjut

  • 8/2/2019 Evaluasi Pembelajaran TEP

    8/47

    8

    8Sumber: Facebook Melati Kamilatila

    yang dilakukan. Di samping itu, tidak bias dalam pengamatan ataupun salah dalam persepsi.Evaluator hendaknya orang luar yang tidak ada kaitan dengan pengambil kebijakan(keputusan) maupun pengelola dan pelaksana program. Evaluator hendaknyamengadakan hubungan yang baik dengan para responden maupun klient, dapatmemahami wataknya, kebiasaan dan cara hidup responnden yang dijadikan sumber data. Evaluator hendaknya tangap terhadap masalah politik dan sosial budaya,apalagi tujuan evaluasi adalah untuk pengembangan program. Evaluator harusmemiliki konsep diri yang tinggi sehingga tidak mudah terpengaruh atau terbawaarus. Evaluator hendaknya menguasai teknik untuk memilih desain dan metodologiyang tepat untuk program yang akan dievaluasi. Evaluator hendaknya bersikapterbuka terhadap kritik dan memberikan kesempatan kepada orang lain/pihak luar untuk melihat apa yang sedang dan akan terjadi. Evaluator hendaknya menyadarikekurangan dan keterbatasannya serta bersikap jujur, menyampaikan kelemahandan kekurangan tentang evaluasi yang dilakukan. Evaluator hendaknya bersikap

    pasrah kepada umum mengenai penemuan yang positif maupun yang negatif.Evaluator bersedia menyebarluaskan hasil evaluasi, teutama bagi pihak-pihak yangmembutuhkan. Hasil evaluasi yang tidak secara eksplisit dinyatakan sebagaiinformasi terbuka, sebaiknya tidak disebarluaskan. Evaluator tidak mudah membuatkontrak. Evaluator yang tidak memenuhi persyaratan-persyaratan yang disebutkandi atas, sebaiknya tidak mudah menyanggupi menerima tugas-tugas, karena secaraetis dan moral akan merupakan sesuatu yang kurang dapat dibenarkan.

    E. Context Evaluation.

    Context Evaluation, according to Stufflebeam (90), addresses this questions:What unmet needs exist in the context served by a particular institution? What

    objectives should be pursued in order to order to meet this needs? What objectiveswill receive support from the community? What set of objectives in most feasible toachieve?Stufflebeam (90) suggest five questions that input evaluation should be capable of answering:Does a given project strategy provide a logical response to a set of specifiedobjectives? Is a given strategy legal? What strategies already exist with potentialrelevance for meeting previously established objectives? What specific proceduresand time schedules will be needed to implement a given strategy? What are theoprerating characteristics and effects of competing strategy ubder pilot conditions?Stufflebeam (90) suggest the folowing questions to be addresed by process

    evaluation:Is the project on schedule? Should be staff be retrained or reoriented prior tocompletions of the process priject cycle? Are the facilities and materials being usedadequately and appropiately? What major procedural barriers need to be overcomeduring the present cycle?The checlist consists of six major steps:Focusing the evaluation, which means identifying and defining the decisionsituations or goals of the evaluatuon, the setting within which it is be conducted,and the polities within which it is to operate; Planning the data cillection; Planningthe organization odf the data; Planning the data analysis; Specifying audience,format, means, and schedule for reporting the finding; Adminstrating theevaluation, or providing an overal plan for executing the evaluation design.Dressel (21) offers a more comprehensive and useful checklist plan for planning anevaluation:

  • 8/2/2019 Evaluasi Pembelajaran TEP

    9/47

    9

    9Sumber: Facebook Melati Kamilatila

    What is the purpose and background of the evaluation?What inputs, environmentfactors, processes, or outcomes are to be evaluated? What are the critical points atwhich evidence will be required for decisions? What rules, procedures, assumsions,and principles are involved in the decisions? Who will make decisions and what isthe process by which these will be made? Does the overall situation suggest.Require, or prohibit certain tactics and strategies? What timing considerations areinvolved? What are the litimitation on costs? What are the specific evaluationtasks?What information is to be collected?Are the particular items unambigiously definedand collectible by objective and reliable means? Frome where or from whom id theevidence to be collected? By whom is it to be collected? What instruments or

    procedures are to be used? Will the collections of evidence in itself seriously affectthe input, environment, process, or outcomes? Will the collections of evidence

    become a regular part of the process, or is it an add-on for one-time evaluation?What is the schedule for collection of information?What procedures will be used for organizing and analysing data?In what form isinformation to be collected? Will coding be required? If subjective judgements wiil

    be required in coding, are the criteria for the adequate? Who will do the coding?How will the data be stored, received, and processed? What analytic procedures areto be used?Is the reporting procedure clear?Who will receive reports? Will reports beorganized by analytic procedures, by type of data, or by decisions to be made? Willreport include the practical implications regarding the various possible decisions to

    be made or leave these implications for the project staff of admnistrators to theevidence? Is the evaluator to state explisitly the particular decisions which be

    believes are supported by the evidence? When and in what detail are reports to bemade?

    How is the evaluation to be evaluated?Who will be involvedproject staff, theevaluator, decision-makers, some presumably more objective individual? What willthe criteria used in this second-level evaluation becosts, program improvement,impact on further planning of related enterprises? To whom and when is this reportto be presented? What decisions are to be anticipated as a result of the report? Willthey include improvement of evaluation processes in the future?F. Beberapa Model Evaluasi Program

    1. Model Tyler Model ini dinamakan model Tyler karena tidak ada nama resmi yang diberikan oleh

    pengembangnya. Tyler yang mengajukan model ini menuliskan buah pikirannya

    tersebut tidak dalam suatu tulisan lepas mengenai evaluasi. Ia mengemukakan pikiran-nya mengenai evaluasi program ini dalam suatu buku kecil tentangkurikulum. Dengan buku kecil ini pula namannya terangkat sebagai seorang ahliyang disegani baik dalam kurikulum maupun dalam evaluasi. Buku yang diberi

    judul Basic principles of curriculum and instruction ditulis ketika ia bertugassebagai tenaga pengajar di Universutas Chicago. Idenya tentang evaluasidituangkan dalam bab 4 yang diberi judul How can the efeffectiveness of leraningexperiences be evaluated?Model yang dikemukakannya dibangun atas dua dasar, yaitu: evaluasi yangditujukan kepada tingkah laku siswa dan evaluasi harus dilakukan pada tingkahlaku awal siswa sebelum suatu pelaksanaan kurikulum serta pada saat siswa telahmelaksana-kan kurikulum tersebut. Dengan kedua dasar ini ia ingin mengatakan

    bahwa evaluasi kurikulum yang sebenarnya hanya berhubungan dengan hasil belajar menurut pengertian yang dikemukakan terdahulu. Evaluasi kurikulum

  • 8/2/2019 Evaluasi Pembelajaran TEP

    10/47

    10

    10Sumber: Facebook Melati Kamilatila

    sebagai rencana yang dinamakan sebagai intermediate or preliminary stages of evaluation (Tyler 1949:104) dianggap bukan merupakan suatu penghargaan yangadekuat terhadap kurikulum. Evaluasi terhadap kurikulum sebagai kegiatan tidak dimasukkan dalam ruang lingkup evaluasi oleh Tyler.Dengan dasar evaluasi yang kedua, Tyler menghendaki evaluasi dapat menentukan

    perubahan tingkah laku yang terjadi adalah memang perubahan yang disebabkanoleh kurikulum. Kenyataan seperti itu menurut Tyler tidak mungkin dapatditetapkan apabila evaluator hanya melihat tingkah laku siswa setelah merekamengikuti kurikulum tersebut. Dalam kata-katanya sendiri Tyler 1949:108 menulis:On this basic, one is not able to evaluate an instructional prgram by testing studentsonly at the end odfthe program. Without knowing where the students were at the

    beginning, it is not possible to tell how far changes have taken place.

    Karena itu evaluasi yang dilakukan di mana model Tyler dipergunakansebagaimana mestinya memerlukan informasi perubahan tingkah laku paling tidak

    pada dua saat yaitu sebelum dan sesudah siswa mengikuti suatu kurikulum. Dalamistilah yang banyak dipergunakan sekarang ini diperlukan adanya tes awal (pretest)dan tes akhir (posttest) untuk mengumpulkan kedua informasi tersebut.Berdasarkan informasi yang diperoleh dari hasil tes awal dan tes akhir ini kemudianmodel yang dikembangkan Tyler ini mensyaratkan bahwa informasi yang diperolehdari tes awal adalah gambaran tingkah laku siswa yang ada sebelum mengikuti

    program. Sedangkan informasi dari tes akhir adalah gambaran tingkah laku siswakarena pengalaman yang diperolehnya selama mengikuti program tersebut. Olehkarena itu Tyler juga mengisyaratkan validitas informasi tes akhir tersebut. Usahauntuk menjamin validitas ini memerlukan cara yang dianggap sangat tepat.Lebih lanjut karena model ini sangat menekankan adanya tes awal dan tes akhir maka model Tyler ini dikenal pula dengan nama black box. Nama ini

    mencerminkan bahwa apa yang terjadi dalam proses tidak memerlukan perhatianoleh evaluator. Bagian ini sudah terjamin dengan desain eksperimen tadi walalupunsesungguhnya evaluator tidak tahu persis apa yang terjadi pada diri siswa. Karenaitu bagian dari proses ini dianggap sebagai kotak hitam yang menyimpan segalamacam teka-teki.Dalam pelaksanaannya, Tyler mengemukakan ada tga prosedur utama yang harusdilakukan. Ketiga prosedur tersebut itu adalah:menentukan tujuan kurikulum yang akan dievaluasi. menentukan situasi di manasiswa mendapatkan kesempatan untuk memperlihatkan tingkahlaku yang

    berhubungan dengan tujuan. memnentukan alat evaluasi yang akan dipergunakanuntuk mengukur tingkah laku siswa. Ketika menentukan tujuan kurikulum yang

    akan dievaluasi harus pula dipertimbangkan mengenai tingkah laku yang bagaimana yang dianggap merupakan pernyataan bahwa tujuan tersebut telahtercapai. Artinya, evaluator harus dapat menentukan jenis tingkah laku yang harusdiperlihatkan siswa sesuai dengan materi yang telah dipelajarinya. Disini evaluator dituntut untuk mengembangkan kisi-kisi tujuan yang akan dievaluasi dalam tabeldua dimensi: dimensi tingkahlaku dan dimensi materi. Oleh karena itu diharapkan

    para pengembang kurikulum telah merumuskan tujuan tersebut dalam bentuk behavioral objectives.Konsekuensi dari persyaratan ini seringkali evaluator yang mempergunakan modelTyler mengharapkan pula agar para pengembang program merumuskan tujuan

    program dalam bentuk behavioral objectives. Seringkali terjadi, evaluator harus berkonsultasi terlebih dahulu dengan para pengembang kurikulum mengenai tujaunapa yang akan dievaluasi mengenai tingkat pencapaiannya. Pekerjaan evaluasi yangdilakukan oleh Braithwaite dan Koop (1982) merupakan contoh model ini. Mereka

  • 8/2/2019 Evaluasi Pembelajaran TEP

    11/47

    11

    11Sumber: Facebook Melati Kamilatila

    mendapat tugas untuk mengevaluasi penataran yang dilakukan di bagian baratmetropolitan Sidney. Untuk itu mereka membicarakan mengenai tujuan programyang akan dievaluasi dan mengembangkan tujuan tersebut dalam bentuk behavioralatau juga sering diistilahkan dengan operasional.Persoalan pengembangan tujuan program menurut ukuran behavioral seperti yangdipersyaratkan poleh Tyler memang sudah umum dilakukan di Indonesia, terutamasetelah PPSI diperkenalkan melalui Kurikulum 1975. tetapi harus diingat bahwa

    pada waktu Tyler mengemukakan persyaratan tersebut, tujuan dengan rumusanyang demikian masih merupakan sesuatu yang baru bagi dunia pendidikan di A.S.Justru gagasam Tyler ini yang kemudian mengilhami Bloom dan kawan-kawanmengembang-kan ide tersebut menjadi taksonomi tujuan pendidikan yang terkenaltersebut. Taksonomi ini kemudian yang diterapkan di Indoensia melalui cara

    pengembangan tujuan instruksional yang tercakup dalam model PPSI.Tujuan kurikulum yang akan dievaluasi, seperti yang juga dikembangkan dalamtaksonomi tujuan pendidikan Bloom dan kanwan-kawan, tidak selalu hanya

    berhubung-an dengan tujuan yang bersifat kognitif saja. Tetapi kurikulum yangmenyangkut asepek afektif dan juga psikomotorik dapat pula dievaluasi apabilatujuan tersebut dianggap penting oleh para pengembang kurikulum dan dapatdinyatakan dalam bentuk operasional sehingga tujuan itu dapat diamati. Dengandemikian ruang lingkup pekerjan evaluator dapat menjadi sangat luas.Langkah kedua adalah menentukan situasi atau keadaan yang memberikankesempatan kepada siswa untuk menunjukkan kemampuan yang akan dievaluasi.Langkah ini sangat berhubungan erat dengan langkah pertama. Pada langkah

    pertama dikatakan bahwa yang dievaluasi adalah tingkat pencapaian tujuankurikulum dan siswa dijadikan sumber utama untuk mendapat informasi mengenaitingkat pencapaian tujuan tersebut. Oleh karena itu dalam langkah kedua inievaluator harus dapat menentukan situasi apa yang dianggap terbaik agar

    kemampuan yang akan diperlihatkan siswa sebagai sumber informasi betul-betulmemperlihatkan kemampuan sebenarnya. Dengan demikian validitas data evaluasiterjamin.Dalam langkah ini evaluator dapat saja mempergunakan lebih dari satu situasi,sesuai dengan jenis data yang diharapkan yang sebetulnya merupakan konsekuensidari tujuan yang akan dievaluasi. Misalkan seorang evaluator akan menilai

    pencapaian tujuan kognitif kurikulum. Katakanlah, evaluasi tadi ingin mengetahuitingkat pencapai-an tujuan kurikulum dalam setiap jenjang kemampuan kognitif seperti yang dipersyarat-kan oleh kurikulum. Dengan demikian evaluator tersebutakan berhubungan dengan kemampuan siswa dalam jenjang pengetahuan,

    pemahaman, aplikasi, analisis, sintesis, dan evaluasi. Maka dalam langkah kedua

    ini evaluator tadi harus menentukan situasi yang paling sesuai untuk mengevaluasikemampuan-kemampuan tersebut. Misalnya evaluator tida dapat menentukan

    bahwa kemampuan-kemampuan tadi akan diperlihat-kan oleh siswa dalam suatutes. Dengan demikian, seluruh siswa yang dijadikan sumber informasi harusmenyatakan kemampuan mereka dalam situasi tes yang mungkin pula berupasituasi tes tertulis, tes lisan, tes performansi, dan sebagainya.Mungkin pula evaluator tersebut menentukan bahwa untuk tujuan seperti di atasakan dipergunakan beberapa situasi yang berbeda. Untuk jenjang pengetahuan,

    pemahaman, dan evaluasi akan dipergunakan situasi tes. Untuk jenjang aplikasi,analisis, dan sintesis akan dipergunakan situasi bekerja di laboratorium. Barangkali

    pula kombinasi situasi lainnya yang dipergunakan sesuai dengan hekikat bidangstudi (konten kurikulum), karakteristik tujuan, waktu dan dana yang tersedia, sertakemampu-an evaluator yang melakukan tugas tersebut. Pertimbangan profesional

  • 8/2/2019 Evaluasi Pembelajaran TEP

    12/47

    12

    12Sumber: Facebook Melati Kamilatila

    evaluator terhadap faktor-faktor yang baru disebutkan menentukan situasi apa yangakan dipergunakannya.Langkah kedua ini nampaknya sederhana. Tetapi ia sangat menentukankeberhasilan evaluasi yang dulakukan. Apabila situasi yang ditetapkan tidak tepat,tingkah laku siswa yang diharapkan tidak akan terungkapkan dengan baik. Artinya,apa yang ingin kita ketahui tidak terungkapkan dengan sebenarnya validitas datayang diperoleh sangat diragukan. Dengan perkataan lain, tujuan kurikulum tidak terevaluasi sebagaimana seharusnya. Oleh karena itu walaupun tampaknyasederhana, sebaiknya evaluator memberikan perhatian yang seksama terhadap

    pelaksanaan langkah kedua ini.Seperti hubungan antara langkah pertama dan langkah kedua, demikian pulakeeratan hubungan antara langkah kedua dengan langkah ketiga. Pada waktuevaluator menentukan situasi dalam langkah kedua secara eksplisit sebenarnya iatelah pula menentukan langkah ketiga, yaitu penetuan alat evaluasi yang akandipergunakan. Alat evaluasi dapat berbentuk tes seperti yang banyak dipergunakanorang. Tapi ia dapat pula berbentuk alat bukan tes seperti alat observasi, kuesioner,

    panduan wawancara, dan lain sebagainya. Ketika ia menentukan situasi di manasiswa diharapkan dapat mengemukakan hasil belajar dengan baik, evaluator harusmemiliki pengetahuan tentang alat evaluasi: karakteristik alat tersebut, kekuatandan kelemahan yang ada dihubungkan dengan tujuan yang akan diukur.Meskipun secara eksplisit ia telah menentukan alat evaluasi yang akandipergunakan, secara eksplisit hal itu perlu dilakukan evaluator yang bersangkutan.Ia harus menyebutkan jenis alat evaluasi tersebut. Setelah itu, model evaluasikurikulum Tyler ini menghendaki evaluator untuk melakukan kajian mengenai alatevaluasi yang tersedia. Pertanyaan pokok di sini ialah apakah alat evaluasi yangtersedia sesuai dengan tujuan yang akan diukur. Dalam kata-katanya sendiri Tyler (1949:113) menulis:

    It is only after the objectives have been identified, clearly defined, and situationslisted which give opportunity for the expression of the behavior desired that it is possible to examine available evaluation instruments to see how far they may servethe evaluation purposes desired.

    Apabila di antara instrumen yang tersedia ada yang memang mengukur tujuan yangsama dengan tujuan yanga akan diukur, instrumen tersebut sudah barang tentudapat dipergunakan. Katakanlah bahwa seorang evaluator bertugas untuk mengukur

    pencapaian tujuan suatu kurikulum tertentu. Untuk mudahnya sebut saja tujuanyang akan diukur tersebut sebagai X. kemudian setelah ia menentukan situasi bagisiswa untuk menyatakan kapasitasnya terhadap tujuan tersebut, ia menelaah alat

    evaluasi yang telah dikembangkan orang. Apabila di antara alat evaluasi yangtersedia ada yang memang sesuai dengan situasi yang telah ditentukan dan untuk mengukur tujuan X tadi maka tidak ada salahnya apabila ia mempergunakaninstrumen tersebut. Hal ini bahkan sangat dianjurkan oleh model ini.

    Tetapi kalau tidak ada, evaluator yang bersangkutan harus mengembangkaninstrumen yang sesuai dengan tujuan dan situasi yang telah ditetapkan. Dalammodel ini sangat ditekankan bahwa penggunaan suatu insrumen janganlahdidasarkan atas pertimbangan kecanggihan ataupun popularitas yang dipunyainya.Tujuan yang ingin diukurlah yang menentukan pemakaian suatu instrumen.Memang tugas mengembang-kan instrumen ini merupakan tugas yang tidak ringan.Meskipun demikian, evaluator tersebut tidak dapat mengindarkan tugas ini.Instrumen yang dikembangkan haruslah pula memenuhi persyaratan objektif,terandal (reliabel) dan sahih (valid).

  • 8/2/2019 Evaluasi Pembelajaran TEP

    13/47

    13

    13Sumber: Facebook Melati Kamilatila

    Dilihat dari prosedur kerja evaluasi yang mempergunakan model Tyler ini, proses pengembangan kriteria evaluasi dapat dilakukan melalui pendekatan pengembangan pre-ordinate maupun fidelity. Model ini memberikan keleluasaankepada penggunaan kedua pendekata ini. Pada waktu evaluator bersama dengan

    para pengembang kurikulum menentukan tujuan mana yang akan diukur, disaatitulah kemungkinan penggunaan salah satu dari kedua pendekatan pengembangankriteria itu terjadi. Kalau pada waktu itu ditentukan bahwa tujuan yang akan diukur adalah tujuan yang bersifat umum untuk setiap kurikulum tanpa memperhatikankarakteristiknya, maka evaluator akan bekerja dengan pendekatan pengembangankriteria pre-ordinate. Dengan demikian, alat evaluasi yang akan dipergunakancenderung pada alat evaluasi yang sudah ada karena alat evaluasi yang demikian

    banyak dikembangkan orang. Biasanya tujuan yang akan diukur dengan pendekatanini adalah tujuan generik.Apabila pada waktu penentuan tujuan yanga akan diukur ditentukan hanya tujuan-tujuan yang spesifik terhadap kurikulum itu sendiri maka pendekatan

    pengembangan kriteria fidelity akan dilakukan. Dengan pendekatan ini evaluator mempunyai kemungkinan besar harus mengembangkan alat evaluasi khusus.Perbedaan kerakteristik antar setiap kurikulum menyebabkan tidak ada alat evaluasiyang tersedia akan sesuai dengan tujuan kurikulum yang akan diuji. Terkecualiapabila evaluator tersebut mengevaluasi kurikulum yang sama dengan evaluator atau tugas sebelumnya, hanya lingkungan pendidikan yang berbeda antara keduatugas tersebut. Dalam keadaan demikian tentu saja evaluator tersebut dapatmempergunakan instrumen yang sudah ada. Jadi sebagian kerja sudah dapatdiselesaikan.Seperti pada setiap model, model evaluasi Tyler inipun memiliki kelebihan dankelemahan. Keunggulan utamanya ialah kesederhanaanya. Jika dibandingkandengan model evaluasi lainnya, model evaluasi Tyler ini lebih sederhana, terlihat

    dalam peosedur kerja sepeeti dibicara terdahulu. Evaluator hanya perlu memberikan perhatian kepada pengukuran hasil belajar siswa yang belajar dari kurikulum yangdinilai. Bagi mereka yang terlatih dalam pengukuran, kesederhanaan model inimemberikan kesempatan yang luas untuk melakukan evaluasi kurikulum tanpa

    perlu pendidikan khusus lagi. Perbedaannya dengan prosedur pengukuran adalahsangat kecil. Kalau dalam pengukuran mereka tidak perlu memperhatikankarakteristik evaluan, sekarang mereka harus melakukannya. Tetapi, identifikasikarakteristik itu segera dapat dilakukan dengan berkonsentrasi kepada pihak

    pengembang kurikulum.Keunggulan ini pada sisi lain merupakan kelemahan model evaluasi Tyler.Perhatiannya yang hanya terpusatkan pada kurikulum sebagai hasil belajar

    menjadikan model ini tidak cukup luas dipakai sebagai model evaluasikomprehensif. Seperti telah dibahas sebelumnya, hasil belajar hanyalah merupakansalah satu dimensi kurikulum. Dengan demikian, dimensi kurikulum lainnya tidak dapat dievaluasi dengan memper-gunakan model Tyler ini. Dimensi kurikulumsebagai rencana dan proses tidak dapat dievaluasi dengan mempergunakan modelini.Asumsi yang dipergunakan model ini mengenai dimensi kurikulum sebagai prosessukar dipertahankan. Studi-studi yang mengkaji mengenai dimensi prosesmemperlihatkan bahwa implementasi kurikulum seringkali tidak sesuai dengan apayang dikehendaki oleh kurikulum sebagai rencana. Kenyataan dari hasil studitentang proses ini menyebabkan sukar untuk melakukan claim bahwa hasil yangdiperlihatkan siswa adalah hasil yang ditimbulkan oleh kurikulum yang dievaluasi.Oleh karena itu, proses merupakan variabel penting yang harus diperhatikan dalamsuatu kegiatan evaluasi.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    14/47

    14

    14Sumber: Facebook Melati Kamilatila

    2. Model Countenance Stake

    Ini adalah model pertama evaluasi kurikulum yang dikembangkan oleh Stake.Dalam tulisannya ia sendiri tidak memberikan nama khusus tehadap model ini.

    Nama countenance di sini disesuaikan dengan judul artikel yang ditulis walaupun pengertian countenance itu sendiri mempunyai makna ambigous. Dalam suatu pengertian ia adalah keseluruhan sedangkan dalam pengertian lain kata itu bermakna sesuatu yang disenangi (favourable). Dalam tulisan itu, Stake inginmengemukakan keseluruhan kegiatan evaluasi yang harus yang harus dilakukandan cara yang diinginkannya bagaimana evaluasi tersebut dilakukan. Oleh karenaitu, walaupun beberapa penulis lain yang membicarakan model ini memprgunakan

    judul seperti model concruence atau model contingency, nama nama tersebut tidak dipergunakan di sini karena baik congruence maupun contingency merupakan duakonsep utama dalam model pengolahan data yang dikemukakan oleh Stake. Tetapikedua konsep itu tidak dapat mewakili keseluruhan ide Stake mengenai evaluasikurikulum. Jadi nama countenance dipertahankan sebagai nama model ini secarakeseluruhan.Dalam model ini, Stake mendasarkan dirinya pada evaluasi formal, di manadikatakannya sebagai suatu kegiatan evaluasi yang sangat tergantung pada

    pemakaian checklist, structured visitation by peers, controlled comparisons, andstandardized testing of students (Stake, 1972:93). Lebih lanjut, model inidikembangkan atas keyakinan bahwa suatu evaluasi haruslah memberikan deskripsidan pertimbangan sepenuhnya mengenai evaluan. Dasat ini masih menjadikeyakinannya ketika ia mengembangkan model-model evaluasi lain di kemudianhari, yang memberikan tekanan pada pendekatan kualitatif.Model ini dimasukkan dalam model kuantitatif, karena dalam model ini jelas Stake

    masih mengutamakan data kuantitatif dan pendekatan kuantitatif dalammengumpulkan data. Bahkan mengenai peertimbangan yang duberikan berbagaikelompok sumber haruslah dikumpulkan secara obyektif; suatu sikap yang berubahketika ia kemudian lebih cenderung mempergunakan model-model kualitatif.Seperti yang diungkapkannya ketika ia menguraikan tentang pertimbangan (Stake,1872:95):Evaluation will seek out and record the opinions of persons of special qulification.These opinion, though subjective, can be very useful and can be gatheredobjectively, independent of the solicitors opinions.

    Bahkan dalam model ini Stake sangat menekankan peran evaluator dalam

    mengembangkan tujuan kurikulum menjadi tujuan khusus yang terukur,sebagaimana berlaku dalam tradisi pengukuran yang behavioristik dan kuantitatif.Dalam model ini, Stake mengemukakan bahwa suatu evaluasi forma harusmemberikan perhatian terhadap keadaan sebelum suatu kegiatan kelas berlangsungdan terhadap kegiatan kelas itu sendiri, serta menghubungkan dengan berbagai

    bentuk hasil belajar. Keadaan sebelum suatu kegiatan kelas berlangsungdinamakannya antecendent. Sedangkan kegiatan interaksi yang terjadi di sekolahdinamakannya dengan istilah transactions.Lebih lanjut dikemukakannya, bahwa ketiga tingkatan tersebut, antecendent,transaction dan hasil (outcome), terbagi atas dua kategori. Kategori pertama ialahapa yang diinginkan (intent) oleh pengembang program. Seorang guru, sebagaiseorang pengembang program, merencanakan mengenai keadaan (persyaratan)yang diingin-kannya, untuk suatu kegiatan kelas tertentu. Apakah persyaratantersebut berhubungan dengan siswanya seperti minat, kemampuan, pengalaman,

  • 8/2/2019 Evaluasi Pembelajaran TEP

    15/47

    15

    15Sumber: Facebook Melati Kamilatila

    dan lain sebagainya yang biasa diisitilahkan dengan entry behavior. Mungkin pulaersyaratan itu berhubungan dengan lingkungan di kelas. Lebih lanjut, guru tersebutmerencanakan apa yang diperkirakan akan terjadi pada waktu interaksi dikelas, dankemampuan apa yang diharapkan dimiliki siswa setelah proses interaksi

    berlangsung. Dengan kata lain, perencanaan yang dilakukan guru dalam satuan pelajaran, merupakan apa yang diingin-kan guru tersebut (intent).Kategori kedua ialah kategori yang berhubungan dengan apa yang sesungguhnyaterjadi, bukan lagi apa yang diinginkan. Misalnya keadaan apa yang ada pada waktusuatu interaksi kelas akan dilakukan; bagaimana dengan kemampuan siswa yangakan belajar; apakah siswa telah belajar mengenai topik yang akan dibicarakan

    pada malam hari sebelum pelajaran berlangsung. Apakah atlas yang akandigunakan guru memang tersedia; demikian pula dengan OHP yang akan dipakaioleh guru yang bersangkutan? Bagaimana interaksi tersebut berlangsung? Apakahsetelah guru mencoba memberikan pertanyaan kepada siswa untuk mengetahuikemajuan yang mereka peroleh dari proses interaksi yang terjadi? Karena Stakemembuat ketegorinya berdasarkan apa yang dilakukan evaluator, kategori kedua inidinamakan observasi. Jadi seperti juga dengan intent, data mengenai observasi inimeliputi antecendent, transaction, dan hasil yang diperoleh.Baik data yang dikelompokkan ke dalam intent maupun observasi adalah data yangmengungkapkan tentang apa dan bagaimana kurikulum itu. Data ini barumerupakan sebagian dari data yang harus dikumpulkan evaluator yang bekerjamempergunakan model evaluasi ini. Oleh karena itu, pekerjan belumlah selesai. Ia

    baru menyelesaikan sebagian dari kegiatan pengumpulan data yang harusdilakukannya.Stake juga beranggapan bahwa, suatu evaluasi harus sampai kepada pemberian

    pertimbangan. Stake yang menyadari banyak di antara evaluator yang engganmemberikan pertimbangan dan untuk mengatasi hail tersebut, dalam model ini ia

    mengemukakan jalan keluar yaitu evaluator harus mengumpulkan data mengenai pertimbangan tersebut dari sekelompok orang yang dianggap memiliki kualifikasiuntuk memberikan pertimbangan tersebut. Data pertimbangan ini yang kemudiandimasukkan ke dalam matriks sebagai bagian dari model ini.Data pertimbangan ini meliputi tiga jenjang yang dikemukakan oleh Stake, yaituantecendent, transactions, dan hasil yang diperoleh. Di samping meliputi tiga

    jenjang ini, data mengenai pertimbangan tersebut terbagi pula atas tiga kategori,yaitu standar dan pertimbangan. Oleh karena itu matriks pertimbangan, seperti jugametriks deskripsi, terdiri dari atas 6 kotak. Tiga kotak untuk data pertimbangan dantiga kotak lagi mengenai data standar.Keseluruhan matriks yang mendukung model Stake ini terdiri dari 12 kotak. Di

    samping itu, ada sebuat kotak lagi yang dinamakan kotak rasional. Setiap pengembang kurikulum/guru harus memiliki rasional untuk setiap intent yangdikembangkan. Mungkin sekali mereka tidak mempunyai rasional yang tertulis, danmungkin pula mereka tidak dapat mengemukakannya dalam susunan kalimat yang

    baik tapi mereka pasti memilikinya.Cara kerja model evaluasi Stake ini adalah sebagai berikut. Evaluator mengumpulkan data mengenai apa yang diinginkan pengembangan program baik yang berhubungan dengan antecendents (persyaratan awal), transaksi (interaksi),dan juga hasil. Data dapat dikumpulkan melalui studi dokumen tetapidapat puladilakukan dengan jalan wawancara. Cara terakhir ini dilakukan apabila dokumentidak diperoleh karena sesuatu dan lain hal. Cara terbaik tentulah melalui studidokumen.Bersamaan dengan pengumpulan data mengenai intents (tujuan) ini dapat puladikumpulkan resional dari setiap tujuan tersebut. Di sini Stake memperingatkan

  • 8/2/2019 Evaluasi Pembelajaran TEP

    16/47

    16

    16Sumber: Facebook Melati Kamilatila

    agar data mengenai rasional janganlah dikumpulkan dengan jalan mendikte pengembang program/guru tersebut. Biarkanlah mereka berbicara dengan pengertian dan bahasa yang ada pada diri mereka. Evaluator mendengarkan danmencatat apa yang dikemukakan oleh pengembang program. Suatu hal yang perludiperhatikan, walaupun dalam gambar kotak rasional berada di sebelah kiri matriksdeskripsi, hal itu tidaklah berarti bahwa pengumpulan data tentang rasionaldilakukan terlebih dahulu. Dalam kenyataannya, data tentang rasional tak mungkindikumpulkan sebelum data mengenai tujuan telah dikumpulkan. Oleh karena ituwaktu yang paling cepat untuk segera mengumpulkan data mengenai rasionaladalah bersamaan dengan waktu pengeumpulan data mengenai tujuan.Kegiatan berikutnya ialah pengumpulan data observasi mengenai persyaratan awal,transaksi dan hasil. Sesuai dengan namanya, data untuk bagian ini dikumpulkanmelalui observasi. Dan, seperti ditekankan Stake, observasi ini haruslah observasiformal. Maksudnya, observasi tersebut haruslah dilakukan denga mepergunakaninstrumen (alat pengumpul data yang dikembangkan khusus). Stake (1972:98)mengemukakan bahwa instrumen yang dipakai dapat meliputi daftar inventori,daftar pertanyaan tentang data biografis, daftar wawancara, daftar cek, pertanyaantentang pendapat (optionares), dan semua jenis tes psikometrik. Yang penting,data tersebut berhubungan dengan apa yang dikembangkan dalam tujuan.Dalam pengolahan data matriks deskripsi, Stake mengemukakan dua konsep yaitucontingency dan cungruency. Kedua konsep ini berbeda dalam penggnnaannya.Contingency dipegunakan untuk menganalisis data secara vertikal, mencarikesesuaian antara kotak di atas dengan kotak di bawahnya. Ada dua analisismengenai kesesuaian ini. Pertama adalah kesesuaian secara logika, yaitu kesesuaianmenurut pemikiran logika evaluator. Evaluator mempertimbangkan apakahhubungan yang satu dengan lainnya masuk akal, apakah yang satu itu mungkintercapai melalui apa yang ada pada kotak lainnya.

    Analisis logis ini dipergunakan Stake dalam memberikan pertimbangan mengenaiketerhubungan antara persyaratan awal, transaksi, dan hasil dari kotak-kotak tujuan(intent). Evaluator harus dapat menentukan apakah persyaratan awal yang telahdikemukakan pengembang program/guru. Ataukah sebetulnya ada model transaksilain yang lebih efektif untuk mencapai apa yang dikemukakan dalam prasyarat.Demikian pula mengenai hubungan antara transaksi dengan hasil yang diharapkan.Analisis kedua adalah analisis empirik kontingensi. Dasar bekerjanya adalah samadengan analisis logis tapi data yang dipergunakan adalah data empirik. Jadi, dalamanalisis ini evaluator harus mempertimbangkan keterhubungan tersebut berdasarkandata empirik yang telah dikumpulkannya. Pertanyaan-pertanyaan yang diajukanuntuk analisis logus dipergunakan untuk analisis empirik ini.

    Masih dalam analisis mengenai data deskriptif, pekerjaan evaluator berikutnya ialahmengadakan analisis congruence (kesesuaian) antara apa yang dikemukakan dalamtujuan (intent) dengan apa yang terjadi dalam kegiatan observasi. Pertanyaan yangdapat diajukan di sini ialah apakah yang telah direncanakan dalam tujuan memangsesuai dalam pelaksanaannya di lapangan (observasi). Apakah terjadi

    penyimpangan-penyimpangan antara apa yang direncanakan (intent) dengan apayang terjadi dan kalau ada penyimpangan faktor-faktor apa yang berperan dalam

    penyimpangan tersebut.Apabila analisis contingency dan concruency tersebut telah diselesaikan, adalahtugas evaluator untuk menyerahkan hasilnya kepada tim yang terdiri dari para ahlidan orang yang terlibat dalam program. Tim ini yang akan meneliti kasahihan hasilanalisis evaluator tersebut. Lebih lanjut tim ini pula yang akan memberikan

    persepsinya mengenai faktor penting baik dalam contingency maupun congruency.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    17/47

    17

    17Sumber: Facebook Melati Kamilatila

    Tugas berikut evaluator ialah memberikan pertimbangan mengenai program yangsedang dikaji. Untuk itu evaluator memerlukan standar. Dalam model keseluruhandigambarkan bahwa dalam matriks pertimbangan ada yang dinamakan standar dan

    pertimbangan. Standar dapat berbentuk standar mutlak dan relatif. Standar mutlak adalah standar yang dianggap belaku untuk suatu kurikulum atau program.Katakanlah untuk program IPS ditentukan adanya standar-standar tertentu baik mengenai tujuan yang akan dicapai, proses belajar mengajar, dan hasil belajar.Mungkin saja standar itu datang dari individu para ahli tetapi standar itu adalahstandar yang diinginkan bagi setiap program studi IPS, terlepas dari karakteristik khusus yang dimiliki program tersebut.Standar relatif berhubungan dengan komparasi antara satu program dengan

    program lainnya dalam satu bidang studi yang sama. Untuk konteks pendidikan diAS dan beberapa negara lainnya, adanya beberapa program dalam satu bidang studiyang sama adalah jamak. Suatu negara bagian tertentu atau bahkan satu lingkunganotoritas pendidikan tertentu memiliki program IPA yang berbeda dengan negara

    bagian atau lingkungan otoritas pendidikan lainnya. Dalam konteks pendidikanIndonesia perbedaan semacam itu mungkin tidak akan terjadi. Oleh karena itukomparasi untuk konteks pendidikan di Indonesia hanya dapat dilakukan antara

    program yang lama dengan program yang baru.Menurut Stake (1972:101), evaluator yang harus mempergunakan kedua standar tersebut. Jadi, evaluator harus memberikan pertimbangan baik yang bersifat mutlak maupun relatif. Hanya dengan kedua pertimbangan tersebut arti dari kurikulumtersebut dapat ditetapkan terlebih mantap. Dengan demikian, pada waktu evaluator memberikan umpan balik kepada pembuat keputusan, pertimbangan yangdiberikannya adalah pertimbangan yang bersifat menyeluruh (komprehensif).Model Stake ini lebih dapat dipergunakan untuk melakukan evaluasi mengenai

    pelaksanaan implementasi kurikulum dalam konteks pendidikan Indonesia. Proses

    pengembangan kurikulum di Indoensia sedemikian rupa sehungga kurikulumsebagai rencana dibuat di tingkat basional dan bersifat tidak siap pakai. Gurumasih harus mengembangkan rencana besar tersebut menjadi rencana yang lebihoperasional, yang dalam istilah kependidikan di Indonesia disebut satuan pelajaran(SP). Satuan pelajaran inilah yang dapat dipergunakan untuk mengisi matriks intentmodel yang dikemukakan Stake.Mengenai standar yang diinginkan Stake dapat dikembangkan dari komponen yangada dalam rencana besar kurikulum tersebut. Meskipun demikian, tidak adasalahnya apabila evaluator juga mempergunakan standar yang dikembangkan dari

    para ahli bidang studi bersangkutan. Tentu saja masalah akan timbul apabila antarastandar yang dikembangkan dari rencana besar tidak bersesuaian dengan yang

    dikembangkan dari para ahli tadi. Tapi persoalan yang demikian juga dihadapisetiap evaluator yang mempergunakan model Stake ini, meskipun dalam konteks

    pendidikan di AS di mana model ini dilahirkan. Hal ini pula kiranya yangmenyebabkan mengapa Stake (1972:100) menganjurkan agar jangan mengevaluasikurikulum dengan mikroskop tetapi seharusnya dengan a panoramic view finder.Adanya beragam standar akan memebrikan kesempatan kepada evaluator untuk mempergunakan standar tersebut sebagai teorpong panorama dan buka mikroskop.Meskipun demikian untuk konteks pendidiakn di Indonesia, selain untuk mengevaluasi dimensi kurikulum sebagai kegiatan, model Stake ini dapatdipergunakan dalam pengembangan kurikulum di tringkat nasional apabilaeksperimen dilakukan. Pada waktu eksperimen, pengembang kurikulum dapatmenerapkan model ini sepenuhnya karena semua persyaratan Stake terpenuhi.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    18/47

    18

    18Sumber: Facebook Melati Kamilatila

    3. Model CIPP

    Model ini dikembangkan oleh suatu tim yang diketuai Stufflebeam. Pada waktumemimpin tim ini ia bekerja di Ohio State University. Meskipun demikian, timyang dipimpinnya tersebut terdiri dari para sarjana yang berkerja di berbagaiuniversitas dan salah seorang anggotanya, Gephart, adalah sarjana yang bekerja diPhi Delta Kappa (PDK). Organisasi ini pula yang menugaskan Stufflebeam dankawan-kawannya berkarya mengembangkan pemikiran tentang evaluasi

    pendidikan. Oleh karena itu, model yang mereka kembangkan itu kadang-kadangdinamakan pula dengan model PDK.

    Nama CIPP, dalam kenyataannya lebih dikenal masyarakat perguruan tinggi dankalangan evaluator. Hal ini mungkin sekali disebabkan CIPP adalah singkatan dariContext, Input, Process dan Product. Memang keempat daerah kerja ini adalahkomponen utama dari model ini. Dalam buku yang mereka tulis, model tersebutdikemukakan dalam bab 7, setelah mereka mendiskusikan pikiran mereka mengenaievaluasi dan hubungannya dengan pembuatan keputusan. Dalam buku suntinganMadaus, Scriven dan Stufflebeam (1983) model ini dibicarakan kembali dalam bab7 pula, ditulis oleh Stufflebeam sendiri. Tetapi dalam buku suntingan ini,Evaluation Model, Stufflebeam membuat semacam penyederhanaan yangsebenarnya lebih mengena pada pokok ide tentang model itu sendiri.Menurut Stufflebem (1983:117) model ini telah diterapkan di banyak tempat diA.S. dan telah dibahas dalam beberapa disertasi doktor. Di antara beberapa disertasidibuat oleh mahasiswa di the Ohio State Universiry. Sayangnya, di universitas ini

    pada saat sekarang sudah tidak menunjukkan bekas-bekas hasil kerja profesor tersebut. Seolah-olah hasil binaan Stufflebeam di unversitas tersebut sirna begitusaja. Adalah wajar pula kalau model CIPP ini berkembang di universitas WesternMichigan di mana Stufflebeam sekarang ini bekerja. Penyederhanaan model dalam

    bentuk diagram dilakukan setelah ia meninggalkan the Ohio State Unversity.Meskipun terjadi penyederhanaan, pokok-pokok pikiran CIPP yang dikembang-kantim PDK masih tetap merupakan dasar dari penyederhanaan yang dilakukanStufflebeam. Oleh karena itu, pembahasan mengenai model CIPP ini tidak akanmembandingkan antara keduanya. Pembahasan dilakukan berdasarkan model yangdikembangkan terakhir.Sesuai dengan namanya, model ini terbentuk dari 4 jenis evaluasi yaitu evaluasikonteks (Context), masukan (Input), proses (Process) dan hasil (Product). Keempatevaluasi ini merupakan suatu rangkaian keutuhan. Tetapi seperti dikemukakan olehStufflebeam sendiri, dalam pelaksanaan seorang evaluator dapat saja hanyamelakukan satu jenis atau kombinasi dari dua atau lebih jenis evaluasi itu

    (Stufflebeam, 1983:122). Artinya, seorang evaluator tidak selalu harusmempergunakan keempatnya. Walaupun demikian, karena model inidikembangkan berdasarkan suatu pandangan tentang kegiatan kurikulum sebagaisesuatu dalam dimensinya yang utuh, pelaksanaan ke empat jenis evaluasi modelini merupakan hal yang diharapkan. Lagi pula kekuatan model sebetulnya terletak dari rangkaian kegiatan keempat jenis evaluasi itu sendiri.Sesuai dengan namanya, keempat jenis evaluasi Stufflebeam ini mempunyai obyek kejian yang berbeda. Evaluasi konteks ditujukan untuk menilai keadaan yangsedang dilakukan oleh suatu lembaga pendidikan. Jadi, evaluasi ini tidak mengharuskan lembaga pendidikan mempunyai suatu kurikulum baru terlebihdahulu untuk melakukan kegiatan evaluasi. Evaluasi justru dilakukan dari kegiatanawal sebelum suatu inovasi kurikulum direncanakan. Bahkan adalah fungsi darievaluasi konteks untuk melihat apakah diperlukan adanya suatu inovasi atau tidak.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    19/47

    19

    19Sumber: Facebook Melati Kamilatila

    Tujuan evaluasi konteks yang utama ialah untuk mengetahui kekuatan dankelemahan yang dimiliki evaluan (Stufflebeam, 1983:128). Dengan mengetahuikekuatan dan kelemahan ini, evaluator dapat memberikan arah perbaikan yangdiperlukan. Dalam melakukan evaluasi ini evaluator harus dapat menemukankebutuhan yang diperlukan evaluan. Oleh karena itu, evaluan konteks ini sebagiantigasnya adalah melakukan need assesment. Tetapi, selain dari need asesment,evaluasi konteks ini harus pula dapat memberikan pertimbangan apakah tujuanyang akan dicapai sesuai dengan kebutuhan yang telah ditentukan.Dari tugas yang harus dilakukan terlihat nahwa evaluasi konteks mencoba untuk memberikan pertimbangan mengenai nilai dan arti dari auatu keadaan. Nilaidiperlihat-kan dengan mengemukakan mengenai keadaan evaluan. Kekuatan dankelemahan yang dimiliki evaluan merupakan hasil pertimbangan evaluator tentangnilai evaluan. Sedangkan arti evaluan diperlihatkan dengan memberikan

    pertimbangan apakah tujuan yang akan dicapai sesuai dengan kebutuhan.Dari evaluasi konteks ini terlihat perbedaan antara model CIPP ini dengan model-model evaluasi yang telah dibahas terdahulu. Model-model lain mulai denganadanya suatu inovasi yang sedang dilaksanakan oleh suatu lembaga pendidikan.Inovasi itu yang kemudian dijadikan evaluan. CIPP bahkan membantu evaluanuntuk memutus-kan apakah inovasi diperlukan atau tidak. Kalau perlu, evaluator yang mempergunakan model CIPP tidak lantas berpangku tangan. Evaluator harusdapat menentukan skala inovasi yang dilakukan.Dalam model aslinya dikenal ada tiga jenis skala inovasi yang mungkin dilakukan.Ketiganya diberi label yang cukup klasik walaupun cukup jelas menggambarkanskala yang dimaksud. Ketiganya ialah homeostatic, incremental, dan neobolistic.Homeostatic merupakan skala terendah di mana inovasi yang akan dilakukan hanyamemasukkan unsur baru yang tidak berarti. Dapat dikatakan bahwa skala inovasihomeostatic tidak akan mengubah pola kegiatan yang sudah ada. Hanya elemen

    tertentu dari pola yang ada yang harus diubah. Dampak perubahan hanya bersifatmikro. Oleh karena itu, apabila inovasi yang akan dilakukan bersifat homeostatic,evaluasi berikutnya tidak dapat dikatakan tidak diperlukan. Tetapi apabila skalainovasi yang akan dilakukan bersifat incremental (penambahan), apalagi dalamskala noebolistic, evaluasi berikutnya yaitu evaluasi masukan merupakan suatuyang dipersyaratkan.Mengapa demikian? Seperti dikemukakan oleh Stufflebeam (1983:130), bahwaorientasi utama evaluasi ialah mengemukakan suatu program yang dapat mencapaiapa yang diinginkan lembaga tersebut. Program yang dimaksudkan ialah programyang membawa perubahan yang membawa perubahan berskala penambahan dan

    pembaharu-an. Lebih lanjut, Staufflebeam menulis:

    This type of study should identify and rate relevant approaches (including any thatare already in operation) and assist and explicating and shaking down the one thatis chosen for instalation or continuation. It should also search the clientsenvironment for barriers, constraints, and potentially available resources that needto be taken info account in the process of activating the program.

    Dengan demikian evaluasi masukan tidak hanya melihat apa yang ada padalingkungan lembaga tersebut ( baik material maupun personal) tetapi juga harusdapat memperkira-kan kemungkinan-kemungkinan yang akan dihadapi di waktumendatang ketika suatu inovasi kurikulum dilaksanakan.Dari apa yang telah dibicarakan mengenai evaluasi masukan ini, makin jelas bahwaCIPP tidak hanya dilaksanakan dalam situasi di mana suatu inovasi sedangdilaksanakan tetapi justru model ini dilakukan ketika inovasi itu akan atau belumdilaksanakan. Meskipun demikian, tidaklah berarti bahwa CIPP tidak dapat dapat

  • 8/2/2019 Evaluasi Pembelajaran TEP

    20/47

    20

    20Sumber: Facebook Melati Kamilatila

    dilaksanakan apabila suatu inovasi kurikulum sedang dalam proses pelaksanaan.CIPP tetap dapat dilakukan kendati suatu lembaga pendidikan telah melaksanakansuatu inovasi kurikulum dalam waktu tertentu.Seperti telah dikemukakan, Stufflebeam telah mengatakan CIPP tidak mutlak harusdigunakan dalam keseluruhan model, CIPP dapat digunakan dalam salah satu ataukombinasi dari dua atau lebih kegiatan evaluasi. Jadi, CIPP dapat digunakan hanyadengan menggunakan evaluasi proses saja. Mengingat obyek kajian dan tujuanyang akan dicapai evaluasi proses, CIPP dapat digunakan walaupun bukan darisejak awal ketika akan menemukan ide inovasi.Evaluasi proses adalah evaluasi mengenai pelaksanan dari suatu inovasi kurikulum.Jadi, kalau evaluasi konteks adalah evaluasi kurikulum dalam dimensi pengertiansebagai ide, evaluasi masukan adalah evaluasi kurikulum dalam dimensi pengertiansebagai rencana, evaluasi proses adalah evaluasi kurikulum dalam dimensi

    pengertian sebagai realita atau kegiatan. Artinya, evaluasi proses ini baru dapatdilakukan apabila inovasi kurikulum tersebut telah dilaksanakan di lapangan, bukan

    pada waktu ia dirancang. Oleh karena itu, evaluator dapat saja menggunakan modelCIPP walaupun ia baru diminta berpartisipasi ketika suatu program inovasi sedangdilaksanakan.Dalam pelaksanaannya, model CIPP ini bertujuan memperbaiki keadaan yang ada.Evaluator diminta untuk menentukan sampai sejauh mana rencana inovasi itudilaksanakan di lapangan, hambatan-hambatan apa yang ditemui yang tak dapatdiperkirakan sebelumnya, dan perubahan-perubahan apa yang harus dilakukanterhadap inovasi tersebut. Informasi yang dikumpulkan disajikan sebagai umpan

    balik bagi para pengelola dan juga staf. Dengan demikian, keputusan-keputusanyang diperlukan dalam usaha memperbaiki proses yang sedang berlangsung dapatdilaksanakan.Dari tujuan yang akan dicapai oleh evaluasi proses CIPP ini terlihat jelas bahwa

    CIPP mempergunakan pendekatan pengembangan kriteria baik yang bersifatfidelity maupun yang bersifat mutual adaptive. Kriteria yang bersifat fidelityterlihat dari tujuan untuk menentukan sampai sejauh mana rencana inovasi yangdibuat telah tercapai. Pendekatan mutual adaptive terlihat dari adanya usahauntuk memperbaiki keadaan lapangan agar inovasi itu sendiri. Artinya, evaluator yang melaksanakan evaluasi proses ini harus pula dapat memberikan informasimengenai hal-hal apa dari lapangan yang harus diubah dan komponen apa dariinovasi yang harus pula diubah. Dengan perubahan-perubahan tersebut diharapkaninovasi dan lapangan mencapai kesesuaian.Evaluasi hasil adalah kegiatan evaluasi berikutnya dalam model CIPP. Tujuanutama dari evaluasi hasil ini adalah untuk menentukan sampai sejauh mana

    kurikulum yang dimplementasikan tersebut telah dapat memenuhi kebutuhankelompok yang mempergunakannya (Stufflebeam, 1983:134). Dalam hal ini,diharapkan pula bahwa evaluasi hasil memperlihatkan pengaruh program tidak hanya yang bersifat langsung tapi juga pengaruh tidak langsung. Pengaruh tersebuttidak saja yang bersifat positif (biasanya evaluasi hasil hanya melihat pengaruh darisudut pandangan positif ini), tetapi juga pengaruh negatif dari kurikulum tersebut.Adanya pengaruh negatif ini kedengarannya aneh tetapi sebenarnya realistis.Bukankah suatu hal yang mustahil bahwa suatu kurikulum menghasilkan pengaruhsampingan yang bersifat negatif yang tidak pernah diperkirakan oleh para

    pengembang-nya. Misalnya, suatu kurikulum yang dikembangkan berdasarkantradisi intelektual. Hasilnya, mungkin memberikan kemampuan intelektual tinggi

    bagi siswa tapi dapat pula kemampuan intelektual tinggi tersebut menyebabkansiswanya menjadi ingkar terhadap agama. Dalam suatu studi di AS, misalnya,ditemukan bahwa program yang dikembangkan berdasarkan pandangan humanistik,

  • 8/2/2019 Evaluasi Pembelajaran TEP

    21/47

    21

    21Sumber: Facebook Melati Kamilatila

    memberikan pengaruh negatif dalam aspek disiplin. Evaluasi hasil dalam konsepCIPP ini memberikan laporan komprehensif mengenai pengaruh dari programtersebut. Untuk itu barangkali suatu perbandingan dengan kurikulum lainnya perludilakukan sehingga pendekatan pengembangan kriteria preordinate yangdipergunakan.Adanya ruang lingkup pengaruh yang luas sebagai fokus kajian evaluasi hasil CIPPmemberikan kesan ada pengaruh model evaluasi Goal Free dari Scriven.Sayangnya, hal tersebut tidak dapat dinyatakan secara pasti. Paling tidak adanya

    pengaruh tersebut tidak dapat diidentifikasi dari bacaan yang dipergunakanStufflebeam. Kiranya korespondensi pribadi dapat lebih menjelaskan persoalan.Sayangnya, korespondensi semacam itu belum dapat dilakukan penulis buku ini.Hanya pada bagian awal tulisannya, dikatakan ia berhubungan dengan Scriven.Bahkan mereka berdua pernah diminta untuk membicarakan model masing-masing

    pada beberapa lembaga. Bukan tidak mungkin pengaruh tersebut berkembangselama masa ini. Atau, ide tersebut memang muncul secara terpisah pada kedua diri

    pengembang model tersebut walaupun keduanya sering berdiskusi.Suatu hal yang pasti dan diakui oleh Stufflebeam bahwa terdapat perbedaan

    pandangan mengenai peran evaluasi yang cukup prinsipil antara dia denganScriven. Sementara model CIPP lebih menekankan pada peran formatif sedangkanmodel Scriven, baik formatif-sumatif maupun Goal Free, sangat memberikan

    perhatian yang besar terhadap peran sumatif. Oleh karena itu dalam evaluasi hasilinipun model CIPP memberikan posisi penting bagi peran formatif. Artinya,informasi yang dihasilkan evaluasi hasil CIPP tidak dipergunakan untuk menentukan apakah suatu program harus diganti. Informasi yang diberikandigunakan untuk menetapkan apakah ada komponen kurikulum yang harusdiperbaiki.Karena sifatnya yang demikian, adalah sangat berbahaya kalau evaluasi hasil model

    CIPP ini dilakukan secara terpisah. Keterbatasan ruang lingkup evaluasi hasilmerupakan hambatan sehingga informasi yang diberikan tidak cukup kuat untuk dipergunakan sebagai landasan dalam memperbaiki program. Misalnya, katakanlahkalau evaluasi hasil menunjukkan bahwa hasil belajar siswa sangat rendahdibanding-kan dengan apa yang direncanakan. Lantas, kesimpulan apa yang dapatdiambil? Apakah kelemahan tersebut disebabkan oleh faktor masukan ataukahfaktor proses.Atau, mungkin kelemahan itu disebabkan kelemahan dalam kurikulum itu sebagaisuatu ide? Adanya kelemahan semacam ini bukannya tidak disadari olehStufflebeam. Oleh karena itu ia menganjurkan, kalaulah jenis-jenis evaluasi yangada dalam CIPP akan dilakukan tidak seutuhnya, sebaiknya pekerjaan evaluasi

    meng-gabungkan dua atau lebih dari jenis evaluasi yang ada. Dengan adanya penggabungan ini tentu saja kelemahan seperti yang diungkapkan di atas tidak perlu dikhawatirkan. Keunggulan suatu jenis evaluasi dapat menutupi kelemahan jenis evaluasi lainnya.Tampaknya, kalau model CIPP ini diperhatikan, yang paling dapat diper-tanggungjawabkan ialah evaluasi konteks di sati pihak, evaluasi masukan, proses,dan hasil di lain pihak. Pemisahan semacam ini merupakan suatu penyelesaianterutama apabila evaluasi hasil akan dilakukan. Apabila evaluasi hasil tidak diikutsertakan, persoalannya tidaklah begitu mengkhawatirkan. Setiap gabunganlainnya tidak akan membawa persoalan yang mengandung resiko tinggi bagi

    pengambil keputusan.Sudah tentu yang terbaik ialah apabila keseluruhan model CIPP dapat dilaksana-kan. Gambar 6 memperlihatkan alur kerja keseluruhan model tersebut. Sepertiterlihat dalam gambar tersebut, dalam model ini perbedaan kegiatan dinyatakan

  • 8/2/2019 Evaluasi Pembelajaran TEP

    22/47

    22

    22Sumber: Facebook Melati Kamilatila

    dengan perbedaan bentuk. Bentuk kotak persegi empat digunakan untuk menggambarkan kegiatan pelaksanaan. Bentuk belah ketupat digunakan untuk menggambarkan keputusan yang harus diambil. Oleh karena itu dalam setiapkeputusan itu ada garis ya yang berarti keputusan yang diambil mengiyakan

    pertanyaan ayanga ada dalam bentuk belah ketupat itu. Sedangkan tidak berartimenolak pertanyaan yang diajukan. Bentuk lonjong (oval) menunjukkan kegiatanevaluasi yang dilakukan. Bagi pembaca yang kenal dnegan program komputer tentusaja bentuk-bentuk tersebut bukanlah sesuatu yang baru.Dalam diagram asli mengenal CIPP kotak untuk kegiatan evaluasi proses dan hasildipisahkan. Dalam diagram terbaru ini Stufflebeam menggabungkan keduakegiatan evaluasi itu dalam satu kotak. Kiranya, penggabungan ini merupakansesuatu yang sugestif bahwa paling tidak evaluasi hasil harus digabungkan dalam

    pelaksanaan-nya dengan evaluasi proses.Gambar 6 yang memperlihatkan alur kerja model CIPP itu sangat jelasmemperlihatkan kapan suatu evaluasi diadakan dan jenis keputusan apa diharapkan,serta tindak lanjut apa yang dapat dilakukan berdasarkan keputusan yang diambil.Sebagai contoh, evaluasi konteks secara berkala melakukan kajian terhadap

    pelaksanaan sistem yang berlaku. Dari hasil kajian itu harus dapat diputuskanapakah suatu inovasi diperlukan. Kalau tidak, kembali melaksanakan apa yangsedang dilakukan oleh lembaga pendidikan itu. Kalau suatu inovasi diperlukan (ya),masalah yang dihadapi harus diidentifikasi dan tujuan yang akan dicapai harus puladirumuskan. Setelah itu, keputusan yang harus diambil adalah apakah pemecahanmasalah sudah memuaskan. Kalau sudah, solusi itu dilaksanakan. Kalau tidak,evaluasi masukan dilaksanakan. Demikian seterusnya.Model CIPP ini memiliki keunggulan terutama apabila keseluruhan modeldilaksanakan. Keempat dimensi kurikulum, seperti yang dibicaraan dalam buku inidapat dilayani dengan baik oleh model ini. Kurikulum dalam dimensi ide dapat

    dievaluasi meklakui evaluasi konteks. Pertnyaan keputusan tentang apakah suatuide inovasi kurikulum mempunyai kekuatan justifikasi adalah pertanyaan dasar dalam kajian dimensi ide. Evaluasi masukan dapat ditujukan kepada kurikulumdalam dimensi sebagai rencana. Seperti diketahui dalam pendekatan sistem, yang

    juga sebenarnya merupakan dasar pemikiran model CIPP ini, kurikulum sebagairencana adalah suatu masukan (kadang-kadang disebut dengan istilah instrumentalinput. Sedangkan evaluasi proses dan hasil, sesuai dengan namanya, ditujukanuntuk mengkaji dimensi proses dan hasil suatu kurikulum.Keunggulan lain dari model ini ialah peran aktif evaluator sejak awal. Seperti telahdikemukakan, evaluasi konteks dilaksanakan bahkan sebelum suatu ide inovasidirumuskan secara kongkrit. Evaluator harus melihat keadaan yang barlaku dan

    kemudian, berdasarkan hasil kajian tersebut, mempertanyakan apakah suatu inovasidiperlukan. Di sini evaluator bertindak sebagai orang yang mempunyai posisi

    penting dalam membantu memberikan penyelesaian terhadap masalah yangdihadapi suatu lembaga pendidikan. Sepanjang pengetahuan penulis, model laintidak memberikan pesan yang sedemikian penting bagi evaluator terkecuali kejianneed assessment yang biasanya dimasukkan dalam ruang lingkup kajian

    perencanaan. Tetapi model CIPP menempatkan kajian need assessment sebagaisalah satu teknik evaluasi konteks dan memberikan kedudukan yang penting bagievaluator dalam suatu usaha inovasi.Kelemahan model ini ialah apabila ia diterapkan secara bagian demi bagian(partial). Penerapan yang demikian melemahkan ide dasar model. Pelaksanaankombinasi antar dua atau lebih jenis evaluasi menyebabkan alur kegiatan evaluasimenjadi tidak utuh. Dengan pelaksanaan yang demikian, hubungan antara satukeputusan dengan keputusan lain dapat kehilangan kesinambungan.

  • 8/2/2019 Evaluasi Pembelajaran TEP

    23/47

    23

    23Sumber: Facebook Melati Kamilatila

    4. Model Evaluasi Scriven

    Menurut Michael Scriven, evaluasi program dibedakan atas dasr fungsinya yaitu:evaluasi formative dan evaluasi sumatif.Evaluasi formatif berfungsi untuk mengumpulkan data selama kegiatan sedangdilaksanakan. Data yang dikumpulkan dapat pula digunakan oleh pengembang

    program untuk membentuk dan memodifikasi program. Dalam beberapa hal, penemuan-penemuan dari evaluasi dapat digunakan sebagai bahan acuan bagi pelaksana dalam melaksanakan program selanjutnya, agar tidak terjadi pemborosan biaya, tenaga dan waktu.Evaluasi sumatif berfungsi untuk mengmpulkan data ketika kegiatan program

    benar-benar selesai. Evaluasi sumatif dilaksanakan dengan tujuan untuk mengetahui kemanfaatan program, terutama jika dibandingkan dengan program lainyang sejenis. Data yang dikumpulkan selama evaluasi sumatif sangat berguna bagi

    pihak pembuat keputusan atau penanggungjawab program dalam menentukankebijakan dan tindak lanjut.Oleh Scriven, evaluasi formatif dan sumatif menunjuk model evaluasi karenamengandung pengertian tentang:a. Komponen

    1) Formatif : Evaluasi sebagian program2) Sumatif : Evaluasi seluruh program

    b. Instrumen1) Formatif : Disusun oleh evaluator 2) Sumatif : Terstandar

    c. Pelaksana1) Formatif : Dilakukan orang dalam

    2) Sumatif : Dilakukan orang luar d. Langkah-langkah1) Formatif : Terus menerus disusun, memperoleh hasil sambil

    menggunakan langsung, tidak perlu desain lengkap.2) Sumatif : Satu kali pelaksanaan: menyeluruh, memperoleh

    data, mengolah dan menyimpulkan data danmenyebarkan kepada pihak pengambilkeputusan. Memerlukan penyusunan desainsecara lengkap.

    Langkah-langkah pelaksanaan evaluasi formatif dan evaluasi sumatif.5. Evaluasi formatif dilaksanakan selama program berlangsung dengan tujuan

    untuk menyediakan informasi yang bermanfaat kepada pimpinan atau penanggungjawab program untuk kepentingan perbaikan dan penyempurnaan program. Setiap langkah pelaksanaan evaluasi akan menghasilkan umpan balik segera. Selanjutnya berdasarkan informasi yang telah dikumpulkan dapatdipergunakan untuk merevisi dan menyempurnakan progran apabila diperlukan.6. Evaluasi sumatif dilaksanakan pada akhir kegiatan untuk memberi-kaninformasi kepada kemampuan potensial tentang manfaat atau kegunaan program.7. Evaluasi formatif hendaknya menarah kepada keputusan tentang program,termasuk perbaikan, modifikasi dan penyempurnaan. Sedangkan evaluasi sumatif mengarah kepada kebutuhan mengenai kelanjutan program berikutnya atau

    program yang ditersukan pengabdosiannya.8. Jelasnya bahwa kedua evaluasi ini penting karena keputusan yang diperlukanselama proses, tingkat pengembangan program, untuk memperbaiki danmemperkuat keputusan progran yang diambil. Dan apabila sudah stabil dapat

  • 8/2/2019 Evaluasi Pembelajaran TEP

    24/47

    24

    24Sumber: Facebook Melati Kamilatila

    dipakai untuk mengevaluasi manfaat progran atau untuk memutuskan masadepan/kelanjutan program yang bersangkutan.

    5. Model Evaluasi Discrepancy (Kesenjangan)Malcolm Provus sebagai perintis dan pengembang model ini berpendapat bahwaevaluasi kesenjangan berfungsi untuk mengetahui tingkat kesesuaian antara standar yang sudah ditetapkan dengan penampilan aktual program yang bersangkutan.Sedangkan menurut AECT (1979), evaluasi kesenjangan adalah suatu metode untuk mengidentifikasi perbedaan/kesenjangan antara tujuan khusus yang ditetapkandengan penampilan aktual.Adapun langkah-langkah dalam pelaksanaan model evaluasi kesenjangan adalah:Tahap Penyusunan Desain, kegiatan yang dilakukan antara lain:Merumuskan tujuan

    program. Menyiapkan audience, personil dan kelengkapan lainnya. Menentukankriteria dalam bentuk rumusan yang menunjuk pada sesuatu yang dapat diukur.Tahap pemasangan Instalasi, kegiatan yang dilakukan antara lain:Menilai kembali

    penetapan kriteria (standar) yang telah ditetapkan pada tahap penyusunan desain.Meninjau/memonitor program yang sedang dilaksanakan. Meneliti kesenjanganantara apa yang telah direncanakan dengan apa yang telah dicapai. Tahap proses

    pengumpulan data, kegiatan yang dilakukan antara lain: mengadakan evaluasiterhadap tujuan-tujuan manakah yang telah dan akan dicapai. Pada tahap inidisebut tahap pengumpulan data dari pelaksanaan program. Tahap pengukurantujuan (product), yaitu mengadakan analisis data dan menetapkan tingkat outputyang diperoleh. Tahap perbandingan (comparison), yaitu membandingkan hasilyang telah dicapai dengan tujuan yang telah ditetapkan sebelumnya. Dalam tahapini evaluator menulis semua temuan tentang kesenjangan. Selanjutnya disajikankepada pengambil kebijakan/ pembuat keputusan, agar mereka dapat memutuskan

    kelanjutan dari program tersebut. Kemungkinan hasil keputusan yang ditetapkanadalah (a) menghentikan program, (b) mengganti atau merevisi program, (c)meneruskan progran yang telah didesain atau (d) memodifikasi ataumenyempurnakan tujuannya.

    6. Model Ekonomi MikroSebenarnya model ekonomi mikro ini nukan hanya satu. Tetapi untuk memudahkan

    pembahasan, dan lagi pula satu sama lainnya saling bertautan, model-model yang

    dikembangkan dari ekonomi mikro ini dimasukkan dalam satu kelompok pembahasan. Dengan cara demikian, diharapkan pengulangan pembahasan yangtidak perlu dapat dihindari.Pada mulanya, model-model ekonomi mikro ini hanya dikenal oleh orang-orangyang belajar ekonomi. Oleh karena itu yang dievaluasi adalah pola program dankegiatan-kegiatan yang berhubungan dengan kegiatan perekonomian dalam artikata sempit. Artinya, kegiatan yang dievaluasi adalah kegiatan yang dilakukan olehlembaga-lembaga sosial budaya, mempunyai karakteristik khusus yang tidak selalumendasarkan dirinya atas perhitungan ekonomi. Jadi kajian evaluatif mengenai

    pendidikan seolah-olah tidak memerlukan adanya perhitungan biaya dankeuntungan dalam pengertian ekonomi. Pandangan yang demikian kemudian

    berubah. Keadaan perekonomian yang tidak selalu cerah menyebabkan orang mulai berpikir bahwa kegiatan pendidikan pun harus dapat dipertanggungjawabkan darisegi finansiil. Lagipula, prinsip efisiensi seperti yang dilaksanakan presiden

  • 8/2/2019 Evaluasi Pembelajaran TEP

    25/47

    25

    25Sumber: Facebook Melati Kamilatila

    Johnson, dan prinsip akuntabilitas yang dicanangkan presiden Nixon, mengukuhkankedudukan model-model ekonomi mikro dalam kajian evaluasi di bidang

    pendidikan pada saat sekarang, kuliah-kuliah mengenai model ini banyak ditawarkan di berbagai fakultas ilmu pendidikan di AS. Ada kalanya kuliahmerupakan sesuatu yang berdiri sendiri sebagai suatu mata kaliah mandiri, tapi

    banyak pula yang mebahas konsep-konsep ekonomi yang digunakan model inidalam suatu perkuliahan kependidikan dengan judul berbeda. Ada yangmembicarakannya dalam kuliah perencanaan pendidikan, dan ada pula yangmembicarakannya sebagai topik dalam kuliah evaluasi. Apapun modus yangdigunakan, kenyataan tersebut menunjuk-kan peranan model ini yang semakindirasakan manfaatnya dalam kaji