PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING …digilib.unila.ac.id/56070/3/TESIS TANPA BAB...

86
PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING DENGAN POLITOMUS RESPONSE PADA MATA PELAJARAN MATEMATIKA SEKOLAH MENENGAH KEJURUAN (Tesis) PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS LAMPUNG BANDAR LAMPUNG 2019 Oleh AAN SULISTIAWAN

Transcript of PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING …digilib.unila.ac.id/56070/3/TESIS TANPA BAB...

PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING DENGANPOLITOMUS RESPONSE PADA MATA PELAJARAN MATEMATIKA

SEKOLAH MENENGAH KEJURUAN

(Tesis)

PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKAFAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS LAMPUNGBANDAR LAMPUNG

2019

OlehAAN SULISTIAWAN

ABSTRAK

PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNINGDENGAN POLITOMUS RESPONSE PADA MATA PELAJARAN

MATEMATIKA SEKOLAH MENENGAH KEJURUAN

Oleh :

Aan Sulistiawan

Penelitian ini bertujuan untuk menghasilkan instrumen assessment for learningdengan politomus response pada Mata Pelajaran Matematika dan mengetahuikualitas instrumen berdasarkan parameter butir. Penelitian ini merupakanpenelitian pengembangan yang mengacu pada model pengembangan pendidikanumum dari Plomp. Produk awal divalidasi oleh dua ahli. Tahap uji coba instrumenmelibatkan 413 peserta didik kelas X di tiga SMK di Lampung timur. Hasil ujicoba instrummen berupa data politomus yang dianalisis dengan pendekatanPartial Credit Model 1-Parameter Logistic (1-PL) dengan bantuan programwinsteps. Indeks validitas butir dianalisis menggunakan formula indeks Gregorydan parameter butir dianalisis menggunakan pendekatan teori tes modern. Hasilpenelitian menunjukkan bahwa instrumen assessment for learning telah validsecara isi dan konstruk. Tingkat kesukaran instrumen assessment for learningberada pada kategori sedang, dan fungsi informasi yang diperoleh 22,36 dengankesalahan baku dalam pengukuran 0,211 sehingga instrumen assessment forlearning dinyatakan reliabel. Hasil pengukuran ditinjau dari kemampuan pesertadidik dalam menjawab setiap butir soal dinyatakan berada pada rentang -2 sampaidengan +2; jika ditinjau dari presentase penguasaan peserta didik dalammenjawab setiap butir soal dinyatakan dalam kategori sedang.

Kata Kunci: instrumen assessmen for learning, politomus response, itemrensponse theory

ABSTRACT

DEVELOPING ASSESSMENT FOR LEARNING INSTRUMENT WITHPOLITOMUS RESPONSE ON MATH SUBJEC TO VOCATIONAL SCHOOL

By :

AAN SULISTIAWAN

This study aims to produce assessment instruments for learning with politomus responsesin Mathematics Subjects and find the quality of instruments based on item parameters.This research is a development research that refers to the general education developmentmodel of Plomp. The research subjects were conducted at three schools, they are SMKPraja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar Sribhawono, and SMKMa'arif NU Penawaja. The total number of trial subjects was 423 students. The researchdata was collected using multiple choice tests with open reasons. The instrument consistsof two package questions with each package consisting of 40 items. But only one packageof questions was tested. The item validity index was analyzed using the Gregory indexformula and the grain parameters were analyzed using the Partial Credit Model 1-Parameter Logistic approach (1-PL) using the Winsteps program. The results of the studyindicate that the instrument valid. This is based on the calculation that the Gregory indexvalue is 1. In addition, the average reliability coefficient of 0.89 is obtained, so it is statedreliable to measure the ability of students. The measurement results in terms of the abilityof students to answer each item are stated in the range of logit -2 to +2; if it is viewedfrom the percentage of students mastery in answering each items of the questions arestated in the medium category.

Keywords: assessment for learning instrument, politomus responsese, item responsetheory

PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING

DENGANPOLITOMUS RESPONSE PADA MATA PELAJARAN

MATEMATIKA SEKOLAH MENENGAH KEJURUAN

Oleh

AAN SULISTIAWAN

Tesis

Sebagai Salah Satu Syarat untuk Mencapai Gelar

MAGISTER PENDIDIKAN MATEMATIKA

Pada

Program Studi Magister Pendidikan Matematika

Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam

PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2019

RIWAYAT HIDUP

Penulis dilahirkan di Brawijaya, Lampung Timur, pada tanggal

29 Mei 1991. Penulis merupakan anak pertama dari pasangan

Bapak Suyitno dan Ibu Juminah.

Penulis menyelesaikan pendidikan dasar di SD Negeri

Brawijaya pada tahun 2002, pendidikan menengah pertama di SMP N1 Bandar

Sribhawono pada tahun 2005, dan pendidikan menengah atas di SMA N1 Bandar

Sribhawono pada tahun 2008. Penulis menyelesaikan sarjana program studi

Pendidikan Matematika di Universitas Muhammadiyah Metro pada tahun 2012.

Penulis menjadi pengajar di salah satu sekolah Sekolah Menengah Kejuruan

(SMK) swasta yang berada di Bandar Sribhawono tahun 2012 sampai dengan saat

ini. Penulis melanjutkan pendidikan pada program studi Magister Pendidikan

Matematika Universitas Lampung tahun 2015.

MOTTO

“Bersanding, Berbanding, Bersaing”

Persembahan

Dengan Mengucap Syukur Kepada Allah SWT

Kupersembahkan karya ini sebagai tanda cinta & kasih sayangku kepada:

Istriku tercinta Aflah Mufidatul Mahmudah yang selalu bersedia membantumemberikan solusi, dukungan, dan membersamaiku selama studi.

Anakku tersayang Aulia Afidatul Myesha yang selalu menjadi motivasi dalamsegala hal

Bapakku Suyitno dan Ibuku Juminah, yang telah membesarkan, mendidik,mencurahkan kasih sayang, dan selalu mendoakan kebahagiaan dan

keberhasilanku.

Bapak Mertuaku Sugiyanto dan Ibu Mertuaku Nursidah, yang tak hentimendukung, menyemangati, dan selalu mendoakan kelulusan dan keberhasilanku.

Adik-adikku yang sama-sama sedang berjuang menyelesaikan studi pada masing-masing jenjang, serta seluruh keluarga besar yang terus memberikan dukungan

dan doanya padaku.

Para pendidik yang telah mendidik dan membimbing dengan penuh kesabaran danketelatenan.

Sahabat-sahabat seangkatan selama menempuh pendidikan yang telahmemberikan warna setiap harinya.

Almamater Universitas Lampung tercinta

SANWACANA

Alhamdulillahi Robbil ‘Alamin, puji syukur kehadirat Allah SWT Yang Maha

Pengasih dan Maha Penyayang, atas rahmat dan karunia-Nya sehingga penulis

dapat menyelesaikan penyusunan tesis yang berjudul “Pengembangan instrument

assessment for learning dengan politomus response pada mata pelajaran

matematika jenjang Sekolah Menengah Kejuruan” sebagai syarat untuk mencapai

gelar Magister pendidikan pada Fakultas Keguruan dan Ilmu Pendidikan,

Universitas Lampung.

Penulis menyadari sepenuhnya bahwa terselesaikannya penyusunan tesis ini tidak

terlepas dari bantuan berbagai pihak. Oleh karena itu, penulis mengucapkan

terima kasih yang tulus ikhlas kepada:

1. Bapak Dr. Sugeng Sutiarso, M.Pd., selaku Dosen Pembimbing I dan Ketua

Program Studi Magister Pendidikan Matematika yang telah bersedia

meluangkan waktunya untuk membimbing, sumbangan pemikiran, kritik, dan

saran selama penyusunan tesis, sehingga tesis ini menjadi lebih baik.

2. Bapak Dr. Undang Rosidin, M.Pd., selaku Dosen Pembimbing II yang telah

bersedia meluangkan waktunya untuk konsultasi dan memberikan bimbingan,

memberikan perhatian, dan memotivasi selama penyusunan tesis sehingga

tesis ini menjadi lebih baik.

3. Ibu Dr. Een Yayah Haenilah, M.Pd., selaku dosen pembahas yang telah

memberikan masukan, kritik, dan saran kepada penulis.

4. Bapak Drs. Suharsono S, M.Sc., Ph.D., dan Ibu Dr. Rochmiyati, M.Pd selaku

validator dalam penelitian ini yang telah banyak memberikan saran dan

masukan untuk memperbaiki Instrumen Assessment for Learning ini agar

menjadi lebih baik.

5. Bapak Prof. Dr. Patuan Raja, M.Pd., selaku Dekan FKIP Universitas

Lampung, beserta staf dan jajarannya yang telah memberikan bantuan kepada

penulis dalam menyelesaikan tesis ini.

6. Bapak Prof. Drs. Mustofa, M.A., Ph.D. selaku Direktur Program Pascasarjana

Universitas Lampung, beserta staf dan jajarannya yang telah memberikan

perhatian dan arahan kepada penulis dalam menyelesaikan tesis.

7. Bapak dan Ibu dosen Magister Pendidikan Matematika di Fakultas Keguruan

dan Ilmu Pendidikan yang telah memberikan bekal ilmu pengetahuan kepada

penulis.

8. Bapak Restu Risntano, ST,M.Si, selaku Kepala SMK Mitra Bhakti Bandar

Sribhawono beserta Wakil, staff, dan karyawan yang telah memberikan

kemudahan selama penelitian.

9. Bapak Sugeng, M.Pd, selaku Kepala SMK Praja Utama Bandar Sribhawono

beserta Wakil, staff, dan karyawan yang telah memberikan kemudahan selama

penelitian.

10. Bapak Suprapto, S.Pd.,MM., selaku Kepala SMK Ma’arif 2 Penawaja

Sekampung Udik beserta Wakil, staff, dan karyawan yang telah memberikan

kemudahan selama penelitian.

11. Peserta didik kelas XI SMK Lampung Timur Tahun Pelajaran 2017/2018, atas

semangat dan kerjasamanya.

12. Almamater tercinta yang telah mendewasakanku.

Semoga dengan kebaikan, bantuan, dan dukungan yang telah diberikan pada

penulis, mendapat balasan pahala yang setimpal dari Allah SWT dan semoga tesis

ini dapat bermanfaat.

Bandar Lampung, Februari 2019

Penulis

Aan Sulistiawan

DAFTAR ISI

Halaman

DAFTAR TABEL ...................................................................................... xiv

DFTAR GAMBAR ..................................................................................... xv

DAFTAR LAMPIRAN .............................................................................. xvi

I. PENDAHULUAN

A. Latar Belakang Masalah ............................................................... 1

B. Rumusan Masalah ........................................................................ 9

C. Tujuan Penelitian .......................................................................... 9

D. Manfaat Penelitian ........................................................................ 10

II. TINJAUAN PUSTAKA

A. Pembelajaran Matematika ............................................................ 11

1. Teori Belajar Matematika ....................................................... 11

2. Tujuan Pendidikan Matematika .............................................. 13

B. Penilaian ....................................................................................... 17

C. Taksonomi Bloom ........................................................................ 18

D. Instrumen Penilaian ...................................................................... 20

E. Assessment for Learning Dalam Pembelajaran ............................ 23

F. Instrumen Pilihan Ganda Beralasan ............................................. 25

G. Item Response Theory ................................................................... 27

H. Validitas Tes ................................................................................. 38

I. Reliabilitas Tes ............................................................................. 43

J. Kerangka Berpikir ....................................................................... 44

III. METODE PENELITIAN

A. Jenis Penelitian ............................................................................ 47

B. Subjek Penelitian ......................................................................... 47

C. Prosedur Pengembangan .............................................................. 49

D. Teknik dan Instrumen Pengumpulan Data ................................... 55

E. Teknik Analisis Data ................................................................... 56

IV. HASIL PENELITIAN DAN PEMBAHASAN

A. Hasil Pengembangan Produk Awal .............................................. 62

1. Merumuskan materi matematika kelas X ............................... 63

2. Menyusun kisi-kisi tes ............................................................ 63

3. Menyusun spesifikasi butir soal ............................................. 64

4. Menulis butir soal ................................................................... 64

xiii

5. Menelaah butir soal ................................................................ 65

B. Hasil Uji Coba Produk ................................................................. 66

1. Hasil Uji Validasi Ahli dan Reliabilitas ................................. 67

2. Hasil Uji Asumsi Rasch .......................................................... 69

a. Uji Asumsi Unidimensi .................................................... 69

b. Uji Asumsi Independensi Lokal ....................................... 71

c. Kecocokan Butir (Item Fit)............................................... 72

d. Tingkat Kesukaran Butir (Item dificulty).......................... 74

e. Fungsi Informasi dan Kesalahan Pengukuran .................. 77

C. Revisi Produk ............................................................................... 79

D. Kajian Produk Akhir ..................................................................... 79

1. Konstruksi Instrumen ............................................................. 80

a. Validitas isi dan konstruk ................................................. 80

b. Reliabilitas ........................................................................ 82

2. Karakteristik Butir Instrumen ................................................. 83

a. Tingkat kesukaran............................................................. 83

b. Fungsi informasi dan kesalahan pengukuran ................... 83

E. Pebahasan Pengembangan Instrumen Assessment for Learning .. 84

1. Prosedur Pengembangan Instrumen Assessment for learning 84

2. Kualitas Instrumen Assessment for learning .......................... 85

3. Hasil Analisis Instrumen Assessment for learning ................. 86

4. Deskripsi Kemampuan Peserta Didik ..................................... 104

F. Keterbatasan Penelitian ................................................................ 108

V. KESIMPULAN DAN SARAN

A. Kesimpulan ................................................................................ 111

B. Saran .......................................................................................... 112

DAFTAR PUSTAKA

LAMPIRAN

DAFTAR TABEL

Tabel Halaman

2.1 Tabel Kontingensi untk Menghitung Indeks Gregory........................ 423.1 Kriteria Penskoran Jawaban ............................................................... 563.2 Kriteria Penilaian Butir Instrumen oleh Validator ............................. 573.3 Kriteria Cronbach’s Alpha ................................................................. 593.4 Kategori Tingkat Kesukaran............................................................... 603.5 Rentang Nilai IMS dan OMS ............................................................. 614.1 Kisi-kisi Instrumen Assessment for Learning Matematika................. 644.2 Subjek Uji Coba ................................................................................. 674.3 Index Gregory Butir Soal ................................................................... 684.4 Hasil Uji KMO dan Bartlet................................................................. 704.5 Total Variance Explained ................................................................... 704.6 Hasil Uji Asumsi Independensi Lokal................................................ 724.7 Kecocokan Butir Terhadap Model ..................................................... 734.8 Tingkat Kesukaran Butir .................................................................... 744.9 Skor Hasil Hasil Uji Coba .................................................................. 1024.10 Kategorisasi Kemampuan Peserta Didik ............................................ 105

DAFTAR GAMBAR

Gambar Halaman

2.1 Perubahan dari Kerangka Pikir Asli ke Revisi (Anderson danKrathwohl, 2001:268)......................................................................... 20

2.2 Mekanisme Pengembangan Instrumen Evaluasi ................................ 463.1 Langkah Pengembangan..................................................................... 544.1 Scree Plot Unidimensi ........................................................................ 714.2 Item Difficult Map .............................................................................. 764.3 Grafik Fungsi Informasi Dan Kesalahan Pengukuran........................ 774.4 Jawaban Peserta Didik Soal No. 1...................................................... 874.5 Jawaban Peserta Didik Soal No. 2...................................................... 884.6 Jawaban Peserta Didik Soal No. 3...................................................... 894.7 Jawaban Peserta Didik Soal No. 4...................................................... 904.8 Jawaban Peserta Didik Soal No. 5...................................................... 91

DAFTAR LAMPIRAN

Lampiran Halaman

1. Kisi-Kisi Instrumen Paket A ................................................................. 1162. Kisi-Kisi Instrumen Paket B ................................................................. 1323. Instrumen Tes Paralel Paket A.............................................................. 1484. Instrumen Tes Paralel Paket B .............................................................. 1625. Kunci Jawaban Instrumen Tes Paket A ................................................ 1736. Kunci Jawaban Instrumen Tes Paket B................................................. 1857. Lembar Validasi Para Ahli.................................................................... 1978. Hasil Analisis Indeks Gregory .............................................................. 2549. Hasil Analisis Uji Coba......................................................................... 25610. Hasil Analisis Faktor Menggunakan Program SPSS............................. 25811. Hasil Uji Asumsi Independendi Lokal.................................................. 26012. Hasil Analisis Kecocokan Butir Soal (Item Fit) ................................... 26213. Hasil Analisis Tingkat Kesukaran Butir (Item Difficulty)..................... 26314. Hasil Analisis Fungsi Informasi Tes dan Kesalahan Baku Pengukuran 26415. Kegiatan Uji Coba Penelitian................................................................ 269

I. PENDAHULUAN

A. Latar Belakang

Perbaikan pendidikan dengan mengubah kurikulum menjadi kurikulum 2013

dilakukan pemegang kekuasaan dalam bidang pendididikan dilakukan

dikarenakan dalam pembelajaran peserta didik kurang didukung untuk

mengembangkan kemampuan berpikir dan membangun pemahaman konsepnya.

Kurikulum merupakan rencana atau program yang menyangkut seluruh

pengalaman yang dihayati peserta didik dibawah pengarahan oleh sekolah. Sesuai

dengan Permendikbud No. 60 Th 2014, bahwa pengembangan kurikulum di

Indonesia saat ini yaitu Kurikulum 2013 diterapkan di seluruh jenjang pendidikan.

Implementasi Kurikulum 2013 mempunyai beberapa perubahan, salah satunya

dalam sistem penilaian belajar. Penilaian ditekankan pada hasil dan proses

pembelajaran peserta didik. Kurikulum 13 menuntut dimana proses pembelajaran

aktif meliputi mengamati, menanya, mengumpulkan data, mengasosiasi, dan

menyimpulkan. Dengan adanya pedoman baru dalam kurikulum 2013 tersebut,

proses pembelajaran di Indonesia harus mengikutsertakan siswa dalam

mengonstruk pengetahuan mereka sendiri secara aktif. Peserta didik berperan aktif

dalam proses pembelajaran bagi diri mereka sendiri. Mereka akan memilih

informasi dan menyusun maknanya sendiri dari informasi yang mereka pilih.

2

Proses pembelajaran kurikulum 2013 mengharuskan guru merancang kegiatan

yang menuntut peserta didik sampai pada suatu setting pembelajaran dengan

kesatuan mendasar, tujuan-tujuan mereka, pengalaman-pengalaman sebelumnya,

dan mereka akan menggunakan seluruh hal ini untuk memahami informasi yang

mereka peroleh. Proses pemahaman yang sangan konstruktif ini meliputi

pengaktifan pengetahuan terdahulu. Seperti halnya dengan proses-proses kogniti

yang bekerja pada pengetahuan ini.

Kegiatan pembelajaran yang terpusat pada siswa, meskipun setiap siswa mendapat

perlakuan yang sama, mereka dapat membentuk pengetahuan mereka sendiri yang

berbeda dengan harapan guru. Pengetahuan yang dikonstruksi tersebut bisa

menjadi salah karena adanya keterbatasan pada diri siswa tersebut atau dapat

bercampur dengan gagasan-gagasan lain. Hal ini disebabkan karena siswa belum

terbiasa mengonstruksi konsep dengan benar dan belum mempunyai kerangka

ilmiah yang dapat digunakan sebagai acuan.

Siswa yang telah memahami konsep dapat terukur dari hasil belajar yang baik.

Hasil belajar tersebut diberian oleh guru pada setiap kurun waktu tertentu. Hasi

belajar yang rendah mengindikasikan adanya kesulitan dalam proses belajar

siswa, sehingga mempengaruhi tingkat pemahaman siswa. Hasil belajar juga

dipengaruhi oleh gagasan awal siswa yang yang dibawa ke dalam proses

pembelajaran.

Pendidik dapat melaksanaan penilaian hasil belajar salah satu caranya dengan

memberikan tes dalam proses kegiatan belajar mengajar. Arikunto (2012: 67)

mengemukakan bahwa tes adalah alat atau prosedur yang digunakan untuk

3

mengetahui atau mengukur sesuatu dalam suasana, dengan cara aturan-aturan

yang sudah ditentukan. Tujuan dari melakukan tes adalah untuk mengetahui

pencapaian belajar atau kompetensi peserta didik, dan dapat memberikan

informasi tentang kemampuan kognitif atau keterampilan peserta didik.

Tes menjadi salah satu aspek yang sangat penting dalam pelaksanaan proses

belajar mengajar. Tes yang dikatakan baik apabila mampu mengukur apa yang

seharusnya diukur dan dapat memberikan hasil yang dapat dipercaya. Kegiatan

preses belajar mengajar saling berkaitan erat dengan sistem penilaian. Penilaian

dalam proses belajar mengajar dilakukan dalam tiga aspek yaitu aspek kognitif,

aspek afektif, dan aspek pesikomotorik.

Tes hasil belajar merupakan bentuk tes yang digunakan untuk menilai hasil

belajar siswa tentang materi pelajaran yang telah diberikan guru kepada murid-

muridnya dalam jangka waktu tertentu. Tes yang dilaksanakan pada akhir

semester disebut tes sumatif atau dikenal dengan sebutan ulangan umum.

Sedangkan tes yang dilaksanakan untuk memperbaiki proses pembelajaran yang

sedang atau yang sudah dilaksanakan disebut tes formatif atau ulangan harian.

Tes hasil belajar yang digunakan guru biasanya dibagi lagi menjadi tes subjektif

dan tes objektif. Tes subyektif untuk mengukur kemampuan siswa dalam hal

menganalisasi pikirannya, mengemukakan kata-kata atau kalimat siswa sendiri.

Sedangkan tes objektif pilihan ganda dapat mengukur kemampuan intelektual atau

kognitif, afektif dan psikomotor. Istilah lain untuk menyebut tes formatif dan

objektif yaitu Assessment for learning untuk tes formatif, dan Assessment of

learning untuk tes objektif.

4

Tes pilihan ganda merupakan salah satu bentuk tes selected response yang luas

penggunaannya untuk berbagai macam keperluan, misalnya: ulangan umum, ujian

akhir nasional, survey internasional seperti Trends in Mathematics and Science

Study (TIMSS) maupun Programme for International Student Assessment (PISA),

tes bahasa Inggris yang diselenggarakan oleh lembaga testing di luar negeri

seperti TOEFL, IELTS, TOEIC, GRE, dan bakat skolastik. Hal tersebut tidak

terlepas dari keunggulun tes pilihan ganda yang efektif untuk mengukur berbagai

jenis pengetahuan dan hasil belajar yang kompleks. Tes pilihan gandat sangat

tepat untuk ujian yang pesertanya banyak dan hasilnya harus segera diumumkan,

serta karena jumlah dapat banyak maka faktor reliabilitas bertambah. Namun

rupanya terdapat beberapa kelemahan, yaitu: siswa tidak mempunyai keleluasaan

dalam menulis, mengorganisasikan, dan mengekspresikan gagasan yang mereka

miliki yang dituangkan ke dalam kata atau kalimatnya sendiri; tidak dapat

digunakan untuk mengukur kemampuan problem solving; sangat sensitif terhadap

terkaan; penyusunan tes yang baik memerlukan waktu yang relatif lama

dibandingkan dengan bentuk tes yang lainnya; serta sangat sukar menentukan

alternatif jawaban (distraktor) yang benar-benar homogen, logis, dan berfungsi.

Sampai saat ini tes yang digunakan untuk mengukur kemampuan peserta didik

berupa soal bentuk tes pilihan ganda. Walaupun tes objektif pilihan ganda dapat

digunakan untuk mengukur semua proses berpikir dalam ranah kognitif mulai dari

berpikir sederhana (ingatan) sampai dengan jenjang berpikir tinggi (kreasi). Tetapi

pada kenyataannya butir soal yang diujikan kebanyakan hanya mengukur proses

berpikir rendah, sehingga sukar untuk mengetahui kemampuan pada ranah

berpikir tinggi.

5

Soal pilihan ganda memiliki pilihan jawaban yang disediakan menyebabkan

kemungkinan besar peserta didik hanya mengandalkan intuisi bahkan tebakan.

Selain itu peserta didik tidak dapat mengorganisasi, menghubungkan, dan

menyatakan idenya karena jawaban telah disediakan. Akibatnya pendidik tidak

dapat mengidentifikasi kesulitan dan tingkat pemahaman peserta didik terhadap

materi yang telah dipelajari.

Bentuk tes uraian atau essay merupukan alat alat penilaian hasil belajar yang

paling tua. Secara umum tes uraian adalah pertanyaan yang menuntut siswa

menjawabnya dalam bentuk menguraikan, menjelaskan, mendiskusikan,

membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan

tuntutan pertanyaan dengan menggunakan kata – kata dan bahasa sendiri. Dengan

demikian, dalam tes ini dituntut kemampuan siswa dalam hal mengekspresikan

gagasannya melalui bahasa tulisan.

Adapun kelebihan atau keunggulan tes uraian ini yaitu dapat terlatih kemampuan

berpikir teratur atau penalaran, yakni berfikir logis, analitis, dan sistematis. Serta

dapat mengembangkan keterampilan pemecahan masalah (problem solving) bagi

peserta didik. Namun dilain pihak kelemahan atau kekurangan yang terdapat

dalam tes ini, yaitu, pemeriksaannya memerlukan waktu lama sehingga tidak

praktis bagi kelas yang jumlah siswanya relatif besar serta tidak dapat

sembarangan orang melakukan pemerikasaan jawaban. Bahkan dalam tes ini

sifatnya bisa sangat subjektif, baik dalam menanyakan, dalam membuat

pertanyaan, maupun dalam cara memeriksanya.

6

Pakar pendidikan, Mardapi (2008: 5) mengungkapkan bahwa hasil penilaian yang

baik akan memberikan informasi penting yang akan mendorong pendidik untuk

merancang pembelajaran yang lebih baik. Selain itu hasil penilaian yang baik juga

akan memberikan motivasi kepada peserta didik. Penilaian yang sering dilakukan

oleh guru-guru di Indonesia adalah penilaian sumatif atau Assessment of Learning

yang digunakan untuk mendapat skor atau prestasi belajar siswa tanpa adanya

usaha perbaikan pembelajaran. Penilaian yang dapat digunakan untuk

memperbaiki kualitas pembelajaran adalah penilaian formatif atau Assessment for

Learning.

Fakta dilapangan menunjukkan guru mengalami kesulitan dalam penilaian belajar

terutama dalam penilaian hasil belajar terutama penilaian formatif/proses sehingga

pelaksanaannya belum optimal. Faktor penghambat pelaksanaan penilaian

formatif yaitu metode, pemanfaatan hasil dan peserta didik. Informasi dari guru

juga memberikan indikasi lemahnya kemampuan peserta didik. Kelemahan

tersebut dapat terlihat ketika peserta didik dihadapkan pada soal-soal kurang

mampu mengungkapkan gagasan. Dan selama ini, guru masih belum pernah

membuat tes yang difokuskan untuk mengukur kemampuan peserta didik. Pada

umumnya tes yang dilakukan oleh guru hanya bertujuan untuk memberikan

penilaian pada peserta didik tanpa memperhatikan penguasaan matematika.

Padahal apabila asesmen dilakukan secara tepat akan mampu meningkatkan

penguasaan matematika.

Pengembangan instrumen penilaian sebagai variasi bentuk tes sangat penting.

Selain variasi tes, kualitas butir tes juga menjadi pertimbangan dalam pelaksanaan

7

tes. Instrumen tes yang baik merupakan tes yang dapat mengukur apa yang

hendak akan diukur oleh pendidik, yaitu untuk mengetahui tingkat penguasaan

dan pemahaman peserta didik. Guru membutuhkan cara yang efisien untuk

mendiagnosa letak kesalahan konsep peserta didik. Identifikasi kesalahan konsep

dapat dilakukan dengan berbagai jenis tes. Alternatif tes yang dapat mengukur

kemampuan atau kompetensi peserta didik dalam hal ini mengukur tingkat

pemahamannya adalah dengan menggunakan tes pilihan ganda beralasan. Tes

tersebut berisi soal yang memuat alasan bagi peserta didik atas jawaban dari

pertanyaan yang diberikan.

Pada tes pilihan ganda beralasan ini, peserta didik di minta memilih jawaban yang

benar kemudian mengemukakan alasan yang mendasari jawabannya tersebut. Soal

pilihan ganda yang disertai dengan alasan sebagai penjelasan atas jawaban yang

dipilih, lebih efektif dalam mengidentifikasi masalah yang adal dalam

pembelajaran. Ada dua bentuk soal tes pilihan ganda beralasan. Soal tes bentuk

pertama, pilihan ganda beralasan tertutup dengan alasan jawaban sudah

disediakan pada soal. Soal bentuk ini lebih dikenal dengan soal pilihan ganda dua

tingkat. Soal tes betuk kedua, pilihan ganda beralasan terbuka yaitu soal yang

hanya membuat tingkat pilihan ganda yang alasan pilihan jawabnya dituliskan,

sehingga peserta didik menguraikan alasan secara langsung. Alasan dituliskan

oleh peserta didik agar tidak membatasi pemahaman yang diterima. Apabila

menjawab soal dengan benar dan disertai dengan alasan yang tepat, maka dapat

dikatakan bahwa peserta didik memiliki tingkat pemahaman yang baik. Dan

sebaliknya, apabila peserta didik menjawab soal dengan benar namun alasan yang

diberika kurang tepat, maka dapat dikatakan bahwa kompetensi atau tingkat

8

pemahaman peserta didik kurang baik. Hal ini disesuikan dengan indikator

pencapaian kompetensi yang telah dikembangkan sebelumnya.

Dengan menggunakan instrumen tes jawaban beralasan terbuka, guru dapat

mengetahui letak penguasaan materi pembelajaran yang sering terjadi kesalahan

konsep didalamnya. Selain itu, guru dapat mengetahui kategori pemahaman siswa

dari jawaban siswa dalam kategori ketidakpahaman konsep atau dari menebak.

Oleh karena itu dengan penggunaan tes jawaban beralasan terbuka ini diharapkan

dapat mengidentifikasi letak kesalahan pada konsep yang diujikan.

Merujuk pada fakta-fakta di atas memang tidak menggambarkan kondisi

pelaksanaan penilaian secara keseluruhan di Indonesia, tetapi hal ini menunjukkan

bahwa terdapat sedikit permasalahan terkait dengan pelaksanaan penilaian yang

perlu diselesaikan. Salah satu masalahnya yaitu belum adanya butir-butir tes yang

dapat mengukur kemampuan kompetensi peserta didik, dan tentang sejauh mana

tingkat pemahaman mereka terhadap materi yang telah diberikan. Pengembangan

instrumen penilaian dengan politomus response atau jawaban beralasan pada mata

pelajaran matematika menjadi sangat penting untuk dilakukan. Hal ini

dikarenakan bahwa butir-butir tes dengan politomus response memiliki bukti

validitas, reliabilitas, dan parameter-parameter butir yang baik untuk mengukur

kompetensi peserta didik.

Bentuk soal pilihan ganda dan essay masing-masing memiliki keunggulan dan

kelemahan, yakni bentuk soal pilihan ganda lebih objektif dan menghemat waktu

namun tidak bisa menggambarkan kemampuan siswa secara menyeluruh. Bentuk

soal essay dapat menggambarkan kemampuan siswa yang sebenarnya, namun

9

pemeriksaanya terkesan subjektif. Berdasarkan keunggulan dan kelemahan dari 2

bentuk soal tersebut, maka dalam penelitian akan dikembangkan Instrumen

assessment for learning dalam bentuk pilihan ganda beralasan dengan tujuan

untuk tetap mengakomodir kedua bentuk soal tersbut. Solusi tersebut kemudian

diterjemahkan dalam penelitian yang berjudul “Pengembangan Instrumen

Assessment for Learning dengan Politomus Response Pada Mata Pelajaran

Matematika Jenjang Sekolah Menengah Kejuruan”.

B. Rumusan Masalah

Berdasarkan identifikasi masalah, rumusan masalah dalam penelitian ini adalah

sebagai berikut.

1. Bagaimana proses dan hasil pengembangan instrumen assessment for learning

dengan politomus respons (jawaban beralasan) pada mata pelajaran

matematika jenjang Sekolah Menengah Kejuruan?

2. Apakah instrumen yang dikembangkan ini memiliki parameter butir instrumen

assessment for learning dengan politomus response yang berkualitas?

C. Tujuan Penelitian

Berdasarkan rumusan masalah yang diangkat, maka penelitian ini bertujuan yaitu.

1. Menghasilkan instrumen assessment for learning dengan politomus respons

(jawaban beralasan) pada mata pelajaran matematika jenjang Sekolah

Menengah Kejuruan yang dapat diterima peserta didik dan guru jenjang

SMK.

2. Mengetahui kualitas instrumen assessment for learning dengan politomur

response berdasarkan parameter butir.

10

D. Manfaat Penelitian

Pengembangan instrumen evaluasi ini diharapkan memberikan hasil yang dapat

dimanfaatkan secara teoritis dan praktis.

1. Manfaat teoritis

a. Mengembangkan khazanah keilmuan di bidang instrumen evaluasi untuk

mengukur keterampilan berpikir tingkat tinggi dengan indikator menganalisis,

mengevaluasi, dan menciptakan.

b. Sebagai sumbangsih pengembangan pendidikan dalam memberikan alternatif

penggunaan instrumen evaluasi pada materi bilangan riil.

2. Manfaat praktis

a. Alternatif untuk model penilaian yang digunakan dalam Ujian Sekolah

Berbasis Nasional

b. Peserta didik dapat mengukur kemampuan kognitif pada materi bilangan riil

yang telah dikuasai.

c. Guru dapat memanfaatkan hasil penelitian sebagai informasi dan wawasan

dalam mengembangkan instrumen evaluasi pembelajaran kedepannya.

d. Peneliti memperoleh pengalaman langsung dalam mengembangkan instrumen

evaluasi sebagai alat ukur kemampuan kognitif.

e. Sebagai bahan pertimbangan untuk penelitian lebih lanjut baik pada tema yang

sama maupun yang berbeda.

II. KAJIAN TEORI

A. Pembelajaran Matematika

1. Teori Belajar Matematika

Matematika merupakan salah satu disiplin ilmu yang dapat meningkatkan

kemampuan berpikir dan beragumentasi, memberikan kontribusi dalam

penyelesaian masalah sehari-hari dan dalam dunia kerja, serta memberikan

dukungan dalam pengembangan ilmu pengetahuan dan teknologi. Kebutuhan

akan aplikasi matematika saat ini dan masa depan tidak hanya untuk keperluan

sehari-hari, tetapi juga dalam dunia kerja, dan untuk mendukung perkembangan

ilmu pengetahuan. Berdasarkan Lampiran Permendikbud nomor 60 tahun 2014

matematika adalah ilmu universal yang berguna bagi kehidupan manusia,

mendasari perkembangan teknologi modern, berperan dalam berbagai ilmu, dan

memajukan daya pikir manusia. Sejalan dengan hal tersebut Ruseffendi (2006)

mengungkapkan bahwa matematika diajarkan di sekolah karena matematika

berguna dalam memecahkan persoalan kehidupan sehari-hari dan persoalan lain.

Saat guru memberikan soal cerita kepada siwa yang sederhana dan dirancang

sedemikan rupa, membuat siswa dapat mengembangkan strategi dalam

menyelesaikan masalah.

Reedal (2010:16) menyatakan bahwa teori tahapan perkembangan Jean Peaget

dapat diaplikasikan dalam tahapan pembelajaran matematika terdapat 4 tahapan.

12

Tahap yang pertama adalah tahap sensori motor yang dalam perkembangan

kognitif piaget peserta didik akan terbatas pada bagaimana mereka anak

membandingkan atau mengkomparasikan objek atau situasi. Dalam tahap

kemampuan matematikanya anak akan mampu mengkomparasikan sesuatu

misalnya membandingkan ukuran mainan. Tahap kedua adalah tahap pra-

oprasional, dimana tahap ini memungkinkan sedikit pemahaman lebih jauh

tentang bagaimana membandingkan lebih banyak objek ataupun situasi namun

masih dibatasi sesuatu yang konkrit. Tahap ini dapat dicontohkan dengan salah

satu studi Piaget dengan memberikan pada peserta didik untuk mengkonservasi

atau membandingkan kontainer dengan tinggi dan lebar yang sama. Tahap ketiga

adalah tahap oprasional dasar, dimana pada tahapan ini peserta didik dapat

membandingkan dua wadah berbeda secara akurat dan memahami bahwa jika

suatu zat cair jika dituangkan pada wadah yang berbeda tidak mengurangi isi dari

zat cair tersebut. Tahap terakhir adalah tahap oprasional formal, adapun ada tahap

ini peserta didik jauh lebih memahami bagaimana membandingkan situasi

matematika yang berbeda. Pada tahap ini peserta didik sudah lebih mengerti

tentang permasalahan yang bersifat konkrit, mereka juga sudah mampu

membandingkan pecahan, kemungkinan berbagai peristiwa atau masalah, dan

himpunan tak hingga.

Bruner (Karso, dkk 2009: 1.12), menekankan bahwa setiap individu pada waktu

tertentu mengalami atau mengenal peristiwa atau benda di dalam lingkungannya,

menemukan cara untuk menyatakan kembali peristiwa atau benda tersebut di

dalam pikirannya, yaitu suatu model mental tentang peristiwa atau benda yang

dialaminya atau dikenalnya. Lebih lanjut Bruner menjelaskan proses tersebut

13

sebagai proses belajar yang setiap tahapan prosesnya akan dijelaskan sebagai

berikut.

a. Tahap Enaktif atau Tahap Kegiatan (Enactive)

Tahap ini adalah tahap dimana seoarang anak akan mempelajari konsep yang

berhubungan dengan benda nyata atau peristiwa yang terjadi di dunia sekitarnya.

Tahap enaktif juga akan menjadikan anak mampu menyusun, mengutak-atik,

mensejajarkan, memanipulasi suatu bentuk gerakan atau gerak reflek.

b. Tahap Ikonik atau Tahap Gambar Bayangan (Iconic)

Tahap ikonik ditandai dengan kemampuan anak yang dapat memberikan

gambaran atau membayangkan kembali dalam pikirannya mengenai suatu

peristiwa atau benda yang dialami atau dikenalnya.

c. Tahap simbolik (Symbolic)

Tahap simbolik merupakan tahap dimana anak mampu memahami simbol-simbol

dan menjelaskan simbol tersebut dengan bahasnya sendiri.

Berdasarkan uraian diatas terdapat beberapa pendapat tentang teori belajar

matematika dari para ahli. Pendapat real tentang teori belajar matematika sejalan

dengan pendapat Piaget tentang perkembangan kognitif peserta didik yang

memiliki 4 tahapan yaitu tahap sensori motor, tahap pra-oprasional, tahap

oprasional, dan tahap oprasional formal (Makmun, 2002:104). Berdasarkan

pendapat ahli tersebut dapat disimpulkan bahwa pada pembelajaran matematika

terdapat tahapan proses belajar secara bertahap yang dimulai dari sesuatu yang

real atau konkrit menuju ke abstrak.

14

2. Tujuan Pendidikan Matematika

Pembelajaran matematika SMK berorentasi pada tercapainya tujuan pembelajaran

matematika yang telah ditetapkan dalam Kurikulum 2013. Tujuan yang dimaksud

bukan penguasaan materi saja, tetapi proses untuk mengubah tingkah laku siswa

sesuai dengan tujuan pembelajaran matematika yang akan dicapai. Chambers

(2008:11) memaparkan bahwa pembelajaran matematika dibagi menjadi 10 tujuan

yaitu:

a) Membaca dan memahami bagian-bagian matematika,

b) Mengomunikasikan secara jelas dan urut menggunakan media yang sesuai,

c) Bekerja secara jelas dan logis menggunakan notasi dan bahasa yang cocok,

d) Menggunakan metode yang sesuai untuk memanipulasi bilangan dan simbol-

simbol,

e) Mengoperasikan secara nyata dan imajiner,

f) Mengaplikasikan urutan mengerjakan, memeriksa, memprediksi, menguji,

menggeneralisasi dan membuktikan,

g) Mengkonstruksikan dan menguji mode matematika dari situasi nyata,

h) Menganalisis masalah dan memilih teknik untuk menyelesaikan yangsesuai,

i) Menggunakan keterampilan matematika dalam kehidupan sehari-hari,

j) Menggunakan alat-alat secara mekanik.

Menurut Mathematical Sciences Education Board-National Research Council

(Wijaya, 2012: 7), terdapat empat tujuan pendidikan matematika ditinjau dalam

lingkungan sosial, meliputi:

a) Tujuan Praktis

15

Tujuan praktis dari matematika ialah berkaitan pengembangan kemampuan siswa

dalam mengaplikasikan matematika untuk menyelesaikan masalah dalam

kehidupan sehari-hari.

b) Tujuan Kemasyarakatan

Tujuan pendidikan matematika ini yaitu mengupayakan pengembangan

kemampuan siswa untuk berpartisipasi secara aktif dan cerdas dalam hidup

bermasyarakat. Sudah saatnya pendidikan matematika tidak hanya

mengembangkan kemampuan kognitif siswa namun pendidikan matematika juga

harus dapat mengembangkan kemampunan sosial siswa.

c) Tujuan Profesional

Tujuan profesional dari pendidikan matematika berorientasi pada mempersiapkan

siswa untuk terjun di dunia kerja. Seperti kita ketahui seluruh jenis pekerjaan yang

ada sekarang baik langsung maupun tidak langsung menuntut kemampuan

matematika.

d) Tujuan Budaya

Pendidikan merupakan suatu bentuk budaya dan diharapkan pendidikan

matematika dapat dijadikan bagian dari suatu budaya manusia sehingga berperan

dalam mengembangkan kebudayaan.

Sementara itu berdasarkan Lampiran Permendikbud nomor 60 tahun 2014,

pembelajaran matematika memiliki tujuan sebagai berikut:

a) Dapat memahami konsep matematika, yaitu menjelaskan keterkaitan antar

konsep dan menggunakan konsep maupun algoritma, secara luwes, akurat,

efisien, dan tepat, dalam pemecahan masalah.

16

b) Menggunakan pola sebagai dugaan dalam penyelesaian masalah, dan mampu

membuat generalisasi berdasarkan fenomena atau data.

c) Menggunakan penalaran pada sifat, melakukan manipulasi matematika baik

dalam penyederhanaan, maupun menganalisa komponen yang ada dalam

pemecahan masalah.

d) Mengomunikasikan gagasan, penalaran serta mampu menyusun bukti

matematika dengan menggunakan kalimat lengkap, simbol, tabel, diagram,

atau media lain untuk memperjelas keadaan atau masalah.

e) Memiliki sikap menghargai kegunaan matematika dalam kehidupan, yaitu

memiliki rasa ingin tahu, perhatian, dan minat dalam mempelajari matematika,

sikap ulet dan percaya diri dalam pemecahan masalah.

f) Memiliki sikap dan perilaku yang sesuai dengan nilai-nilai dalam matematika

dan pembelajarannya, seperti taat azas, konsisten, menjunjung tinggi

kesepakatan, toleran, menghargai pendapat orang lain, santun, demokrasi, ulet,

tangguh, kreatif, menghargai kesemestaan (konteks, lingkungan), tanggung

jawab, adil, jujur, teliti, dan cermat.

g) Melakukan kegiatan motorik menggunakan pengetahuan matematika.

h) Menggunakan alat peraga sederhana maupun hasil teknologi untuk melakukan

kegiatan-kegiatan matematik (Kemendikbud, 2014: 328)

Berdasarkan tersebut di atas terdapat pendapat tentang tujuan pendidikan

matematika. Adapun ahli memaparkan bahwa tujuan pendidikan matematika

meliputi tujuan praktis, tujuan kemasyarakatan, tujuan buadaya, dan tujuan

profesional. Adapun penekanan pembelajaran matematika pada tujuan tersebut

terletak pada penataan nalar, pemecahan masalah, pembentukan sikap, dan

17

keterampilan dan penerapan mattematika. Merujuk pada penekanan-penekanan

tersebut, maka sangat deperlukan adanya pengembangan instrumen assessment

for learning untuk siswa SMK.

B. Penilaian

Penilaian merupakan sebuah istilah yang sering digunakan dalam dunia

pendidikan dari istilah asing assessment. Selain penilaian dalam pendidikan ada

yang dinamakan tes dan pengukuran. Banyak yang mengartikan penilaian, tes,

dan pengukuran memiliki makna yang sama. Padahal penilaian, tes, dan

pengukuran merupakan sebuah proses yang hierarki dalam kegiatan evaluasi.

Penilaian merupakan proses untuk menentukan nilai kepada objek berdasarkan

kriteria tertentu. Dalam Permendikbud No. 23 Tahun 2016 dijelaskan bahwa

penilaian adalah proses pengumpulan dan pengolahan informasi untuk mengukur

pencapaian hasil belajar peserta didik.

Pelaksanaan assessment menggunakan berbagai cara dan beragam alat penilaian

untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau

ketercapaian kompetensi (rangkaian kemampuan) peserta didik. Penilaian

menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang

peserta didik. Hasil akhir penilaian dapat berupa nilai kualitatif (pernyataan naratif

dalam kata-kata) dan nilai kuantitatif (berupa angka). Penilaian hasil belajar pada

dasarnya adalah mempermasalahkan, bagaimana pengajar dapat mengetahui hasil

pembelajaran yang telah dilakukan.

Dalam kegiatan pembelajaran di sekolah, penilaian sangat penting untuk

dilakukan. Kegiatan penilaian ini dapat dilakukan sebelum pembelajaran, selama

18

pembelajaran, maupun setelah pembelajaran. Menurut Daryanto (2008 : 14-16)

jika ditinjau dari berbagai segi dalam sistem pendidikan, penilaian memiliki

empat tujuan yakni sebagai fungsi selektif artinya penilaian digunakan untuk

seleksi terhadap siswa, sebagai fungsi diagnostik artinya penilaian digunakan

untuk melihat kebaikan dan kelemahan siswa beserta penyebabnya, sebagai fungsi

penempatan artinya penilaian dapat digunakan untuk menempatkan siswa dalam

kelompok tertentu, dan sebagai fungsi pengukur keberhasilan artinya penilaian

dapat digunakan untuk mengetahui sejauh mana suatu program berhasil

diterapkan.

Dari berbagai macam pengertian mengenai penilaian dapat disimpulkan bahwa

penilaian merupakan suatu proses yang dilakukan melalui langkah-langkah

perencanaan, pengumpulan informasi melalui sejumlah bukti yang menunjukkan

pencapaian hasil belajar siswa, pelaporan, dan penggunaan informasi tentang hasil

belajar siswa.

C. Taksonomi Bloom

Taksonomi ialah klasifikasi atau pengelompokan benda menurut ciri-ciri tertentu.

Taksonomi dalam bidang pendidikan, digunakan untuk klasifikasi tujuan

instruksional; ada yang menamakannya tujuan pembelajaran, tujuan penampilan,

atau sasaran belajar, yang digolongkan dalam tiga klasifikasi umum atau ranah

(domain), yaitu: (1) ranah kognitif, berkaitan dengan tujuan belajar yang

berorientasi pada kemampuan berpikir; (2) ranah afektif berhubungan dengan

perasaan, emosi, sistem nilai, dan sikap hati); dan (3) ranah psikomotor

(berorientasi pada keterampilan motorik atau penggunaan otot kerangka).

19

Taksonomi Bloom ranah kognitif merupakan salah satu kerangka dasar untuk

pengkategorian tujuan-tujuan pendidikan, penyusunan tes, dan kurikulum di

seluruh dunia. Taksonomi pendidikan ini terkandung dalam buku The Taxonomy

of Educational Objectives The Classification of Educational Goals, Handbook I:

Cognitive Domain yang terbit pada tahun 1956 sebagai buah karya dari Benjamin

Samuel Bloom (editor), M.D. Engelhart, E.J. Furst, W.H. Hill, dan Krathwohl.

Kerangka pikir karya Benjamin Bloom dkk. berisikan enam kategori pokok

dengan urutan mulai dari jenjang yang rendah sampai dengan jenjang yang paling

tinggi, yakni: pengetahuan (knowledge); (2) pemahaman (comprehension); (3)

penerapan (application); (4) analisis (analysis); (5) sintesis (synthesis); dan (6)

evaluasi (evaluation).

Tingkatan-tingkatan dalam Taksonomi Bloom tersebut telah digunakan hampir

setengah abad sebagai dasar untuk penyusunan tujuan-tujuan pendidikan,

penyusunan tes, dan kurikulum di seluruh dunia. Kerangka pikir ini memudahkan

guru memahami, menata, dan mengimplementasikan tujuan-tujuan pendidikan.

Berdasarkan hal tersebut Taksonomi Bloom menjadi sesuatu yang penting dan

mempunyai pengaruh yang luas dalam waktu yang lama. Namun pada tahun 2001

terbit sebuah buku A Taxonomy for Learning, Teaching, and Assesing: A Revision

of Bloom’s Taxonomy of Educatioanl Objectives yang disusun oleh Lorin W.

Anderson dan David R. Krathwohl. Perubahan dari kerangka pikir asli ke

revisinya diilustrasikan pada Gambar 2.1.

20

Gambar 2.1. Perubahan dari Kerangka Pikir Asli ke Revisi (Anderson danKrathwohl, 2001:268)

D. Instrumen Penilaian

Dalam melakukan penilaian di dunia pendidikan, terdapat bermacam-macam alat

penilaian guna menilai proses dan hasil pendidikan yang telah dilakukan siswa.

Menurut Joni (1986; 6) penggunaan tes lebih banyak dijadikan sebagai alat ukur

penilaian dalam pendidikan dibandingkan alat penilaian yang lain. Daryanto

(2008; 35) mengungkapkan hal yang sama yakni tes lebih bersifat resmi dan

penuh dengan batasan-batasan. Tes terdiri atas sejumlah soal yang harus

dikerjakan siswa dan menghadapkan siswa pada suatu tugas untuk menanggapi

tugas atau soal tersebut. Ditinjau dari segi kegunaan untuk mengukur siswa,

Arikunto (2012; 33-41) membedakan atas tiga macam tes yaitu:

1. Tes diagnostik merupakan tes yang digunakan untuk mengetahui kesulitan-

kesulitan siswa sehingga berdasarkan hal tersebut dapat dilakukan penanganan

yang tepat. Tes ini dapat dilakukan di awal pembelajaran untuk mengetahui

pengetahuan awal siswa, di pertengahan proses pembelajaran untuk

menyelidiki bagian mana dari pembelajaran guru yang tidak dapat dipahami

21

oleh siswa dan bagian akhir untuk mengevaluasi tingkat penguasaan materi

terhadap bahan yang diberikan.

2. Tes formatif merupakan tes yang dilakukan di akhir program yang bertujuan

untuk mengetahui sejauh mana siswa telah mengikuti program tertentu. Tes

ini bisa disebut juga dengan tes diagnostik pada akhir pelajaran.

3. Tes sumatif merupakan tes yang dilaksanakan di akhir semester yang

bertujuan untuk menentukan nilai seseorang.

Tes sebagai alat ukur kemampuan siswa di bidang pendidikan memiliki perbedaan

yang fundamental dibandingkan alat ukur barang yang digunakan sehari-hari. Joni

(1986; 21-22) mengungkapkan bahwa alat ukur barang dapat digunakan secara

langsung atau setidaknya bisa diukur melalui variabel yang diketahui mempunyai

hubungan fungsional tertentu dengan variabel yang akan diukur, maka tidak

demikian halnya dengan alat ukur dalam pendidikan. Alat ukur dalam pendidikan,

salah satunya tes, tidak dapat langsung mengukur variabel yang akan diukur. Hal

ini dikarenakan respons siswa terhadap jawaban tes tidak selalu konsisten

mencerminkan kecakapan atau suasana batin seseorang oleh banyaknya faktor-

faktor yang juga mempengaruhi pencetusan tingkah yang nampak. Maka dari itu,

agar sebuah tes dapat mengukur apa yang hendak diukur, instrumen atau soal

yang diberikan pada sebuah tes perlu memenuhi komponen-komponen tolok ukur

(kriteria) tertentu. Makmun (2007; 196-198) menjelaskan syarat sebuah instrumen

tes yang layak sebagai berikut:

1. Memenuhi taraf ketepatan (validity) yang memadai. Artinya, instrumen tes

dapat mengukur apa yang hendak diukur. Hal ini dapat diidentifikasi dari

22

kesesuaian butir-butir soal dengan ruang lingkup dan jenjang materi atau

bahan ajar serta ruang lingkup aspek tertentu.

2. Memiliki taraf kemantapan sehingga hasil pengukuran dapat dipegang atau

dipercaya (reliability).

3. Memiliki kepraktisan untuk keperluan kemudahan administrasi. Artinya tidak

diperlukan fasilitas penunjang dan bebas kesulitan bahasa.

4. Memiliki kemampuan untuk membedakan siswa pandai (upper group) dan

lemah (lower group). Siswa pandai dapat menjawab butir soal-soal sukar dan

siswa lemah menjawab butir-butir soal mudah.

Pembuatan instrumen tes dalam pendidikan dapat dibuat oleh guru ataupun para

ahli penyusun tes. Namun Arikunto (2012: 146) berpendapat bahwa instrumen

yang baku dan standar, lazimnya dikembangkan oleh ahli. Menurut Nitko &

Brookhart, (2007; 198) para ahli penyusun tes membuat instrumen tes dengan

menggunakan populasi dan sampel yang diuji secara cermat dan teliti, sedangkan

guru menggunakan populasi dan sampel hanya terbatas di sekolah atau kelas.

Namun persamaan dari keduanya yakni diperlukan tahap pengembangan

instrumen tes yang bertujuan agar instrumen benar-benar layak dan akurat

digunakan.

Assessment memiliki tujuan yaitu untuk mengevaluasi dan mendiagnosa

kebutuhan yang harus diperbaiki sehingga pendidik dan peserta didik dapat

meneliti ulang, merencanakan, dan mengaplikasikan ulang. Tidak hanya untuk

mendapatkan evaluasi dari kegiatan belajar mengajar, assessment dilakukan untuk

dapat melakukan perbaikan sesegera mungkin (Purnomo, 2014).

23

Assessment tidak dapat dipisahkan dengan pembelajaran, maka tujuan assessment

dapat difokuskan pada tiga kategori, yaitu penilaian terhadap pembelajaran

(Assessment of Learning), penilaian untuk pembelajaran (Assessment for

Learning), dan penilaian sebagai pembelajaran (Assessment as Learning).

Assessment of learning merupakan penilaian yang dilaksanakan setelah proses

pembelajaran selesai. Proses pembelajaran selesai tidak selalu terjadi di akhir

tahun atau di akhir peserta didik menyelesaikan pendidikan pada jenjang tertentu.

Assessment for learning dilakukan selama proses pembelajaran berlangsung dan

biasanya digunakan sebagai dasar untuk melakukan perbaikan proses belajar

mengajar. Dengan assessment for learning pendidik dapat memberikan umpan

balik terhadap proses belajar peserta didik, memantau kemajuan, dan menentukan

kemajuan belajarnya. Assessment as learning mempunyai fungsi yang mirip

dengan assessment for learning, yaitu berfungsi sebagai formatif dan

dilaksanakan selama proses pembelajaran berlangsung. Perbedaannya, assessment

as learning melibatkan peserta didik secara aktif dalam kegiatan penilaian

tersebut. Peserta didik diberi pengalaman untuk belajar menjadi penilai bagi

dirinya sendiri.

E. Assessment for Learning Dalam Pembelajaran

Assessment for learning atau yang sering disebut sebagai penilaian formatif

merupakan kegiatan yang terintegrasi dalam pembelajaran. Di kelas, assessment

for learning sering dilakukan melalui kegiatan penilaian untuk mengetahui

kemajuan dan tingkat pemahaman peserta didik yang kemudian digunakan untuk

mengidentifikasi kebutuhan belajar dan merencanakan kegiatan pembelajaran

yang sesuai.

24

Definisi yang disampaikan oleh Cowie dan Bell (dalam Rasyid, 2013: 84)

mengatakan bahwa penilaian untuk belajar sebagai proses yang digunakan oleh

guru dan anak untuk mengakui dan merespon pembelajaran sehingga siswa

mempertinggi aktivitas atas tugas-tugas selama pembelajaran. Menurut Stiggins

mendefinisikan penilaian untuk belajar sebagai suatu alternatif penggunaan

berbagai metode penilaian yang berbeda secara terus-menerus untuk memperoleh

bukti penguasaan pengetahuan dan ketrampilan siswa terhadap standar. Pendapat

Stiggins (dalam Rasyid, 2013: 84) tersebut menekankan pada penggunaan

berbagai metode penilaian untuk memperoleh informasi tentang penguasaan

konsep pengetahuan dan ketrampilan yang telah diajarkan. Informasi tersebut

dapat digunakan sebagai dasar bagi guru,siswa, dan orang tua dalam membuat

keputusan yang berkaitan dengan perkembangan belajar peserta didik.

Cizek (2010: 4) menyatakan suatu tes atau instrumen dikatakan sebagai

assessment for learning jika memiliki dua kriteria. Kriteria pertama adalah

asesmen dilakukan selama proses pembelajaran. Yang kedua, harus memenuhi

satu atau lebih tujuan utama dari assessment for learning berikut: 1)

mengidentifikasi kekuatan dan kelemahan siswa, 2) menilai pendindik dalam

merencanakan pembelajaran, 3) memandu siswa agar dapat mengatur belajarnya

secara mandiri, memperbaiki kinerjanya, dan mendapat keterampilan

mengevaluasi diri, 4) serta membantu meningkatkan kesadaran tanggung jawab

untuk terus belajar.

Operasional pengertian AfL dalam kerangka tujuan, dinyatakan dalam CEA

(dalam Mansyur, 2011:76) yang mengatakan bahwa tujuan AfL untuk:

25

1. Memberi wawasan pembelajaran kepada guru dan peserta didik dalam upaya

meningktkan kesuksesan untuk semua.

2. Membantu proses penetapan tujuan.

3. Memungkinkan refleksi secara kontinu terhadap apa yang peserta didik

diketahui sekarang dan apa yang mereka butuhkn untuk diketahui berikutnya.

4. Mengukur apa yang dinilai.

5. Menetapkan intervensi secara cepat dan tepat sesuai dengan tujuan

pembelajaran.

6. Meningkatkan standar yang diperoleh peserta didik.

Berdasarkan pendapat di atas, assessment for learning merupakan proses

penilaian dalam pembelajaran untuk mengetahui kemajuan dan mengidentifikasi

kebutuhan belajar dan merencanakan kegiatan pembelajaran yang sesuai. Dalam

pelaksanaan assessment for learning akan diperoleh sebuah inforamasi dan terjadi

pemanfaat informasi. Informasi atau keterangan diperoleh melalui kerjasama

antara guru dengan peserta diidk dan informasi tersebut dimanfaatkan oleh

mereka (guru dan peserta didik) untuk perbaikan dan peningkatan kualitas

pembelajaran berikutnya.

F. Instrumen Pilihan Ganda Beralasan

Krishnan dan Howe 1994 (Suwarto, 2012; 136) mengembangkan soal pilihan

ganda disertai dengan alasan sebagai bentuk penjelasan atas jawaban yang

dipilihnya. Bentuk soal ini menurut Tamir (Treagust, 1988; 160) dikenal dengan

pilihan ganda beralasan. Soal pilihan ganda beralasan lebih menguntungkan

dibandingkan pilihan ganda biasa. Tüysüz (2009; 627) dalam penelitiannya

26

mengungkapkan keuntungan dari bentuk soal ini yakni dapat mengidentifikasi dua

aspek yang berbeda sekaligus dalam satu fenomena. Awal penggunaan tes pilihan

ganda beralasan dimulai sejak tahun 80an yang bertujuan untuk mengidentifikasi

miskonsepsi siswa.

Tes pilihan ganda beralasan terdiri dari dua macam yaitu tes pilihan ganda

beralasan terbuka dan tes pilihan ganda beralasan tertutup. Menurut Suwarto

(2012; 56) tes pilihan ganda beralasan terbuka adalah tes pilihan ganda yang

disertai alasan sehingga siswa harus menuliskan alasan terhadap jawaban yang

dipilihnya. Kelebihan tes pilihan ganda berlasan terbuka yaitu siswa dapat leluasa

mengungkapkan alasan atas jawaban yang dipilihnya. Kelemahannya yakni

dibutuhkan waktu untuk pemahaman jawaban siswa yang luas.

Sedangkan tes pilihan ganda tertutup adalah tes pilihan ganda yang disertai

pilihan alasan. Tes ini menurut Treagust (1988; 160) disebut juga tes pilihan

ganda dua tingkat (two tier multiple choice). Tingkat pertama merupakan soal

pilihan ganda dengan pilihan jawaban sedangkan tingkat kedua merupakan pilihan

ganda dengan pilihan alasan atas jawaban pada tingkat pertama. Chandrasegaran,

et al., (2007; 299) mengatakan bahwa alasan siswa pada bentuk pilihan ganda

beralasan tetutup telah disediakan sehingga siswa hanya memilih jawaban dari

opsi yang sudah tersedia. Jawaban benar jika siswa dengan tepat memilih opsi

pada tingkat pertama dan tingkat kedua. Penilaian dilakukan berdasarkan pilihan

jawaban dan alasan siswa pada kedua tingkat. Kelemahan instrumen ini menurut

Suwarto (2012; 57) yaitu siswa tidak leluasa mengungkapkan alasan pemilihan

jawaban. Kelebihan instrumen ini yakni mempermudah dalam proses penilaian.

27

Selain itu siswa memiliki peluang menebak jawaban lebih kecil dibandingkan

pilihan ganda satu tingkat.

Pada penelitian ini instrumen yang dikembangkan berupa soal pilihan ganda

beralasan terbuka. Hal ini bertujuan untuk mengetahui tingkap pemahaman dan

penalaran peserta didik dalam menyelesaikan soal yang diberikan.

G. Item Respons Theory

Dalam butir dikotomus respons jawaban hanya ada dua kemungkinan, seperti

benar atau salah, iya atau tidak, dengan nilai nol atau satu. Kadang-kadang

respons lebih dari dua kemungkinan tersebut, misalnya pada angket skala likert,

atau soal dengan jawaban bergradasi sesuai dengan tingkat kebenarannya. Butir

yang respons jawabannya lebih dari satu kemungkinan disebut butir politomus.

Model-model politomus pada teori respons butir menurut Linden & Hambleton

(dalam Retnawati, 2014: 32) antara lain nominal respons model (NRM), rating

scale model (RSM), partikel credit model (PCM), graded respons model (GRM)

dan generalized partisan credit model (GPCM).

Model respons butir politomus dapat dikategorikan menjadi model respons butir

nominal dan ordinal, tergantung pada asumsi karakteristik tentang data. Model

respons butir nominal dapat diterapkan pada butir yang mempunyai alternatif

kawanan yang tidak terurut (ordered) dan adanya berbagai tingkat kemampuan

yang diukur. Pada model respons ordinal terjadi pada butir yang dapat diskor ke

dalam banyaknya kategori tertentu yang tersusun dalam jawaban. Skala Likert

diskor berdasarkan pedoman penskoran kategori respons terurut, yang merupakan

penskoran ordinal. Butir-butir tes matematika dapat diskor menggunakan sistem

28

parsial kredit, langkah-langkah menuju jawaban benar dihargai sebagai penskoran

ordinal. Model pensekoran yang paling sering dipakai ahli yakni GRM, PCM, dan

GPCM.

1. Graded Respons Model (GRM)

Respons peserta terhadap butir j dengan model GRM dikategorikan menjadi m+1

skor kategori terurut, k = 0, 1, 2, ..., m dengan m merupakan banyaknya langkah

dalam menyelesaikan dengan benar butir j, dan indeks kesukaran dalam setiap

langkah juga terurut. Hubungan parameter butir dan kemampuan peserta dalam

GRM untuk kasus homogen (aj sama dalam setiap langkah) dapat dinyatakan oleh

Muraki & Block (1997; 7) sebagai berikut.( ) = ∗ ( ) − ∗ ( )( ) = −1 + −

Dengan ∗ ( )= 1 dan ∗ ( )= 0

aj : indeks daya beda butir jθ : kemampuan peserta,bjk : indeks kesukaran kategori k butir j( ) : probabilitas peserta berkemampuan θ yang memperoleh skor kategori k

pada butir j∗ ( ) : probabilitas peserta berkemampuan θ yang memperoleh skor kategori katau lebih pada butir j

D : faktor skala

2. Partial Credit Model (PCM)

PCM merupakan perluasan dari model Rasch, dengan asumsi setiap butir

mempunyai daya beda yang sama. PCM mempunyai kemiripan dengan GRM

pada butir yang skor dalam kategori berjenjang, namun indeks kesukaran dalam

29

setiap langkah tidak perlu terurut, suatu langkah dapat lebih sukar dibandingkan

langkah berikutnya. Bentuk umum PCM menurut Muraki & Block (1997; 16)

sebagai berikut.

( ) = ∑ −∑ ∑ −Dengan :( ) : probabilitas peserta berkemampuan θ memperoleh skor kategori k pada

butir jθ : kemampuan pesertam + 1 : banyaknya kategori butir jbjk : indeks kesukaran kategori k butir j

dan

− ≡ 0 dan − ≡ −Skor kategori pada PCM menunjukkan banyaknya langkah untuk menyelesaikan

dengan benar butir tersebut. Skor kategori yang lebih tinggi menunjukkan

kemampuan yang lebih besar daripada skor kategori yang lebih rendah.

Pada PCM, jika suatu butir memiliki dua kategori, maka PCM dapat diterapkan

pada butir dikotomus dan politomus.

3. Generalized Partial Credit Model (GPCM)

GPCM menurut Muraki (1997) merupakan bentuk umum dari PCM, yang

dinyatakan dalam bentuk matematis, yang disebut sebagai fungsi respons kategori

butir sebagai berikut.

( ) = ∑ ( )∑ ∑ ( ) untuk k = 0, 1, 2, ..., mj

( ) = − = − + , = 0

30

Keterangan :( ) : probabilitas peserta berkemampuan θ memperoleh skor kategori k padabutir j,

θ : indeks daya beda butir j,bjh : indeks kesukaran kategori h butir j,bj : indeks kesukaran lokasi butir j (parameter butir lokasi),dh : parameter kategori hmj + 1 : banyaknya kategori butir j, danD : faktor skala (D = 1,7)

Parameter bjh oleh Master dinamai dengan parameter tahap butir. Parameter ini

merupakan titik potong antara kurva Pjk(θ) dengan Pjk-1(θ). Kedua kurva hanya

berpotongan di satu titik pada skala θ.

Jika θ = bjk, maka Pjk (θ) = Pjk-1 (θ)

Jika θ > bjk, maka Pjk(θ) > Pjk-1 (θ)

Jika θ < bjk, maka Pjk(θ) < Pjk-1 (θ), K = 1, 2, 3, ..., mj

Menurut Hambleton, Swaminathan, & Rogers (1991; 9 – 12) ada tiga asumsi

dalam teori respons butir yaitu;

1) Unidimensi artinya hanya ada salah satu kemampuan yang diukur dengan satu

set butir dalam tes. Asumsi ini tidak dapat secara ketat terpenuhi karena

beberapa faktor kognitif, kepribadian, dan pelaksanaan tes yang selalu

mempengaruhi kinerja tes, setidaknya sampai batas tertentu. Faktor-faktor ini

mungkin termasuk motivasi, tingkat kecemasan, kemampuan untuk bekerja

dengan cepat, kecenderungan untuk menebak bila ragu dengan jawaban dan

keterampilan kognitif di samping satu dominan yang diukur dengan butir tes.

2) Independensi lokal (local Independence) artinya ketika kemampuan

mempengaruhi kinerja agar tetap konstan, maka respons peserta ujian untuk

setiap pasangan butir independen secara statistik satu sama lain. Dengan kata

31

lain, setelah uji kemampuan masuk ke dalam perhitungan ada hubungan antara

respons peserta ujian untuk butir yang berbeda.

3) Invariansi parameter kemampuan adalah landasan IRT dan perbedaan utama

dari teori tes klasik. Adapun yang menjadi ciri butir tidak bergantung pada

distribusi kemampuan peserta ujian dan parameter yang menjadi ciri khas

suatu ujian tidak tergantung pada set butir, model matematisnya mempunyai

makna bahwa probabilitas subjek untuk menjawab butir soal dengan benar

tergantung pada kemampuan subjek dan karakteristik butir. Ini berarti bahwa

peserta tes dengan kemampuan tinggi akan mempunyai probabilitas menjawab

benar lebih besar jika dibandingkan dengan peserta yang mempunyai

kemampuan rendah. Inilah satu-satunya faktor yang mempengaruhi peserta

ujian untuk menguji butir.

Terdapat hal penting yang perlu di perhatikan dalam teori respons butir yaitu

pemilihan model yang tepat. Model yang tepat akan mengungkap keadaan yang

sesungguhnya dari data tes sebagai hasil pengukuran. Ada 3 model hubungan

antara kemampuan dan parameter butir, yaitu

1) model 1 parameter (model Rasch), ditentukan oleh indeks tingkat kesukaran

butir (bi).

2) model 2 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi) dan

indeks daya beda butir (ai).

3) model 3 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi), indeks

daya beda butir (ai) dan tebakan semu (ci).

Berdasarkan macam-macam model penskoran dan model parameter, rumus yang

akan digunakan untuk analisis penelitian ini yaitu Partial Credit Model (PCM).

32

Model PCM cocok untuk menganalasis butir tes yang memerlukan beberapa

langkah penyelesaian, hal ini termasuk soal matematika yang membutuhkan tahap

identifikasi permasalahan hingga solusi akhir.

PCM merupakan pengembangan model 1-PL dan termasuk keluarga Model

Rasch. Model dikotomi dan PCM dapat dikatakan campuran dalam satu analisis

(Wu & Adams, 2007). PCM Merupakan pengembangan Model Rasch butir

dikotomi yang diterapkan pada butir politomi. Asumsi PCM yakni setiap butir

mempunyai daya beda yang sama. Bentuk umum PCM menuru Muraki & Bock

(Renawati, 2014: 37-38) dan Ostini & Nering (2006: 28) menjabarkan bentuk

PCM sesuai dengan persamaan 1 dan 2.

( ) = ∑ −∑ ∑ −Dengan :( ) : probabilitas peserta berkemampuan θ memperoleh skor kategori k pada

butir jθ : kemampuan pesertam + 1 : banyaknya kategori butir jbjk : indeks kesukaran kategori k butir j

Persamaan di atas dapat dijabarkan berdasarkan jumlah kategori di dalam butir.

Misalnya sebuah skala memiliki 4 kategori, yakni kategori dengan skor 1, 2, 3,

dan 4. Kita dapat kategori (g) sebanyak 4 buah persamaan probabilitas individu

pada tiap kategori. PCM mensyaratkan seperti pada persamaan beriktut.

− ≡ 0 dan − ≡ −

33

Skor kategori PCM menunjukkan banyaknya langkah untuk menyelesaikan

dengan benar setiap butir. Skor kategori yang lebih tinggi menunjukkan

kemampuan yang lebih besar dari pada skor kategori yang lebih rendah.

Parcial Credit Model (PCM) merupakan pengembangan dari Model Rasch butir

dikotomi yang diterapkan pada butir politomi. Jika i butir politomi dengan

kategori skor 0, 1, 2, ..., mi, maka probabilitas dari individu n skor x pada butir i

yang nantinya digambarkan dalam categori response function (CRF) diwujudkan

dalam persamaan 2 (Ostini & Nering, 2006: 28).

Persamaan di atas dapat dijabarkan berdasarkan jumlah kategori di dalam butir.

Misalnya sebuah skala memiliki 5 kategori dengan skor 0, 1, 2, 3, dan 4, maka

kita dapatkan kategori (g) sebanyak 4 buah persamaan yang probabilitas individu

pada setiap kategori. Parameter big juga diinterpretasikan sebagai titik pada skala

sifat laten dengan dua kategori yang berurutan kurva respos berpotongan sehingga

dinamakan persimpangan kategori (category response curves intersect).

Parameter big merupakan titik dimana dua katefori memiliki prababilitas yang

sama untuk dipilih oleh level trait yang terkait (Linacre, 2012). Disisi lain big tidak

menunjukkan tingkat kesukaran untuk sukses ditahap kedua atau untuk mencapai

skor 2, tetapi lebih menunjukkan tingkat kesulitan butir untuk tahap kedua yang

independen dengan tahap-tahap sebelumnya (Wu & Adams, 2007).

Kesalahan Baku Pengukuran (Standard Error of Measurement, SEM) dapat

digunakan untuk memahami kesalahan yang bersifat acar/random yang

mempengaruhi skor peserta tes dalam pelaksanaan tes. Kesalahan pengukuran

yang disimbolkan dengan , dapat dihitung dengan rumus pada persamaan yang

diturunkan dari rumus reliabilitas (Allen & Yen, 1979 : 73)

34

Ada beberapa karakteristik yang perlu diperhatikan dalam teori respons modern

yaitu;

1. Tingkat kesukaran

Dalam teori respons butir, tingkat kesukaran (bi), pada metrik sama dengan

kemahiran atau trait. Menurut Demars (2010 : 4-5) tingkat kesukaran butir

mengidentifikasi kemampuan dimana sekitar 50% dari peserta ujian (atau lebih

sedikit, tergantung pada model) diharapkan menjawab butir dengan benar. Secara

teori, nilai bi terletak di antaran -~ dan +~. Hembleton & Swaminathan (1985:

107) menyatakan bahwa suatu butir dikatakan baik jika nilai ini berkisar antara -2

dan +2 . Mendukung pernyataan tersebut, Retnawati (2014: 17) mengungkapkan

bahwa jika nilai bi mendekati -2, maka indeks kesukaran butir sangat rendah.

Sedangkan, jika nilai bi mendekati +2 maka indeks kesukaran butir sangat tinggi

untuk suatu kelompok peserta tes.

Kriteria butir soal yang baik yaitu tidak terlalu mudah dan tidak terlalu sulit.

Dengan tingkat kesulitan yang bervariasi maka dapat mengukur kemampuan

peserta tes secara keseluruhan. Sehingga semakin besar indeks kesukaran butir

soal maka semakin sukar soal butir soal tersebut untuk dikerjakan, sebaliknya

semakin kecil indeks kesukaran butir soal maka semakin mudah butir soal.

2. Daya Pembeda

Pada IRT indeks daya pembeda disimbolkan dengan (ai) yaitu mengukur dari daya

beda butir. Indeks biasanya disebut slope karena menunjukkan seberapa curam

kemungkinan perubahan respons yang benar seperti kemampuan atau perubahan

trait. Menurut Demars (2010: 5) daya pembeda yang lebih tinggi berarti bahwa

35

butir dapat membedakan (mendiskriminasikan) antara peserta ujian dengan

barbagai tingkat konstruk.

Menurut Hambleton & Swaminahan (1985: 36) indeks daya beda (ai) berada di

antara 0-2, ai merupakan daya pembeda yang dimiliki butir ke-i. Pada kurva

karakteristik, ai merupakan (slope) dari kurva di titik bi untuk skala kemampuan

tertentu, karena merupakan kemiringan, semakin besar kemiringannya maka

semakin besar daya pembeda butir tersebut. Secara teori, Retnawati (2014: 17)

menyatakan bahwa nilai nilai ai terletak antara -~ dan +~. Semakin banyak butir

yang memenuhi kriteria daya beda (ai) maka butir tes semakin baik dalam

membedakan kemampuan peserta tes.

3. Kecocokan Butir dengan Model Logistik (goognes of fit statistik)

Menurut Retnawati (2014: 24-25) kecocokan model dapat diketahui dengan

membandingkan khi-kuadrat ( ) tabel dengan derajat kebebasan tertentu. Butir

dikatakan cocok dengan suatu model jika nilai khi-kuadrat hitung tidak melebihi

nilai khi-kuadrat tabel. Kecocokan dapat diketahui pula dari nilai probabilitas

(signifikansi, sig). Jika nilai sig < , maka butir dikatakan tidak cocok dengan

model.

Kecocokan model juga dapat diketahui dengan melihat proporsi butir yang cocok

dengan model logistik. Proporsi butir cocok terbanyak diantara model 1PL, 2PL

dan 3PL dinyatakan sebagai model yang cocok pada pengujian butir tes. Cara lain

yang dapat dilakukan yakni dengan membuat plot kurva karakteristik. Plot dapat

digambarkan dengan bantuan program winsteps, dengan plot dapat diketahui

seberapa tepat distribusi data dibandingkan dengan modelnya.

36

4. Nilai Fungsi Informasi

Menurut Ratnawati (2014: 18) fungsi informasi butir (item information functions)

merupakan suatu model untuk menjelaskan kekuatu suatu butir pada perangkat

tes, pemilihan butir tes, dan perbandingan beberapa perangkat tes. Fungsi

informasi menyatakan kekuatan atau sumbangan butir tes dalam mengungkap

kemampuan laten yang diukur dengan tes tersebut. Dengan demikian melalui

fungsi informasi butir dapat diketahui butir mana yang cocok dengan model

sehingga dapat membantu dalam seleksi butir tes. Dalam Hambleton dan

Swaminathan (1985: 104) secara matematis fungsi informasi butir dapat

dituliskan dengan rumus sebagai berikut:

( ) = ( )( ) ( )Keterangan:

i = 1, 2, 3, ... , nIi ( ) = fungsi informasi butir ke-iPi ( ) = peluang peserta dengan kemampuan menjawab benar butir iP’i ( ) = turunan fungsi Pi ( ) terhadap Qi ( ) = peluang peserta dengan kemampuan menjawab benar butir i

Berdasarkan teori respons butir fungsi informasi dan kemampuan peserta didik

dapat diperoleh. Hambleton, Swaminathan & Rogers (1991: 94) menyatakan

bahwa fungsi informasi tes merupakan penjumlahan dari fungsi informasi butir

penyusun tes tersebut pada tingkat kemampuan . Berhubungan dengan hal ini,

fungsi informasi perangkat tes akan tinggi jika butir tes mempunyai fungsi

informasi yang tinggi pula. Menurut Naga (1991: 324) fungsi informasi tes akan

berubah-ubah menurut nilai . Pada nilai tertentu, nilai fungsi informasi

mencapai maksimum. Titik maksimum berarti bahwa jika butir itu dikerjakan oleh

37

peserta dengan tersebut, maka akan diperoleh informasi yang paling tinggi.

Dalam Hambleton, Swaminathan & Rogers (1991: 94) secara matematis fungsi

informasi dapat dituliskan sebagai berikut :

( ) = ( )Informasi yang diberikan tes pada kemampuan merupakan jumlah dari fungsi

informasi butir. Berdasarkan persamaan di atas jelas bahwa butir berkontribusi

secara independen untuk fungsi informasi tes. Fungsi informasi tes diperlukan

untuk menafsirkan hasil tes. Perangkat tes yang baik akan memiliki nilai fungsi

informasi yang lebih besar dibandingkan dengan kesalahan pengukuran. Jika

kesalahan pengukuran lebih tinggi dibandingkan informasi maka dapat

diperkirakan bahwa perangkat tes tidak sesuai kemampuan peserta yang diberikan

tes

5. Standard Error of Measurement (SEM)

Standard error , SE adalah standar deviasi asimtotik distribusi normal dari

estimasi kemungkinan maksimum untuk kemampuan yang diberikan pada nilai

kemampuan sebenarnya. Pada teori respons butir, kesalahan penaksiran standar

SEM (Standard Error of Measurement) berkaitan erat dengan fungsi informasi.

Menurut Hambleton, Swaminathan, & Rogers (1991: 94-95) fungsi informasi

dengan SEM mempunyai hubungan yang berbanding terbalik kuadratik, semakin

besar fungsi informasi maka SEM semakin kecil atau sebaliknya.

= ( )Besarnya standard error umumnya tergantung pada;

38

a) Jumlah butir tes. Banyaknya butir tes mempengaruhi kesalahan standar, dalam

hal ini berkaitan dengan waktu pengerjaan tes. Kesalahan standar yang lebih

kecil berhubungan dengan lama tes.

b) Kualitas butir tes. Pada umumnya, kesalahan standar yang lebih kecil

berhubungan dengan butir yang sangat diskriminatif dengan jawaban benar

tidak dapat diperoleh dengan menebak.

c) Perbandingan antara tingkat kesukaran butir dan kemampuan peserta ujian.

Kesalahan standar yang lebih kecil diasumsikan berada pada tes yang terdiri

dari butir dengan parameter tingkat kesukaran sama dengan parameter

kemampuan peserta ujian sebagai lawan tes yang relatif mudah atau relatif

sulit.

Embretson (dalam Irvine & Kyllonen, 2002: 225) mengungkapkan bahwa model

teori respons butir cocok dengan data penelitian yang akan dilakukan. Parameter

butir yang diperkirakan oleh kemungkinan maksimum marjinal, menggunakan

program winsteps. Keuntungan utama dari program winsteps adalah kemampuan

untuk secara bersamaan memperkirakan parameter butir dan kemampuan seluruh

kelompok yang diberikan pada bentuk tes yang berbeda. Berdasarkan beberapa

pendapat yang dikemukakan di atas dapat disimpulkan bahwa kesalahan

pengukuran diminimalkan dengan menyesuaikan perangkat tes dengan

kemampuan peserta tes.

H. Validitas Tes

Suatu instumen tes atau alat tes memiliki kriteria baik salah satunya adalah

memenuhi syarat valid. Menurut Purwanto (2013:137) validitas adalah kualitas

39

yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti

atau tujuan kriteria belajar atau tingkah laku. Dan William (2008: 123)

menyatakan validitas menunjukkan kemampuan suatu tes untuk mengukur apa

yang hendak diukur. Menurut AERA, APA, & NCME (dalam Retnawati, 2016:

16) validitas merujuk pada derajat dari fakta dan teori yang mendukung

interpretasi skor tes, dan merupakan pertimbangan paling penting dalam

pengembangan tes. Sehingga validitas merupakan karakteristik paling penting

suatu tes.

Terdapat beberapa cara untuk mengukur validitas. Menurut Sudijono (2011: 163)

ada dua cara yang dapat dilakukan untuk pengujian validitas, yaitu penganalisisan

yang dilakukan dengan cara berpikir secara rasional atau penganalisisan yang

dilakukan dengan mendasarkan kepada kenyataan empiris. Secara umum Alen &

Yen (1979; 95) mengelompokkan validitas menjadi tiga (3) kategori, yaitu

validitas isi (content validity), validitas kriteria (criterion-related validity), dan

validitas konstruk (construct validity). Menurut Miller (2008: 11) validitas isi

merupakan tipe validitas yang menunjukkan keakuratan penilaian terhadap tujuan

pembelajaran. Sehingga dengan validasi isi suatu instrumen dapat menunjukkan

kualitas tes yang berkaitan dengan representasi keterwakilan isi materi

pembelajaran.

Validitas kriteria menunjukkan hubungan empiris suatu tes dengan variabel

kriteria yang relevan. Menurut Mardapi (2008: 23) variabel kriteria yang relevan

yaitu variabel eksternal yang bias berupa kriteria bahwa tes diharapkan

memprediksi, seperti hubungan dengan tes lain yang mengukur hal yang berbeda.

40

Kriteria lain seperti kriteria performans, sering digunakan untuk keperluan seleksi

atau penempatan karyawan atau pegawai.

Mardapi (2008: 23-24) dan Wiliam (2008: 126) membedakan validitas kriteria

menjadi dua jenis, yaitu validitas prediktif dan validitas konkruen. Dijelaskan

bahwa validitas prediktif diperoleh jika pengambilan skor tes kriteria tidak sama

dengan pengambilan skor tes. Setelah peserta tes dikenai tes yang akan dicari

validitas prediktifnya, lalu diberikan tenggang waktu tertentu sebelum skor

kriteria diambil dari perserta tes yang sama. Apabila skor tes dan skor kriteria

diperoleh dalam waktu yang relative sama maka validitas yang akan diperoleh

adalah validitas konkruen. Dengan demikian dapat dikatakan bahwa untuk

memperoleh koefisien validitas prediktif suatu tes membutuhkan waktu yang

cukup lama, sebaliknya koefisien validitas konkruen diperoleh dalam waktu yang

relatif singkat.

Validitas konstruk yaitu validitas yang menunjukkan hasil pengukuran dapat

ditafsirkan sesuai dengan definisi yang digunakan. Mardapi (2008: 21)

menyatakan bahwa definisi atau konsep yang diukur berasal dari teori yang

digunakan. Pendapat tersebut sesuai dengan yang dikemukakan oleh Messick

(1988: 33) validitas tes merupakan suatu integrasi pertimbangan evaluative secara

empiris yang mendasarkan pemikiran teoritis yang mendukung ketepatan dan

kesimpulan berdasarkan pada skor tes. Berdasarkan pendapat-pendapat tersebut,

maka proses validasi konstruk suatu tes diawali dengan pendefinisian variabel

yang hendak diukur berdasarkan teori yang mendasarinya. Berdasarkan teori ini

diambil suatu konsekuensi praktis mengenai hasil pengukuran yang akan diuji

41

pada kondisi tertentu. Suatu tes dianggap memiliki validitas konstruk yang baik

apabila hasil pengukuran menggunakan tes tersebut sesuai dengan yang

diharapkan.

Validitas dapat diketahui dari bukti validitas atau sumber validitas. Mardapi

(2008: 17) menjelaskan bahwa bukti validitas dapat dilihat dari bukti yang ada

berdasarkan isi tes, proses respons, struktur internal dan hubungannya dengan

variabel lain. Bukti validitas berdasarkan isi dapat dipenuhi menggunakan

penilaian para pakar pada bidang yang diukur dan pakar bidang pengukuran

melalui suatu diskusi panel. Penilaian para pakar sangan tergantung pada

subjektivitas individual pakar sesuai dengan latar belakang pengetahuannya.

Validitas isi tampak dari kisi-kisi tes atau spesifikasi domain isi tes yang dibuat

oleh pengembang. Spesifikasi domain ini menjelaskan isi secara rinci, sering

dengan cakupan isi dan tipe item tes.

Validitas isi juga berkaitan dengan pertanyaan, “apakah item tes mencakup

keseluruhan materi atau bahan yang ingin diikur?”. Bukti validitas tersebut

diperoleh dari analisis rasional terhadap isi tes, yang penilaiannya didasarkan atas

pertimbangan subjektif individual. Sehubungan dengan hal ini Mardapi (2008: 18)

mengungkapkan bahwa walaupun subjektif, namun yang terlibat dalam proses

validasi adalah beberapa pakar pada bidang yang diukur dalam suatu forum

diskusi sehingga hasilnya dapan dipertanggung jawabkan. Hasil panel pakar

merupakan bukti untuk menunjukkan bahwa isi tes sesuai dengan materi yang

ingin diujikan. Bukti validitas isi menjamin bahwa dari segi isi, tes itu valid untuk

tujuan pengukuran tertentu. Bila suatu tes ingin digunakan untuk tujuan yang

42

berbeda dari tujuan semula penyusunan tes, maka diperlukan evaluasi terhadap isi

untuk menentukan bahwa interpretasi skor tes dapat dilakukan atau tidak untuk

tujuan yang berbeda itu.

Validitas berdasar respons memberikan bukti kesesuaian konstruk dengan respons

peserta tes. Bukti berdasarkan proses respon dapat diperoleh dari analisis teori dan

empiris terhadap respons peserta tes.

Validitas isi secara kuantitatif dapat dilakukan dengan menggunakan formula

menggunakan Indeks Gregory karena instrumen hanya divalidasi oleh 2 ahli.

Hasil penilaian dari validator dibuat dalam tabel kontingensi pada dua ahli, untuk

ahli 1 dan ahli 2, pada relevansi lemah dan kuat. Indeks kesepakatan ahli untuk

validitas isi merupakan perbandingan banyaknya butir dari kedua ahli dengan

kategori relevansi kuat dengan keseluruhan butir. Contoh pertolongan untuk

menghitung indeks Gregory disajikan pada tabel berikut.

Tabel 2.1. Tabel Kontingensi untk Menghitung Indeks Gregory.

Rater 1Lemah Kuat

Rater 2Lemah A BKuat C D

Koefisien validitas isi =

Keterangan:V = ValiditasA = Penilai I dan II menyatakan lemahB = Penilai I menyatakan kuat, penilai II menyatakan lemahC = Penilai I lemah, penilai II menyatakan kuatD = Penilai I dan II menyatakan kuat

(Retnawati, 2016: 32-33)

43

Setelah dilakukan perhitungan dengan tabel kontingensi Indeks Gregory.

Selanjutnya hasil tersebut diinterpretasikan, jika indeks kesepakatan tersebut

kurang dari 0,4 maka dikatakan validitasnya rendah, diantara 0,4-0,8 dikatakan

validitasnya sedang (mediocare) dan jika lebih dari 0,8 dikatakan tinggi.

Validitas konstruk diperoleh berdasarkan analisis data empirik dari hasil uji coba

lapangan. Validitas tes berdasarkan data empirik akan ditinjau menggunakan

analisis faktor dan dianalisis menggunakan analisis faktor konfirmatori. Hasil

analisis tersebut merupakan bukti bahwa hasil pengukuran dapat ditafsirkan sesuai

definisi yang digunakan. Definisi atau konsep tersebut merupakan teori yang

mendasari penyusunan suatu instrumen. Hasil analisis validitas konstruk

menunjukkan kemampuan tes mengungkap suatu trait yang dimaksudkan untuk

diukur. Rosidin (2017: 135) menyatakan bahwa aspek pendekatan empiris

terhadap validitas konstruk terdiri dari dua hubungan, yaitu, a) hubungan internal,

yaitu hunungan antara item-item di dalam alat pengukur ada atau tidak

bertentangan; b) hubungan eksternal, yaitu hubungan antara skor yang diperoleh

dari alat pengukur tersebut dengan sekor dari alat pengukur lain harus konsisten

dengan konstruk.

I. Reliabilitas Tes

Reliabilitas adalah tingkat kepercayaan hasil suatu pengukuran, pengukuran yang

memiliki reliabilitas tinggi adalah pengukuran yang dapat menghasilkan data yang

reliabel. Pengukuran yang memiliki reliabilitas tinggi yaitu yang mampu

memberikan hasil ukur yang terpercaya, yang disebut reliabel. Reliabilitas suatu

alat dapat diketahui jika alat tersebut mampu menunjukkan sejauh mana

44

pengukurannya dapat memberikan hasil yang relatif sama bila dilakukan

pengukuran kembali pada objek yang sama (Azwar, 2009:4).

Reliabilitas dinyatakan dengan koefisien reliabilitas yang angkanya berada dalam

rentang 0 sampai dengan 1,00. Semakin tinggi koefisien reliabilitas mendekati

angka 1,00 berarti semakin tinggi reliabilitasnya. Sebaliknya koefisien yang

semakin mendekati angka 0 berarti semakin rendah reliabilitasnya. Untuk

mengetahui reliabilitas dari tiap alat ukur, maka penelitian ini menggunakan

rumus Alpha Cronbach dengan bantuan IBM SPSS 20. Penggunaan rumus ini

dikarenakan skor yang dihasilkan dari instrument penelitian merupakan rentangan

skala 1-4, bukan dengan hasil 1 dan 0.

J. Kerangka Pikir

Berdasarkan permasalahan yang telah dijabarkan dalam latar belakang masalah,

dapat kita lihat bahwa pelaksanaan asesmen pembelajaran di sekolah-sekolah saat

ini belum maksimal. Salah satu penyebabnya adalah kurangnya kemampuan guru

dalam membuat instrumen penilaian yang memenuhi kriteria syarat instrumen

evaluasi yang baik digunakan. Penilaian dilakukan guru untuk mengetahui faktor-

faktor yang mempengaruhi keberhasilan dan kegagalan dalam proses

pembelajaran. Selain itu, penilaian berguna untuk memperoleh informasi

mengenai seberapa jauh kemampuan peserta didik dalam menguasai materi

pembelajaran yang sudah dilaksanakan.

Dalam dunia pendidikan terdapat bermacam-macam alat penilaian guna menilai

proses dan hasil pendidikan yang telah dilakukan siswa, khususnya pengetahuan

menggunakan alat ukur berupa tes dan non-tes. Penilaian merupakan salah satu

45

cara untuk mengevaluasi hasil belajar peserta didik dengan pemberian tes kepada

peserta didik. Tes merupakan sejumlah pertanyaan yang diberikan kepada peserta

tes, yang memiliki jawaban benar atau salah. Kegiatan pengetesan digunakan para

guru untuk menaksir tingkat kemampuan peserta didik secara tidak langsung,

yaitu melalui respons peserta didik terhadap stimulus atau pertanyaan.

Penggunaan tes lebih banyak dijadikan sebagai alat ukur penilaian dalam

pendidikan dibandingkan alat penilaian yang lain. Instrumen penilaian merupakan

tahap akhir dari sebuah pembelajaran karena penilaian merupakan tahap dimana

guru melakukan penilaian terhadap hasil belajar siswa. Penilaian digunakan untuk

mengukur ketercapaian peserta didik terhadap proses pembelajaran. Dengan

penilaian maka guru mampu memberikan timbal balik terhadap hasil belajar

siswa.

Hasil pengetesan yang diberikan kepada peserta didik merupakan data yang diolah

menjadi informasi, selanjutnya digunakan sebagai pertimbangan dalam

menentukan kebijakan atau putusan. Guru memberikan tes kepada peserta didik

kemudian mengumpulkan butir-butir soal yang sesuai dengan kompetensi yang

diharapkan kepada peserta didik. Pemberian tes dikhawatirkan terjadi kesalahan

pengukuran yaitu berupa data yang tidak baik sesuai dalam mengukur pencapaian

kemampuan yang diharapkan. Data yang tidak baik, tidak bisa diolah menjadi

informasi yang baik. Oleh karena itu diperlukan perangkat tes yang berkualitas.

Teknik penyusunan tes terdapat beberapa langkah yang sebaiknya dilakukan oleh

masing-masing guru ketika hendak memberikan tes kepada peserta didik. Adapun

langkah-langkah yang harus dilakukan meliputi, analisis materi, menyusun dan

46

merumuskan instrumen (di dalamnya berupa menyusun kisi-kisi, menyusun

spesifikasi butir soal, dan menulis butir soal), instrumen penilaian dan jawaban

(membuat telaah butir soal dan jawabannya), melakukan uji coba, menganalisis

butir soal, memperbaiki soal, melaksanakan tes (penelitian), dan menafsirkan hasil

tes.

Prosedur penyusunan butir soal dilakukan dengan menentukan tujuan tes

berdasarkan kisi-kisi, menentukan bentuk soal yang diinginkan, menentukan

panjang tes. Tujuan tes meliputi untuk mengetahui tingkat kemampuan peserta

didik, mengukur pertumbuhan dan perkembangan peserta didik, mendiagnosis

kesulitan belajar, mengetahui hasil pembelajaran, mengetahui pencapaian

kurikulum dan mendorong guru untuk melaksanakan pembelajaran yang lebih

baik.

Daya BedaButir

Nilai fungsiinformasi

Kemahiran(Trait)

KecocokanButir

Menyusun Kisi-kisi Instrumen Assessmen forLearning

ValiditasAhli

Uji coba &Penelitian

Analisis

Analisis Materi berdasarkan KD, MerumuskanIndikator Pencapaian Kompetensi

Menyusun Spesifikasi Butir Soal BerdasarkanKisi-kisi

47

III. METODE PENELITIAN

A. Jenis Penelitian

Jenis penelitian ini adalah Research and Development (R & D) atau dapat

dikatakan sebagai penelitian pengembangan. Produk yang dikembangkan adalah

Instrumen Assessment for Learning dengan Politomus Response (Jawaban

Beralasan) Jenjang Sekolah Menengah Kejuruan (SMK) yang mengacu pada

model pengembangan pendidikan umum dari Plomp (Rochmad, 2012: 66).Model

pengembangan yang dikemukakan oleh Plomp terdiri dari lima tahap yaitu: tahap

investigasi awal, tahap desain, tahap realisasi/konstruksi, tahap tes, evaluasi dan

revisi, dan tahap implementasi.

B. Subjek Penelitian

Penelitian ini akan dilaksanakan di lingkungan Sekolah Menengah Kejuruan

(SMK) yang ada di Kabupaten Lampung Timur. Subjek dalam penelitian ini

dibagi dalam beberapa tahap berikut:

1. Subjek Studi Pendahuluan

Pada studi pendahuluan dilakukan beberapa langkah sebagai analisis kebutuhan,

yaitu observasi, wawancara, dan analisis tingkat kesulitan soal. Subjek pada pada

saat observasi adalah peserta didik SMK Mitra Bhakti Bandar Sribhawono.

Subjek pada saat wawancara adalah satu orang guru yang mengajar matematika di

48

SMK Praja Utama Bandar Sribhawono. Subjek pada saat analisis tingkat kesulitan

soal adalah peserta didik di SMK Mitra Bhakti Bandar Sribhawono.

2. Subjek Validasi Instrumen

Subjek validasi instrumen assessment for learning dengan politomus response

dalam penelitian ini adalah dua orang ahli yang terdiri atas satu ahli materi dan

satu ahli evaluasi.

3. Subjek Uji Coba Lapangan awal

Subjek pada tahap ini adalah peserta didik yang pernah menempuh materi yang

akan diujikan.

4. Subjek Uji Coba Lapangan

Subjek pada tahap ini adalah seluruh peserta didik pada lingkungan SMK se

Kabupaten Lampung Timur. Dalam hal ini akan diwakili oleh 3 sekolahan

berdasarkan kriteria status akreditasinya, yaitu :

a. SMK Praja Utama Bandar Sribhawonob. SMK Mitra Bhakti Bandar Sribhawonoc. SMK Ma’arif NU Penawaja

Pengambilan sampel uji coba dilakukan dengan teknik non probability sampling

yaitu accidental sampling. Dalam non probability sampling, setiap unsur tidak

memiliki kesempatan atau peluang yang sama untuk dipilih sabagai sample.

Pemilihan unit sampling didasarkan pada pertimbangan atau penilaian subjekti

dan tidak menggunakan teori probabilitas. Dalam teknik ini, sampel paling sedikit

harus empat atau lima kali dari jumlah item pertanyaan. Dalam penelitian ini

adalah 413 sampel, melebihi batas minimal yang seharusnya 200 sampel (40 butir

soal x 5).

49

Dalam penarikan jumlah ukuran sampel, apabila populasinya tidak diketahui

secara pasti jumlahnya (accidental sampling) maka digunakan teknik atau rumus

sesuai dengan teori Malhotra (2006; 291). Accidental sampling merupakan

prosedur sampling yang memilih sampel orang atau unit yang paling mudah

dijumpai atau diakses. Kelemahan dari metode ini sangat mungkin sampel yang

diperoleh tidak representatif dan bias, sehingga tidak mungkin menarik

kesimpulan yang bersifat generalisasi berdasarkan metode ini.

C. Prosedur Pengembangan

Perangkat pembelajaran yang akan dikembangkan ialah instrumen assessment for

learning dengan politomus response. Spesifikasi butir soal disusun berdasarkan

Kompetensi Inti, Kompetensi Dasar, dan Indikator yang dipilih berdasarkan

pertimbangan peserta didik telah mendapatkan materi yang akan diujikan.

Penjelasan tentang tahap-tahap pengembangan tersebut dijelaskan sebagai berikut.

1. Tahap investigasi

Kegiatan yang dilakukan pada tahap investigasi awal adalah menghimpun

informasi permasalahan evaluasi belajar matematika terdahulu, mengidentifikasi

dan mengkaji teori-teori yang melandasi penelitian. Dalam tahap ini juga

dilakukan kajian secara teoritis tentang kurikulum mata pelajaran matematika

SMK, meliputi analisis materi berdasarkan Kompetensi Dasar yang telah dipilih,

merumuskan indikator pencapaian kompetensi dan kisi-kisi butir soal.

2. Tahap desain

Berdasarkan tahap investigasi awal, dilakukan suatu upaya mengembangkan suatu

produk yakni instrumen assessment for learning dengan politomus response

50

(jawaban beralasan). Pada tahap ini dilakukan perancangan instrumen, yaitu

merumuskan tujuan tes, merumuskan materi matematika, dan menyusun kisi-kisi

butir soal.

a. Merumuskan materi

Perumusan materi dilakukan dengan memperhatikan beberapa bab dan sub bab

materi kelas yang termasuk dalam materi pembelajaran pada satu semester. Materi

sesuai pada Kompetensi Inti (KI) dan Kompetensi Dasar (KD) dalam

Permendikbud No. 70 Tahun 2013 tentang Kerangka Dasar dan Struktur

Kurikulum Sekolah Menengah Kejuruan/Madrasah Aliyah Kejuruan. Dan

disesuaikan dengan Keputusan Direktur Jendral Pendidikan Dasar dan Menengah

No. 130/D/KEP/KR/2017 tentang Struktur Kurikulum Pendidikan Menegah

Kejuruan. Materi tes yang digunakan terletak pada Kompetensi Dasar:

1. Menganalisis barisan dan deret aritmatika (3.5).2. Menganalisis barisan dan deret geometri (3.6).3. Menerapkan operasi matriks dalam menyelesaikan masalah yang berkaitan

dengan matriks (3.15)4. Menentukan nilai determinan, invers dan transpose pada ordo 2 x 2 dan nilai

determinan dan transpose pada ordo 3 x 3 (3.16)5. Menentukan nilai variabel pada persamaan dan fungsi kuadrat (3.19)6. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan deret

aritmatika (4.5).7. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan deret

geometri (4.6).8. Menyelesaikan masalah yang berkaitan dengan matriks (4.15)9. Menyelesaikan masalah yang berkaitan dengan determinan, invers dan

transpose pada ordo 2 x 2 serta nilai determinan dan (4.16)10. Menyelesaikan masalah yang berkaitan dengan persamaan dan fungsi kuadrat

(4.19)

b. Menyusun kisi-kisi penulisan soal

Penyusunan kisi-kisi tes berdasarkan pada materi yang telah dirumuskan

sebelumnya. Kisi-kisi penulisan soal berisi Kompetensi Inti, Kompetensi Dasar,

51

Indikator Pencapaian Kompetensi, Materi, Indikator Soal dan Nomor Soal.

Selanjutnya pada masing-masing indikator pencapaian kompetensi berisi minimal

satu butir soal. Indikator pencapaian kompetensi dikembangkan menjadi beberapa

indikator soal. Indikator soal berisi tujuan dan kriteria soal tes untuk digunakan

oleh peneliti sebagai panduan dalam menyusun spesifikasi butir soal. Kisi-kisi tes

diperlukan agar penulisan butir soal sesuai dengan standar kompetensi yang

diharapkan.

c. Menyusun spesifikasi butir soal

Kisi-kisi yang telah disusun kemudian digunakan sebagai panduan dalam

menyusun butir soal. Spesifikasi butir soal secara garis besar berisi Standar

Kompetensi Lulusan (SKL), indikator pencapaian kompetensi, ruang lingkup

materi dan contoh butir soal. Spesifikasi butir soal disusun untuk beberapa butir

soal dengan ketentuan tercakup dalam indikator SKL dan materi yang sama.

Selanjutnya spesifikasi butir soal digunakan oleh guru mata pelajaran yang

dikenakan sebagai penulis soal dalam penelitian. Penulisan soal dilakukan untuk

mengetahui kesesuaian antara spesifikasi dan butir soal yang dihasilkan.

3. Tahap realisasi/konstruksi

Pada tahap ini, solusi yang telah didesain direalisasikan untuk bisa menghasilkan

suatu prototipe awal. Prototipe yang dihasilkan masih berupa prototipe awal yang

berupa instrumen evaluasi. Konstruksi prototipe berawal dari penulisan butir

soalyang selanjutnya perlu dilakukan penelaahan butir soal.

52

a. Penulisan butir soal

Penulisan butir soal berpedoman pada spesifikasi butir soal yang telah disusun

agar butir soal yang dihasilkan sesuai dengan standar kompetensi yang

diharapkan. Jumlah butir soal yang kembangkan sebanyak 20 butir.

b. Menelaah butir soal

Penelaahan butir soal tidak terlepas dari kisi-kisi dan spesifikasi butir soal yang

telah dibuat. Contoh butir soal yang telah dihasilkan dari spesifikasi butir soal

selanjutnya dirakit menjadi lembar penilaian instrumen tes. Berdasarkan lembar

instrumen penilaian yang dihasilkan selanjutnya dilakukan telaah oleh guru mata

pelajaran dan dosen ahli. Validator diminta oleh peneliti untuk memberikan

penilaian kesesuaian antara indikator dengan butir soal. Telaah dimaksudkan

untuk memudahkan peneliti dalam memperoleh informasi terkait butir soal yang

telah memenuhi kriteria atau belum memenuhi kriteria aspek telaah. Dengan

demikian untuk mempertimbangkan keefektifan waktu peneliti maka penilaian

lembar instrumen dilakukan secara terpisah oleh masing-masing telaah. Hasil

telaah digunakan oleh peneliti untuk memperbaiki contoh butir soal. Lembar

penilaian dirancang tiap butir untuk memudahkan validator dalam mencermati

kedalaman isi butir soal terhadap indikator yang disajikan dan ketetapan pilihan

jawaban yang diberikan. Butir yang sesuai dengan indikator soal diberi nilai 1 dan

butir yang tidak sesuai diberi nilai 2. Jika validator memberi penilaian tidak sesuai

maka diberi tanda check list pada kolom “lemah” dan memberi saran perbaikan

pada butir soal. Jika validator memberi penilaian “sesuai” maka beri tanda check

list pada kolom “kuat”, selanjutnya dihitung menggunakan Indeks Gregory untuk

mengetahui validitas isi tes.

53

Berdasarkan hasil perhitungan validitas isi maka butir soal yang memiliki

interprestasi sebagai koefisien yang rendah, sedang atau tinggi. Azwar (2014:

113) menyatakan bahwa artinya butir tersebut memiliki validitas isi yang baik dan

mendukung validitas isi tes secara keseluruhan, sehingga dapat digunakan sebagai

contoh soal yang memiliki kriteria baik.

4. Tahap tes, evaluasi, dan revisi

Pada tahap ini instrumen evaluasi yang berhasil direalisasikan dilihat kualitasnya.

Hal-hal yang dilakukan adalah menguji validitas instrumen evaluasi yang masih

berupa prototipe 1 oleh validator. Berdasarkan hasil uji validasi ini kemudian

dilakukan revisi hingga diperoleh perangkat instrumen assessment dalam bentuk

prototipe i yang valid untuk kemudian dilakukan uji coba untuk mengetahui

validitas, reliabilitas, daya beda, dan tingkat kesukarannya.

Pada tahap ini tes dapat berupa uji coba penelitian, yakni butir soal yang telah

dirakit terlebih dahulu dilakukan uji coba. Uji coba diberikan kepada kelas yang

sudah mendapatkan materi. Sekolah sasaran ini di SMK se-Lampung Timur yang

dalam hal ini diwakili oleh salah satu sekolahan yang tidak termasuk dalam

sasaran uji penelitian. Setelah uji coba penelitian selanjutnya dilakukan

pengumpulan lembar jawaban peserta didik untuk dianalisis secara kuantitatif

menggunakan Winsteps.

5. Tahap implementasi

Tahap ini termasuk dalam uji penelitian, setelah dilakukan perbaikan butir soal

berdasarkan hasil analisis dari uji coba penelitian. Butir soal yang telah

dinyatakan baik digunakan pada uji coba penelitian. Uji penelitian diberikan

54

kepada kelas yang telah mendapatkan materi yang diujikan. Sekolah sasaran di

SMK se-Lampung Timur yang diwakili oleh tiga sekolahan sasaran penelitian.

Setelah dilakukan evaluasi dan diperoleh produk yang valid, dan dinyatakan

layak, maka produk dapat diimplementasikan pada situasi yang sesungguhnya dan

wilayah yang lebih luas. Plomp (1997:6) menyatakan:“Solutions have to be

introduced,in other words, have to be implemented”. Pemecahan (solusi) harus

dikenalkan, dengan perkataan lain, harus diimplementasikan. Implementasi ini

dapat dilakukan dengan melakukan penelitian lanjutan penggunaan produk

pengembangan pada wilayah yang lebih luas. Lebih jelasnya perhatikan gambar

3.1.

Implementation

Keterangan :

: Kegiatan pengembangan

Implementation

Prelimenary investigation

design

Realization/construction

Test, evaluation and revision

Gambar 3.1. Langkah Pengembangan.

55

: Alur kegiatan tahap pengembangan

: Alur kegiatan timbal balik antara tahapan pengembangan dan

implementasi yang dilakukan

: Arah kegiatan balik ketahapan pengembangan selanjutnya

D. Teknik dan Instrumen Pengumpulan Data

1. Teknik pengumpulan data

Teknik pengumpulan data merupakan faktor penting demi keberhasilan penelitian.

Dalam penelitian ini, peneliti menggunakan teknik pengumpulan data yaitu

dokumentasi. Menurut Sukmadinata (2012: 221) “Teknik dokumentasi merupakan

suatu teknik pengumpulan data dengan menghimpun dan menganalisis dokumen-

dokumen, baik dokumen tertulis, gambar maupun elektronik”. Teknik

dokumentasi yang digunakan untuk mendapatkan data berupa : (a) lembar Soal

Evaluasi, (b) lembar kunci jawaban soal, dan (c) lembar jawaban peserta didik.

Butir soal yang telah disusun akan dianalisis secara kualitatif dan diujikan kepada

peserta didik. Selanjutnya dilakukan tahap analisis secara kuantitatif. Berdasarkan

hasil analisis tersebut diperoleh butir baik sehingga produk akhir yang dihasilkan

berupa instrumen assessment for learning untuk mata pelajaran matematika.

2. Instrumen pengumpulan data

Instrumen pengumpulan data berupa beberapa instrumen yang digunakan pada

penelitian meliputi 1) kisi-kisi instrumen assessmen for learning. Kisi-kisi

instrumen yang digunakan sebagai acuan peneliti untuk menyusun spesifikasi

butir soal, 2) instrumen assessment for learning berbentuk pilihan ganda beralasan

untuk mengukur kemampuan peserta didik, 3) lembar penilaian instrumen tes

56

untuk mengetahui validitas isi instrumen. Lembar telaah berisi kriteria yang perlu

dinilai terdiri dari kompetensi dasar, indikator, dan soal mengacu pada spesifikasi

butir soal, 4) lembar telaah tes secara teoritis berdasarkan aspek isi, aspek

konstruksi, dan aspek bahasa untuk mengetahui butir yang telah memenuhi

kriteria aspek telaah, dan 5) lembar jawaban peserta didik yang digunakan oleh

peneliti untuk memperoleh informasi terkait respons peserta didik.

Untuk dapat digunakan suatu tes tersebut perlu dilengkapi dengan pedoman

penskoran. Pedoman penskoran dibentuk untuk menjaga objektivitas penilaian

dan kepastian yang diperoleh peserta didik. Penskoran ini dirancang dalam skala

politomus 1 sampai 4 dengan kriteria skor sebagai berikut:

Tabel 3.1. Kriteria Penskoran Jawaban

Kriteria Jawaban Alasam Skor1. Jika peserta didik salah dalam menjawab pertanyaan soal

(S) dan salah dalam memberikan alasan (S).S S 1

2. Jika peserta didik salah dalam menjawab pertanyaan soal(S) namun benar dalam memberikan alasan (B).

S B 2

3. Jika peserta didik benar dalam menjawab pertanyaan soal(B) namun salah dalam memberikan alasan (S).

B S 3

4. Jika peserta didik benar dalam menjawab pertanyaan soal(B) dan benar dalam memberikan alasan (B).

B B 4

Penskoran tersebut mengacu pada penentuan skor politomus model Partial Credit

Model dimana jawaban dan opsi memiliki keterkaitan (Retnawati, 2016: 149).

E. Teknik Analisis Data

Teknik analisis data yang digunakan dalam penelitian pengembangan ini meliputi:

1. Validitas isi

Validitas isi ditentukan menggunakan kesepakatan ahli (expert). Kesepakata ahli

bidang studi atau sering disebut domain yang diukur menentukan tingkatan

57

validitas isi. Hal ini dikarenakan instrumen pengukuran dibuktikan valid jika ahli

meyakini bahwa instrumen tersebut mengukur penguasaan kemampuan yang

didefinisikan dalam domain ataupun konstruk psikologi yang diukur (Retnawati,

2014: 7). Peneliti meminta kepada ahli untuk memeriksa ketepatan antara

kesesuaian butir soal dengan indikator-indikatornya, redaksi penulisan soal, dan

kesesuaian pilihan jawaban (pengecoh) pada pilihan ganda. Apabila masih ada

kekeliruan dalam pembuatan instrumen, maka instrumen tersebut direvisi

kembali.

Setelah dilakukan pemeriksaan oleh ahli, dalam hal ini sebagai validator,

selanjutnya ahli memberikan penilaian terhadap instrumen. Penilaian tersebut

terdiri dari 4 kriteria sebagai berikut

Tabel 3.2. Kriteria Penilaian Butir Instrumen oleh Validator

Nilai Keterangan1 Tidak relevan2 Cukup relevan3 Relevan4 Sangat Relevan

Setelah diberikan penilaian oleh ahli, selanjutnya peneliti menghitung hasil

penilaian menggunakan indeks validitas, diantaranya dengan indeks yang

diusulkan oleh Gregory sebagai berikut.

Koefisien validitas isi =

Keterangan:V = ValiditasA = Penilai I dan II menyatakan lemahB = Penilai I menyatakan kuat, penilai II menyatakan lemahC = Penilai I lemah, penilai II menyatakan kuatD = Penilai I dan II menyatakan kuat

(Retnawati, 2016: 32-33)

58

Rentang angka V yang mungkin diperoleh adalah antara 0 sampai dengan 1.

Semakin tinggi angka V (mendekati 1 atau sama dengan 1) maka nilai kevalidan

sebuah item/butir soal juga semakin tinggi, dan semakin rendah angka V

(mengekati 0 atau sama dengan 0) maka nilai kevalidan sebuah item/butir soal

juga semakin rendah.

2. Validitas konstruk

Untuk membuktikan validitas konstruk dapat dilakukan dengan dua cara, yakni

analisis faktor eksplanatori dan analisis faktor konfirmatori. Dalam penelitian ini,

pembuktian validitas konstruk menggunakan analisis faktor eksplanatori. Sebelum

melakukan analisis faktor eksplanatori terlebih dahulu dilakukan uji kecukupan

sampel dengan melihat nilai Kaiser Mayer Olkin (KMO). Nilai KMO diperoleh

melalui analisis dengan bantuan software IBM SPSS 22. Jika nilai KMO lebih

dari 0,5 maka variabel dan sampel yang digunakan memungkinkan untuk

dilakukan analisis lebih lanjut (Retnawati, 2016:47).

Tahap selanjutnya adalah melihat nilai eigen dan screplot dari hasil analisis faktor

eksplanatori, Untuk melihat faktor-faktor yang terbentuk maka yang diperhatikan

adalah nilai eigen yang lebih besar dari 1. Dari faktor yang terbentuk maka dapat

diketahui persentase variansi yang dapat dijelaskan. Jika persentase varians yang

terjelaskan lebih besar dari 20% atau perbandingan nilai eigen pertama dengan

kedua sebesar 5 atau 4 maka instrument yang diukur memuat dimensi tunggal atau

bersifat unidimensi (wells & Purwono, 2008).

Adapun langkah-langkah untuk mencari nilai KMO dengan SPSS IBM 20 adalah

sebagai berikut:

a. Input data,

59

b. Klik Analyze,

c. Pilih Dimension Reduction, lalu pilih Factor,

d. Masukkan semua butir soal ke kolom items, lalu pilih Descriptives dan

beri tanda centang pada KMO and Barlett’s test of sphecirity, dan

e. Klik OK

3. Estimasi reliabilitas instrumen

Teknik analisis data untuk estimasi reliabilitas instrumen ini menggunakan teknik

estimasi konsistensi internal dengan formula Chronbach-alpha yang dibantu

aplikasi SPSS IBM. Jika nilai Chronbach’s Alpha 0,60 dan kurang dari 1, maka

nilai instrumen tersebut memiliki korelasi tinggi atau reliabel, sedangkan jika nilai

Cronbach’s Alpha di bawah 0,50 ke bawah, maka instrumen tersebut berkorelasi

rendh atau tidak reliabel (Basuki dan Hariyanto, 2014: 105). Hal ini juga

didukung oleh Surapranata (2009: 114), bahwa koefisien reliabilitas sebesar 0,5

dapat digunakan untuk tujuan penelitian.

Adapun langkah-langkah untuk mencari nilai Cronbach’s Alpha dengan SPSS

IBM adalah sebagai berikut:

a. Input data,

b. Klik Analyze,

c. Pilih Scale, lalu pilih Reliability Analysis,

d. Masukkan semua butir soal ke kolom items, dan

e. Klik OK.

Tabel 3.3. Kriteria Cronbach’s Alpha

Nilai Cronbach’s Alpha Tingkat Keandalan0.0 - 0.20 Kurang Andal>0.20 – 0.40 Agak Andal

60

Nilai Cronbach’s Alpha Tingkat Keandalan>0.40 – 0.60 Cukup Andal>0.60 – 0.80 Andal>0.80 – 1.00 Sangat Andal

Dalam penelitian ini didapatkan nilai reliabilitasnya sebesar 0,71, maka dapat

dikatakan instrument tersebut berkorelasi tinggi atau reliabel. Derikut reliabilitas

yang diperoleh, dapat dilihat juga dari kolom Summary of Statistics dengan

program Winstep (Lampiran Hasil Output winstep reliabilitas).

4. Tingkat Kesukaran Butir Soal

Teknik analisis data tingkat kesukaran butir soal berupa pilihan ganda beralasan

dapat dihitung menggunakan rumus (Nitko, 2011:30):

= ℎ ℎSetelah dilakukan perhitungan maka butir soal dapat dikategorikan menjadi butir

soal yang sangat mudah, sedang, sukar, dan sangat sukar mengacu pada Baker

(2011:11). Berikut adalah table tingkat kesukaran.

Tabe 3.4. Kategori Tingkat Kesukaran

Sangat mudah Mudah Sedang Sukar Sangat sukar– 2,0 – 0,5 0 +0,5 2,0

5. Analaisis Karakteristik Butir Tes Uji Coba

Analisis data dimulai dengan mendeskripsikan kelayakan karakteristik tes objektif

pilihan ganda tingkat SMK menggunakan item respon teori dengan bantuan

Program Winstep. Program Winstep digunakan karena memiliki beberapa

keunggulan (Subali & Suyata, 2011:2) yaitu: 1). Dapat menganalisis data berupa

61

dikotomus dan politomus, 2). Tersedianya hasil analisis teori modern didasarkan

pada model maksimum likelihood menggunakan model logistik satu parameter.

Analisis menggunakan IRT dapat dilakukan dengan menguji asumsi unidimensi

melalui analisis kesesuaian (fit) atau analisis faktor eksplanatori. Butir tes

dilakukan unidimensi jika butir tersebut mengukur satu kemampuan. Jika asumsi

unidimensi telah terpenuhi, maka secara otomatis asumsi independiensi local juga

telah terpenuhi. Indikasi bahwa butir tes bersifat unidimensi adalah data

cocok/sesuai (fit) dengan model. Untuk mengetahui apakah model yang

digunakan sesuai butir maka dapat digunakan statistic Infit mean-Squere (IMS)

dan Outfit Mean-Square (OMS). Statistic IMS dan OMS merupakan tingkat

kesesuaian antara data observasi dan nilai prediksi oleh model. Butir tes dikatakan

fit model jika memiliki nilai IMS dan OMS berkisar dari 0,5 sampai 1,5 (Linacre,

2002).

Tabel 3.5. Rentang Nilai IMS dan OMS

Nilai Implikasi bagi pengukuran>2,0 Merusak sistem pengukuran1,5 – 2,0 Tidak mempunyai makna bagi pengukuran0,5 – 1,5 Bermanfaat bagi pengukuran< 0,5 Tidak bermanfaat bagi pengukuran, tetapi tidak merusak

V. KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan tujuan penelitian pengembangan yang telah dilakukan, dapat ditarik

kesimpulan sebagai berikut:

1. a. Semua butir assessment for learning dengan politomus respons yang telah

dikembangkan cocok dengan Partial Credit Model (PCM).

b. Keseluruhan butir soal assessment for learning dengan politomus respons

yang telah dikembangkan memiliki tingkat kesulitan dengan kategori

sedang.

2. a. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan berdasarkan hasil validitas konstruk terdiri dari 40 butir

soal.

b. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan memiliki indeks validitas isi sebesar 1 atau dengan kategori

sangat tinggi.

c. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan memiliki koefisien reliabilitas sebesar 0,89 atau kategori

sangat tinggi.

d. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan telah memenuhi parameter unidimensi dengan nilai

komulatif eigen sebesar 20,22% dan scree plot grafik landai pada faktor

110

kedua.

e. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan telah memenuhi parameter independensi lokal dengan nilai

kovaria antar kelompok mendekati nol.

f. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan telah memenuhi parameter kecocokan butir (item fit)

dengan nilai Output MNSQ sebesar 0,5 sampai dengan 1,5 dan Pt-Measure

Corr bernilai positif.

g. Instrumen assessment for learning dengan politomus respons yang telah

dikembangkan berdasarkan nilai fungsi informasi dan kesalahan

pengukuran, instrumen cocok untuk peserta didik dengan kemampuan

sedang

B. Saran

Berdasarkan simpulan dapat diberikan saran pemanfaatan produk sebagai berikut:

1. Adanya instrumen assessment for learning dengan politomus respons yang

digunakan sebagai alat evaluasi diimbangi dengan kegiatan belajar mengajar

yang melatih dan mampu mengembangkan pemahaman peserta didik dan

kemampuan berpikir peserta didik secara berkesinambungan.

2. Instrumen assessment for learning dengan politomus respons dapat digunakan

oleh guru untuk proses evaluasi dan diharapkan untuk dapat dijadikan

pedoman untuk menyusun instrumen serupa pada materi matematika yang

lainnya

111

3. Bagi guru-guru yang akan melihat kemampuan peguasaan dan pemahaman

peserta didik dalam mata pelajaran matematika dapat menggunakan instrumen

dalam penelitian ini, karena sudah teruji karakteristiknya. Khsususnya pada

kompetensi dasar :

a. Menganalisis barisan dan deret aritmatika (3.5).b. Menganalisis barisan dan deret geometri (3.6).c. Menerapkan operasi matriks dalam menyelesaikan masalah yang berkaitan

dengan matriks (3.15)d. Menentukan nilai determinan, invers dan transpose pada ordo 2 x 2 dan

nilai determinan dan transpose pada ordo 3 x 3 (3.16)e. Menentukan nilai variabel pada persamaan dan fungsi kuadrat (3.19)f. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan

deret aritmatika (4.5).g. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan

deret geometri (4.6).h. Menyelesaikan masalah yang berkaitan dengan matriks (4.15)i. Menyelesaikan masalah yang berkaitan dengan determinan, invers dan

transpose pada ordo 2 x 2 serta nilai determinan dan (4.16)j. Menyelesaikan masalah yang berkaitan dengan persamaan dan fungsi

kuadrat (4.19)

4. Bagi guru yang ingin mengembangkan mencoba mengembangkan sediri

instrumen assessment for learning dengna politomus respons agar mengikuti

langkah-langkah pengembangan instrumen yang digunakan dalam penelitian

ini agar memperoleh instrumen yang valid.

DAFTAR PUSTAKA

Allen, M.j., & Yen, W.M. 1979. Introduction to measurement theory. Monterey,Mexico : Broocks/Cole Publishing Company.

Anderson, L.W., & Krathwohl, D.R. 2001. A Taxonomy for Learning, Teaching,and Assesing: A Revision of Bloom’s Taxonomy of EducatioanlObjectives. New York: Addison Wesley Longman, Inc.

Arikunto, S. 2012. Dasar-Dasar Evaluasi Pendidikan Edisi Revisi. Jakarta: BumiAksara

Azwar, S. 2009. Reliabilitas dan Validitas, edisi ke-3. Yogyakarta: PustakaPelajar.

Baker, F.B. 2001. The basics of item response theory. United States of America:ERIC

Basuki, I. & Hariyanto. 2014. Asesmen pembelajaran. Bandaung : PT. RemajaRosdakarya.

Bloom, B.S., Engelhart, M.D., Furst, E.J., Hill, W.H., & Krathwohl, D.R. 1956.The Taxonomy of Educational Objectives The Classification ofEducational Goals, Handbook I: Cognitive Domain. New York: DavidMcKay.

Chandrasegaran, A.L, Treagust, D, & Mocerino, M. 2007. The Development of ATwo-Tier Multiple-Choice Diagnostic Instrument forEvaluatingSecondary School Students’ Ability to Describe And ExplainChemical Reactions Using Multiple Levels Of Representation. ChemistryEducation Research and Practice 8(3). 293-307.

Cizek, G. & Andrade, H. 2010. Handbook of Formative Assessment. New York:Roudledge.

Daryanto. 2008. Evaluasi Pendidikan. Jakarta: Rineka Cipta

Demars, C.E. 2010. Item Response Theory. New York: Oxford University Press.

Hambleton, R.K., & Swaminathan, H. 1985. Item Response Theory: Principlesand Applications. Boston: Kluwer.

Hambleton, R.K., Swaminahan, H., & Rogers, H.J. 1991. Fundamental of ItemResponse Theory. Newbury, CA: Sage Publication Inc.

Irvine & Kyllonen. 2002. Item Generation for Test Development. Mahwah, NJ:Lawrence Erlbaum Associates, Publishers.

Joni, T. R. 1986. Pengukuran Dan Penilaian Pendidikan. Surabaya: Karya Anda.

Linacre, J. M. 2012. Winstep : Rasch-Model Computer Programs. Chicago:Winsteps.com

Karso, dkk. 2009. Pendidikan Matematika I. Jakarta: Universitas Terbuka.

Makmun, A.S. 2007. Psikologi Kependidikan Perangkat sistem PengajaranModul. Bandung: Rosdakarya

Malhotra, Naresh K. 2006. Riset Pemasaran. Jakarta: Eirlangga.

Mardapi, D. 2008. Teknik penyusunan instrumen tes dan non tes. Yogyakarta :Mitra Cendika

Masters, G.N. 1999. Partial credit model. In: Masters, G.N. & Keeves, J.P.(1999). Advances in measurement in educational research andassessment. Amasterdam: Pergamon, An imprint of Elsevier Science.

Messick, S. 1988. The once and feature issues of validity. Dalam H. Wainer & H.L. Braun (Eds.). Test validyty. (pp. 33-40). Hilladale, NJ: LawrenceErlbaum Associates, Publisher.

Miller, P.W. 2008. Measurement and teaching. Munster, Indiana: Patric W. Miller& Association.

Muraki,E., & Bock, R.D. 1997. Parscale 3: IRT based test scoring and itemanalysis for graded items and rating scales. Chicago: Scintific SoftwareInc.

Nitko, A.J., & Brookhart, S.M. 2007. Educational Assessment of Student. NewJersey: Pearson Education

Ostini, R. & Nering, M. L. 2006. Polytomus Item Response Theory Models.Thousand Oaks, CA: Sage Publications, Inc.

Permendikbud No. 22 Tahun 2016. Tentang Standar Isi untuk Satuan PendidikanDasar dan Menengah.

Permendikbud No. 23 Tahun 2016. Tentang Standar Penilaian Pendidikan.

Permendikbud No. 60 Tahun 2014. Tentang Kurikulum 2013 Sekolah MenengahKejuruan/Madrasah Aliyah Kejuruan.

Plomp, Tj. 1997. Educational Design: Introduction. Form Tjeerd Plomp (eds).Educational & Training System Design:Introduction. Design ofEducation and Training (in Dutch). Utrecht (The Netherlands): Lemma.Netherland. Faculty of Educational Science and Technology, Universityof Twente. Enschede the Netherlands.

Purnomo, Y.W. 2014. Assessment Based Learning: Sebuah Tinjauan untukMeningkatkan Motivasi Belajar dan Pemahaman Matematis. SigmaJourna, ISSN: 1411-5166 No.01, Vol. VI.

Reedal, Kristin E. 2010. Journay Jean Piaget’s Cognitive DevelopmentTheory in Mathematics Education. Dalam Jurnal InternasionalCognitive Development and Learning Mathematics.http://ripon.edu/macs/summation.

Retnawati, H. 2014. Teori Respons Butir dan Penerapannya untuk Peneliti,Praktisi Pengukuran dan Pengujian, Mahasiswa Pascasarjana.Yogyakarta: Nuha Medika.

__________. 2016. Validitas, Reliabilitas & Karakteristik Butir Panduan untukPeneliti, Mahasiswa, dan Psikometrian. Yogyakarta: Nuha Medika.

Rochmad. 2012. “Desain Model Pengembangan Perangkat PembelajaranMatematika”. Jurnal Kreano. Volume 3 No. 1. Hal 59-72.

Rosidin, Undang. 2017. Evaluasi dan Asesmen Pembelajaran. Media Akademi:Yogyakarta.

Ruseffendi, E.T. 2006. Pengantar kepada Membantu Guru MengembangkanKompetensinya dalam Pengajaran Matematika untuk MeningkatkanCBSA. Bandung: Tarsito.

Sukmadinata, Nana Syaodih. 2012. Metode Penelitian Pendidikan. Bandung:Remaja Rosdakarya.

Surapranata, S. 2009. Analisis, validitas, reliabilitas, dan interpretasi hasil tesimplementasi kurikulum 2004. Bandung : PT. Remaja Rosdakarya.

Suwarto. 2012. Pengembangan Tes Diagnostik dalam Pembelajaran. Jogjakarta:Graha Ilmu

Syah, Muhibbin. 2010. Psikologi Pendidikan dengan Pendekatab Baru. Bandung: Remaja Rosdakarya.

Treagust, D. 1988. Development and Use of Diagnostic Tests to EvaluateStudent’s Misconceptions in Science. International Journal of ScienceEducation 10(2). 159-169

Tüysüz, 2009. Development of Two-Tier Diagnostic Instrument and AssessStudents’ Understanding In Chemistry. Academic Journal. 4(6). 626-631

Wu, M. & Adam, R. 2007. Applying The Rasch Model To PsychosocialMeasurement: A Practical Approach. Melbourne: EducationalMeasurement Solution.