life long education: BELAJAR VALIDITAS DAN RELIABILITAS

BAB I

PENDAHULUAN

A. Latar Belakang

Pelaksanaan kegiatan pembelajaran mulai dari perencanaan, pelaksanaan, dan penilaian. Kegiatan tersebut dilakukan secara sistematis dan hirarki untuk menjamin mutu pendidikan pada suatu satuan pendidikan. Sebagai upaya menjamin mutu pendidikan maka perlu adanya suatu kegiatan yang dilakuka sekolah untuk mengetahui ketercapaian pembelajaran. kegiatan tersebut adalah melalui tes.

Pelaksaan tes dapat dilakukan berdasarakan waktu pada pertengahan semester atau tes formatif dan tes akhir semester atau tes sumatif. Kedua tes tersebut dilakukan untuk mengetahui ketercapaian tujuan pembelajaran yang telah ditentukan. Dalam melaksanakan tes tersebut dapat dengan menggunakan bentuk-bentuk tes yaitu subjektif dan uraian.

Namun dalam pelaksanaan tes tersebut dilapangan ternyata masih sering terdapat instrumen tes yang belum optimal dalam mengukur kemampuan tiap siswa. Guru lebih sering ketika selesai menyusun soal dan memberikan kepada siswa langsung dinilai tanpa melakukan analisis butir tiap soal. Hal tersebut dapat dilihat pada hasil penelaah soal-soal yang diberikan para guru pada sekolah tertentu yang ternyata belum dapat dikatakan baik.

Oleh karena itu, sebuah instrumen tes perlu diadakan analisis sehingga dapat dikatakan baik untuk dapat mengukur kemampuan siswa setelah menerima materi yang diajarkan. Aspek-aspek yang perlu dianalisis diantaranya tingkat validitas, reliabilitas, distractor, taraf kesukaran, analisis butir secara kualitatif, dan menyusun kartu soal.

Berdasarkan permasalahan di atas maka dianggap perlu untuk dikaji lebih dalam melalui paparan materi dengan judul “analisis butir soal” sehingga dapat mengatasi masalah-masalah di atas.

B. Rumusan Masalah

Berdasarkan latar belakang masalah di atas maka paparan materi ini dapat dirumuskan sebagai berikut.

1. Apa pengertian validitas dan reliabilitas?

2. Bagaimana pengujian validitas dan reliabilitas?

3. Apa saja faktor-faktor yang mempengaruhi validitas dan reliabilitas?

4. Bagaimana analisis tingkat kesukaran?

5. Bagaimana menghitung keefektifan pengecoh?

6. Bagaimana analisis butir secara kualitatif?

7. Bagaimana menyusun kartu soal pilihan ganda?

C. Tujuan

Adapun tujuan penulisan materi ini diantaranya

1. Validitas dan Reliabilitas

2. Pengujian Validitas dan Reliabilitas

3. Faktor-Faktor yang Mempengaruhi Validitas dan Reliabilitas

4. Analisis Tingkat Kesukaran

5. Menghitung Keefektifan Pengecoh

6. Analisis Butir Secara Kualitatif

7. Menyusun Kartu Soal Pilihan Ganda

BAB II

PEMBAHASAN

A. Validitas dan Reliabilitas

1. Pengertian Validitas

Menurut Azwar (1998) menyatakan validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Dengan demikian maka tes yang dilakukan untuk mengetahui penguasaan sejumlah kompetensi oleh siswa harus disusun dengan merepresentasikan sejumlah materi yang telah diajarkan.

Mahendra, dkk (2014) menyatakan suatu tes di katakan valid jika tes itu benar-benar mengukur apa yang hendak di ukur. Misalnya bila hendak mengukur tinggi badan seseorang maka ukuran yang cocok atau memenuhi syarat adalah meter. Berdasarkan kedua pendapat di atas maka dapat dikatakan bahwa validnya suatu instrumen sangat bergantung pada ketepatan dalam mengukur sesuatu.

2. Pengertian Reliabilitas

Menurut Nuriyah (2014) yang dimaksud dengan reliable adalah konsisten dan dapat diandalkan. Jika anda memberi tes yang sama pada siswa yang sama atau mengorelasikan dua buah perangkat tes yang paralel, dan hasilnya relatif sama, tes itu dikatakan terandal. Reliabilitas dapat mencakupi reliabilitas antarpenilai dan reliabilitas pelaksanaan. Reliabilitas antarpenilai akan terjadi apabila hasil penilaian yang dilakukan oleh beberapa penilai relatif sama. Misalnya, jika kita memberi skor esei seorang siswa 70, sedangkan sejawat kita memberi skor 72, kedua penilai itu dapat dikatakan memberikan hasil penilaian yang reliable. Reliabilitas dalam pelaksanaan penilaian terjadi apabila instrumen tes yang digunakan dalam situasi apapun hasilnya relatif sama. Reliabilitas dalam pelaksanaan ini dapat terganggu oleh adanya kegaduhan, variasi hasil foto kopi, pencahayaan, dan faktor-faktor sejenis lainnya.

Menurut Anzwar (1998) menyatakan bahwa reliabilitas diterjemahkan dari kata reliability. Pengukuran yang memiliki reliabilitas tinggi maksudnya adalah pengukuran yang dapat menghasilkan data yang reliabel. Hal ini dapat dijelaskan bahwa tingkat reliabilitas sangat tergantung pada hasil yang diperoleh bersifat konstan. Sejalan dengan itu, Joesmani (1988) mengatakan bahwa reliabilitas menunjuk kepada keajegan (consistency) pengukuran. Paparan kedua pengertian tersebut dapat ditegaskan bahwa keajegan merupakan syarat utama suatu data dapat dikatakan reliabel.

Berdasarkan kedua pengertian tentang validitas dan reliabilitas maka dapat dinyatakan bahwa tiap butir soal yang digunakan sebagai intrumen dalam melakukan tes untuk mengetahui penguasaan sejumlah kompetensi oleh siswa dilihat dari segi hasil yang diperoleh oleh siswa dan hasil tersebut tidak berubah-ubah ketika dilakukan tes dalam waktu yang berbeda-beda (consistency).

B. Pengujian Validitas dan Reliabilitas

1. Pengujian Validitas

Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara :Pertama, penganalisisan yang dilakukan dengan jalan berfikir secara rasional atau penganalisisan dengan menggunakan logika
(logical analysis). Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, dimana penganalisisan dilaksanakan dengan menggunakan empirical analysis (Anas Sudijono, 2009 dalam Mahendra, dkk. 2014).

a. Pengujian Validitas Tes Secara Rasional

Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diproleh dengan berfikir secara logis. Dengan demikian maka suatu tes hasil belajar dapat dikatakan telah memiliki validitas Rasional, apabila setelah dilakukan penganalisisan secara rasional ternyata bahwa tes hasil belajar itu memang (secara rasional) dengan tepat telah dapat mengukur apa yang
seharusnya di ukur.

Validitas tes dapat dibedakan menjadi tiga macam berdasarkan tiga sudut pandang (dari arah isi yang diukur, dari arah rekaan teoritis atau disebut contruct atribut yang diukur, dan dari arah kriteria alat ukur), yaitu; 1) Validitas isi (content validity); 2) Validitas kontruksi (construct validity); dan 3). validitas berdasar kriteria (criterion-related validity).

1) Validitas Isi

Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Jadi, validitas isi sebenarnya identik dengan pembicaraan tentang populasi dan sampel. Sedangkan menurut (Sumarna. 2004 dalam Mahendra, dkk. 2014) menyatakan bahwa validitas isi sering pula dinamakan validitas kurikulum yang mengandung arti bahwa suatu alat ukur dipandang valid apabila sesuai dengan isi kurikulum yang hendak diukur.

Kalau saja keseluruhan materi pelajaran yang telah diberikan kepada peserta didik atau sudah diperintahkan untuk dipelajari oleh peserta didik kita anggap sebagai populasi, dan isi tes hasil belajar dalam mata pelajaran yang sama kita anggap sebagai sampelnya, maka tes hasil belajar dalam mata pelajaran tersebut dapat dikatakan telah memiliki validitas isi, apabila isi tes tersebut (sebagai sampel), dapat menjadi wakil yang representatif (layak = memadai) bagi seluruh materi pelajaran yang telah diajarkan atau telah diperintahkan untuk dipelajari (sebagai populasi).

Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan. Validitas isi suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Jadi validitas isi adalah validitas yang dilihat dari segi tes itu sendiri sebagi alat pengukur hasil belajar. Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pembelajaran yang diberikan.

2) Validitas Kunstruksi

Secara etimologi “konstuksi” mengandung arti susunan, kerangka atau rekaan. Adapun secara terminologi, suatu tes hasil belajar dapat diajarkan sebagai tes yang telah memiliki validitas konstruksi, apabila tes tersebut ditinjau dari segi susunan, kerangka atau kerangkaann nya telah dapat dengan secara tepat mencerrminkan suatu konstruksi dalam teori psikologi. Validitas kontruksi dari suatu tes hasil belajar dapat dilakukan penganalisisannya dengan jalan melakukan pencocokan terhadap aspek-aspek berfikir yang terkandung dalam tes hasil belajar tersebut.

Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya dengan melakukan pencocokan antara aspekaspek berpikir yang terkandung dalam tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk adalah malalui pendekatan multi trait multi-method (Saifuddin Azwar, 2003 dalam Mahendra, dkk. 2014).

3) Validitas Berdasarkan Kriteria

Validitas kriteria merupakan validitas yang disusun berdasarkan kriteria yang telah ada sebelumnya. Dalam validitas kriteria, kesahihan alat ukur dilihat dari sejauhmana hasil pengukuran tersebut sama dengan hasil pengukuran alat lain yang dijadikan kriteria. Biasanya, dalam pengukuran psikologis, yang dijadikan kriteria, adalab hasil Pengukuran lain yang telah dianggap sebagai alat ukur yang
baik misalnya tes Stanford Binnet atau tes Weschler. Validitas kriteria dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang disebut validitas
prediktif (predictive validity).

Untuk memperoleh validitas kriteria, diperlukan pengujian dengan menggunakan korelasi. Validitas kriteria ditunjukkan dengan angka korelasi antara skor pada alat yang dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria. Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas ditunjukkan dengan skor pada saat ujian masuk dengan skor yang diperoleh padasaat seseorang telah belajar selama beberapa waktu tertentu.

Menurut Sumadi Suryabrata, (2004) dalam (Mahendra, dkk. 2014) dalam menafsirkan koefisien validitas yang didapat dari mengkorelasikan skor alat ukur
dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. Semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.

b. Pengujian Validitas Tes Secara Empiris

Validitas empirik adalah kerapatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Dengan kata lain validitas empirik adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi yaitu pertama, segi daya ketepatan meramalnya ( predictive validity) dan kedua dari segi daya ketepatan bandingannya (concurrent validity).

1) Validitas Ramalan

Validitas ramalan adalah suatu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan criteria tertentu, jika kedua variable tersebut terdapat korelasi positif yang signifikan maka, tes hasil belajar yang sedang diuji validitas ramalannya tersebut dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramalan yang
tepat artinya apa yang diramalkan tersebut benar-benar terjadi secara nyata dalam praktek.

2) Validitas Bandingan

Suatu tes sebagai alat pengukur dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukan adanya hubungan searah antara tes pertama dengan tes berikutnya. Validitas bandingan juga dikenal dengan istilah sama saat validtas penganlaman atau validitas ada sekarang. Dikatakan validitas pengalaman karena, validitas tes tersebut ditentukan atas dasar pengalaman yang telah diperoleh sedangkan, dikatakan validitas ada sekarang, sebab validitas itu dikaitkan dengan hal-hal yang telah ada, sehingga data mengenai pengalaman masa lalu itu pada saat sekarang ini sudah berada ditangan.

Seperti halnya validitas ramalan, maka untuk dapat mengetahui ada atau tidaknya hubungan searah antara tes pertama dengan tes berikutnya, dapat digunakana teknik analisis korelasi product moment, jika korelasi variable X tes pertama dengan variable Y adalah positif maka, tes tersebut dapat dinyatakan
sebagai tes yang telah memiliki validitas bandingan.

c. Teknik Pengujian Validitas Item Tes Hasil Belajar

1) Pengertian validitas item

Menurut Pramana, dkk (2014) mengatakan validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.

Berdasarkan uraian diatas maka cukup jelas bahwa sebutir item dapat dikatakan telah memiliki validitas tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya, skor total disini berkedudukan sebagai variabel terikat sedangkan variabel item merupakan variable bebasnya. Permasalahannya adalah bagaimana memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu.

a) Pengujian Validitas

Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul atau salah. Setiap butir soal yang dapat dijawab dengan benar diberikan skor 1 (satu) sedangkan untuk setiap jawaban yang salah diberikan skor 0 (nol) jenis data seperti ini biasanya merupakan tes benar – salah, ya – tidak dan sejenisnya dalam ilmu statistic dikenal dengan disket murni atau data dikotomik. Sedangkan, skor total yang dimiliki oleh masing-masing testee adalah merupakan
penjumlahan dari setiap skor itu merupakan data kontinyu.

Berdasarkan teori yang ada apabila variable 1 berupa data dikotomik sedangkan variable II data kontinyu maka, teknik korelasi yang tepat untuk digunakan dalam mencari korelasi dua variabel adalah teknik korelasi point biserial, dimana angka indeks korelasi diberi lambang Rpbi dapat diperoleh dengan
rumus :
R_pbi=

Keterangan:

R_pbi = koefisien korelasi point berserial yang melambangkan kekuatan korelasi antara variable I dan II yang dalam hal ini sebagai koefisien validitas item

Mp = skor rata-rata hitung yang dimiliki oleh testee

Mt = skor rata-rata dari skor total

SDt = standar deviasi dari skor total

p = proporsi testee yang menjawab dengan benar terhadap butir item yang diuji validitasnya.

q = proporsi testee yang menjawab salah terhadap
butir item yang diuji validitasnya

2. Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Objektif

Single test – single trial merupakan pendekatan “serba single” atau „serba satu”, yaitu satu kelompok subyek, satu jenis alat pengukur atau satu kelompok
testee, dan satu kali testing. Penentuan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula spearman-brown dikenal dengan istilah teknik belah dua (split half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.

r_tt =

Keterangan :

Rtt = Koefisien relibilitas tes secara total (tt = total tes)

Rhh = Koefisien kolerasi product moment antara separuh tes pertama dan separuh tes kedua (hh = half-half).

1 & 2 = Bilangan konstan

Selain itu pendekatan single test-single trial dengan menggunakan formula Flanagan:

Rumus: r₁₁= 2 (1- )

Keterangan.

r11 = Koefesien reliabilitas secara total

2 & 1 = Bilangan konstan

S1² = Jumlah varian dari skor-skor hasil tes yang termasuk belahan I

S2² = Jumlah varian dari skor-skor hasil tes yang termasuk belahan II

St² = Jumlah varian total dari skor hasil tes belahan I dan II

Rumus: S₁^2 =∑x2/N, deviasi x = X-M_x

S₂^{2 =}∑Y2/N, deviasi y = Y-M_y

S_t^{2 =}∑(X+Y)2/N

Hasil pengukuran diharapkan akan sama apabila pengukuran itu diulangi.
Dengan perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada
peserta yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada
perubahan dalam kemampuan maka skor yang diperoleh akan konstan. Kriteria
untuk menentukan tinggi rendahnya reliabilitas sebuah perangkat tes, menurut
(Suharsimi Arikunto : 2001) dilihat pada rentangan koefesien korelasi sebagai
berikut :

Kategori Reliabilitas Tes Nilai Koefisien Korelasi

Sangat Tinggi = 0,800-1,000

Tinggi = 0,600-0,799

Cukup = 0,400-0,599

Rendah = 0,200-0,399

Sangat Rendah = 0,000-0,199

C. Faktor-Faktor Yang Mempengaruhi Validitas dan Reliabilitas

1. Faktof Yang Mempengaruhi Validitas

Menurut Djoesmani (1988) menyatakan bahwa tidak ada suatu tes yang benar-benar invalid, yang ada yaitu validitas rendah, sedang, dan tinggi. Berikut merupakan beberapa faktor yang mempengaruhi validitas tes.

a. Faktor tes itu sendiri

Dalam menganalisis soal tes dalam hubungan dengan validitas ada dua hal yang perlu diperhatikan yaitu pengukuran isi pengajaran dan pengukuran fungsi mental. Soal tes dengan penekanan pengukuran isi pengajaran (subject matter content) menyangkut validitas isi, sedangkan soal tes dengan penekanan pengukuran fungsi mental menyangkut validitas kosntruk. Berikut merupakan faktor yang menyebabkan rendahnya fungsi tes hingga hasilnya menunjukkan validitas yang rendah pula.

1) Petunjuk Pengerjaan Tidak Jelas

2) Kata-kata yang digunakan sukar

3) Tingkat kesukaran soal kurang memadai

4) Konstruksi tes yang kurang baik

5) Soal-soal yang ambigius

6) Soal-soal tes tidak sesuai dengan kemampuan yang diukur

7) Tes dengan soal yang sangat sedikit

8) Pengaturan soal tes yang salah

9) Cara mengatur letak jawaban yang benar

b. Faktor prosedur dan fungsi isi pengajaran

Pada pengukuran prestasi belajar siswa guru tidak hanya membandingkan antara isi soal tes dan isi pengajaran saja tetapi juga kompleksitas kemampuan yang akan diukur. Misalnya jenjang kemampuan berpikir kritis diukur dengan soal problem solving. Bila soal problem solving itu pernah diberikan dan guru sudah memberikan pemecahannya, maka soal tersebut tidak mengukur berpikir kritis lagi tetapi hanya mengukur ingatan saja.

c. Faktor pelaksanaan tes dan pemberian skor

Dalam pelaksanaan tes ada beberapa hal yang dapat mempengaruhi validitas tes. Tempat tes yang tidak nyaman, ventilasi yang tidak cukup, udara yang pengap, tempat duduk yang berdekatan, gaduh, bantuan yang ilegal yang diberikan kepada peserta tes dan sebagainya. Demikian juga dalam pemberian skor soal tes essai yang terlalu subjektif akan sangat mempengaruhi validitas tes.

d. Faktor respon siswa

Umumnya dalam mengahadapi tes banyak diantara siswa yang muncul rasa takut, cemas dan sebagainya. Apabila siswa pada saat mengerjakan tes masih memiliki rasa tersebut akan menjadi gurup, skor yang diperoleh tidak mencerminkan kemampuan yang sesungguhnya.

2. Faktor Yang Mempengaruhi Reliabilitas

Sebagai contoh speeded tes selalu menunjukkan adanya koefisien reliabilitas tinggi yang mengukur konsistensi internal, sedang pada test-retest koefisien ditentukan oleh lamanya interval waktu yang digunakan, makin pendek angka koefisien makin besar dan sebagainya. Berikut merupakan beberapa faktor yang dapat mempengaruhi besarnya koefisien reliabilitas.

a. Panjang Tes

Secara umum apabila jumlah soal tes makin banyak maka angka koefisien reliabilitas semakin tinggi. Makin banyak soal tes makin banyak sampel yang diukur, proporsi jawaban benar makin banyak, dengan demikian faktor guessing makin rendah.

b. Penyebaran Skor

Besarnya koefisien reliabilitas tes juga dipengaruhi oleh penyebaran skor dalam kelompok peserta tes. Bila dalam berbagai hal sama, makin besar penyebaran skor makin rendah pula reliabilitas. Koefisien reliabilitas ditentukan oleh posisi skor individu dari tes yang satu ke tes yang lain.

c. Derajat Kesukaran

Tingkat kesukaran soal sangat mempengaruhi besarnya koefisien reliabilitas tes. Tes yang sangat mudah atau sangat sukar cenderung mempunyai koefisien reliabilitas yang rendah. Sedangkan pada tes dengan derajat kesukaran ideal akan mempunyai koefisien reliabilitas yang tinggi.

d. Objektivitas

Objektivitas menunjukkan kepada keajegan dalam skor. Karena itu kunci objektivitas terletak pada korektor. Bila korektor dapat memberikan skor dengan prosedur yang ajeg dari berbagai tes yang diberikan maka hasilnya akan ajeg pula, reliabilitas akan tinggi.

D. Analisis Tingkat Kesukaran

Menurut (Pramana, 2014) Berkualitas atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah. Dengan kata lain derajat kesukaran item tersebut adalah sedang atau cukup.

Menurut Whiterington (dalam Pramana, 2014) angka indeks kesukaran item tersebut besarnya berkisar antara 0,00 sampai dengan 0,01. Artinya angka indeks kesukaran paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indeks 0,00 merupakan petunjuk bagi tester bahwa item butir-butir tes hasil belajar tersebut terlalu sukar. Sebaliknya, jika angka indeks 0,01 merupakan bahwa butir item yang bersangkutan terlalu mudah.

Untuk memperoleh angka indeks tersebut menggunakan rumus :
P =
Dimana :
P          = proporsi atau angka indeks kesukaran (P kotor)
Np       = jumlah testee yang menjawab benar
N         = jumlah testee

Cara kedua untuk menghitung indeks adalah dengan menggunakan skala kesukaran linier. Skala kesukaran linier ini disusun dengan cara mentransformasikan nilai P menjadi nilai z, dimana perubahan dari P ke z itu
dilakukan dengan berkonsultasi pada tabel nilai z yang pada umumnya dilampirkan pad buku-buku statistik. Dengan menggunakan cara yang kedua, maka memperhatikan langkah-langkah sebagai berikut.
Langkah pertama dengan menggunakan rumus :

Rumus: P_b=

Dimana :

P_b = P bersih

P_k= P kotor

A = option yang digunakan

1 = bilangan konstan

Besarnya tingkat kesukaran berkisar antara 0,00 sampai 1,00. Untuk
sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi
tiga kelompok, yaitu mudah, sedang dan sukar. Sebagai patokan menurut
(Asmawi Zainul, dkk : 1997) dapat digunakan tabel sebagai berikut.

Tingkat Kesukaran Nilai p

Sukar = 0,00-0,25

Sedang = 0,26-0,75

Mudah = 0,76-1,00

Setelah berhasil diidentifikasi butir-butir item mana yang derajat kesukarannya termasuk dalam kategori cukup, terlalu sukar dan terlalu mudah maka yang menjadi pokok permasalahan sekarang adalah, bagaimana menindaklanjuti hasil analisis item tersebut. Dalam kaitannya dengan hasil analisis item dari segi derajat kesukaran, maka tindak lanjut yang perlu
dilakukan oleh tester adalah sebagai berikut.

1. Kategori Baik

Untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam kategori baik, seyogyanya butir item tersebut segera dicata dalam buku bank soal. Selanjutnya butir-butir soal tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang.

2. Kategori Terlalu Sukar

Untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tidak lanjut, yaitu; 1) Butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang; 2) diteliti ulang, dilacak dan ditelusuri sehingga dapat diketahui factor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee; apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan atau menjawab soalnya sulit dipahami, atau dalam soal terdapat istilah-istilah yang tidak jelas. Setelah dilakukan perbaikan kembali, butirbutir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang; 3) haruslah dipahami bahwa tidak setiap butir item yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki kegunaan. Butir-butir item yang terlalu sukar itu sewaktu-waktu masih dapat diambil manfaatnya, yaitu dapat digunakan dalam tes-tes (terutama tes seleksi) yang sifatnya sangat ketat. Dalam kondisi seperti itu sangat tepat apabila butir-butir item yang dikeluarkan adalah butir-butir item yang termasuk kategori terlalu sukar dengan asumsi bahwa testee dengan kemampuan yang rendah dengan mudah akan tersisihkan dari seleksi, sedangkan testee yang memiliki kemampuan tinggi tidak akan terlalu sukar untuk lolos dalam seleksi tersebut.

3. Kategori Terlalu Mudah

Untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga ada tiga kemungkinan tindak lanjut, yaitu: (1) butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang. (2) diteliti ulang, dilacak dan ditelusuri secara cermat guna mengetahui factor yang menyebabkan butir item tersebut dapat dijawab betul oleh hamper seluruh testee; ada kemungkinan option atau alternative yang dipasangkan pada butir-butir item yang bersangkutan terlalu mudah diketahui oleh testee, mana item yang merupakan kunci jawaban item dan mana option yang berfungsi sebagai pengecoh atau distractor. Disini tester harus berusaha memperbaiki atau menggantinya dengan option yang lain sedemikian rupa sehingga antara kunci jawaban dengan pengecoh sulit dibedakan oleh testee. Setelah dilakukan perbaikan, item yang bersangkutan dicoba untuk dikeluarkan lagi pada tes hasil belajar selanjutnya. Tujuannya adalah untuk mengetahui apakah derajat kesukaran item itu menjadi lebih baik atau tidak daripada yang sebelumnya. (3) seperti halnya butir-butr item yang terlalu sukar, butirbutir item yang terlalu mudah juga masih mengandung manfaat, yaitu bahwa butr-butir item yang termasuk dalam kategori ini dapat dimanfaatkan pada tes-tes yang sifatnya longgar, dalam arti bahwa sebagian besar dari testee akan dinyatakan lulus dalam tes seleksi tersebut.

Dalam kondisi seperti ini sangat bijaksana apabila butir-butir item yang dikeluarkan dalam tes seleksi tersebut adalah butir-butir item yang termasuk dalam kategori terlalu mudah, sehingga tes seleksi itu boleh dikatakan
hanya sebagai formalitas saja.

E. Menghitung Keefektifan Pengecoh

Menurut (Pramana, dkk. 2014) pada saat membicarakan tentag tes obyektif bentuk multiple choice item telah dikemukakan bahwa pada tes bentuk multiple choice item tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar sudah dilengkapi dengan beberapa kemungkinan jawaban, atau yang sering dikenal dengan istilah option. Option atau altrnatif ini jumlahnya berkisar antara tiga sampai dengan lima buah, dan dari kemungkinankemungkinan jawaban yang dipasang pada setiap butir item itu salah satu merupakan jawaban yang betul, dan sisanya itu merupakan jawaban yang salah. Jawabanjawaban yang salah itulah yang bisa dikenal dengan istilah distractor.

Tujuan utama dari pemasangan distractor pada setiap butir item yaitu agar dari sekian banyak testee yang menikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab mereka akan mengira bahwa jawaban yang merepilih adalah jawaban betul. Jadi mereka akan terkecoh, menganggap bahwa distractor yang terpasang pada item itu sebagai kunci jawaban, padahal bukan. Dengan kata lain distractor baru dapat menjalankan fungsinya dengan baik jika distraktor telah memiliki daya rangsang yang membuat testee terkecoh. Menganalisis fungsi distractor sering dikenal dengan istilah menganalisis pola penyebaran jawaban item.

Menganalisis fungsi distractor sering dikenal dengan istilah lain, yaitu: menganalisis pola penyebaran jawaban item. Adapaun yang dimaksud dengan pola penyebaran jawaban item adalah suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir item. Dalam hubungannya dengan pe,bicaraan tentang pengecoh atau distractor, cara yang dapat digunakan untuk menentukan apakah suatu distractor tersebut dudah dapat menjalankan fungsinya dengan baik atau tidak, ada beberapa hal yang perlu ditekankan.

Kelaziman yang berlaku dalam dunia evaluasi hasil belajar ialah, bahwa distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta. Misalnya tes hasi belajar diikuti oleh 100 testee. Distractor yang dipasang pada item tersebut dapat dinyatakan berfungsi apabila minimal 5 orang dari 100 testee sudah terkecoh untuk memilih distractor tersebut

Menurut Arifin (2016) pada soal bentuk pilihan ganda ada alternatif jawaban (opsi) yang merupakan pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata.

Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:

IP = x 100%

Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh

N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal

n = jumlah alternatif jawaban (opsi)

1 = bilangan tetap

Adapun kualitas pengecoh berdasar indeks pengecoh adalah.

Sangat baik IP = 76% - 125%

Baik IP = 51% - 75% atau 126% - 150%

Kurang Baik IP = 26% - 50% atau 151% - 175%

Jelek IP = 0% - 25% atau 176% - 200%

Sangat jelek IP= lebih dari 200%

F. Analisis Butir Soal Secara Kualitatif

Menurut Basuki dan Hariyanto (2016) analisis butir soal dapat dilakukan baik secara kualitatif maupun kuantitatif. Dalam analisis butir soal secara kualitatif digunakan format penelaahan soal. Biasanya hal-hal yang ditelaah dalam analisis kualitatif adalah hal-hal yang terkait materi soal, konstruksi soal dan kaitannya dengan bahasa serta budaya di masyarakat tempat soal itu dibuat.

Agar para penelaah dapat dengan mudah menggunakan format penelaan soal, para penelaah soal perlu memperhatikan petunjuk pengisian formatnya sebagai berikut.

1. Analisislah setiap butir soal berdasarkan kriteria yang tertera dalam format.

2. Berilah tanda cek (√) pada kolom “ya” jika soal yang ditelaah sudah sesuai dengan kriteria.

3. Berilah tanda cek (√) pada kolom “tidak” jika soal yang ditelaah tidak sesuai dengan kriteria, kemudian tuliskan alasan mengapa tidak sesuai pada teks soal dan atau perbaikannya.

Berikut ini akan dibahas tentang format analisis butir soal bentuk pilihan ganda.

Tabel 2.1 Contoh Format Penelaahan Soal Bentuk Pilihan Ganda

No.	Aspek yang ditelaah	Nomor soal
No.	Aspek yang ditelaah	1	2	3	4	dst
A.	Materi
1.	Soal sesuai dengan indikator (menurut tes tertulis untuk pilihan ganda).
2.	Materi yang ditanyakan sesuai dengan komposisi (urgensi, relevansi, kontuinitas, keterpakaian sehari-hari tinggi).
3.	Pilihan jawaban homogen dan logis
4.	Hanya ada satu kunci jawaban
B.	Konstruksi
1.	Pokok soal dirumuskan dengan singkat, jelas, dan tegas.
2.	Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja
3.	Pokok soal tidak memberi petunjuk kunci jawaban
4.	Pokok soal bebas dari pernyataan yang bersifat negatif ganda
5.	Pilihan jawaban homogen dan logis ditinjau dari segi materi.
6.	Gambar, grafik, tabel, diagram, atau sejenisnya jelas dan berfungsi
7.	Panjang pilihan jawaban relatif sama
8.	Pilihan jawaban tidak menggunakan pernyataan “semua jawaban di atas salah/benar” dan sejenisnya.
9.	Pilihan jawaban berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnya.
10.	Butir soal tidak bergantung pada jawaban soal sebelumnya
C.	Bahasa
1.	Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia
2.	Menggunakan bahasa ang komunikatif
3.	Tidak menggunakan bahasa yang berlaku setempat/tabu.
4.	Pilihan jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu kesatuan pengertian.
5.	Kalimat soal tidak menyalin/menjiplak persis suatu teks bacaan.
6.	Kalimat dalam pokok soal tidak menyinggung pribadi seseorang, suku, ras, dan agama.

G. Menyusun Kartu Soal Bentuk Pilihan Ganda

Depdiknas (2008) menyatakan menulis soal bentuk pilihan ganda sangat diperlukan keterampilan dan ketelitian. Hal yang paling sulit dilakukan dalam menulis soal bentuk pilihan ganda adalah menuliskan pengecohnya. Pengecoh yang baik adalah pengecoh yang tingkat kerumitan atau tingkat kesederhanaan, serta panjang‐pendeknya relatif sama dengan kunci jawaban. Oleh karena itu, untuk memudahkan
dalam penulisan soal bentuk pilihan ganda, maka dalam penulisannya perlu mengikuti langkah‐langkah berikut, langkah pertama adalah menuliskan pokok soalnya, langkah kedua menuliskan kunci jawabannya, langkah ketiga menuliskan pengecohnya. Untuk memudahkan pengelolaan, perbaikan, dan perkembangan soal, maka soal ditulis di dalam format kartu soal. Setiap satu soal ditulis di dalam satu format.

Gambar 2.1 Contoh Kartu Soal

Soal bentuk pilihan ganda merupakan soal yang telah disediakan pilihan jawabannya. Peserta didik yang mengerjakan soal hanya memilih satu jawaban yang benar dari pilihan jawaban yang disediakan. Soalnya mencakup: (1) dasar pertanyaan/stimulus (bila ada), (2) pokok soal (stem), (3) pilihan jawaban yang terdiri atas: kunci jawaban dan pengecoh.
Perhatikan contoh berikut!

Gambar 2.2 Contoh Penulisan Butir Soal

1. Kaidah penulisan soal pilihan ganda adalah seperti berikut ini.

a. Materi

1) Soal harus sesuai dengan indikator. Artinya soal harus menanyakan perilaku dan materi yang hendak diukur sesuai dengan rumusan indikator dalam kisi‐kisi.

2) Pengecoh harus bertungsi

3) Setiap soal harus mempunyai satu jawaban yang benar. Artinya, satu soal hanya mempunyai satu kunci jawaban.

b. Konstruksi

1. Pokok soal harus dirumuskan secara jelas dan tegas. Artinya, kemampuan/ materi yang hendak diukur/ditanyakan harus jelas, tidak menimbulkan pengertian atau penafsiran yang berbeda dari yang dimaksudkan penulis. Setiap butir soal hanya mengandung satu persoalan/gagasan.

2. Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja. Artinya apabila terdapat rumusan atau pernyataan yang sebetulnya tidak diperlukan, maka rumusan atau pernyataan itu dihilangkan saja.

3. Pokok soal jangan memberi petunjuk ke arah jawaban yang benar. Artinya, pada pokok soal jangan sampai terdapat kata, kelompok kata, atau ungkapan yang dapat memberikan petunjuk ke arah jawaban yang benar.

4. Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda. Artinya, pada pokok soal jangan sampai terdapat dua kata atau lebih yang mengandung arti negatif. Hal ini untuk mencegah terjadinya kesalahan penafsiran peserta didik terhadap arti pernyataan yang dimaksud. Untuk keterampilan bahasa, penggunaan negatif ganda diperbolehkan bila aspek yang akan diukur justru pengertian tentang negatif ganda itu sendiri.

5. Pilihan jawaban harus homogen dan logis ditinjau dari segi materi. Artinya, semua pilihan jawaban harus berasal dari materi yang sama seperti yang ditanyakan oleh pokok soal, penulisannya harus setara, dan semua pilihan jawaban harus berfungsi.

6. Panjang rumusan pilihan jawaban harus relatif sama. Kaidah ini diperlukan karena adanya kecenderungan peserta didik memilih jawaban yang paling panjang karena seringkali jawaban yang lebih panjang itu lebih lengkap dan merupakan kunci jawaban.

7. Pilihan jawaban jangan mengandung pernyataan “Semua pilihan jawaban di atas salah" atau "Semua pilihan jawaban di atas benar". Artinya dengan adanya pilihan jawaban seperti ini, maka secara materi pilihan jawaban berkurang satu karena pernyataan itu bukan merupakan materi yang ditanyakan dan pernyataan itu menjadi tidak homogen.

8. Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar kecilnya nilai angka atau kronologis. Artinya pilihan jawaban yang berbentuk angka harus disusun dari nilai angka paling kecil berurutan sampai nilai angka yang paling besar, dan sebaliknya. Demikian juga pilihan jawaban yang menunjukkan waktu harus disusun secara kronologis. Penyusunan secara unit dimaksudkan untuk memudahkan peserta didik melihat pilihan jawaban.

9. Gambar, grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi. Artinya, apa saja yang menyertai suatu soal yang ditanyakan harus jelas, terbaca, dapat dimengerti oleh peserta didik. Apabila soal bisa dijawab tanpa melihat gambar, grafik, tabel atau sejenisnya yang terdapat pada soal, berarti gambar, grafik, atau tabel itu tidak berfungsi.

10. Rumusan pokok soal tidak menggunakan ungkapan atau kata yang bermakna tidak pasti seperti: sebaiknya, umumnya, kadang‐kadang.

11. Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan pada soal sebelumnya menyebabkan peserta didik yang tidak dapat menjawab benar soal pertama tidak akan dapat menjawab benar soal berikutnya

c. Bahasa/budaya

1. Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. Kaidah bahasa Indonesia dalam penulisan soal di antaranya meliputi; a) pemakaian kalimat; (1) unsur subyek; (2) unsur predikat; (3) anak kalimat; b) pemakaian kata: (1) pilihan kata; (2) penulisan kata; dan c) pemakaian ejaan; (1) penulisan huruf; (2) penggunaan tanda baca.

2. Bahasa yang digunakan harus komunikatif, sehingga pernyataannya mudah dimengerti warga belajar/peserta didik.

3. Pilihan jawaban jangan yang mengulang kata/frase yang bukan merupakan satu kesatuan pengertian. Letakkan kata/frase pada pokok soal

BAB III

PENUTUP

A. Kesimpulan

Kegiatan penilaian merupakan bagian penting dalam kegiatan pembelajaran. Melalui kegiatan penilaian maka kita dapat mengetahui hasil belajar peserta didik. Hasil belajar yang diperoleh hendaknya diuji tingkat validitas ataupun reliabilitas ketika selesai melaksanakan tes. Selain itu dapat pula dianalisis isntrumen tes melalui menghitung keefektifan pengecoh, taraf kesukaran, serta menganalisis instrumen secara kualitatif.

Melalui kegiatan di atas maka suatu instrumen dan hasil belajar yang diperoleh peserta didik dapat dikatakan baik. Sehingga, hasil belajar yang telah diketahui dapat digunakan pula untuk meremedi atau bahkan dilakukan pengayaan bagi peserta didik. Dengan demikian maka hasil kegiatan penilaian yang dilakukan dapat dipakai dalam rangka penjaminan mutu pendidikan satuan pendidikan tertentu.

DAFTAR RUJUKAN

Arifin, Zainal. 2016. Evaluasi Pembelajaran. Bandung: PT Remaja Rosadakarya

Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil Belajar. Pusat Antar
Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan
Dan kebudayaan

Azwar S. 1998. Tes Prestasi Fungsi Pengembangan Pengukuran Prestasi Belajar Yogyakarta. Pustaka Pelajar

Basuki, Ismet & Hariyanto. 2016. Asesmen Pembelajaran. Bandung: PT Remaja Rosdakarya

Depdiknas. 2008. Panduan Penulisan Butir Soal. Jakarta: Departemen Pendidikan Nasional Direktorat Jenderal Manajemen Pendidikan Dasar dan Menengah Direktorat Pembinaan Sekolah Menengah Atas https://teguhsasmitosdp1.files.wordpress.com/2010/05/butir_soal1.pdf

Joesmani. 1988. Pengukuran dan Evaluasi Dalam Pengajaran. Jakarta: Departemen Pendidikan dan Kebudayaan Direktorat Jenderal Pendidikan Tinggi Proyek Pengembangan Lembaga Pendidikan Tentang Tenaga Kependidikan

Mahendra A. K. dkk. 2014. Ilmu Dasar Evaluasi Pembelajaran. diakses:ebook

https://restanaasta.files.wordpress.com/2014/01/ilmu-dasar-evaluasi-pendidikan.pdf

Nuriyah, N. 2014. Evaluasi Pembelajaran. diakses:jurnal https://www.google.co.id/search?dcr=0&q=jurnal+evaluasi+pembelajaran+pdf&sa=X&ved=0ahUKEwjsoMS6lsrZAhULLo8KHbqnCjoQ1QIIwgEoAw

Pramana, Doni, Nyoman, I. dkk. 2014. Evaluasi Pendidikan. Bali: Beta

Suharsimi Arikunto. 2001. Dasar-Dasar Evaluasi Pendidikan. Bumi Aksara:
Jakarta.

Sukardi, M.H. 2011. Evaluasi Pendidikan Prinsip dan Operasionalnya. Jakarta: PT Bumi Aksara

life long education

Sabtu, 17 Maret 2018

BELAJAR VALIDITAS DAN RELIABILITAS

Tidak ada komentar:

Posting Komentar

Formulir Kontak