PENDAHULUAN
A.
Latar
Belakang
Pelaksanaan kegiatan
pembelajaran mulai dari perencanaan, pelaksanaan, dan penilaian. Kegiatan
tersebut dilakukan secara sistematis dan hirarki untuk menjamin mutu pendidikan
pada suatu satuan pendidikan. Sebagai upaya menjamin mutu pendidikan maka perlu
adanya suatu kegiatan yang dilakuka sekolah untuk mengetahui ketercapaian
pembelajaran. kegiatan tersebut adalah melalui tes.
Pelaksaan tes dapat dilakukan
berdasarakan waktu pada pertengahan semester atau tes formatif dan tes akhir
semester atau tes sumatif. Kedua tes tersebut dilakukan untuk mengetahui
ketercapaian tujuan pembelajaran yang telah ditentukan. Dalam melaksanakan tes
tersebut dapat dengan menggunakan bentuk-bentuk tes yaitu subjektif dan uraian.
Namun dalam pelaksanaan
tes tersebut dilapangan ternyata masih sering terdapat instrumen tes yang belum
optimal dalam mengukur kemampuan tiap siswa. Guru lebih sering ketika selesai
menyusun soal dan memberikan kepada siswa langsung dinilai tanpa melakukan
analisis butir tiap soal. Hal tersebut dapat dilihat pada hasil penelaah
soal-soal yang diberikan para guru pada sekolah tertentu yang ternyata belum
dapat dikatakan baik.
Oleh karena itu, sebuah instrumen
tes perlu diadakan analisis sehingga dapat dikatakan baik untuk dapat mengukur
kemampuan siswa setelah menerima materi yang diajarkan. Aspek-aspek yang perlu
dianalisis diantaranya tingkat validitas, reliabilitas, distractor, taraf kesukaran, analisis butir secara kualitatif, dan
menyusun kartu soal.
Berdasarkan permasalahan
di atas maka dianggap perlu untuk dikaji lebih dalam melalui paparan materi
dengan judul “analisis butir soal” sehingga dapat mengatasi masalah-masalah di
atas.
|
1
|
B.
Rumusan
Masalah
Berdasarkan
latar belakang masalah di atas maka paparan materi ini dapat dirumuskan sebagai
berikut.
1.
Apa pengertian validitas
dan reliabilitas?
2. Bagaimana
pengujian validitas dan reliabilitas?
3. Apa
saja faktor-faktor yang mempengaruhi validitas dan reliabilitas?
4. Bagaimana
analisis tingkat kesukaran?
5. Bagaimana
menghitung keefektifan pengecoh?
6. Bagaimana
analisis butir secara kualitatif?
7. Bagaimana
menyusun kartu soal pilihan ganda?
C.
Tujuan
Adapun
tujuan penulisan materi ini diantaranya
1.
Validitas dan
Reliabilitas
2. Pengujian
Validitas dan Reliabilitas
3. Faktor-Faktor
yang Mempengaruhi Validitas dan Reliabilitas
4. Analisis
Tingkat Kesukaran
5. Menghitung
Keefektifan Pengecoh
6. Analisis
Butir Secara Kualitatif
7.
Menyusun Kartu Soal
Pilihan Ganda
PEMBAHASAN
A.
Validitas
dan Reliabilitas
1.
Pengertian
Validitas
Menurut
Azwar (1998) menyatakan validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan
suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Dengan demikian
maka tes yang dilakukan untuk mengetahui penguasaan sejumlah kompetensi oleh
siswa harus disusun dengan merepresentasikan sejumlah materi yang telah
diajarkan.
Mahendra,
dkk (2014) menyatakan suatu tes di katakan valid jika tes itu benar-benar mengukur apa yang hendak
di ukur. Misalnya
bila hendak mengukur tinggi badan
seseorang maka ukuran yang cocok atau memenuhi syarat adalah meter.
Berdasarkan kedua pendapat di atas maka dapat dikatakan bahwa validnya suatu
instrumen sangat bergantung pada ketepatan dalam mengukur sesuatu.
2.
Pengertian
Reliabilitas
|
3
|
Menurut Anzwar (1998)
menyatakan bahwa reliabilitas diterjemahkan dari kata reliability. Pengukuran yang memiliki reliabilitas tinggi maksudnya
adalah pengukuran yang dapat menghasilkan data yang reliabel. Hal ini dapat
dijelaskan bahwa tingkat reliabilitas sangat tergantung pada hasil yang
diperoleh bersifat konstan. Sejalan dengan itu, Joesmani (1988) mengatakan
bahwa reliabilitas menunjuk kepada keajegan (consistency)
pengukuran. Paparan kedua pengertian tersebut dapat ditegaskan bahwa keajegan
merupakan syarat utama suatu data dapat dikatakan reliabel.
Berdasarkan kedua
pengertian tentang validitas dan reliabilitas maka dapat dinyatakan bahwa tiap
butir soal yang digunakan sebagai intrumen dalam melakukan tes untuk mengetahui
penguasaan sejumlah kompetensi oleh siswa dilihat dari segi hasil yang
diperoleh oleh siswa dan hasil tersebut tidak berubah-ubah ketika dilakukan tes
dalam waktu yang berbeda-beda (consistency).
B.
Pengujian
Validitas dan Reliabilitas
1.
Pengujian
Validitas
Penganalisisan
terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara :Pertama,
penganalisisan yang dilakukan dengan jalan berfikir secara rasional atau penganalisisan dengan menggunakan
logika
(logical analysis). Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, dimana penganalisisan dilaksanakan dengan menggunakan empirical analysis (Anas Sudijono, 2009 dalam Mahendra, dkk. 2014).
(logical analysis). Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, dimana penganalisisan dilaksanakan dengan menggunakan empirical analysis (Anas Sudijono, 2009 dalam Mahendra, dkk. 2014).
a.
Pengujian
Validitas Tes Secara Rasional
Validitas rasional adalah validitas
yang diperoleh
atas dasar hasil pemikiran, validitas yang diproleh dengan berfikir secara
logis. Dengan
demikian maka suatu tes hasil belajar dapat dikatakan telah memiliki
validitas Rasional,
apabila setelah dilakukan penganalisisan
secara rasional ternyata bahwa tes
hasil belajar itu memang (secara rasional) dengan tepat telah dapat mengukur apa
yang
seharusnya di ukur.
seharusnya di ukur.
Validitas tes
dapat dibedakan menjadi tiga macam berdasarkan tiga sudut pandang (dari arah isi yang diukur,
dari arah rekaan teoritis atau disebut contruct atribut yang diukur, dan dari arah
kriteria alat ukur), yaitu; 1) Validitas
isi (content validity); 2) Validitas kontruksi
(construct validity); dan 3). validitas berdasar kriteria (criterion-related
validity).
1)
Validitas
Isi
Validitas isi adalah validitas yang
ditilik dari
segi isi tes itu sendiri sebagai alat pengukur hasil belajar peserta didik,
isinya telah
dapat mewakili secara representatif terhadap keseluruhan materi atau
bahan pelajaran
yang seharusnya diteskan (diujikan). Jadi, validitas isi sebenarnya
identik dengan pembicaraan
tentang populasi dan sampel. Sedangkan
menurut (Sumarna. 2004 dalam Mahendra, dkk. 2014) menyatakan bahwa validitas isi sering
pula dinamakan
validitas kurikulum yang mengandung
arti bahwa suatu alat ukur dipandang
valid apabila sesuai dengan isi
kurikulum yang hendak diukur.
Kalau saja keseluruhan materi
pelajaran yang
telah diberikan kepada peserta didik atau sudah diperintahkan untuk dipelajari
oleh peserta
didik kita anggap sebagai populasi, dan isi tes hasil belajar dalam mata
pelajaran yang sama
kita anggap sebagai sampelnya, maka tes hasil belajar dalam mata pelajaran
tersebut dapat
dikatakan telah memiliki validitas isi, apabila isi tes tersebut (sebagai
sampel), dapat menjadi
wakil yang representatif (layak =
memadai) bagi seluruh materi pelajaran yang telah diajarkan
atau telah diperintahkan untuk dipelajari
(sebagai populasi).
Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah
maupun sebelum
tes hasil belajar dilaksanakan.
Validitas isi suatu tes hasil belajar adalah validitas yang diperoleh setelah
dilakukan penganalisisan,
penelusuran atau pengujian terhadap
isi yang terkandung dalam tes hasil belajar tersebut. Jadi validitas isi
adalah validitas yang dilihat dari segi tes itu sendiri sebagi alat pengukur hasil belajar.
Sebuah tes dikatakan
memiliki validitas isi apabila mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isi pembelajaran
yang diberikan.
2)
Validitas
Kunstruksi
Secara etimologi “konstuksi” mengandung arti susunan, kerangka
atau rekaan.
Adapun secara terminologi, suatu tes hasil belajar dapat diajarkan sebagai
tes yang telah
memiliki validitas konstruksi, apabila tes tersebut ditinjau dari segi susunan,
kerangka atau
kerangkaann nya telah dapat dengan secara tepat mencerrminkan suatu konstruksi dalam teori psikologi. Validitas kontruksi dari suatu tes
hasil belajar dapat dilakukan penganalisisannya
dengan jalan melakukan pencocokan
terhadap aspek-aspek berfikir yang
terkandung dalam tes hasil belajar tersebut.
Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk.
Misalnya dengan
melakukan pencocokan antara aspekaspek berpikir yang terkandung dalam tes hasil belajar dengan aspek-aspek berpikir
yang hendak
diungkap oleh tujuan instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk adalah
malalui pendekatan
multi trait multi-method (Saifuddin Azwar, 2003 dalam Mahendra, dkk.
2014).
3)
Validitas
Berdasarkan Kriteria
Validitas kriteria merupakan
validitas yang
disusun berdasarkan kriteria yang telah ada sebelumnya. Dalam validitas
kriteria, kesahihan
alat ukur dilihat dari sejauhmana
hasil pengukuran tersebut sama dengan hasil pengukuran alat lain yang dijadikan
kriteria. Biasanya,
dalam pengukuran psikologis, yang
dijadikan kriteria, adalab hasil Pengukuran lain yang telah dianggap sebagai alat ukur
yang
baik misalnya tes Stanford Binnet atau tes Weschler. Validitas kriteria dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang disebut validitas
prediktif (predictive validity).
baik misalnya tes Stanford Binnet atau tes Weschler. Validitas kriteria dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang disebut validitas
prediktif (predictive validity).
Untuk memperoleh validitas kriteria, diperlukan pengujian dengan
menggunakan korelasi.
Validitas kriteria ditunjukkan dengan angka korelasi antara skor pada alat yang dipergunakan dengan skor yang
dihasilkan dari alat
yang dijadikan kriteria. Tetapi dalam ujian masuk perguruan tinggi misalnya,
koefisien validitas
ditunjukkan dengan skor pada saat
ujian masuk dengan skor yang diperoleh padasaat seseorang
telah belajar selama beberapa waktu
tertentu.
Menurut Sumadi Suryabrata, (2004)
dalam (Mahendra, dkk. 2014) dalam menafsirkan koefisien validitas yang didapat dari mengkorelasikan skor
alat ukur
dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. Semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.
dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. Semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.
b.
Pengujian
Validitas Tes Secara Empiris
Validitas empirik adalah
kerapatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik.
Dengan kata lain validitas empirik adalah validitas
yang bersumber
pada atau diperoleh atas dasar pengamatan
di lapangan. Untuk dapat menentukan
apakah tes hasil belajar sudah memiliki validitas empirik ataukah
belum, dapat dilakukan penelusuran dari dua segi yaitu pertama, segi daya ketepatan meramalnya ( predictive
validity) dan kedua dari segi daya ketepatan bandingannya (concurrent
validity).
1)
Validitas
Ramalan
Validitas ramalan adalah suatu
kondisi yang
menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat
menunjukan kemampuannya
untuk meramalkan apa yang bakal
terjadi pada masa mendatang. Untuk
mengetahui apakah suatu tes hasil
belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan
ataukah belum,
dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan
criteria tertentu,
jika kedua variable tersebut terdapat korelasi positif yang signifikan maka,
tes hasil belajar
yang sedang diuji validitas ramalannya tersebut dapat dinyatakan sebagai tes
hasil belajar
yang telah memiliki daya ramalan yang
tepat artinya apa yang diramalkan tersebut benar-benar terjadi secara nyata dalam praktek.
tepat artinya apa yang diramalkan tersebut benar-benar terjadi secara nyata dalam praktek.
2)
Validitas
Bandingan
Suatu tes sebagai alat pengukur dikatakan telah memiliki validitas
bandingan apabila
tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukan adanya hubungan searah
antara tes
pertama dengan tes berikutnya. Validitas bandingan juga dikenal dengan istilah
sama saat
validtas penganlaman atau validitas ada sekarang. Dikatakan validitas
pengalaman karena,
validitas tes tersebut ditentukan atas dasar pengalaman yang telah diperoleh sedangkan, dikatakan validitas ada
sekarang, sebab
validitas itu dikaitkan dengan hal-hal yang telah ada, sehingga data
mengenai pengalaman
masa lalu itu pada saat sekarang
ini sudah berada ditangan.
Seperti halnya validitas ramalan,
maka untuk
dapat mengetahui ada atau tidaknya hubungan searah antara tes pertama dengan tes berikutnya, dapat digunakana teknik
analisis korelasi
product moment, jika korelasi variable X tes pertama dengan variable Y
adalah positif
maka, tes tersebut dapat dinyatakan
sebagai tes yang telah memiliki validitas bandingan.
sebagai tes yang telah memiliki validitas bandingan.
c.
Teknik
Pengujian Validitas Item Tes Hasil Belajar
1)
Pengertian
validitas item
Menurut Pramana, dkk
(2014) mengatakan validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh
sebutir item
(yang merupakan bagian yang tak
terpisahkan dari tes bagian suatu totalitas), dalam mengukur apa yang seharusnya diukur
lewat butir item
tersebut.
Berdasarkan uraian diatas maka cukup jelas bahwa sebutir item dapat
dikatakan telah memiliki
validitas tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item
yang bersangkutan
memiliki kesesuaian atau kesejajaran
arah dengan skor totalnya, skor
total disini berkedudukan sebagai variabel terikat sedangkan variabel item
merupakan variable
bebasnya. Permasalahannya
adalah bagaimana memilih
dan menentukan jenis tekhnik dalam rangka menguji validitas item itu.
a)
Pengujian Validitas
Seperti yang diketahui pada tes objektif maka
hanya ada dua kemungkinan
yaitu betul atau salah. Setiap
butir soal yang dapat dijawab dengan
benar diberikan skor 1 (satu) sedangkan
untuk setiap jawaban yang salah
diberikan skor 0 (nol) jenis data seperti ini biasanya merupakan tes benar – salah,
ya – tidak
dan sejenisnya dalam ilmu statistic dikenal dengan disket murni atau data dikotomik. Sedangkan, skor total yang
dimiliki oleh masing-masing testee adalah merupakan
penjumlahan dari setiap skor itu merupakan data kontinyu.
penjumlahan dari setiap skor itu merupakan data kontinyu.
Berdasarkan teori yang ada apabila variable 1 berupa data dikotomik
sedangkan variable
II data kontinyu maka, teknik korelasi yang tepat untuk digunakan dalam
mencari korelasi
dua variabel adalah teknik korelasi point biserial, dimana angka indeks
korelasi diberi
lambang Rpbi dapat diperoleh dengan
rumus :
Rpbi =
rumus :
Rpbi =
Keterangan:
Rpbi = koefisien
korelasi point berserial yang melambangkan kekuatan korelasi antara variable I
dan II yang dalam hal ini sebagai koefisien validitas item
Mp = skor rata-rata hitung
yang dimiliki oleh testee
Mt = skor rata-rata dari
skor total
SDt = standar deviasi dari
skor total
p = proporsi testee yang
menjawab dengan benar terhadap butir item yang diuji validitasnya.
q = proporsi testee yang menjawab salah
terhadap
butir item yang diuji validitasnya
butir item yang diuji validitasnya
2.
Teknik
Pengujian Reliabilitas Tes Hasil Belajar Bentuk Objektif
Single test –
single trial merupakan pendekatan “serba single” atau „serba satu”,
yaitu satu kelompok subyek, satu jenis alat
pengukur atau satu kelompok
testee, dan satu kali testing. Penentuan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula spearman-brown dikenal dengan istilah teknik belah dua (split half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.
testee, dan satu kali testing. Penentuan reliabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula spearman-brown dikenal dengan istilah teknik belah dua (split half technique). Hal itu dikarenakan dalam penentuan reliabilitas tes, penganalisisannya dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-masing testee memiliki dua macam skor. Untuk mengetahui reliabilitas tes secara keseluruhan spearman-brown menciptakan formula sebagai berikut.
rtt =
Keterangan :
Rtt = Koefisien relibilitas tes
secara total (tt = total tes)
Rhh = Koefisien kolerasi product moment antara
separuh tes pertama dan separuh tes kedua (hh = half-half).
1 & 2 = Bilangan konstan
Selain itu pendekatan single
test-single trial dengan menggunakan formula Flanagan:
Rumus: r11 = 2 (1-
)
Keterangan.
r11 =
Koefesien reliabilitas secara total
2 & 1 = Bilangan
konstan
S1² = Jumlah varian dari skor-skor hasil tes
yang termasuk belahan I
S2² =
Jumlah varian dari skor-skor hasil tes yang termasuk belahan II
St² = Jumlah varian total dari skor hasil
tes belahan I dan II
Rumus: S12 = ∑x2/N, deviasi x =
X-Mx
S22 = ∑Y2/N, deviasi y
= Y-My
St2 = ∑(X+Y)2/N
Hasil
pengukuran diharapkan akan sama apabila pengukuran itu diulangi.
Dengan perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada
peserta yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada
perubahan dalam kemampuan maka skor yang diperoleh akan konstan. Kriteria
untuk menentukan tinggi rendahnya reliabilitas sebuah perangkat tes, menurut
(Suharsimi Arikunto : 2001) dilihat pada rentangan koefesien korelasi sebagai
berikut :
Dengan perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada
peserta yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada
perubahan dalam kemampuan maka skor yang diperoleh akan konstan. Kriteria
untuk menentukan tinggi rendahnya reliabilitas sebuah perangkat tes, menurut
(Suharsimi Arikunto : 2001) dilihat pada rentangan koefesien korelasi sebagai
berikut :
Kategori
Reliabilitas Tes Nilai
Koefisien Korelasi
Sangat Tinggi =
0,800-1,000
Tinggi =
0,600-0,799
Cukup =
0,400-0,599
Rendah =
0,200-0,399
Sangat Rendah =
0,000-0,199
C.
Faktor-Faktor
Yang Mempengaruhi Validitas dan Reliabilitas
1.
Faktof
Yang Mempengaruhi Validitas
Menurut Djoesmani (1988)
menyatakan bahwa tidak ada suatu tes yang benar-benar invalid, yang ada yaitu
validitas rendah, sedang, dan tinggi. Berikut merupakan beberapa faktor yang
mempengaruhi validitas tes.
a.
Faktor
tes itu sendiri
Dalam menganalisis soal
tes dalam hubungan dengan validitas ada dua hal yang perlu diperhatikan yaitu
pengukuran isi pengajaran dan pengukuran fungsi mental. Soal tes dengan
penekanan pengukuran isi pengajaran (subject
matter content) menyangkut validitas isi, sedangkan soal tes dengan
penekanan pengukuran fungsi mental menyangkut validitas kosntruk. Berikut
merupakan faktor yang menyebabkan rendahnya fungsi tes hingga hasilnya
menunjukkan validitas yang rendah pula.
1) Petunjuk
Pengerjaan Tidak Jelas
2) Kata-kata
yang digunakan sukar
3) Tingkat
kesukaran soal kurang memadai
4) Konstruksi
tes yang kurang baik
5) Soal-soal
yang ambigius
6) Soal-soal
tes tidak sesuai dengan kemampuan yang diukur
7) Tes
dengan soal yang sangat sedikit
8) Pengaturan
soal tes yang salah
9) Cara
mengatur letak jawaban yang benar
b.
Faktor
prosedur dan fungsi isi pengajaran
Pada pengukuran prestasi
belajar siswa guru tidak hanya membandingkan antara isi soal tes dan isi
pengajaran saja tetapi juga kompleksitas kemampuan yang akan diukur. Misalnya
jenjang kemampuan berpikir kritis diukur dengan soal problem solving. Bila soal
problem solving itu pernah diberikan dan guru sudah memberikan pemecahannya,
maka soal tersebut tidak mengukur berpikir kritis lagi tetapi hanya mengukur
ingatan saja.
c.
Faktor
pelaksanaan tes dan pemberian skor
Dalam pelaksanaan tes ada
beberapa hal yang dapat mempengaruhi validitas tes. Tempat tes yang tidak
nyaman, ventilasi yang tidak cukup, udara yang pengap, tempat duduk yang
berdekatan, gaduh, bantuan yang ilegal yang diberikan kepada peserta tes dan
sebagainya. Demikian juga dalam pemberian skor soal tes essai yang terlalu
subjektif akan sangat mempengaruhi validitas tes.
d.
Faktor
respon siswa
Umumnya dalam mengahadapi
tes banyak diantara siswa yang muncul rasa takut, cemas dan sebagainya. Apabila
siswa pada saat mengerjakan tes masih memiliki rasa tersebut akan menjadi
gurup, skor yang diperoleh tidak mencerminkan kemampuan yang sesungguhnya.
2.
Faktor
Yang Mempengaruhi Reliabilitas
Sebagai contoh speeded tes selalu menunjukkan adanya
koefisien reliabilitas tinggi yang mengukur konsistensi internal, sedang pada
test-retest koefisien ditentukan oleh lamanya interval waktu yang digunakan,
makin pendek angka koefisien makin besar dan sebagainya. Berikut merupakan
beberapa faktor yang dapat mempengaruhi besarnya koefisien reliabilitas.
a.
Panjang
Tes
Secara umum apabila
jumlah soal tes makin banyak maka angka koefisien reliabilitas semakin tinggi.
Makin banyak soal tes makin banyak sampel yang diukur, proporsi jawaban benar
makin banyak, dengan demikian faktor guessing
makin rendah.
b.
Penyebaran
Skor
Besarnya koefisien
reliabilitas tes juga dipengaruhi oleh penyebaran skor dalam kelompok peserta
tes. Bila dalam berbagai hal sama, makin besar penyebaran skor makin rendah
pula reliabilitas. Koefisien reliabilitas ditentukan oleh posisi skor individu
dari tes yang satu ke tes yang lain.
c.
Derajat
Kesukaran
Tingkat kesukaran soal
sangat mempengaruhi besarnya koefisien reliabilitas tes. Tes yang sangat mudah
atau sangat sukar cenderung mempunyai koefisien reliabilitas yang rendah.
Sedangkan pada tes dengan derajat kesukaran ideal akan mempunyai koefisien
reliabilitas yang tinggi.
d.
Objektivitas
Objektivitas menunjukkan
kepada keajegan dalam skor. Karena itu kunci objektivitas terletak pada
korektor. Bila korektor dapat memberikan skor dengan prosedur yang ajeg dari
berbagai tes yang diberikan maka hasilnya akan ajeg pula, reliabilitas akan
tinggi.
D.
Analisis
Tingkat Kesukaran
Menurut
(Pramana, 2014) Berkualitas atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing
butir item tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah. Dengan kata lain derajat kesukaran item tersebut adalah sedang atau cukup.
Menurut Whiterington
(dalam Pramana, 2014) angka indeks kesukaran item tersebut besarnya berkisar antara 0,00 sampai dengan 0,01. Artinya angka indeks kesukaran paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indeks 0,00 merupakan petunjuk bagi tester bahwa item butir-butir tes
hasil belajar tersebut terlalu sukar. Sebaliknya, jika angka indeks 0,01 merupakan bahwa butir item yang bersangkutan terlalu mudah.
Untuk memperoleh angka indeks
tersebut menggunakan rumus :
P =
Dimana :
P = proporsi atau angka indeks kesukaran (P kotor)
Np = jumlah testee yang menjawab benar
N = jumlah testee
P =
Dimana :
P = proporsi atau angka indeks kesukaran (P kotor)
Np = jumlah testee yang menjawab benar
N = jumlah testee
Cara kedua
untuk menghitung indeks adalah dengan menggunakan
skala kesukaran linier. Skala kesukaran linier
ini disusun dengan cara mentransformasikan nilai P menjadi nilai z, dimana perubahan dari P ke z itu
dilakukan dengan berkonsultasi pada tabel nilai z yang pada umumnya dilampirkan pad buku-buku statistik. Dengan menggunakan cara yang kedua, maka memperhatikan langkah-langkah sebagai berikut.
Langkah pertama dengan menggunakan rumus :
dilakukan dengan berkonsultasi pada tabel nilai z yang pada umumnya dilampirkan pad buku-buku statistik. Dengan menggunakan cara yang kedua, maka memperhatikan langkah-langkah sebagai berikut.
Langkah pertama dengan menggunakan rumus :
Rumus: Pb =
Dimana :
Pb = P
bersih
Pk = P
kotor
A = option yang
digunakan
1 = bilangan konstan
Besarnya tingkat
kesukaran berkisar antara 0,00 sampai 1,00. Untuk
sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi
tiga kelompok, yaitu mudah, sedang dan sukar. Sebagai patokan menurut
(Asmawi Zainul, dkk : 1997) dapat digunakan tabel sebagai berikut.
sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi
tiga kelompok, yaitu mudah, sedang dan sukar. Sebagai patokan menurut
(Asmawi Zainul, dkk : 1997) dapat digunakan tabel sebagai berikut.
Tingkat Kesukaran Nilai p
Sukar =
0,00-0,25
Sedang =
0,26-0,75
Mudah =
0,76-1,00
Setelah
berhasil diidentifikasi butir-butir item mana yang derajat kesukarannya termasuk dalam kategori cukup, terlalu sukar dan terlalu mudah maka yang menjadi pokok permasalahan sekarang adalah, bagaimana menindaklanjuti hasil analisis item tersebut. Dalam
kaitannya dengan hasil analisis item dari segi derajat kesukaran, maka tindak lanjut yang perlu
dilakukan oleh tester adalah sebagai berikut.
dilakukan oleh tester adalah sebagai berikut.
1.
Kategori Baik
Untuk
butir-butir item yang berdasarkan hasil analisis
termasuk dalam kategori baik, seyogyanya butir item tersebut segera dicata dalam buku bank soal. Selanjutnya butir-butir soal tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang.
2.
Kategori Terlalu Sukar
Untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tidak lanjut, yaitu; 1) Butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang; 2) diteliti ulang, dilacak dan ditelusuri sehingga dapat diketahui factor yang menyebabkan butir item yang
bersangkutan sulit dijawab oleh testee; apakah
kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan atau menjawab
soalnya sulit dipahami, atau dalam soal
terdapat istilah-istilah yang tidak jelas. Setelah dilakukan
perbaikan kembali, butirbutir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang; 3) haruslah dipahami bahwa tidak setiap butir item yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki kegunaan. Butir-butir item yang terlalu sukar itu sewaktu-waktu masih dapat diambil manfaatnya, yaitu dapat digunakan dalam tes-tes (terutama tes seleksi) yang sifatnya sangat ketat. Dalam kondisi seperti itu sangat tepat apabila butir-butir item yang dikeluarkan adalah butir-butir item yang termasuk kategori terlalu sukar dengan asumsi bahwa testee dengan kemampuan yang rendah dengan mudah akan tersisihkan dari seleksi, sedangkan testee yang memiliki kemampuan tinggi tidak akan terlalu sukar untuk lolos dalam seleksi tersebut.
3.
Kategori Terlalu Mudah
Untuk
butir-butir item yang termasuk dalam kategori
terlalu mudah, juga ada tiga kemungkinan tindak
lanjut, yaitu: (1) butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang. (2) diteliti ulang, dilacak dan ditelusuri secara cermat guna mengetahui factor yang menyebabkan butir item tersebut dapat dijawab betul oleh hamper seluruh testee; ada kemungkinan option atau alternative yang dipasangkan pada butir-butir item yang
bersangkutan terlalu mudah diketahui oleh testee, mana item yang merupakan kunci jawaban item dan mana option yang berfungsi sebagai pengecoh atau distractor. Disini tester harus berusaha memperbaiki atau menggantinya dengan option yang lain sedemikian rupa sehingga antara kunci jawaban dengan pengecoh sulit dibedakan oleh testee. Setelah dilakukan perbaikan, item yang bersangkutan dicoba untuk dikeluarkan lagi pada tes hasil belajar selanjutnya. Tujuannya adalah untuk mengetahui apakah derajat kesukaran item itu menjadi lebih baik atau tidak daripada yang sebelumnya. (3) seperti halnya butir-butr item yang terlalu sukar, butirbutir item
yang terlalu mudah juga masih mengandung manfaat,
yaitu bahwa butr-butir item yang termasuk dalam
kategori ini dapat dimanfaatkan pada tes-tes yang sifatnya longgar, dalam arti bahwa sebagian besar dari testee akan dinyatakan lulus dalam tes seleksi tersebut.
Dalam kondisi
seperti ini sangat bijaksana apabila butir-butir item yang dikeluarkan dalam
tes seleksi tersebut adalah butir-butir item yang
termasuk dalam kategori terlalu mudah, sehingga tes
seleksi itu boleh dikatakan
hanya sebagai formalitas saja.
hanya sebagai formalitas saja.
E.
Menghitung
Keefektifan Pengecoh
Menurut
(Pramana, dkk. 2014) pada saat membicarakan tentag tes obyektif bentuk multiple choice item telah dikemukakan bahwa pada tes bentuk multiple choice item tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar sudah dilengkapi dengan beberapa kemungkinan jawaban, atau yang sering dikenal dengan istilah option. Option atau altrnatif ini jumlahnya berkisar antara tiga sampai dengan lima buah, dan dari kemungkinankemungkinan jawaban
yang dipasang pada setiap butir item itu salah satu merupakan
jawaban yang betul, dan sisanya itu merupakan jawaban
yang salah. Jawabanjawaban yang salah itulah yang bisa dikenal dengan istilah distractor.
Tujuan utama
dari pemasangan distractor pada setiap butir
item yaitu agar dari sekian banyak testee yang menikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab mereka akan mengira bahwa jawaban yang merepilih adalah jawaban betul. Jadi mereka akan terkecoh, menganggap bahwa distractor yang terpasang pada item itu sebagai kunci jawaban, padahal bukan. Dengan kata lain distractor baru dapat menjalankan fungsinya dengan baik jika distraktor telah memiliki daya rangsang yang membuat testee terkecoh. Menganalisis fungsi distractor sering dikenal dengan istilah menganalisis pola penyebaran jawaban item.
Menganalisis
fungsi distractor sering dikenal dengan istilah
lain, yaitu: menganalisis pola penyebaran jawaban item. Adapaun yang dimaksud
dengan pola penyebaran jawaban item adalah suatu pola
yang dapat menggambarkan bagaimana testee
menentukan pilihan jawabannya terhadap
kemungkinan-kemungkinan jawaban yang telah dipasangkan
pada setiap butir item. Dalam hubungannya dengan
pe,bicaraan tentang pengecoh atau distractor, cara
yang dapat digunakan untuk menentukan apakah suatu
distractor tersebut dudah dapat menjalankan
fungsinya dengan baik atau tidak, ada beberapa hal yang
perlu ditekankan.
Kelaziman
yang berlaku dalam dunia evaluasi hasil belajar
ialah, bahwa distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta. Misalnya tes hasi belajar diikuti oleh 100 testee. Distractor yang dipasang pada item tersebut dapat dinyatakan berfungsi apabila minimal 5 orang dari 100 testee sudah terkecoh untuk memilih distractor tersebut
Menurut Arifin (2016)
pada soal bentuk pilihan ganda ada alternatif jawaban (opsi) yang merupakan
pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh
peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang baik,
pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik
bila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati jumlah
ideal. Indeks pengecoh dihitung dengan rumus:
IP =
x
100%
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih
pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab
benar pada setiap soal
n = jumlah alternatif jawaban (opsi)
1 = bilangan tetap
Adapun
kualitas pengecoh berdasar indeks pengecoh adalah.
Sangat
baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126% - 150%
Kurang
Baik IP = 26% - 50% atau 151% - 175%
Jelek
IP = 0% - 25% atau 176% -
200%
Sangat
jelek IP= lebih dari 200%
F.
Analisis
Butir Soal Secara Kualitatif
Menurut Basuki dan
Hariyanto (2016) analisis butir soal dapat dilakukan baik secara kualitatif
maupun kuantitatif. Dalam analisis butir soal secara kualitatif digunakan
format penelaahan soal. Biasanya hal-hal yang ditelaah dalam analisis
kualitatif adalah hal-hal yang terkait materi soal, konstruksi soal dan
kaitannya dengan bahasa serta budaya di masyarakat tempat soal itu dibuat.
Agar para penelaah dapat
dengan mudah menggunakan format penelaan soal, para penelaah soal perlu
memperhatikan petunjuk pengisian formatnya sebagai berikut.
1. Analisislah
setiap butir soal berdasarkan kriteria yang tertera dalam format.
2. Berilah
tanda cek (√) pada kolom “ya” jika soal yang ditelaah sudah sesuai dengan
kriteria.
3. Berilah
tanda cek (√) pada kolom “tidak” jika soal yang ditelaah tidak sesuai dengan
kriteria, kemudian tuliskan alasan mengapa tidak sesuai pada teks soal dan atau
perbaikannya.
Berikut
ini akan dibahas tentang format analisis butir soal bentuk pilihan ganda.
Tabel 2.1 Contoh Format Penelaahan Soal Bentuk Pilihan
Ganda
No.
|
Aspek
yang ditelaah
|
Nomor
soal
|
||||
1
|
2
|
3
|
4
|
dst
|
||
A.
|
Materi
|
|||||
1.
|
Soal
sesuai dengan indikator (menurut tes tertulis untuk pilihan ganda).
|
|||||
2.
|
Materi
yang ditanyakan sesuai dengan komposisi (urgensi, relevansi, kontuinitas,
keterpakaian sehari-hari tinggi).
|
|||||
3.
|
Pilihan
jawaban homogen dan logis
|
|||||
4.
|
Hanya
ada satu kunci jawaban
|
|||||
B.
|
Konstruksi
|
|||||
1.
|
Pokok
soal dirumuskan dengan singkat, jelas, dan tegas.
|
|||||
2.
|
Rumusan
pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja
|
|||||
3.
|
Pokok
soal tidak memberi petunjuk kunci jawaban
|
|||||
4.
|
Pokok
soal bebas dari pernyataan yang bersifat negatif ganda
|
|||||
5.
|
Pilihan
jawaban homogen dan logis ditinjau dari segi materi.
|
|||||
6.
|
Gambar,
grafik, tabel, diagram, atau sejenisnya jelas dan berfungsi
|
|||||
7.
|
Panjang
pilihan jawaban relatif sama
|
|||||
8.
|
Pilihan
jawaban tidak menggunakan pernyataan “semua jawaban di atas salah/benar” dan
sejenisnya.
|
|||||
9.
|
Pilihan
jawaban berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya
angka atau kronologisnya.
|
|||||
10.
|
Butir
soal tidak bergantung pada jawaban soal sebelumnya
|
|||||
C.
|
Bahasa
|
|||||
1.
|
Menggunakan
bahasa yang sesuai dengan kaidah bahasa Indonesia
|
|||||
2.
|
Menggunakan
bahasa ang komunikatif
|
|||||
3.
|
Tidak
menggunakan bahasa yang berlaku setempat/tabu.
|
|||||
4.
|
Pilihan
jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu
kesatuan pengertian.
|
|||||
5.
|
Kalimat
soal tidak menyalin/menjiplak persis suatu teks bacaan.
|
|||||
6.
|
Kalimat
dalam pokok soal tidak menyinggung pribadi seseorang, suku, ras, dan agama.
|
|||||
G.
Menyusun
Kartu Soal Bentuk Pilihan
Ganda
Depdiknas (2008)
menyatakan menulis soal bentuk pilihan ganda sangat diperlukan keterampilan dan
ketelitian. Hal yang paling sulit dilakukan dalam menulis soal bentuk pilihan
ganda adalah menuliskan pengecohnya. Pengecoh yang baik adalah pengecoh yang
tingkat kerumitan atau tingkat kesederhanaan, serta panjang‐pendeknya relatif sama dengan kunci jawaban. Oleh karena itu,
untuk memudahkan
dalam penulisan soal bentuk pilihan ganda, maka dalam penulisannya perlu mengikuti langkah‐langkah berikut, langkah pertama adalah menuliskan pokok soalnya, langkah kedua menuliskan kunci jawabannya, langkah ketiga menuliskan pengecohnya. Untuk memudahkan pengelolaan, perbaikan, dan perkembangan soal, maka soal ditulis di dalam format kartu soal. Setiap satu soal ditulis di dalam satu format.
dalam penulisan soal bentuk pilihan ganda, maka dalam penulisannya perlu mengikuti langkah‐langkah berikut, langkah pertama adalah menuliskan pokok soalnya, langkah kedua menuliskan kunci jawabannya, langkah ketiga menuliskan pengecohnya. Untuk memudahkan pengelolaan, perbaikan, dan perkembangan soal, maka soal ditulis di dalam format kartu soal. Setiap satu soal ditulis di dalam satu format.
Gambar 2.1 Contoh Kartu Soal
Soal bentuk pilihan ganda merupakan soal yang telah disediakan
pilihan jawabannya. Peserta didik yang mengerjakan soal hanya memilih satu
jawaban yang benar dari pilihan jawaban yang disediakan. Soalnya mencakup: (1)
dasar pertanyaan/stimulus (bila ada), (2) pokok soal (stem), (3) pilihan
jawaban yang terdiri atas: kunci jawaban dan pengecoh.
Perhatikan contoh berikut!
Perhatikan contoh berikut!
Gambar 2.2 Contoh Penulisan Butir Soal
1.
Kaidah penulisan soal
pilihan ganda adalah seperti berikut ini.
a.
Materi
1)
Soal harus sesuai dengan
indikator. Artinya soal harus menanyakan perilaku dan materi yang hendak diukur
sesuai dengan rumusan indikator dalam kisi‐kisi.
2)
Pengecoh harus bertungsi
3)
Setiap soal harus
mempunyai satu jawaban yang benar. Artinya, satu soal hanya mempunyai satu
kunci jawaban.
b.
Konstruksi
1.
Pokok soal harus
dirumuskan secara jelas dan tegas. Artinya, kemampuan/ materi yang hendak
diukur/ditanyakan harus jelas, tidak menimbulkan pengertian atau penafsiran yang
berbeda dari yang dimaksudkan penulis. Setiap butir soal hanya mengandung satu
persoalan/gagasan.
2.
Rumusan pokok soal dan
pilihan jawaban harus merupakan pernyataan yang diperlukan saja. Artinya
apabila terdapat rumusan atau pernyataan yang sebetulnya tidak diperlukan, maka
rumusan atau pernyataan itu dihilangkan saja.
3.
Pokok soal jangan
memberi petunjuk ke arah jawaban yang benar. Artinya, pada pokok soal jangan
sampai terdapat kata, kelompok kata, atau ungkapan yang dapat memberikan
petunjuk ke arah jawaban yang benar.
4.
Pokok soal jangan
mengandung pernyataan yang bersifat negatif ganda. Artinya, pada pokok soal
jangan sampai terdapat dua kata atau lebih yang mengandung arti negatif. Hal
ini untuk mencegah terjadinya kesalahan penafsiran peserta didik terhadap arti pernyataan
yang dimaksud. Untuk keterampilan bahasa, penggunaan negatif ganda diperbolehkan
bila aspek yang akan diukur justru pengertian tentang negatif ganda itu sendiri.
5.
Pilihan jawaban harus
homogen dan logis ditinjau dari segi materi. Artinya, semua pilihan jawaban
harus berasal dari materi yang sama seperti yang ditanyakan oleh pokok soal,
penulisannya harus setara, dan semua pilihan jawaban harus berfungsi.
6.
Panjang rumusan pilihan
jawaban harus relatif sama. Kaidah ini diperlukan karena adanya kecenderungan
peserta didik memilih jawaban yang paling panjang karena seringkali jawaban
yang lebih panjang itu lebih lengkap dan merupakan kunci jawaban.
7.
Pilihan
jawaban jangan mengandung pernyataan “Semua pilihan jawaban di atas salah"
atau "Semua pilihan jawaban di atas benar". Artinya dengan adanya
pilihan jawaban seperti ini, maka secara materi pilihan jawaban berkurang satu
karena pernyataan itu bukan merupakan materi yang ditanyakan dan pernyataan itu
menjadi tidak homogen.
8.
Pilihan
jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar
kecilnya nilai angka atau kronologis. Artinya pilihan jawaban yang berbentuk
angka harus disusun dari nilai angka paling kecil berurutan sampai nilai angka
yang paling besar, dan sebaliknya. Demikian juga pilihan jawaban yang
menunjukkan waktu harus disusun secara kronologis. Penyusunan secara unit
dimaksudkan untuk memudahkan peserta didik melihat pilihan jawaban.
9.
Gambar,
grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada soal harus jelas
dan berfungsi. Artinya, apa saja yang menyertai suatu soal yang ditanyakan
harus jelas, terbaca, dapat dimengerti oleh peserta didik. Apabila soal bisa
dijawab tanpa melihat gambar, grafik, tabel atau sejenisnya yang terdapat pada
soal, berarti gambar, grafik, atau tabel itu tidak berfungsi.
10. Rumusan pokok soal tidak menggunakan ungkapan atau kata yang
bermakna tidak pasti seperti: sebaiknya, umumnya, kadang‐kadang.
11. Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan
pada soal sebelumnya menyebabkan peserta didik yang tidak dapat menjawab benar
soal pertama tidak akan dapat menjawab benar soal berikutnya
c.
Bahasa/budaya
1.
Setiap soal
harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. Kaidah
bahasa Indonesia dalam penulisan soal di antaranya meliputi; a) pemakaian
kalimat; (1) unsur subyek; (2) unsur predikat; (3) anak kalimat; b) pemakaian
kata: (1) pilihan kata; (2) penulisan kata; dan c) pemakaian ejaan; (1)
penulisan huruf; (2) penggunaan tanda baca.
2.
Bahasa yang
digunakan harus komunikatif, sehingga pernyataannya mudah dimengerti warga
belajar/peserta didik.
3.
Pilihan
jawaban jangan yang mengulang kata/frase yang bukan merupakan satu kesatuan pengertian.
Letakkan kata/frase pada pokok soal
PENUTUP
A. Kesimpulan
Kegiatan
penilaian merupakan bagian penting dalam kegiatan pembelajaran. Melalui
kegiatan penilaian maka kita dapat mengetahui hasil belajar peserta didik.
Hasil belajar yang diperoleh hendaknya diuji tingkat validitas ataupun
reliabilitas ketika selesai melaksanakan tes. Selain itu dapat pula dianalisis
isntrumen tes melalui menghitung keefektifan pengecoh, taraf kesukaran, serta
menganalisis instrumen secara kualitatif.
Melalui
kegiatan di atas maka suatu instrumen dan hasil belajar yang diperoleh peserta
didik dapat dikatakan baik. Sehingga, hasil belajar yang telah diketahui dapat
digunakan pula untuk meremedi atau bahkan dilakukan pengayaan bagi peserta
didik. Dengan demikian maka hasil kegiatan penilaian yang dilakukan dapat
dipakai dalam rangka penjaminan mutu pendidikan satuan pendidikan tertentu.
DAFTAR RUJUKAN
Arifin,
Zainal. 2016. Evaluasi Pembelajaran.
Bandung: PT Remaja Rosadakarya
Asmawi
Zainul dan Noehi Nasoetion. 1997. Penilaian
Hasil Belajar. Pusat Antar
Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan
Dan kebudayaan
Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan
Dan kebudayaan
Azwar
S. 1998. Tes Prestasi Fungsi Pengembangan
Pengukuran Prestasi Belajar Yogyakarta. Pustaka Pelajar
Basuki,
Ismet & Hariyanto. 2016. Asesmen
Pembelajaran. Bandung: PT Remaja Rosdakarya
Depdiknas.
2008. Panduan Penulisan Butir Soal.
Jakarta: Departemen Pendidikan Nasional Direktorat Jenderal Manajemen
Pendidikan Dasar dan Menengah Direktorat Pembinaan Sekolah Menengah Atas https://teguhsasmitosdp1.files.wordpress.com/2010/05/butir_soal1.pdf
Joesmani.
1988. Pengukuran dan Evaluasi Dalam
Pengajaran. Jakarta: Departemen Pendidikan dan Kebudayaan Direktorat
Jenderal Pendidikan Tinggi Proyek Pengembangan Lembaga Pendidikan Tentang
Tenaga Kependidikan
Mahendra
A. K. dkk. 2014. Ilmu Dasar Evaluasi
Pembelajaran. diakses:ebook
Nuriyah,
N. 2014. Evaluasi Pembelajaran. diakses:jurnal
https://www.google.co.id/search?dcr=0&q=jurnal+evaluasi+pembelajaran+pdf&sa=X&ved=0ahUKEwjsoMS6lsrZAhULLo8KHbqnCjoQ1QIIwgEoAw
Pramana,
Doni, Nyoman, I. dkk. 2014. Evaluasi
Pendidikan. Bali: Beta
Suharsimi
Arikunto. 2001. Dasar-Dasar
Evaluasi Pendidikan. Bumi Aksara:
Jakarta.
Jakarta.
Sukardi,
M.H. 2011. Evaluasi Pendidikan Prinsip
dan Operasionalnya. Jakarta: PT Bumi Aksara
|
23
|
Tidak ada komentar:
Posting Komentar