I.
PENDAHULUAN
Salah satu tugas penting yang seringkali
dilupakan oleh staf pengajar adalah tugas melakukan evaluasi terhadap alat
pengukur yang telah digunakan untuk mengukur keberhasilan belajar dari para
peserta didiknya. Alat pengukur dimaksud adalah tes hasil belajar, yang batang
tubuhnya terdiri dari kumpulan butir-butir soal.[1]
Alat pengukur itu bisa dilakukan dengan jalan melakukan penganalisisan terhadap tes hasil belajar
yang telah dijadikan alat pengukur dalam rangka mengukur keberhasilan belajar
dari para peeserta tes tersebut. Disini tester perlu melakukan penelusuran dan
pelacakan dengan secara cermat, terhadap butir-butir soal yang meruakan bagian
tak terpisahkan dari tes hasil belajar sebagai suatu totalitas. penelusuran dan
pelacakan dilaksanakan oleh tester dengan tujuan untuk mengetahui, apakah
butir-butir item yang membangun tes hasil belajar itu sudah dapat menjalankan
fungsinya sebagai alat pengukur hasil belajar yang memadai atau belum.
Identifikasi terhadap setiap butir soal tes hasil belajar itu dilakukan dengan
harapan akan menghasilkan berbagai informasi berharga, yang pada dasarnya akan
merupakan umpan balik guna melakukan perbaikan, pembenahan, dan penyempurnaan
kembali terhadap butir-butir item yang telah dikeluarkan dalam tes hasil
belajar, sehingga pada masa-masa yang akan datang tes hasil belajar yang
disusun atau dirancang oleh tester itu betul-betul dapat menjalankan fungsinya
sebagai alat pengukur hasil belajar yang memilki kualitas yang tinggi.[2]
II.
Rummusan masalah
A.
Bagaimana
Teknik Analisis Soal Tes ( Item Analisis ) ?
B.
Bagaimana
Teknik Analisis Tingkat Kesukaran ?
C.
Bagaimana
Teknik Analisis Daya Pembeda Item ?
D. Bagaimana Teknik Analisis Fungsi Distraktor ?
III.
PEMBAHASAN
A.
Teknik Analisis Soal Tes ( Item Analisis )
Pada
analisis butir, butir akan dilihat karakteristiknya dan dipilih butir-butir yang baik. butir yang
baik adalah butir-butir yang karakteristiknya
memenuhi syarat sebagaimana kriteria
karakteristik butir yang baik.[3]
Adapun cara untuk memperbaiki proses
belajar- mengajar yang paling efektif ialah dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari proses
belajar- mengajar itu sendiri. Dengan kata lain, hasil tes itu di olah
sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui komponen
–komponen manakah dari proses – mengajar itu yang masih lemah.
Pengolahan tes hasil belajar dalam
rangka memperoleh proses belajar mengajar dapat dilakukan dengan berbagai cara,
antara lain:
1.
Dengan
membuat analisis soal ( item analysis )
2.
Dengan
menghitung validitas dan keandalan tes
Dalam pasal ini khusus akan
dibicarakan cara yang pertama yaitu teknik analisis soal atau item analisis.
Menurut Thorndike dan Hagen (1977),
analisis terhadap soal-soal tes yang telah dijawab oleh murid- murid mempunyai
dua tujuan penting.
Pertama, jawaban- jawaban soal itu merupakan informasi diagnostik untuk
meneliti pelajaran dari kelas itu dan kegagalan- kegagalan belajar, serta
selanjutnya untuk membimbing ke arah cara yang lebih baik.
Kedua, jawaban- jawaban terhadap soal yang terpisah dan perbaikan (
review ) soal- soal yang didasarkan atas jawaban – jawaban itu merupakan basis
bagi persiapan tes- tes yang lebih baik untuk tahun berikutnya.
Jadi tujuan khusus dari items
analisis ialah mencari soal tes mana yang baik dan mana yang tidak baik, dengan
membuat analisis soal, sedikitnya dapat mengetahui dari tiga segi yang dapat diperoleh dari tiap soal, yaitu:
a.
Dari
segi derajat kesukaran itemnya
b.
Dari
segi daya pembeda itemnya
c.
Dari
segi fungsi distraktornya.[4]
B.
Teknik Analisis Tingkat Kesukaran
Suatu tes tidakk boleh terlalu mudah, dan juga tidak boleh terlalu
sukar. Sebuah item yang terlalu
mudah sehingga dapat dijawab
dengan benar oleh semua siswa bukanlah merupakan item yang baik . begitu
pula item yang terlalu sukar sehingga
tidak dapat dijawab oleh semua siswa juga bukan merupakan item yang baik. Jadi
item yang baik adalah item yang mempunyai derajat kesukaran tertentu.[5]
Menurut Witherington dalam bukunya
berjudul psychological Education, mengatakan bahwa sudah atau belum memadainya
derajat kesukaran item tes hasil belajar dapat diketahui dari besar kecilnya
angka yang melambangkan tingkat kesulitan dari item tersebut. Angka yang dapat
memberikan petunjuk mengenai tingkat
kesukaran item itu dikenal dengan istilah difficulty index ( angka index
kesukaran item), yang dalam dunia evaluasi hasil belajar umumnya dilambangkan
dengan huruf P, yaitu singkatan dari
kata proportion( proporsi =proposa). Dan
angka indek kesukaran item itu besarnya berkisar antara 0,00 sampai
dengan 1,00. Artinya, angka indek kesukaran itu paling rendah adalah 0,00 dan
paling tinggi adalah 1,00. Angka indek kesukaran sebesar 0,00 ( P= 0,00)
merupakan petunjuk bagi tester bahwa butir item tersebut termasuk dalam
katagori item yang terlalu sukar, sebab di sini seluruh testee tidak dapat
menjawab item dengan betul ( yang dapat menjawab dengan betul =0). Sebaliknya,
apabila angka indek kesukaran item itu adalah 1,00 ( P= 1,00) hal ini
mengandung makna bahwa butir item yang bersangkutan adalah termasuk dalam
katagori item yang terlalu mudah, sebab di sini seluruh testee dapat menjawab
dengan betul butir item yang bersangkutan ( yang dapat menjawab dengan butir =
100%= 100= 1,00
Menurut ketentuan yang sering diikuti, indeks kesukaran sering
diklasifikasikan sebagai berikut:
·
Soal
dengan P 0,00 sampai 0,30 adalah soal sukar
·
Soal
dengan P 0,30 sampai 0,70 adalah soal sedang
·
Soal
dengan P 0,70 sampai 1,00 adalah soal mudah
|
C.
Teknik Analisis Daya Pembeda Item
Daya
pembeda (item discriminination) adalah untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek
yang diukur sesuai dengan perbedaan yang ada dalam kelomppok itu. Indeks yang
digunakan dalam membedakan antara peserta tes yang berkemampuan tinggi dengan
peserta tes yang berkemampuan rendah. Indeks ini menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan.[9]
Mengetahui daya pembeda item itu
penting sekali, sebab salah satu dasar yang dipegang untuk menyusun butir-butir
item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara siswa
yang satu dengan siswa yang lain itu berbeda-beda, dan bahwa butir-butir tes hasil
belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya
perbedaan-perbedaan kemampuan yang terdapat di kalangan siswa tersebut.[10]
Angka yang menunjukkan besarnya daya
pembeda disebut indeks diskriminasi, disingkat D. Seperti halnya indeks
kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai
1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi
pada indeks diskriminasi ada tanda negatif.[11]
Daya pembeda item itu dapat
diketahui melalui atau dengan melihat besar kecilnya angka indeks diskriminasi
item. Angka indeks diskriminasi item adalah sebuah angka yang menunjukkan besar
kecilnya daya pembeda yang dimiliki oleh sebutir item. Daya pembeda pada
dasarnya dihitung atas dasar pembagian siswa ke dalam dua kelompok, yaitu
kelompok atas yakni kelompok yang tergolong pandai, dan kelompok bawah, yaitu
kelompok siswa yang tergolong bodoh. Dalam hubungan ini, jika sebutir item
memiliki angka indeks diskriminasi item dengan tanda positif, hal ini
merupakanmpetunjuk bahwa butir item tersebut telah memiliki daya pembeda, dalam
arti bahwa siswa yang termasuk kategori pandai lebih banyak yang dapat menjawab
dengan betul terhadap butir item yang bersangkutan, sedangkan siswa yang
termasuk kategori bodoh lebih banyak yang menjawab salah.
Jika sebutir item angka indeks
diskriminasinya = 0,00 (nihil), maka hal ini menunjukkan bahwa butir item yang
bersangkutan tidak memiliki daya pembeda sama sekali, dalam arti bahwa jumlah
siswa kelompok atas yang jawabannya betul (atau salah) sama dengan jumlah siswa
kelompok bawah yang jawabannya betul. Jadi diantara kedua kelompok siswa
tersebut tidak ada perbedaannya sama sekali, atau perbedaannya sama dengan nol.
Adapun apabila angka indeks
diskriminasi item dari sebutir item bertanda negatif, maka pengertian yang
terkandung didalamnya adalah, bahwa butir item yang bersangkutan lebih banyak
dijawab betul oleh siswa kelompok bawah ketimbang siswa kelompok atas.[12]
Dengan demikian ada tiga titik pada daya pembeda yaitu:
Adapun klasifikasi daya pembeda
adalah:
Besarnya
angka indeks diskriminasi item (D)
|
Klasifikasi
|
interpretasi
|
Kurang
dari 0,20
|
Poor (jelek)
|
Butir
item yang bersangkutan daya pembedanya lemah sekali, dianggap tidak memiliki
daya pembeda yang baik
|
0,20
– 0.40
|
Satisfactory
(cukup)
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang)
|
0,40
– 0,70
|
Good
(baik)
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang baik
|
0,70
– 1,00
|
Excellent
(sangat baik)
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang baik sekali
|
Bertanda
negatif
|
-
|
Butir
item yang bersangkutan daya pembedanya negatif (jelek sekali)[16]
|
D.
Teknik Analisis Fungsi Distraktor
Pada saat membicarakan tentang
objektif bentuk multiple choice item telah dikemukakan bahwa pada tes objektif
bentuk multiple choice item tesebut untuk setiap butir item yang dikeluarkan
dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawab,
atau yang sering dikenal dengan istilah option atau alternatif.
Option atau alternatif itu jumlahnya
berkisar antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan
jawab yang terpasang pada setiap butir item itu, salah satu diantaranya adalah
merupakan jawaban betul, sedangkan sisanya adalah merupakan jawaban salah.
Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distraktor
(pengecoh).
Tujuan utama dari pemasangan
distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee
yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab
mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban
betul. Jadi mereka terkecoh, menganggap bahwa distraktor yang terpasang pada
item itu sebagai kunci jawaban item, padahal bukan. Semakin banyak testee yang
terkecoh, maka dapat dinyatakan bahwa distraktor yang dipasang itu makin dapat
menjalankan fungsinya dengan sebaik-baiknya. Sebaliknya, apabila distraktor
yang dipasang pada setiap butir item itu “tidak laku”(maksudnya: tidak ada
seoangpun dari sekian banyak testee yang merasa tertarik untuk memilih
distraktor tersebut sebagai jawaban betul), maka hal ini mengandung makna bahwa
distraktor tersebut tidak menjalankan fungsinya dengan baik. Dengan kata lain,
distraktor baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik,
apabila distraktor tersebut telah memiliki daya tarik demikian rupa, sehingga
para testee (khususnya yang termasuk kategori kemampuan rendah) merasa bimbang,
dan ragu-ragu sehingga pada akhirnya mereka menjadi terkecoh untuk memilih
distraktor sebagai jawaban betul, sebab mereka mengira bahwa yang mereka pilih
itu kunci jawaban item, padahal bukan.
Menganalisis fungsi distraktor
sering dikenal dengan istilah lain, yaitu: menganalisis pola penyebaran jawaban
item. Adapun yang dimaksud pola penyebaran item ialah suatu pola yang dapat
menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap
kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.
Suatu kemungkinan dapat terjadi,
yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item tertentu,
samasekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan
“blangko”. Pernyataan blangko ini sering dikenal dengan istilah Oniet dfan
biasa diberi lambang dengan huruf O.[17]
Sesuatu distraktor dapat diperlakukan
dengan tiga cara:
a.
Diterima,
karena sudah baik
b.
Ditolak,
karena tidak baik
c.
Ditulis
kembali, karena kurang baik
Kekurangannya mungkin hanya terletak
pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan
seperlunya. Menulis soal adalah suatu pekerjaan sulit, sehingga apabila masih
dapat diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan
berfungsi baik jika paling sedikit dipilih oleh 5% pengikut tes.[18]
[1] Prof. Drs. Anas
Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT. Raja Grafindo
Persada, 1996), hlm. 367-368
[3]
Purwanto, evaluasi hasil
belajar, yogyakarta:pustaka pelajar, 2009, hlm.97.
[4] M. Ngalim
Purwanto, Prinsip- Prinsip dan Teknik Evaluasi Pengajaran, ( Bandung :
Remaja Rosdakarya, 2002), hlm. 118
[6] Prof. Drs. Anas
Sudijono, Op. Cit, hlm. 370- 371
[7] Dr. Suharsimi
Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: PT. Bumi Aksara,
2010), hlm.208
[8] M. Ngalim
Purwanto, Op.Cit, hlm. 119
[9]
Sumarna suprapranata, Analisi,validitas,
rehabilitas dan interprestasi hasil tes, bandung: pt remaja rosda karya,
2006, hlm.23
[10] Prof. Drs. Anas
Sudijono, Op.Cit, hlm. 385-386
[11] Prof. Dr.
Suharsimi Arikunto, Op.Cit, hlm.211
[12] Prof. Drs. Anas
Sudijono, Op, Cit, hlm, 387-388
[13] Drs. H.
Daryanto, Evaluasi Pendidikan, (Jakarta: Rineka Cipta, 2008), hlm. 184
[14] Drs. M. Chabib
Thoha, Teknik Evaluasi Pendidikan, (Jakarta: PT. Raja Grafindo Persada,
2001), hlm. 147
[15] Prof. Dr.
Suharsimi Arikunto, Op. Cit, hlm. 213-214
[16] Prof. Drs. Anas
Sudijono, Op, Cit, hlm, 389
[18] Prof. Dr.
Suharsimi Arikunto, Op. Cit, hlm. 220
boleh minta fileny pak? klo boleh, kirim ke email sy : diehermansyah@gmail.com Terima kasih. :)
ReplyDeleteAslkm. selamat malam Pak, saya mahasiswa tingkat akhir..kalo berkenan saya ingin bertanya,,
ReplyDeletepada analisis tingkat kesukaran dan daya pembeda sebelumnya kan ditentukan dulu kelompok atas dan kelompok bawah dimana hal itu diambil dari 27% skor paling atas dan 27% skor paling bawah.
nah, angka 27% itu sendiri landasan/dasarnya darimana ya Pak?? kalo boleh jawabannya kirim ke email abett.yani@yahoo.co.id
trma kasih :)
sepengathuan saya pak nilai dari taraf kesukaran hanya ada dua yaitu mudah dan sukar dimana jika nilai yang didapt berada lebih besar sama dengan 5 maka bisa dikatakan mudah dan lebih kecil dari 5 maka bisa dikatakan sukar
ReplyDeletePa, apa landasan munculnya angka 27% dari batas bawah dan atas?
ReplyDeleteSemoga jadi ilmu yang bermanfaat
ReplyDeleteMenurut Suharsimi Arikunto (2016, 227), menyatakan bahwa untuk menghitung daya pembeda perlu dibedakan antara dua kelompok kecil (kurang dari 100) dan kelompok besar (lebih dari 100).
ReplyDelete1) Kelompok kecil
Seluruh kelompok testee dibagi menjadi dua sama besar, 50% kelompok atas (JA) dan kelompok bawah (JB). Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah lalu dibagi dua.
2) Kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas ssebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok bawah (JB).
Menurut Suharsimi Arikunto (2016, 227), menyatakan bahwa untuk menghitung daya pembeda perlu dibedakan antara dua kelompok kecil (kurang dari 100) dan kelompok besar (lebih dari 100).
ReplyDelete1) Kelompok kecil
Seluruh kelompok testee dibagi menjadi dua sama besar, 50% kelompok atas (JA) dan kelompok bawah (JB). Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah lalu dibagi dua.
2) Kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas ssebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok bawah (JB).