Download Disini : http://www.ziddu.com/download/13303275/FIX_LapEva.doc.html
PENDAHULUAN
A. Pentingnya Analisis Butir
Analisis butir soal perlu dilakukan guna untuk mengetahui kualitas butir soal tersebut. Untuk menjaga mutu dari soal-soal yang dibuat oleh guru, perlu adanya suatu analisis butir yang menggambarkan kualitas soal dan kemampuan guru dalam pembuatan soal.. Usaha guru dalam hal ini seharusnya adalah untuk selalu meningkatkan mutu tes yang disusunnya. Namun hal ini tidak selalu dilaksanakan karena kecenderungan seseorang untuk beranggapan bahwa hasil karyanya adalah yang terbaik atau setidak-tidaknya sudah cukup baik. Guru yang sudah banyak berpengalaman mengajar dan menyusun soal-soal tes juga masih sukar menyadari bahwa tesnya belum sempurna. Oleh karena itu, cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh peserta didiknya
Peserta didik dalam satu kelas merupakan populasi atau kelompok yang keadaannya heterogen. Dengan demikian, apabila diadakan tes akan tercermin hasilnya dalam suatu kurva normal. Sebagian besar peserta didik berada di daerah sedang, sebagian kecil berada di ekor kiri, dan sebagian kecil lain berada di ekor kanan kurva. Apabila keadaan setelah hasil tes dianalisis tidak seperti yang diharapkan dalam suatu kurva normal, maka tentu ada sesuatu dengan soal tesnya. Apabila hampir seluruh peserta didik memperoleh skor jelek, berarti ada kemungkinan bahwa soal tes terlalu sukar. Sebaliknya jika seluruh peserta didik memperoleh skor baik dapat diartikan bahwa tesnya terlalu mudah.
Apabila suatu tes telah selesai dilaksanakan, maka hasil–hasil yang ditimbulkan oleh tes tadi kita adakan analisis lagi. Analisis yang kita lakukan setelah suatu tes dilaksanakan adalah untuk menjawab pertanyaan–pertanyaan sebagai berikut.
1. Bagaimanakah kualitas dari item (soal) yang kita gunakan ?
2. Apakah item tersebut sudah cukup baik atau belum ?
3. Kalau belum dimanakah letak kelemahan – kelemahannya?
4. Apakah item tersebut masih bisa direvisi atau harus dibuang sama sekali?
5. Apakah dalam tes acuan normal tiap soal mempunyai daya beda (discriminating power) yang memadai anatara kelompok peserta didik yang pandai dengan kelompok peserta didik yang kurang pandai (high and low achievers).
6. Apakah dalam tes acuan patokan tiap soal telah dapat mengukur dengan tepat hasil pengajaran yang telah diberikan kepada peserta didik ?
7. Apakah tiap soal itu telah mempunyai derajat kesukaran yang memadai ?
8. Apakah tiap pengecoh (distractor) telah berfungsi secara efektif ? (soal pilihan ganda).
Analisis semacam ini disebut analisis empiris. Dengan analisis empiris ini dapat kita ketahui apakah tes yang telah kita susun itu sudah merupakan tes yang baik atau belum? Dengan analisis empiris ini dapat diketahui item-item mana yang perlu diubah atau diperbaiki atau dibuang sama sekali, dan item-item mana yang baik dipergunakan untuk selanjutnya.
Pada umumnya, suatu tes hasil belajar baru akan merupakan tes yang baik, setelah diadakan perbaikan (revisi) beberapa kali, berdasarkan hasil analisis seperti disebutkan di atas. Oleh karena itu maka setiap kali kita mengadakan tes hasil belajar, item–item yang kita gunakan perlu kita analisis lebih lanjut. Dari analisis empiris yang kita lakukan akan dapat kita ketahui kelemahan–kelemahan dari suatu item yang kita gunakan. Selanjutnya kelemahan–kelemahan tersebut kita perbaiki. Lalu kita gunakan lagi. Demikian seterusnya.
Dengan analisis yang berulang kali kita akan mendapatkan item–item tes yang cukup baik. Item–item yang baik ini kita simpan dalam “ bank soal “, dan dapat kita gunakan untuk keperluan evaluasi selanjutnya.
Disamping itu analisis butir juga dapat digunakan pula untuk
1. Membantu guru dalam mengadakan penilaian secara objektif.
2. Mencari kekurangan suatu soal dan petunjuk untuk mengadakan perbaikan
3. Memberikan data sebagai dasar dalam mendiskusikan hasil tes hingga lebih efesien. Soal yang seluruh peserta didik dapat menjawab benar tidak perlu didiskusikan, sebaliknya soal yang sebagian besar peserta didik salah perlu didiskusikan lebih luas.
4. Sebagai dasar mendiagnosis kesulitan belajar peserta didik. Dari hasil diskusi tersebut dapat diketahui kelemahan atau kesulitan belajar yang dialami peserta didik pada umumnya. Dari sini guru membuat program pengajaran baru guna mengatasi kesulitan belajar peserta didik tersebut.
5. Sebagai dasar untuk mengembangkan proses belajar mengajar selanjutnya.
B. Software yang digunakan untuk analisis.
Apabila suatu tes telah selesai dilaksanakan, maka hasil yang diperoleh dari tes tadi perlu kita analisis. Dalam hal ini, untuk menganalisis soal pilihan, baik itu tes maupun non tes (angket), serta isian singkat dengan menggunakan program ITEMAN. Sedangkan untuk soal uraian, kita analisis dengan program Microsoft Office Excel.
Analisis butir dilakukan dengan menggunakan program ITEMAN, yang merupakan perangkat lunak (software) yang dapat dibuat melalui bahasa pemrograman komputer dan diciptakan khusus untuk analisis statistik butir soal dan tes. Program ini dibuat dengan pendekatan analisis statistik butir soal secara klasikal yang berguna untuk menentukan kualitas butir soal dan tes berdasarkan data empiris hasil uji coba.. Hasil dari analisis butir soal mencakup informasi mengenai tingkat kesukaran soal, daya beda soal, dan statistik sebaran jawaban. Selain menghasilkan statistik butir soal, juga menghasilkan statistik tes yang meliputi reliabilitas tes, kesalahan pengukuran (standard error) dan distribusi skor.
ITEMAN hanya dapat menganalisis file data dengan format ASCII. File data tersebut dapat digunakan dengan menggunakan text editor atau word processing editor yang dapat menghasilkan ASCII atau DOS Text atau Non Document. Seluruh data yang dijadikan sebagai input dalam analisis berada dalam file. Program ITEMAN mampu menganalisis maksimal 250 butir soal dalam satu file dengan kapasitas 1000 responden. Lebar karakter maksimal dalam satu file adalah 255 karakter termasuk identitas responden.
Pada dasarnya analisisnya sama dengan butir tes, hanya berbeda dalam keluarannya, yaitu statistic butir kalau dalam tes statistik butirnya parameter yang ada dalam tingkat kesukaran dan daya beda yang dapat dilihat pada kolom "Prob. Correct" untuk tingkat kesukaran dan kolom "Biser" atau "Point Biser" untuk daya beda, sedangkan pada non tes adalah rata-rata butir sebagai pengganti tingkat kesukaran pada kolom "Item Mean" dan korelasi butir sebagai pengganti daya beda pada kolom "Item-Scale Correlation" pada statistik butir. Distribusi jawaban juga dapat dilihat pada kolom "Proportion Endorsing" pada statistik pilihan.
Dalam menganalisis soal uraian, sebenarnya sama dengan soal pilihan di atas. Hanya saja dalam program ITEMAN data uraian tidak dapat dianalisis. Oleh karena itu, kita menggunakan Microsoft Office Excel, yang tentunya dalam menganalisis data dengan cara manual. Peserta didik kita kelompokkan dalam dua kelompok yaitu kelompok atas dan kelompok bawah. Selanjutnya kita mencari indeks kesukaran tiap butir soal, korelasi, dan koefisien reliabilitas.
Jadi, dari hasil proses yang kita lakukan melalui software tersebut dapat diketahui seberapa besarkah tingkat kesukaran, daya beda butir, validitas butir, pengecoh, reliabilitas dan kesalahan baku pengukuran. Sehingga dengan adanya data tersebut dapat kita ketahui butir soal manakah yang baik atau manakah butir yang perlu direvisi atau dibuang. Dari hasil revisi tersebut butir-butir soal tersebut menjadi baik untuk diujikan lagi.
II. LANDASAN TEORI
A. Tingkat Kesukaran Butir
Suatu tes tidak boleh terlalu mudah, dan juga tidak boleh terlalu sukar. Sebuah item (soal) yang terlalu mudah sehingga dapat dijawab dengan benar oleh seluruh peserta didik bukan merupakan item yang baik. begitu pula item yang terlalu sukar sehingga tidak dijawab oleh semua peserta didik bukan merupakan item yang baik. Jadi item yang tergolong baik dan ideal adalah soal yang tingkat kesukarannya rata-rata, artinya tidak terlalu sukar dan tidak terlalu sulit.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu disebut indeks kesukaran (difficult index). Besarnya indeks kesukaran antara 0,00 sampai 1,00. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soalnya terlalu mudah.
0,00 1,00
Sukar mudah
Di dalam istilah evaluasi, indeks kesukaran diberi symbol P. Singkatan dari kata "proporsi". Tingkat kesukaran butir (descriminating power) adalah proporsi jumlah peserta tes yang menjawab benar terhadap indikator kemampuan dasar yang bersangkutan, yaitu perbandingan antara jumlah peserta tes yang menjawab benar dengan jumlah peserta tes seluruhnya. Tingkat kesukaran butir juga sering disebut derajat kesukaran soal, yang menunjukan seberapa jauh soal itu dijawab oleh peserta didik dengan benar. Karena itu tingkat kesukaran soal ditunjukan dengan berapa persen dari seluruh peserta tes yang menjawab soal tersebut benar. Tingkat kesukaran butir dirumuskan sebagai berikut.
Keterangan :
P = Indeks kesukaran
B = Banyaknya peserta didik yang menjawab soal itu dengan benar
T = Jumlah seluruh peserta didik peserta tes
Menurut ketentuan yang diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut :
a. Soal dengan 0,00 < P < 0,30 adalah soal sukar
b. Soal dengan 0,30 < P < 0,70 adalah soal sedang
c. Soal dengan 0,70 < P <1,00 adalah soal mudah
Jadi soal yang kita golongkan sebagai soal yang ideal bagi peserta didik adalah soal-soal sedang yaitu soal-soal yang mempunyai indeks kesukaran 0,30 sampai dengan 0,70.
Walau demikian, soal-soal yang terlalu mudah atau terlalu sukar, bukan tidak boleh digunakan. Hal disesuaikan dengan pengikutnya, jika dari pengikut yang banyak, kita menghendaki yang lulus hanya sedikit kita ambil peserta didik yang paling unggul. Untuk itu, maka lebih baik diambilkan butir-butir tes yang sukar. Sebaliknya jika kekurangan pengikut ujian, kita pilihkan soal-soal yang mudah. Selain itu, soal yang sukar akan menambah motivasi belajar bagi peserta didik yang pandai, sedangkan soal-soal yang terlalu mudah, akan membangkitkan semangat kepada peserta didik yang kurang pandai.
B. Daya Beda Butir
Daya beda soal adalah kemampuan suatu soal untuk membedakan antara peserta didik yang pandai (berkemampuan tinggi) dengan peserta didik yang kurang pandai (berkemampuan rendah). Dalam hal ini tidak ada peserta didik yang bodoh.
Seperti halnya indeks kesukaran, daya beda ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negative (-) , tetapi daya beda ada tanda negative. Tanda negative pada daya beda berarti soal tersebut tidak dapat membedakan peserta didik yang pandai dan peserta didik yang kurang pandai. Atau dengan kata lain, anak yang kurang pandai bisa mengerjakan tetapi anak yang pandai justru tidak bisa mengerjakan.
-1,00 0,00 1,00
Daya beda Daya beda Daya beda
Negatif rendah Tinggi (positif)
Bagi suatu soal yang dapat dijawab dengan benar oleh peserta didik pandai maupun peserta didik bodoh, maka soal itu tidak baik karena tidak mempunyai daya beda. Demikian pula jika semua peserta didik baik pandai maupun kurang pandai tidak dapat menjawab dengan benar, maka soal tersebut tidak baik juga karena tidak mempunyai daya beda. Soal yang baik adalah soal yang dapat dijawab dengan benar oleh peserta didik yang pandai saja.
Seluruh pengikut tes dikelompokkan menjadi dua kelompok yaitu kelompok pandai atau kelompok atas (upper group) dan kelompok kurang pandai atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang seluruh kelompok bawah menjawab salah, maka soal tersebut mempunyai daya beda paling besar yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah menjawab benar, maka daya bedanya -1,00. Tetapi jika peserta didik kelompok atas dan peserta didik kelompok bawah sama-sama menjawab benar atau sama-sama salah, maka soal tersebut mempunyai daya beda 0,00, atau dengan kata lain tidak mempunyai daya beda sama sekali.
Rumus untuk mencari daya beda adalah :
Keterangan :
r : Daya Beda
na : Banyaknya peserta didik kelompok atas yang menjawab dengan benar
Na : Banyaknya peserta didik kelompok atas
nb : Banyaknya peserta didik kelompok bawah yang menjawab dengan benar
Nb : Banyaknya peserta didik kelompok bawah
Soal yang kita golongkan sebagai soal yang ideal dan baik bagi peserta didik adalah soal-soal yang mempunyai daya beda lebih dari 0,30.
C. Pengecoh
Analisis soal juga menyangkut efektifitas altenatif pengecoh Pengecoh (destructor) dapat diartikan sebagai sebaran atau distribusi jawaban peserta didik Artinya, pengecoh dikatakan berfungsi jika semua pilihan jawaban yang tersedia, ada yang menjawab atau memilihnya. Apabila altenatif pengecoh ini tidak dapat menarik perhatian peserta didik dalam arti tidak ada yang memilih, berati pengecoh ini tidak efektif sama sekali. Pada umumnya altenatif pengecoh ini disebut baik atau efektif bila lebih menarik pada peserta didik kelompok bodoh dari pada kelompok pandai. Artinya peserta didik kelompok bodoh memberikan responsi lebih banyak dari kelompok pandai.
Sekalipun soal terlalu sukar atau terlalu mudah, apabila setiap pengecoh (distribusi jawaban) pada soal tersebut menunjukkan kondisi distribusi jawaban merata atau distribusi jawabannya logis, dan daya bedanya negative (kecuali kunci) maka soal-soal tersebut masih memenuhi syarat untuk diterima. Sedangkan soal terlalu sukar atau terlalu mudah, namun apabila memiliki daya beda dan statistic pengecoh memenuhi kriteria, maka soal tersebut dapat dipilih dan diterima sebagai salah satu alternatif untuk disimpan dalam bank soal. Apabila soal ekstrim mudah atau ekstrim sukar, serta daya beda dan statistik pengecohnya belum memenuhi kriteria, maka soal tersebut perlu direvisi dan diuji coba kembali.
D. Validitas
Suatu alat pengukur dapat dikatakan alat ukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. Misalnya barometer adalah alat yang valid untuk mengukur tekanan udara. Tetapi alat ini tidak valid untuk mengukur suhu. Demikian pula alat-alat evaluasi. Suatu hasil belajar dapat dikatakan tes yang valid apabila tes tersebut benar-benar dapat mengukur hasil belajar. Jadi bukan sekedar mengukur daya ingatan atau kemampuan bahasa saja.
Validitas item dapat dihitung dengan dengan korelasi dimana batas korelasi adalah .
1. Hakikat Validitas
Apabila kita mengunakan istilah validitas dalam hubungan dengan tesing, pengukuran dan evaluasi ada 3 hal yang perlu mendapat perhatian, yaitu :
a. Bahwa pengertian validitas menunjuk kepada hasil pengukuran tes sebagai alat evaluasi yang diberikan kepada sekelompok peserta didik secara individual. Dari pengertian ini ada beberapa unsur yang perlu diperhatikan.
1) Validitas menuju kepada hasil pengukuran bukan tesnya. Validitas tes sebagai instrumen dibahas dalam analisis soal tes yaitu tingkat kesukaran dan daya bedanya.
2) Tes sebagai alat (instrumen) yang digunakan dalam evaluasi prestasi hasil belajar peserta didik. Dengan demikian tes dipandang sebagai alat ukur psikologis.
3) Pengukuran ditujukan pada prestasi belajar peserta didik dalam kelompok, hasil skoring sebagi atribut prestasi yang diukur secara individual. Bukan skor yang diperoleh peserta didik dengan kerja kelompok.
b. Validitas masalah tingkat dalam arti skala ordinal. Dengan pengertian ini, tidak ada perbedaan yang mutlak. Karena itu tidak dapat dikatakan hasil tes yang valid atau invalid, yang benar adalah hasil memiliki validitas rendah, sedang, tinggi. Jadi bila validitas tes dinyatakan dalam koefesien 0, tidak berarti validitas tes tersebut invalid.
c. Validitas selalu digunakan dalam hal yang khusus. Tidak ada hasil tes yang memiliki validitas umum. Hasil tes tertulis pada hasil tes PMP misalnya, memiliki validitas sedang dalam pengamalan pancasila tetapi akan memiliki validitas rendah pemahaman terhadap ekonomi. Tiap-tiap tes akan memiliki validitas sesuai dengan tujuan khusus yang telah ditetapkan sebelumnya, tidak pernah ada tes yang dapat disusun agar memiliki validitas umum.
2. Jenis Validitas
Jenis-jenis validitas adalah sebagai berikut.
a. Validitas Isi
Validitas isi artinya kejituan dari suatu tes ditinjau dari isi tes tersebut. Suatu tes hasil belajar daapat dikatakan valid, apabila materi tes tersebut benar-benar merupakan bahan–bahan yang representatif terhadap bahan-bahan pelajaran yang diberikan. Misalnya apabila kita ingin memberikan tes matematika kepada peserta didik kelas II, maka item–itemnya harus diambil dari bahan-bahan pelajaran kelas II. Kalau didalamnya kita selipkan item-item yang diambilkan dari bahan-bahan kelas III maka tes tersebut tidak valid lagi.
Untuk menilai apakah suatu tes memiliki validitas isi atau tidak dapat kita lakukan dengan jalan membandingkan materi tes tersebut dengan analisis rasional yang kita lakukan terhadap bahan–bahan yang seharusnya dipergunakan dalam menyusun tes tersebut.
Apabila materi tes tersebut telah cocok dengan analisis rasional yang kita lakukan, berarti tes yang kita nilai itu mempunyai validitas isi. Sebaliknya apabila materi tes tersebut menyimpang dari analisis rasional kita, berarti tes tersebut tidak valid ditinjau dari validitas isi.
b. Validitas ramalan
Validitas ramalan artinya ketepatan dari suatu alat ukur ditinjau dari kemampuan tes tersebut untuk meramalkan prestasi yang dicapainya kemudian. Misalnya suatu tes hasil belajar dapat dikatakan mempunyai validitas ramalan yang tinggi, apabila hasil yang dicapai anak dalam tes tersebut benar–benar dapat meramalkan sukses tidaknya anak dalam pelajaran yng akan datang. Cara yang dipergunakan untuk menilai tinggi rendahnya validitas ramalan ini adalah dengan jalan mencari korelasi antara nilai-nilai yang dicapai oleh anak dalam suatu tes tersebut dengan nilai-nilai yang dicapai kemudian.
c. Validitas bandingan
Validitas bandingan artinya kejituan dari suatu tes dilihat dari korelasinya terhadap kecakapan yang telah dimiliki saat ini secara riil. Perbedaan antara validitas ramalan dan validitas bandingan adalah dilihat dari segi waktu. Validitas ramalan melihat hubungannya dengan masa yang akan datang, sedangkan vaaliditas bandingan melihat hubungannya dengan masa sekarang. Cara yang dipergunakan untuk menilai validitas bandingan ialah dengan jalan mengkorelasikan hasil-hasil yang dicapai dalam tes tersebut dengan hasil–hasil yang dicapai dalam tes sejenis yang telah diketahui mempunyai validitas tinggi. Tinggi rendahnya koefesien korelasi yang diperoleh menunjukan tinggi rendahnya validitas tes yang akan kita nilai kualitasnya.
d. Validitas susunan
Validitas susunan artinya kejituan dari suatu tes ditinjau dari susunannya. Misalnya kalau kita ingin memberikan tes kecakapan ilmu pasti, kita harus membuat soal yang ringkas dan jelas yang benar-benar akan mengukur kecakapan ilmu pasti, bukan mengukur kemampuan bahasa karena soal itu ditulis secara berkepanjangan dengan bahasa yang sukar dimengerti. Untuk mengetahui apakah suatu tes memenuhi syarat-syarat validitas susunan atau tidak maka kita harus membandingkan susunan tes tersebut dengan syarat-syarat penyusunan tes yang baik
E. Reliabilitas dan Kesalahan Baku
Reliabilitas tes (test reliability) adalah suatu hal yang sangat penting pada alat pengukuran yang standar. Reliabilitas dihubungkan dengan pengertian adanya ketepatan suatu tes dalam pengukurannya. Reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari suatu pengukuran ke pengukuran lainnya. Jadi reliabilitasnya dapat dikatakan sebagai tingkat konsistensi atau kemantapan hasil dari hasil dua pengukura terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi. Dengan perangkat tes yang reliable, apabila tes itu kita berikan dua kali pada orang yang sama tetapi dalam selang waktu yang berbeda, sepanjang tidak ada perubahan kemampuan, maka skor yang diperoleh akan konstan.
Reliabilitas merupakan suatu hal yang penting dalam suatu tes. Reliabilitas memiliki dua konsistensi. Konsistensi pertama adalah konsistensi internal yakni tingkat sejauh mana soal itu homogen baik dari tingkat segi kesukaran maupun bentuk soalnya. Konsistensi yang kedua adalah konsistensi eksternal yakni tingkat sejauh mana skor yang dihasilkan tetap sama sepanjang kemampuan orang yang diukur belum berubah. Apabila hasil skor tes pertama sama dengan hasil skor tes kedua, maka tes dikatakan memiliki reliabilitas yang tinggi atau terdapat korelasi yang tinggi antara hasil tes pertama dengan hasil tes kedua. Kalau antara hasil tes pertama dan kedua tidak terdapat hubungan atau hubungan rendah maka tes itu dikatakan tidak reliable.
Setiap kali kita melakukan tes, pemakai tes mengharapkan jaminan bahwa hasil yang diperoleh akan sama apabila individu peserta tes yang sama di tes ulang dengan kondisi yang sama. Konsistensi skor tes yang diperoleh tersebut disebut reliabilitas. Secara sederhana istilah reliabilitas adalah tingkat sejauh mana skor deviasi seseorang tetap konsisten dengan pengulangan tes yang sama atas tes yang dianggap sama
Ada beberapa prosedur untuk menghitung indeks reliabilitas tes, yaitu diukur dengan :
1. Test re-test (tes yang diulangi)
Untuk mengukur indeks reliabiltas, objek dan alat uji tetap pada saat tes diulangi dalam jangka waktu tertentu. Pengukuran ini dihitung dengan korelasi . Jika reliabel, maka nilai mendekati satu.
2. Kelas dibagi dua
Pengukuran dengan cara ini, peserta tes dalam suatu kelas dibagi menjadi dua. Penghitungan adalah dengan mengkorelasikan hasil dari kedua kelompok tersebut.
3. Koefisien Alpha atau Cronbach's Alpha
Koefisien Alpha dihitung dengan rumus
Keterangan :
: Indeks reliabilitas
K : Banyaknya butir soal
: Varian skor total
: Jumlah varian skor tiap butir
Untuk tes buatan guru, nilai setidak-tidaknya 0,7 sedangkan untuk UAN nilai
III. ANALISIS BUTIR
A. Identifikasi Hasil Analisis Butir Soal Tes
Dalam analisis ini, data diambil di SMP Islam Hidayatullah Semarang, yang beralamat di Jalan Cemara Raya No.290 Banyumanik pada peserta didik kelas VIII Asma’ yang berjumlah 20 siswa dan kelas VIII Hafsah yang berjumlah 17 Siswa.
1. Statistik Butir Soal Pilihan Ganda
Kelas VIII Asma’
a. Item Statistics dan Alternative Statistics
Untuk tes yang terdiri dari butir-butir soal yang bersifat pilihan ganda, analisisnya dengan program ITEMAN. Statistik berikut adalah output statistik butir dan alternatif statistik dari setiap butir soal yang dianalisis.
1) Prop. Correct adalah proporsi (banyaknya) peserta yang menjawab benar butir soal. Prop. Correct ini menunjukkan indeks (tingkat) kesukaran butir. Butir yang mempunyai Prop. Correct antara 0,00 dan 0,30 menunjukan soal yang sulit, dan butir yang mempunyai Prop. Correct antara 0,70 dan 1,00 menunjukan soal yang mudah. Sedangkan butir yang mempunyai Prop. Correct antara 0,30 dan 0,70 menunjukan soal yang sedang. Berdasarkan nilai dalam data, terdapat 2 soal mudah, yaitu butir nomor 1 dan 9, ada 5 soal sedang yaitu nomor 2,3,7, 8, 10 dan 3 soal sukar yaitu nomor 4,5,dan 6.
2) Biser dan Point Biser pada Item Statistics adalah korelasi skor butir dan skor total, yang menunjukkan indeks daya beda soal. Berdasarkan penelitian, untuk analisis data cenderung menggunakan Point Biser. Nilai positif menunjukkan bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi. Atau dengan kata lain peserta tes yang lebih banyak menjawab benar butir soal adalah peserta tes kelompok atas. Sebaliknya nilai negatif menunjukkan bahwa peserta tes yang menjawab benar butir soal, memperoleh skor relatif rendah dalam skala tes/skala tersebut, dan dengan kata lain peserta tes yang lebih banyak menjawab benar adalah peserta tes kelompok bawah. Berdasarkan nilai dalam data, semua soal mempunyai daya beda yang cukup bagus.
3) Pada kolom kedua, yaitu kolom Alternative Statistics, nilai Prop. Endorsing adalah perbandingan antara banyaknya peserta tes yang memilih jawaban tersebut dengan jumlah peserta tes seluruhnya, yang menunjukkan tingkat pengecohan jawaban. Nilai yang tidak nol sudah cukup menandakan bahwa jawaban tersebut telah sukses menjadi pengecoh. Berdasarkan nilai dalam data, ada 2 buah soal yang dalam pilihan jawaban, pengecoh tidak berfungsi, yaitu butir soal nomor 1 pada pilihan A dan butir soal nomor 9 pada pilihan B.
b. Scale Statistics (Statistik skala)
Untuk tes yang terdiri dari butir-butir soal yang bersifat pilihan ganda, statistik berikut adalah output atau hasil analisis berdasarkan skala, yaitu :
a) N of items adalah jumlah butir soal yang ikut dianalisis. Dalam hal ini ada 10 soal yang diujikan dalam bentuk pilihan ganda.
b) N of Examines adalah jumlah peserta tes yang terlibat dalam analisis. Jumlah peserta tes ada 20 peserta didik.
c) Mean adalah skor rata-rata peserta tes. Mean dari tes ini adalah 4,050.
d) Variance adalah varian dari skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes. Varian dari tes ini adalah 3,947.
e) Std. Dev. Adalah deviasi standar dari skor peserta tes. Deviasi standar merupakan akar dari variance. Deviasi standar dari tes ini adalah 1,987.
f) Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk distribusi skor peserta tes. Kemiringan dari tes ini adalah 0,619 (positif) menunjukkan bahwa sebagian besar skor berada pada bagian bawah (skor rendah) dari distribusi skor.
g) Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi normal. Nilai kurtosis tes ini adalah -1,041 (negatif) menunjukkan distribusi yang landai (merata). Kurtosis untuk distribusi normal adalah nol.
h) Minimum (skor terendah) peserta tes ini adalah 2,000.
i) Maximum (skor tertinggi) peserta tes ini adalah 8,000.
j) Median (skor tengah) tes ini adalah 3,000.
k) Alpha adalah indeks reliabilitas atau homogenitas tes / skala. Koefisien alpha hanya cocok digunakan pada tes yang bukan mengukur kecepatan (speeded test) dan hanya mengukur satu dimensi (single-trai ). Alpha minimal untuk tes buatan guru adalah 0,700. Alpha tes ini adalah 0,554.
l) SEM (standard error measure) adalah kesalahan pegukuran standar untuk setiap tes/skala. SEM tes ini adalah 1,326.
m) Mean P adalah rata-rata tingkat kesukaran butir soal dalam tes secara klasikal dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam tes/skala. Mean P dari tes ini 0,405 artinya secara keseluruhan soal tes ini sedang.
n) Mean Item-tot adalah nilai rata-rata indeks daya beda dari semua soal dalam tes/skala yang diperoleh dengan meghitung nilai rata-rata point-biser dari semua soal dalam tes/skala. Mean Item-tot tes ini adalah 0,430.
o) Mean-biserial adalah juga nilai rata-rata indeks daya beda yang diperoleh dengan menghitung nilai rata-rata korelasi biserial dari semua butir soal dalam tes/skala. Mean-biserial tes ini 0,564.
Kelas VIII Hafsah
a. Item Statistics dan Alternative Statistics
Untuk tes yang terdiri dari butir-butir soal yang bersifat pilihan ganda, analisisnya dengan program ITEMAN. Statistik berikut adalah output statistik butir dan alternatif statistik dari setiap butir soal yang dianalisis.
1) Prop. Correct adalah proporsi (banyaknya) peserta yang menjawab benar butir soal. Prop. Correct ini menunjukkan indeks (tingkat) kesukaran butir. Butir yang mempunyai Prop. Correct antara 0,00 dan 0,30 menunjukan soal yang sulit, dan butir yang mempunyai Prop. Correct antara 0,30 dan 0,70 menunjukan soal yang sedang, dan butir yang mempunyai Prop. Correct antara 0,70 dan 1,00 menunjukan soal yang mudah. Berdasarkan nilai dalam data, terdapat 5 soal sulit, yaitu butir nomor 2, 3, 4, 5 dan 6, ada 5 soal sedang yaitu nomor 1, 7, 8, 9 dan 10.
2) Biser dan Point Biser pada Item Statistics adalah korelasi skor butir dan skor total, yang menunjukkan indeks daya beda soal. Berdasarkan penelitian, untuk analisis data cenderung menggunakan Point Biser. Nilai positif menunjukkan bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi. Atau dengan kata lain peserta tes yang lebih banyak menjawab benar butir soal adalah peserta tes kelompok atas. Sebaliknya nilai negatif menunjukkan bahwa peserta tes yang menjawab benar butir soal, memperoleh skor relatif rendah dalam skala tes/skala tersebut, dan dengan kata lain peserta tes yang lebih banyak menjawab benar adalah peserta tes kelompok bawah. Berdasarkan nilai dalam data, semua soal mempunyai daya beda yang cukup bagus.
3) Pada kolom kedua, yaitu kolom Alternative Statistics, nilai Prop. Endorsing adalah perbandingan antara banyaknya peserta tes yang memilih jawaban tersebut dengan jumlah peserta tes seluruhnya, yang menunjukkan tingkat pengecohan jawaban. Nilai yang tidak nol sudah cukup menandakan bahwa jawaban tersebut telah sukses menjadi pengecoh. Berdasarkan nilai dalam data, ada 2 buah soal yang dalam pilihan jawaban, pengecoh tidak berfungsi, yaitu butir soal nomor 1 pada pilihan B serta butir soal nomor 7 pada pilihan A dan D.
b. Scale Statistics (Statistik skala)
Untuk tes yang terdiri dari butir-butir soal yang bersifat pilihan ganda, statistik berikut adalah output atau hasil analisis berdasarkan skala, yaitu :
a) N of items adalah jumlah butir soal yang ikut dianalisis. Dalam hal ini ada 10 soal yang diujikan dalam bentuk pilihan ganda.
b) N of Examines adalah jumlah peserta tes yang terlibat dalam analisis. Jumlah peserta tes ada 17 peserta didik.
c) Mean adalah skor rata-rata peserta tes. Mean dari tes ini adalah 3,471.
d) Variance adalah varian dari skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes. Varian dari tes ini adalah 3,073.
e) Std. Dev. Adalah deviasi standar dari skor peserta tes. Deviasi standar merupakan akar dari variance. Deviasi standar dari tes ini adalah 1,753.
f) Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk distribusi skor peserta tes. Kemiringan dari tes ini adalah 0,049 (positif) menunjukkan bahwa sebagian besar skor berada pada bagian bawah (skor rendah) dari distribusi skor.
g) Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi normal. Nilai kurtosis tes ini adalah -0,450 (negatif) menunjukkan distribusi yang landai (merata). Kurtosis untuk distribusi normal adalah nol.
h) Minimum (skor terendah) peserta tes ini adalah 0,000.
i) Maximum (skor tertinggi) peserta tes ini adalah 7,000.
j) Median (skor tengah) tes ini adalah 3,000.
k) Alpha adalah indeks reliabilitas atau homogenitas tes / skala. Koefisien alpha hanya cocok digunakan pada tes yang bukan mengukur kecepatan (speeded test) dan hanya mengukur satu dimensi (single-trai ). Alpha minimal untuk tes buatan guru adalah 0,700. Alpha tes ini adalah 0,383.
l) SEM (Standard Error Measure) adalah kesalahan pengukuran standar untuk setiap tes/skala. SEM tes ini adalah 1,377.
m) Mean P adalah rata-rata tingkat kesukaran butir soal dalam tes secara klasikal dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam tes/skala. Mean P dari tes ini 0,347 artinya secara keseluruhan soal tes ini sedang.
n) Mean Item-tot adalah nilai rata-rata indeks daya beda dari semua soal dalam tes/skala yang diperoleh dengan meghitung nilai rata-rata point-biser dari semua soal dalam tes/skala. Mean Item-tot tes ini adalah 0,396.
o) Mean-biserial adalah juga nilai rata-rata indeks daya beda yang diperoleh dengan menghitung nilai rata-rata korelasi biserial dari semua butir soal dalam tes/skala. Mean-biserial tes ini 0,535.
2. Statistik Butir Soal Uraian
Kelas VIII Asma’
Untuk tes yang terdiri dari butir-butir soal yang bersifat uraian, analisis yang dilakukan dengan program Microsoft Office Excel. Hasil yang diperoleh dari setiap butir soal yang dianalisis adalah sebagai berikut.
a. Indeks kesukaran dalam soal uraian ini dicari rumus :
Keterangan:
P : Indeks Kesukaran Butir
Smaks : Skor Maksimal Tiap Butir
Rata- rata : Jumlah Skor Tiap Butir Dibagi Banyaknya Siswa
Berdasarkan nilai dalam data analisis, 2 soal mempunyai tingkat kesukaran sedang yaitu soal nomor 1, 2 dan mempunyai 1 soal dengan tingkat kesukaran sulit yaitu butir soal nomor 3.
b. Korelasi dalam hal ini adalah perbandingan skor total tiap butir soal dengan skor total seluruh butir soal. Nilai korelasi yang baik adalah lebih besar dari 0,3. Berdasarkan nilai dalam data analisis, butir soal nomor 1 mempunyai nilai korelasi 0,55 butir soal nomor 2 : 0,34, butir soal nomor 3 : 0,19. Jadi ada satu butir soal yang kurang baik yaitu butir soal nomor 3.
c. Alpha yaitu indeks reliabilitas yang dapat dicari dengan rumus:
Keterangan :
Alpha : Indeks reliabilitas
K : Banyaknya butir soal
: Varian skor total
: Jumlah varian skor tiap butir
Nilai alpha dari soal yang baik sekurang-kurangnya adalah 0,70 Berdasarkan nilai dalam data analisis, nilai alpha adalah 0,15. Nilai ini tidak baik baik sehingga soal perlu direvisi atau ditolak.
Kelas VIII Hafsah
Untuk tes yang terdiri dari butir-butir soal yang bersifat uraian, analisis yang dilakukan dengan program Microsoft Office Excel. Hasil yang diperoleh dari setiap butir soal yang dianalisis adalah sebagai berikut.
a. Indeks kesukaran dalam soal uraian ini dicari rumus :
Keterangan:
P : Indeks Kesukaran Butir
Rata-rata : Jumlah Skor Siswa / Banyaknya Siswa
Smaks : Skor Maksimal Tiap Butir
Berdasarkan nilai dalam data analisis, semua soal mempunyai tingkat kesukaran sedang.
b. Korelasi dalam hal ini adalah perbandingan skor total tiap butir soal dengan skor total seluruh butir soal. Nilai korelasi yang baik adalah lebih besar dari 0,3. Berdasarkan nilai dalam data analisis, butir soal nomor 1 mempunyai nilai korelasi 0,63, butir soal nomor 2 : 0,77, butir soal nomor 3 : 0,81. Jadi semua butir soal baik (valid)
c. Alpha yaitu indeks reliabilitas yang dapat dicari dengan rumus:
Keterangan :
Alpha : Indeks reliabilitas
K : Banyaknya butir soal
: Varian skor total
: Jumlah varian skor tiap butir
Nilai alpha dari soal yang baik sekurang-kurangnya adalah 0,70 Berdasarkan nilai dalam data analisis, nilai alpha adalah 0,72. Nilai ini sudah baik sehingga soal tidak perlu direvisi atau diterima.
B. Identifikasi Hasil Analisis Butir Soal Non Tes
Kelas VIII Asma’
Untuk angket yang terdiri dari butir-butir soal yang bersifat non tes, analisisnya dengan program ITEMAN. Statistik berikut adalah output statistik butir dan alternatif statistik dari setiap butir soal yang dianalisis, dengan meninjau :
1. Item Statistics dan Alternative Statistics
a. Item scale correlation menunjukkan daya beda butir soal. Berdasarkan hasil dari analisis angket tersebut, semua butir nilai korelasinya positif. Ini berarti peserta tes bersikap positif terhadap belief matematika. Soal yang berkategori baik dengan nilai korelasi lebih dari 0,3 sebanyak 4 butir,yakni nomor 4, 5, 8, dan 11 sedangkan soal lain perlu direvisi, yakni nomor 1, 2, 3, 6, 7, 9, 10 dan 12.
b. Proporsing Endorsing adalah perbandingan antara banyaknya peserta tes yang memilih jawaban tersebut dengan jumlah peserta tes seluruhnya, yang menunjukkan distribusi pilihan jawaban. Berdasarkan analisis angket, distribusi atau sebaran pilihan jawaban yang merata ada 4 butir, yaitu butir nomor 2, 4, 6, dan 10 sedangkan sisanya tidak merata, yaitu butir nomor 1, 3, 5, 7, 8, 9, 11, dan 12. Kemudian semua butir soal yang terrnasuk distribusi unimodal.
2. Scale Statistics (Statistik skala)
Statistik berikut adalah output atau hasil analisis berdasarkan skala, yaitu
a. N of items adalah jumlah butir soal yang ikut dianalisis. Dalam hal ini ada 12 soal yang diujikan dalam bentuk angket.
b. N of Examines adalah jumlah peserta tes yang terlibat dalam analisis. Jumlah peserta tes ada 20 peserta didik.
c. Mean adalah skor rata-rata peserta tes. Mean dari tes ini adalah 2,346 dari skala 1 sampai dengan 4. Jadi dapat dikatakan cukup tinggi. Berarti bahwa responden cukup tinggi dalam merespon setiap butir.
d. Variance adalah varian dari skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes. Varian dari tes ini adalah 0,020.
e. Std. Dev. Adalah deviasi standar dari skor peserta tes. Deviasi standar merupakan akar dari variance. Deviasi standar dari tes ini adalah 0,141.
f. Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk distribusi skor peserta tes. Kemiringan dari tes ini adalah 0,222 (positif) menunjukkan bahwa sebagian besar skor berada pada bagian bawah (skor bawah) dari distribusi skor.
g. Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi normal. Nilai kurtosis tes ini adalah -0,930 menunjukkan distribusi yang landai (merata). Kurtosis untuk distribusi normal adalah nol.
h. Minimum (skor terendah) peserta tes ini adalah 2,167.
i. Maximum (skor tertinggi) peserta tes ini adalah 2,636.
j. Median (skor tengah) tes ini adalah 2,417.
k. Alpha adalah indeks reliabilitas atau homogenitas tes / skala. Koefisien alpha hanya cocok digunakan pada tes yang bukan mengukur kecepatan (speeded test) dan hanya mengukur satu dimensi (single-trai). Alpha minimal untuk tes buatan guru adalah 0,700. Alpha tes ini adalah 0,119.
l. SEM (standard error measure) adalah kesalahan pegukuran standar untuk setiap tes/skala. SEM tes ini adalah 0,133.
m. Mean Item-tot adalah nilai rata-rata indeks daya beda dari semua soal dalam tes/skala yang diperoleh dengan menghitung nilai rata-rata Item scale correlation dari semua soal dalam tes/skala. Mean Item-tot tes ini adalah 0.246.
C. Taksiran Hasil Analisis
1. Butir Soal Tes
a. Pilihan Ganda
Kelas VIII Asma’
Simpulan Pengecoh
Daya Beda Tingkat Kesukaran Butir No. Soal
Direvisi Tidak Berfungsi Baik Mudah 1
Diterima Berfungsi Baik Sedang 2
Diterima Berfungsi Baik Sedang 3
Direvisi Berfungsi Baik Sulit 4
Direvisi Berfungsi Baik Sulit 5
Diterima Berfungsi Baik Sulit 6
Ditolak Tidak Berfungsi Baik Sedang 7
Diterima Berfungsi Baik Sedang 8
Diterima Berfungsi Baik Mudah 9
Diterima Berfungsi Baik Sedang 10
Kelas VIII Hafsah
Simpulan Pengecoh
Daya Beda Tingkat Kesukaran Butir No. Soal
Diterima Tidak Berfungsi Baik Sedang 1
Diterima Berfungsi Baik Sulit 2
Diterima Berfungsi Baik Sulit 3
Diterima Berfungsi Baik Sulit 4
Direvisi Berfungsi Baik Sulit 5
Diterima Berfungsi Baik Sulit 6
Ditolak Berfungsi Baik Sedang 7
Diterima Berfungsi Baik Sedang 8
Direvisi Tidak Berfungsi Baik Sedang 9
Diterima Berfungsi Baik Sedang 10
b. Uraian
Kelas VIII Asma’
Simpulan Korelasi Tingkat Kesukaran Butir No. Soal
Diterima Baik Sedang 1
Diterima Baik Sedang 2
Ditolak Kurang Sulit 3
Kelas VIII Hafsah
Simpulan Korelasi Tingkat Kesukaran Butir No. Soal
Diterima Baik Sedang 1
Diterima Baik Sedang 2
Diterima Baik Sedang 3
2.
3. Soal Non Tes
Kelas VIII Asma’
Simpulan Merata Unimodal Daya Beda No. Soal
Ditolak Tidak Ya Kurang 1
Ditolak Ya Ya Kurang 2
Direvisi Tidak Ya Kurang 3
Diterima Ya Ya Baik 4
Diterima Tidak Ya Baik 5
Direvisi Ya Ya Kurang 6
Direvisi Tidak Ya Kurang 7
Diterima Tidak Ya Baik 8
Direvisi Tidak Ya Kurang 9
Ditolak Ya Ya Kurang 10
Diterima Tidak Ya Baik 11
Direvisi Tidak Ya Kurang 12
Kelas VIII Hafsah
Simpulan Merata Unimodal Daya Beda No. Soal
Diterima Tidak Ya Baik 1
Direvisi Tidak Ya Kurang 2
Diterima Tidak Ya Baik 3
Diterima Tidak Ya Baik 4
Diterima Tidak Ya Baik 5
Diterima Tidak Ya Baik 6
Diterima Tidak Ya Baik 7
Diterima Tidak Ya Baik 8
Diterima Tidak Ya Baik 9
Diterima Tidak Ya Baik 10
Diterima TIdak Ya Baik 11
Direvisi Tidak Ya Kurang 12
IV. SIMPULAN DAN SARAN
A. SIMPULAN
1. Soal Tes
a. Pilihan Ganda
Kelas VIII Asma’
Dari hasil analisis dapat disimpulkan bahwa dilihat dari tingkat kesukaran butir, daya beda, dan pengecoh dapat dikatakan bahwa ada butir soal yang direvisi, diterima, dan didrop. Butir soal yang diterima adalah butir soal nomor 2, 3, 6, 8, 9 dan 10. Butir soal yang harus didrop (ditolak) adalah butir soal nomor 7. Sedangkan soal yang direvisi adalah 1,4 dan 5. Secara keseluruhan koefisien reliabilitasnya cukup baik. Nilai alpha nya adalah 0,554, hampir mendekati indeks reabilitas suatu butir soal ideal yang setidaknya memiliki alpha 0,700.
Kelas VIII Hafsah
Dari hasil analisis dapat disimpulkan bahwa dilihat dari tingkat kesukaran butir, daya beda, dan pengecoh dapat dikatakan bahwa ada butir soal yang direvisi, diterima, dan didrop. Butir soal yang diterima adalah butir soal nomor 1, 2, 3, 4, 6, 8 dan 10. Butir soal yang harus didrop (ditolak) adalah butir soal nomor 7. Sedangkan soal yang direvisi adalah 5 dan 9. Secara keseluruhan koefisien reliabilitasnya cukup baik. Nilai alpha nya adalah 0,383, alpha tidak mendekati indeks reabilitas suatu butir soal ideal yang setidaknya memiliki alpha 0,700.
b. Uraian
Kelas VIII Asma’
Dari hasil analisis dapat disimpulkan bahwa dilihat dari tingkat kesukaran butir dan korelasi dapat dikatakan bahwa ada butir soal yang diterima dan ditolak. Semua butir soal diterima kecuali butir soal nomor 3. Secara keseluruhan koefisien reliabilitasnya kurang baik dan jauh dari indeks reliabilitas soal ideal. Nilai alpha adalah 0,15. Nilai alpha ini akan menjadi baik dan sesuai standar jika saja soal nomor 3 bisa direvisi atau diganti dengan soal yang lebih baik.
Kelas VIII Hafsah
Dari hasil analisis dapat disimpulkan bahwa dilihat dari tingkat kesukaran butir dan korelasi dapat dikatakan bahwa semua butir soal diterima. Secara keseluruhan koefisien reliabilitasnya cukup baik dan indeks reliabilitas soalnya ideal. Nilai alpha adalah 0,72.
2. Soal Non Tes
Kelas VIII Asma’
Dari hasil analisis non tes (angket) ini dapat disimpulkan bahwa dilihat dari daya beda butir serta distribusi jawaban yang unimodal dan merata, dapat dikatakan bahwa ada butir soal yang diterima, direvisi dan ditolak. Butir soal yang dapat langsung ditolak adalah butir soal nomor 1, 2 dan 8. Soal yang perlu direvisi adalah nomor 3, 6, 7, 9, dan 12. Sedangkan sisanya yakni nomor 4, 5, 8 dan 11 diterima. Secara keseluruhan koefisien reliabilitasnya kurang baik. Nilai alphanya adalah 0,119. Dalam analisis butir non tes ini tidak ada indeks kesukaran butir.
Kelas VIII Hafsah
Dari hasil analisis non tes (angket) ini dapat disimpulkan bahwa dilihat dari daya beda butir serta distribusi jawaban yang unimodal dan tidak merata, dapat dikatakan bahwa ada butir soal yang diterima dan direvisi. Soal yang diterima adalah nomor 1,3,4,5,6,7,8,9,10, dan 11. Soal yang perlu direvisi adalah nomor 2 dan 12. Secara keseluruhan koefisien reliabilitasnya baik. Nilai alphanya adalah 0.675. Dalam analisis butir non tes ini tidak ada indeks kesukaran butir.
B. SARAN
1. Dalam pengujian, baik butir soal tes maupun non tes, peserta didik kurang sungguh-sungguh dalam mengerjakannya, sehingga kita perlu memberi motivasi agar mereka lebih serius dalam mengerjakan.
2. Hendaknya soal yang dibuat disesuaikan dengan kemampuan siswa.
3. Butir soal non tes yang sebaran jawaban kurang berfungsi sebaiknya direvisi.
4. Untuk meningkatkan reliabilitas perangkat skala ini bisa dilakukan dengan menambah banyaknya butir soal dan ukuran sampel yang lebih besar
Lampiran 2
Butir Soal Tes
I. Pilihan Ganda
1. Harga 8 buah buku tulis dan 6 buah pensil Rp14.400.00. Harga 6 buah buku tulis dan 5 buah pensil Rp11.200,00. Jumlah harga 5 buah buku tulis dan 8 buah pensil adalah....
a. Rp13.600,00
b. Rp12.800,00
c. Rp12.400,00
d. Rp11.800,00
2. Diketahui penyelesaian sistem persamaan 3x + 4y = 7 dan –2x + 3y = –16 adalah x dan y dengan x, y {bilangan bulat}. Nilai 2x – 7y = ....
a. –24 c. 4
b. –4 d. 24
3. Pada sebuah tempat parkir terdapat 84 kendaraan yang terdiri atas sepeda motor dan mobil. Setelah dihitung jumlah roda seluruhnya ada 220 buah. Jika tarif parkir untuk sepeda motor Rp1.000,00 dan untuk mobil Rp2.000,00, besar uang yang diterima tukang parkir adalah ....
a. Rp91.000,00 c. Rp156.000,00
b. Rp110.000,00 d. Rp171.000,00
4. Hasil kali penyelesaian dari system persamaan dan adalah ....
a. –1 c. –10
b. 1 d. 10
5. Berikut ini yang merupakan persamaan linier dua variable adalah. . .
a. w – t = 3w + 6w c. 6t – 3 = – t + 7
b. 7 y – x = 3 + x2 d. 3t – 5y = 8t + 6y2
6. Himpunan penyelesaian dari system persamaan y = 2x + 1 dan 3x – 5y = 16 adalah....
a. {(–3, 5)} c. {(–3, –5)}
b. {(5, 3)} d. {(–5, 3)}
7. Diketahui sebuah segitiga siku-siku, panjang sisi miringnya 3 cm dan panjang salah satu sisinya 3 cm. Panjang sisi siku-siku yang lain adalah ....
a. 7 cm c. 10 cm
b. 9 cm d. 15 cm
8. Jika x, 61, 11 merupakan tripel Pythagoras dan 61 bilangan terbesar maka nilai x adalah....
a. 15 c. 45
b. 30 d. 60
9. Panjang diagonal ruang kubus dengan panjang rusuk 12 cm adalah ....
a. 12 cm c. 12 cm
b. 13 cm d. 13 cm
10. Sebuah segitiga siku-siku memiliki panjang sisi miring 17 cm. Jika panjang alasnya 15 cm, maka luas segitiga adalah ....
a. 8 cm c. 30 cm2
b. 16 cm2 d. 60 cm2
II. Uraian
1. Tentukan himpunan penyelesaian sistem persamaan 2x + 3y = 6 dan x – y = 3!
2. Keliling sebuah persegi panjang 76 cm. Jika selisih antara panjang dan lebar persegipanjang tersebut 10 cm, tentukanlah:
a. panjang dan lebar persegi panjang tersebut,
b. luas persegi panjang tersebut.
3. R
3x
Q 3x P
Diketahui sebuah segitiga siku-siku seperti yang digambarkan di atas, dari segitiga PQR tersebut, tentukan:
a. nilai x,
b. panjang PQ,
c. keliling segitiga PQR,
d. luas segitiga PQR.
lampiran 3
Butir Soal Non Tes
Nama :
Kelas :
No. Absen :
Asal Sekolah :
Berilah tanda ( ) untuk jawaban yang sesuai dengan pilihan anda
No Pernyataan Sering Kadang-kadang Tidak pernah
1. Menyiapkan alat tulis dan buku pelajaran malam hari untuk ke sekolah besok pagi
2. Membaca materi yang akan diajarkan besok
3. Meneliti tugas yang akan dikumpulkan besok pagi pada malam harinya
4. Memasuki ruang kelas sebelum pelajaran dimulai
5. Memperhatikan guru pada saat menyampaikan materi ketika proses pembelajaran sedang berlangsung
6. Bercanda dengan teman pada saat guru menyampaikan materi
7. Berusaha untuk memahami materi yang disampaikan
8. Berusaha mengerjakan soal-soal yang diberikan oleh guru dengan sungguh-sungguh pada saat proses pembelajaran berlangsung
9. Materi-materi yang disampaikan kadang membuat bosan
10. Merasa sulit memahami penjelasan guru
11. Langsung mengerjakan tugas ( PR ) yang diberikan oleh guru ketika pulang sekolah
12. Melengkapi catatan yang belum lengkap sepulang sekolah (seperti meminjam dan menyalin catatan dari buku teman)
Lampiran 4
Data Butir Soal Pilihan Ganda
1. File Input Pilihan Ganda
Kelas VIII Asma’
010_O_N_03
CDBBACBDAD
4444444444
YYYYYYYYYY
001CDBCDCCDAD
002DACCBDBBAB
003BACDCABDAC
004BCDAABBDAC
005CDBCDCCDAD
006BBBDCBCAAC
007CBCABCCADA
008CBBCDBAAAD
009CDBCDCADAD
010CACCCBDCAB
011CBBDCDAAAD
012CDBBCBBDAD
013CDAABDCAAA
014CCCDDDBAAA
015CBABCBDCDA
016CBCDDDBDCD
017DBBCCBBDCA
018CDCDCBBDAD
019BDBAACBCAB
020CCCDCDBACB
Kelas VIII Hafsah
010_O_N_03
CDBBACBDAD
4444444444
YYYYYYYYYY
001ACCCCDBDAA
002CCBCCBBCAC
003ACCCCACBCA
004CAADCBBCCD
005CCADCCCAAC
006CABCCABDAA
007ADCAAACACB
008DBCDCDBBAB
009CADDCBBBAD
010ADDCBABCAD
011ABCACBBADC
012CCDDDACAAB
013ADBBAACBAA
014CDCABCCDBD
015CDABACCDBA
016AACCBABDCD
017CAABCCBDAD
2. File Output Pilihan Ganda
Kelas VIII Asma’
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file ASMA.DAT
Item Statistics Alternative Statistics
----------------------- -----------------------------------
Seq. Scale Prop. Point Prop. Point
No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key
---- ----- ------- ------ ------ ----- --------- ------ ------ ---
1 0-1 0.700 0.311 0.236 A 0.000 -9.000 -9.000
B 0.200 -0.108 -0.075
C 0.700 0.311 0.236 *
D 0.100 -0.445 -0.260
Other 0.000 -9.000 -9.000
2 0-2 0.350 1.000 0.826 A 0.150 -0.556 -0.363
B 0.350 -0.499 -0.388
C 0.150 -0.340 -0.222
D 0.350 1.000 0.826 *
Other 0.000 -9.000 -9.000
3 0-3 0.450 0.734 0.584 A 0.100 -0.445 -0.260
B 0.450 0.734 0.584 *
C 0.400 -0.547 -0.432
D 0.050 -0.012 -0.006
Other 0.000 -9.000 -9.000
4 0-4 0.100 0.272 0.159 A 0.200 -0.108 -0.075
B 0.100 0.272 0.159 *
CHECK THE KEY C 0.350 0.248 0.193 ?
B was specified, C works better D 0.350 -0.296 -0.230
Other 0.000 -9.000 -9.000
5 0-5 0.100 0.272 0.159 A 0.100 0.272 0.159 *
B 0.150 -0.556 -0.363
CHECK THE KEY C 0.450 -0.283 -0.225
A was specified, D works better D 0.300 0.557 0.423 ?
Other 0.000 -9.000 -9.000
6 0-6 0.250 0.693 0.509 A 0.050 -0.256 -0.121
B 0.400 -0.091 -0.072
C 0.250 0.693 0.509 *
D 0.300 -0.456 -0.346
Other 0.000 -9.000 -9.000
7 0-7 0.500 0.032 0.025 A 0.150 0.308 0.201 ?
B 0.500 0.032 0.025 *
CHECK THE KEY C 0.250 0.059 0.044
B was specified, A works better D 0.100 -0.588 -0.344
Other 0.000 -9.000 -9.000
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file ASMA.DAT
Item Statistics Alternative Statistics
----------------------- -----------------------------------
Seq. Scale Prop. Point Prop. Point
No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key
---- ----- ------- ------ ------ ----- --------- ------ ------ ---
8 0-8 0.450 0.798 0.635 A 0.350 -0.567 -0.441
B 0.050 -0.500 -0.237
C 0.150 -0.232 -0.152
D 0.450 0.798 0.635 *
Other 0.000 -9.000 -9.000
9 0-9 0.750 0.574 0.421 A 0.750 0.574 0.421 *
B 0.000 -9.000 -9.000
C 0.150 -0.340 -0.222
D 0.100 -0.588 -0.344
Other 0.000 -9.000 -9.000
10 0-10 0.400 0.951 0.750 A 0.250 -0.574 -0.421
B 0.200 -0.378 -0.264
C 0.150 -0.340 -0.222
D 0.400 0.951 0.750 *
Other 0.000 -9.000 -9.000
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file ASMA.DAT
There were 20 examinees in the data file.
Scale Statistics
----------------
Scale: 0
-------
N of Items 10
N of Examinees 20
Mean 4.050
Variance 3.947
Std. Dev. 1.987
Skew 0.619
Kurtosis -1.041
Minimum 2.000
Maximum 8.000
Median 3.000
Alpha 0.554
SEM 1.326
Mean P 0.405
Mean Item-Tot. 0.430
Mean Biserial 0.56
Kelas VIII Hafsah
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file HAFSAH.DAT
Item Statistics Alternative Statistics
----------------------- -----------------------------------
Seq. Scale Prop. Point Prop. Point
No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key
---- ----- ------- ------ ------ ----- --------- ------ ------ ---
1 0-1 0.529 0.655 0.522 A 0.412 -0.543 -0.429
B 0.000 -9.000 -9.000
C 0.529 0.655 0.522 *
D 0.059 -0.421 -0.210
Other 0.000 -9.000 -9.000
2 0-2 0.294 0.453 0.342 A 0.294 0.453 0.342 ?
B 0.118 -0.670 -0.410
CHECK THE KEY C 0.294 -0.521 -0.394
D was specified, A works better D 0.294 0.453 0.342 *
Other 0.000 -9.000 -9.000
3 0-3 0.176 0.465 0.316 A 0.235 0.558 0.405 ?
B 0.176 0.465 0.316 *
CHECK THE KEY C 0.412 -0.715 -0.566
B was specified, A works better D 0.176 -0.053 -0.036
Other 0.000 -9.000 -9.000
4 0-4 0.176 0.983 0.668 A 0.176 -0.312 -0.212
B 0.176 0.983 0.668 *
C 0.353 -0.165 -0.128
D 0.294 -0.327 -0.247
Other 0.000 -9.000 -9.000
5 0-5 0.176 0.335 0.228 A 0.176 0.335 0.228 *
B 0.176 0.206 0.140
C 0.588 -0.233 -0.185
D 0.059 -0.421 -0.210
Other 0.000 -9.000 -9.000
6 0-6 0.235 0.777 0.563 A 0.412 -0.284 -0.225
B 0.235 -0.205 -0.149
C 0.235 0.777 0.563 *
D 0.118 -0.330 -0.202
Other 0.000 -9.000 -9.000
7 0-7 0.588 0.112 0.088 A 0.000 -9.000 -9.000
B 0.588 0.112 0.088 *
C 0.412 -0.112 -0.088
D 0.000 -9.000 -9.000
Other 0.000 -9.000
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file HAFSAH.DAT
Item Statistics Alternative Statistics
----------------------- -----------------------------------
Seq. Scale Prop. Point Prop. Point
No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key
---- ----- ------- ------ ------ ----- --------- ------ ------ ---
8 0-8 0.353 0.739 0.574 A 0.235 -0.642 -0.465
B 0.235 -0.315 -0.228
C 0.176 0.076 0.052
D 0.353 0.739 0.574 *
Other 0.000 -9.000 -9.000
9 0-9 0.588 0.370 0.293 A 0.588 0.370 0.293 *
B 0.118 0.690 0.423 ?
CHECK THE KEY C 0.235 -0.642 -0.465
A was specified, B works better D 0.059 -0.707 -0.352
Other 0.000 -9.000 -9.000
10 0-10 0.353 0.468 0.363 A 0.294 0.160 0.121
B 0.176 -0.571 -0.388
C 0.176 -0.312 -0.212
D 0.353 0.468 0.363 *
Other 0.000 -9.000 -9.000
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file HAFSAH.DAT
There were 17 examinees in the data file.
Scale Statistics
----------------
Scale: 0
-------
N of Items 10
N of Examinees 17
Mean 3.471
Variance 3.073
Std. Dev. 1.753
Skew 0.049
Kurtosis -0.450
Minimum 0.000
Maximum 7.000
Median 3.000
Alpha 0.383
SEM 1.377
Mean P 0.347
Mean Item-Tot. 0.396
Mean Biserial 0.535
3. Analisis Data Uraian
Kelas VIII Asma’
No Nama Soal 1 (Skor maks 2) Soal 2 (Skor Maks 4) Soal 3 (Skor Maks 4) Jumlah
1 Afifah M. 0,25 0,5 0,75 1,5
2 Andra Sukmalahi S. 1 1 0 2
3 Bella Delsea M. 0,25 0 0 0,25
4 Dessy Anis Safitri 0,25 4 3 7,25
5 Devi Qomariah 0,75 0,5 1 2,25
6 Endah Nur A. 1 0 0 1
7 Fanisa Zidnad 2 2 0,25 4,25
8 Farissa Varamita 2 4 0,25 6,25
9 Fena Dana W. 1 0 1 2
10 Fildzah Nabila 1 1 1 3
11 Muthia Ulya N. 2 4 0,25 6,25
12 Nadia Chairunnisa 2 1 0 3
13 Nadia Rizki R. 0 1 0 1
14 Nurulita Eka P. 0,5 1 1 2,5
15 Rahma Putri K. 2 2 0 4
16 Tify Ananingrum 0,25 0,5 1 1,75
17 Ulfa Nur F. 1 1 2 4
18 Vrilia Diar O. 2 1 1 4
19 Yumna Adelia F. 2 2 2,5 6,5
20 Zidni Ilma R. 1 0,25 0 1,25
Jumlah 22,25 26,75 15
Rata-rata 1,11 1,34 0,75
Tingkat Kesukaran 0,55 0,34 0,19
Kriteria Sedang Sedang Sukar
daya beda [(17:10)-(5,25:10)]:2=0,59 [(22:10)-(4,75:10)]:4= 0,43 [(14,25:10)-(0,75:10)]:4=0,34
Kriteria Baik & diterima Baik & diterima Diterima dan diperbaiki
Korelasi 0,56 0,90 0,55
Si 0,74 1,30 0,88
Si2 0,54 1,69 0,78 3,00
Sx 2,06
Sx2 4,23
Α 3/2(1-(3/4,23))=0,15
Kelas VIII Hafsah
No Nama Soal 1 (Skor maks 2) Soal 2 (Skor Maks 4) Soal 3 (Skor Maks 4) jumlah
1 Anisa Darojatul Ulya 2 0 3 5
2 Anisa R. Amalia 1 1 2 4
3 Astrid Nur F. 2 1 0,5 3,5
4 Ayu Wulararum 2 4 4 10
5 Desy Sanar R. 1 1 4 6
6 Diella Aisyah R. 0,5 0,5 1 2
7 Fathiha Fitrania 1 1 4 6
8 Fitri Anisa 1 3 0,5 4,5
9 Murna Ayu N. U. 2 2,5 3,5 8
10 Nabilah Effendy 1 2 0,5 3,5
11 Narindra P. E. 1 1 2,5 4,5
12 Nisa Imadiana 2 1 4 7
13 Restu Santunufi 2 0 2,5 4,5
14 Sonniya A. Navisa 1 0,5 0,5 2
15 Uswatunnisa A. 2 4 4 10
16 Winda Ayu Nurlita 0,5 1 3 4,5
17 Yuyun Nurlina 2 4 4 10
Jumlah 24 27,5 43,5
Rata-rata 1,41 1,62 2,56
Tingkat Kesukaran 0,705 0,45 0,64
Kriteria Sedang Sedang Sedang
daya beda ((17:9)-(7:8)):2=0,5 [(33,5:9)-(10:8)]:4= 0,59 [(22,5:9)-(5:8)]:4=0,47
Kriteria Baik & diterima Baik & diterima Baik & diterima
Korelasi 0,63 0,77 0,81
Si 0,59 1,38 1,45
Si2 0,35 1,89 2,09 4,33
Sx 2,61
Sx2 6,79
Α 3/2(1-(4,33/6,79))=0,72
4. File Input Non Tes
Kelas VIII Asma’
012_O_N_03
+++++-++--++
333333333333
YYYYYYYYYYYY
001323223323223
002323132332212
003323332332232
004320132332213
005323222332232
006223232332223
007313333322133
008333222333223
009323132333221
010323132332223
011333133222213
012323132332223
013323331332312
014323232332222
015322232300000
016323122332222
017322122332222
018323332330223
019323222322212
020322132322223
Kelas VIII Hafsah
012_O_N_03
+++++-++--++
333333333333
YYYYYYYYYYYY
001222322223322
002322322322222
003322232332223
004323232332222
005323332332232
006333322332223
007323332332223
008322332331323
009323332332222
010222332333323
011223232333212
012322223333313
013321332332222
014223332332223
015323331332222
016323332322223
017332332332222
5. File out put Non Tes
Kelas VIII Asma’
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file AS.DAT Page 1
Item Statistics Alternative Statistics
--------------------------------- -----------------------
Seq. Scale Item Item Item-Scale N per Alter- Proportion
No. -Item Mean Var. Correlation Item native Endorsing Key
---- ----- ------ ------ ----------- ----- ------ ---------- ---
1 0-1 2.950 0.047 -0.115 20 1 0.000 +
2 0.050
CHECK THE KEY 3 0.950
+ was specified, - works better Other 0.000
2 0-2 2.050 0.147 -0.242 20 1 0.050 +
2 0.850
CHECK THE KEY 3 0.100
+ was specified, - works better Other 0.000
3 0-3 2.842 0.133 0.205 19 1 0.000 +
2 0.150
3 0.800
Other 0.050
4 0-4 1.750 0.587 0.697 20 1 0.450 +
2 0.350
3 0.200
Other 0.000
5 0-5 2.700 0.210 0.380 20 1 0.000 +
2 0.300
3 0.700
Other 0.000
6 0-6 1.900 0.190 0.223 20 1 0.050 -
2 0.800
3 0.150
Other 0.000
7 0-7 2.950 0.047 0.291 20 1 0.000 +
2 0.050
3 0.950
Other 0.000
8 0-8 2.737 0.194 0.381 19 1 0.000 +
2 0.250
3 0.700
Other 0.050
9 0-9 1.833 0.139 0.260 18 1 0.000 -
2 0.750
3 0.150
Other 0.100
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file AS.DAT Page 2
Item Statistics Alternative Statistics
--------------------------------- -----------------------
Seq. Scale Item Item Item-Scale N per Alter- Proportion
No. -Item Mean Var. Correlation Item native Endorsing Key
---- ----- ------ ------ ----------- ----- ------ ---------- ---
10 0-10 2.000 0.105 0.094 19 1 0.050 -
2 0.850
3 0.050
Other 0.050
11 0-11 1.895 0.410 0.521 19 1 0.250 +
2 0.550
3 0.150
Other 0.050
12 0-12 2.474 0.355 0.256 19 1 0.050 +
2 0.400
3 0.500
Other 0.050
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file AS.DAT Page 3
Missing-data option: Compute statistics on all available item responses
There were 20 examinees in the data file.
Scale Statistics
----------------
Scale: 0
-------
N of Items 12
N of Examinees 20
Mean 2.346
Variance 0.020
Std. Dev. 0.141
Skew 0.222
Kurtosis -0.930
Minimum 2.167
Maximum 2.636
Median 2.417
Alpha 0.119
SEM 0.133
Mean P N/A
Mean Item-Tot. 0.246
Mean Biserial N/A
Kelas VIII Hafsah
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file AH.DAT Page 1
Item Statistics Alternative Statistics
--------------------------------- -----------------------
Seq. Scale Item Item Item-Scale N per Alter- Proportion
No. -Item Mean Var. Correlation Item native Endorsing Key
---- ----- ------ ------ ----------- ----- ------ ---------- ---
1 0-1 2.765 0.180 0.496 17 1 0.000 +
2 0.235
3 0.765
Other 0.000
2 0-2 2.118 0.104 0.282 17 1 0.000 +
2 0.882
3 0.118
Other 0.000
3 0-3 2.471 0.367 0.479 17 1 0.059 +
2 0.412
3 0.529
Other 0.000
4 0-4 2.765 0.180 0.381 17 1 0.000 +
2 0.235
3 0.765
Other 0.000
5 0-5 2.765 0.180 0.554 17 1 0.000 +
2 0.235
3 0.765
Other 0.000
6 0-6 2.000 0.118 0.500 17 1 0.059 -
2 0.882
3 0.059
Other 0.000
7 0-7 2.941 0.055 0.588 17 1 0.000 +
2 0.059
3 0.941
Other 0.000
8 0-8 2.824 0.145 0.382 17 1 0.000 +
2 0.176
3 0.824
Other 0.000
9 0-9 1.824 0.263 0.762 17 1 0.059 -
2 0.706
3 0.235
Other 0.000
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file AH.DAT
Item Statistics Alternative Statistics
--------------------------------- -----------------------
Seq. Scale Item Item Item-Scale N per Alter- Proportion
No. -Item Mean Var. Correlation Item native Endorsing Key
---- ----- ------ ------ ----------- ----- ------ ---------- ---
10 0-10 1.765 0.180 0.612 17 1 0.000 -
2 0.765
3 0.235
Other 0.000
11 0-11 1.941 0.173 0.569 17 1 0.118 +
2 0.824
3 0.059
Other 0.000
12 0-12 2.471 0.249 0.139 17 1 0.000 +
2 0.529
3 0.471
Other 0.000
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file AH.DAT Page 3
Missing-data option: Compute statistics on all available item responses
There were 17 examinees in the data file.
Scale Statistics
----------------
Scale: 0
-------
N of Items 12
N of Examinees 17
Mean 2.387
Variance 0.040
Std. Dev. 0.200
Skew -1.037
Kurtosis -0.002
Minimum 1.917
Maximum 2.583
Median 2.500
Alpha 0.675
SEM 0.114
Mean P N/A
Mean Item-Tot. 0.479
Mean Biserial N/A
No comments:
Post a Comment