Psikometri



Analisis item/Butir

Definisi Analisis Item

Analisis item adalah suatu proses yang menguji respon subjek terhadap item yang dibuat yang bertujuan untuk menilai kualitas dari item-item dan tes secara keseluruhan. Analisis item juga mampu mengeliminasi item yang ambigu, menyesatkan dan tidak relevan baik dengan konstrak maupun dengan subjek yang diukur.
Analisis aitem penting untuk meningkatkan pengalaman dan keterampilan si pengembang instrumen ukur dalam mengidentifikasi domain-domain konstrak yang ukur, mana domain yang perlu mendapatkan penekanan dan mana yang tidak perlu.
Analisis Dan Seleksi Item
Prosedur seleksi atau pemilihan aitem meliputi dua tahap yaitu

Tahap pertama adalah analisis dan seleksi item berdasarkan evaliatif kualitatif. Evaluasi ditulis sudah sesuai dengan blue-print dan indicator perilaku yang hendak di ungkapnya, Item ditulis sesuai dengan kaidah penulisan yang benar, dan melihat apakah item-item yang ditulis masih mengandung social desirability yang tinggi. Evaluasi dan seleksi aitem dalam tahap ini dikerjakan oleh suatu panel ahli.

kumpulan item dalam jumlah yang cukup maka kumpulan item ini dikomplikasikan dalamk bentuk semifinal yang siap untuk di uji cobakan secara empiris ( Field-tested) pada kelompok subjek yang seharusnya.

  Tahap kedua adalah prosedur seleksi item berdasarkan data empiris (data hasil uji-coba item pada kelompok subjek yang karakteristiknya setara dengan subjek yang hendak dikenai skala itu nantinya) dengan melakukan analisis kuantitatif terhadap parameter-parameter item. Seleksi item yang lebih lengkap akan meliputi analsis validitas dan reliabilitas item, distribusi jawaban, dan aplikasi analisis factor.

Uji-Coba Item

Untuk menghasilkan parameter-parameter yang cukup akurat dan stabil antar kelompok sampel, data empiris dari uji coba ini harus diperoleh dari subjek dalam jumlah yang banyak. Dengan subjek yasng jumlahnya cukup banyak diharapkan dapat diperoleh skor-skor yang variasinya menyebar secara noprmal atau mengikuti distribusi normal. Parameter-parameter item yang diperoleh dari skor yang terdistribusi secara normal akan lebih representative dan menggambarkan estimasi yang cermat terhadap sifat item-item yang di analisis.

Parameter-parameter item akan di hasilkan oleh prosedur analisis item merupakan parameter yang secara kuantitatif tergantung pada karakteristik kelompok yang di gunakan sebagai sampel artinya parameter item yang diperoleh dari hasil analisis data pada suatu kelompok biasanya berbeda dari parameter item yang sama apabila di hitung pada data kelompok yang lain. Parameter item akan semakin sensitive terhadap perbedaan yang terjadi apabila data yang digunakan berasal dari kelompok yang jumlahnya sangat sedikit atau yang merupakan kelompok pilihan.

Parameter Item Untuk Skala Psikologi

Formula korelasi yang tepat untuk digunakan dalam komputasinya tergantung pada sifat penskalaan dan distribusi skor item dan skor skala itu sendiri. Bagi skala-skala yang setiap itemnya diberi skor pada level interval dapat digunakan formula koefisien korelasi positif antara skor item dengan skor skala berarti semakin tinggi konsistensi antara item tersebut dengan skala keseluruhan yang berarti semakin tinggi daya bedanya.

Bila koefisien korelasinya rendah mendekati nol berarti fungsi item tersebut tidak cocok dengan fungsi ukur skala dan daya bedanya tidak baik. Bila koefisien korelasi yang di maksud ternyata negative artinya terdapat cacat serius pada item yang bersangkutan.

Bila menggunakan formula person untuk komputasi koefisien korelasi item-total, dapat dipakai rumusan :
  rix  =                   ∑iX – ( ∑i)(∑X)/n

                     √[∑i– ( ∑i)/ n][∑X– (∑X)/n]
  I = Skor item
X = Skor skala
N = Banyaknya subjek

Koreksi Terhadap Efek Spurios Overlap

Apabila koefisien korelasi item total itu dihitung pada suatu skala yang berisi hanya sedikit item maka sangat mungkin akan diperoleh koefisien korelasi item-total yang over estimated (lebih tinggi daripada sebenarnya) dikarenakan adanya overlap antara skor item dengan skor skala (Guilford,1965).

Contoh misalnya dalam sebuah skala skor di dapatkan dari penjumlahan skor-skor yang terdapat pada item-itemnya, oleh karena itu dengan sendirinya skor setiap item menjadi bagian atau porsi dari skor skala tersebut. Porsi ini akan semakin besar apabila jumlah item dalam skala semakin sedikit. Dengan begitu, sewaktu kita menghitung koefisien korelasi suatu item dengan skor skala, sesungguhnya kita menghitung korelasi antara skor item yang bersangkutan. Dengan kata lain, kita menghitung korelasi skor dengan bagian dari dirinya sendiri dan hal ini tentu saja menyebabkan koefisien korelasinya cenderung menjadi lebih tinggi dari pada kalau korelasi tersebut dihitung antara skor item dengan skor skala yang tidak mengandung item yang bersangkutan

Semakin sedikit item yang ada dalam skala akan semakin besar overlap yang terjadi. Sebaliknya, semakin banyak jumlah item dalam skala maka akibat yang ditimbulkan oleh spurious overlap semakin kecil dan tidak signifikan

Untuk korelasi item total yang dihitung dengan formula product moment Spearmen, formula koreksi terhadap efek spurious overlap adalah :
Ri(x-i) =                      rixs– si

                √[Sx2 + Si– 2rixSiSx ]

Ri(x-i)  = koefisien korelasi item total setelah dikoreksi dari efek spurious overlap
rix            = Koefisien korelasi item total sebelum dikoreksi
si             = deviasi standar skor item yang bersangkutan
sx         = Deviasi skor standar skala

Memilih Item Berdasarkan Koefisien Korelasi Item Total

            Parameter daya beda item yang berupa koefisien korelasi item total memperlihatkan kesesuaian fungsi item dengan fungsi skala dalam mengungkap perbedaan individual. Dengan demikian guna mengoptimalkan fungsi skala maka sangat logis apabila pemilihan item-itemnya didasarkan pada besarnya koefisien korelasi termaksud

Sebagai kriteria pemilihan item berdasar korelasi item total biasanya digunakan batasan rix ≥ 0,30. Semua item yang mencapai koefisien korelasi minimal 0,30 daya pembedanya di anggap memuaskan. Item yang memiliki harga rix atau ri(X-i) kurang dari 0,30 dapat di interpretasikan sebagai item yang memiliki daya diskriminasi rendah. Batasan ini merupakan suatu konvensi. Penyusun tes boleh menentukan sendiri batasan daya diskriminasi aitemnya dengan mempertimbangkan isi dan tujuan skala yang sedang disusun.

Harus pula diketahui bahwa tingginya korelasi skor item dengan skor skala, sekalipun berperanan dalam meningkatkan reliabilitas skala, namun tidak selalu akan meningkatkan validitas skala. Bahkan semata-mata memilih item-item yang berkorelasi tinggi dengan skor skala akan berakibat menurunkan validitas isi dan validitas yang didasarkan pada kriteria ( lemke & Wiersma, 1976; Azwar, 1997 ).

Pertimbangan itu antara lain adalah tujuan penggunaan hasil ukur skala dan komposisi aspek-aspek atau komponen-komponen yang di cakup oleh kawasan ukur yang harus di ungkap oleh skala.

Atribut Tungga vs Atribut Komposit

Pada skala yang dibuat untuk mengukur atribut tunggal seperti itu interkorelasi antar komponen atau dimensinya di harapkan tinggi karena memang komponen-komponen tersebut dirancang untuk mengukur hal yang sama. Dalam seleksi item - itemnya pun kita memilih daya beda item tertinggi yang ada dengan membandingkan indeksnya secara keseluruhan, bukan perkomponen.

Adanya komponen yang ternyata berisi item - item yang berkoefisien korelasi rix rendah menunjukkan antara lain bahwa komponen yang bersangkutan memang tidak relevan dengan tujuan pengukuran dan dapat dihapuskan. Lebih lanjut, untuk pengujian reliabilitasnya cukup dilakukan satu pengujian saja bagi seluruh item yang terpilih sehingga yanga ada adalah koefisien reliabilitas skala bukan koefisien-koefisien reliabilitas komponen Misalnya WAIS, WAIS bertujuan untuk mengukur IQ.

Dalam hal pengukuran atribut komposit seperti ini, kita mengharapkan agar interkorelasi antar aspek atau anatar dimensi itu rendah karena hal itu berarti bahwa setiap aspek memiliki fungsi ukur yang unik dan tidak ada tumpang tindih.

Dari segi pemilihan itemnya, kita harus melakukan analisis item bagi setiap aspek ( menghitung korelasi item dengta skor aspek, bukan dengan skor skala), dengan membandingkan indeks daya deskrimminasinya dalam aspek masing-masing, bukan secara keseluruhan. Begitu juga dalam menguji reliabilitasnya, lebih dahulu dilakukan komputasi koefisien reliabilitas bagi masing masing aspek, baru kemudian dihitung reliabilitas secara keseluruhan yang dikenal dengan nama reliabilitas skor komposit ( Mosier, 1943 dalam Azwar , 1997) .

Suatu skala yang seluruhnya berisi item dengan indeks diskriminasi tinggi berarti bahwa skala itu merupakan kumpulan item yang memiliki tujuan dan fungsi yang sama, tapi hal itu belum menunjukkan fungsi apa yang sebenarnya dimilikinya. Artinya suatu skala yang daya diskriminasi item-itemnya tinggi, belum tentu valid untuk tujuan ukur yang direncanakan.

Comments

Popular Posts