Home Materi Kuliah Karakteristik Tes Bahasa Yang Baik Untuk Pembelajaran Bahasa Kedua

Karakteristik Tes Bahasa Yang Baik Untuk Pembelajaran Bahasa Kedua

by Muhammad Ismail
Tes bahasa yang baik

Sebelum memahami karakteristik tes bahasa yang baik silahkan membaca jenis tes bahasa berdasarkan sasaran dan tes bahasa khusus DISINI.

Untuk memenuhi syarat-syarat tes yang baik, tes dapat menunaikan fungsinya dalam umpan balik kepada penyelenggaraan pembelajaran apabila sesuai (valid) dengan kemampuan yang menjadi sasaran tes, memberikan hasil yang dapat diandalkan (reliable) dan secara teknis dapat dilaksanakan tanpa terlalu banyak kesulitan (praktis).

A. Validitas

Gronlund(1985), dalam Surapranata (2005), menyatakan bahwa validitas berkaitan denganhasil suatu alat ukur, menunjukkan tingkatan, dan bersifat khusus sesuai dengantujuan pengukuran yang akan dilakukan. Hal senada diungkapkan oleh Mardapi(2008) bahwa pengertian validitas suatu tes mengacu tingkat kebenaranpenafsiran skor tes. Penafsiran ini berdasarkan pada tujuan penggunaan tes.Dalam proses validasi, sebenarnya kita tidak bertujuan melakukan validasi testetapi melakukan validasi terhadap interpretasi data yang diperoleh melaluiprosedur tertentu.

Jadi, Istilah validitas pada dasarnya berkaitan dengan hasil tes. Namun, masih banyak terdapat kerancuan bahwa istilah validitas cenderung dikaitkan dengan tes itu sendiri daripada dikaitkan dengan hasil tes. Sementara itu, M. Ainin dkk. (2006) menegaskan bahwa suatu tes sebenarnya tidak mempunyai sifat valid. Jadi, pertanyaan: “Apakah tes ini valid?” tidaklah tepat. Pertanyaan yang tepat adalah: “Bagaimanakah tingkat validitas hasil/skor yang diperoleh dari tes ini?” Tambahan pula, validitas bukanlah ukuran yang bersifat dikotomis (valid – tidak valid), melainkan ditunjukkan dalam bentuk rentangan atau tingkatan (sangat tinggi, tinggi, sedang, rendah, sangat rendah).

Hasilsuatu tes atau pengukuran dikatakan valid apabila hasil tes atau pengukurantersebut benar-benar menggambarkan kemampuan yang diukur/diteskan. Misalnya,jika seorang guru bermaksud mengukur kemampuan membaca siswa, maka ia menyusuntes yang terdiri atas teks bacaan dan pertanyaan-pertanyaan tentang kemampuanmembaca. Melalui pertanyaan-pertanyaan tersebut, ia berusaha menanyakan isiteks bacaan, seperti (a) ide pokok; (b) ide penunjang; dan (c) fakta. Dengantes tersebut, akan dapat diperoleh hasil tes dengan tingkat validitas yangrelatif tinggi.

Di dalam ilmu psikologi bila berbicara mengenai validitas, maka akan dibicarakan validitas dalam konteks: Penelitian (research validity), soal (item validity) dan validitas alat ukur atautes. Validitas penelitian berbicara mengenai sejauh mana kesesuaian hasil penelitiandengan keadaan yang sebenarnya atau sejauh mana hasil penelitian mencerminkan keadaanyang sebenarnya. Validitas penelitian dapat dilihat dari dua sudut pandang,yaitu :

Validitas internal

Validitas internal berbicara mengenai sejauh mana kesesuaianantara data hasil penelitian dan keadaan sebenarnya. Validitas ini diperoleh denganpenggunaan instrument pengambil data yang memenuhi persyaratan ilmiah (validdan reliable)

Validitas eksternal

Validitas eksternal membicarakan sejauh mana kesesuaianantara generalisasi hasil penelitian dan keadaan yang sebenarnya. Validitas inidapat terpenuhi dengan baik bila pengambilan sampel yang kita lakukanrepresentative.

Adapun validitas soal berbicara mengenai sejauh mana kesesuaianantara sebuah soal dan perangkat soal-soal lain. Hal yang perlu diperhatikan dalammembicarakan validitas soal adalah tentang daya beda soal (butir) dan taraf kesukaransoal (butir). Adapun validitas tes membicarakan sejauh mana derajat kecermatan pengukurandengan alat tes.Apakah alat tes yang ada telah mengukur sasaran yang akan diukur.Dalam validitas tes terdapat tipe-tipe validitas. Menurut The Americanpsychological association, the American education research association dan Thenational council on measurement used in education (Kerliager 1986). Diantaranya ialah validitas isi (content validity), validitas kriteria (criterionrelated validity) dan validitas konsepsi (construct validity).

Validitas isi berfungsi untuk mengetahui apakah alat ukur atau tes yang dibuat telah memenuhi validitas isi, maka dapat dilakukan dengan meminta penilaian dari orang yang kompeten (pakar). Validitas isi merupakan kerepresentatifan butir-butir dalam instrument pengukuran. Apakah butir-butir yang ada mewakili sesuatu yang akan diukur atau tidak. Validitas isi memiliki dua jenis:

Validitas muka/tampang (face validity)

Validitas ini sesungguhnya hanya didasarkan pada penilaian terhadap format tampilan dari alat ukur yang ada. Validitas ini dianggap telah terpenuhi apabila penampilan alat ukur atau tes telah meyakinkan dan memberi kesan mampu mengungkapkan apa yang hendak diukur.

Validitas logis (logical validity/sampling validity)

Validitas ini membicarakan sejauh mana isi alat ukur atautes yang ada telah merepresentasikan ciri-ciri atribut yang hendak diukur. Butiratau item yang dipergunakan sudah relevan untuk mengukur hal yang akan diukur.

Adapun validitas kriteria didapat dari hasil membandingkan skor pengukuran atau tes yang dilakukan dengan suatu kriteria yang telah ada. Validitas kriteria pun dibagi menjadi dua yaitu:

Validitas prediktif (predictive validity)

Validitas ini sangat penting artinya bila alat ukur atautes yang dimaksud dapat memprediksi performa di waktu yang akan datang.

Validitas serentak (concurrent validity)

Validitas ini terpenuhi jika skor alat ukur atau tes danskor kriteria yang telah ditetapkan dapat diperoleh dalam waktu yangbersamaan..

Sedangkan dalam validitas konsepsi membicarakan sejauhmana alat ukur atau tes yang ada apakah sudah benar-benar mengungkapkan suatu konsepsiteoritis yang diukur. Dalam rangka untuk memenuhi validitas konsepsi, maka akanterus-menerus dilakukan pengujian mengenai konsep yang diukur.

Validitas factorial (factorial validity)

Dalam kehidupan sehari-hari, perilaku kita (manusia)memiliki banyak variasi atau ragam yang dapat dimunculkan. Di antara sekian banyakvariasi atau ragam perilaku yang ada, dapat ditemukan atau didefinisikan faktor-faktorapa saja yang mendasari variasi atau ragam tersebut dengan bantuan analisis faktor.

Validitas multiciri dan multimerode (multitrait-multimethod)

Dalam validitas multiciri dan multimetode ini digunakansuatu referensi pembanding, yaitu : lebih dari satu ciri (sifat) dan lebih darisatu metode.

Validasi konvergen.

Yaitu suatu tes harus berkorelasi tinggi denganvariable-variabel yang secara teoritis harus berkorelasi tinggi (terhadap kesesuaiandengan referensi yang cocok). Validitas tinggi bila cocok, dan sebaliknya validitasrendah bila tidak cocok.

Validasi diskriminan

Yaitu sesuatu tes harus tidak berkorelasi denganvariable-variabel lain yang secara teoretis tidak berkorelasi (terdapat perbedaandengan referensi yang beda). Validitas tinggi bila beda, dan sebaliknya validitasrendah bila tidak beda.

B. Reliabilitas

Istilah reliabilitasbermakna keajegan (konsisten), yang dalam bahasa Arab disebut (الثبات).Surapranata (2005) menyatakan bahwa reliabilitas merupakan kestabilan skor yangdiperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasiyang berbeda atau dari satu pengukuran ke pengukuran lainnya. Jadi, istilahreliabilitas berkaitan dengan konsistensi hasil tes.

Jikakita menyusun atau memiliki suatu alat tes, kita perlu mempertanyakan, apakahalat tes tersebut terpercaya?. Jika tes itu diujicobakan lebih dari satu kalikepada subjek yang sama, apakah dapat memberikan hasil yang kurang lebih sama?;artinya, walau terjadi perbedaan, perbedaan itu tidak signifikan. Beberapapertanyaan tersebut berkaitan dengan masalah ketepercayaan (reliabilitas) tes.Jika sebuah tes diujicobakan lebih dari satu kali kepada subjek yang sama dapatmenghasilkan data yang kurang lebih sama, tes itu dikatakan terpercaya. Alattes tersebut dapat mengukur secara konsisten, secara ajeg adanya sifat keajeganinilah terutama yang dituntut oleh sebuah tes untuk dapat disebut tercepercaya.Kriteria ketepercayaan tes menunjuk pada pengertian apakah suatu tes dapatmengukur secara konsisten sesuatu yang akan diukur dari waktu ke waktu (Tuchman,1975 :254).

Pengertiankonsisten dalam ketepercayaan tes berhubungan dengan hal-hal : (1) tes dapatmemberikan hasil yang relatif tetap terhadap sesuatu yang diukur, (2) jawabansiswa terhadap butir-butir tes secara relatif tetap, dan (3) hasil tesdiperiksa oleh siapa pun juga akan menghasilkan skor yang kurang lebih sama.Ketiga hal tersebut merupakan sesuatu yang akan mempengaruhi tinggi ataurendahnya tingkat ketepercayaan tes. Perlu diketahui bahwa tidak ada satu puninstrumen tes dan atau prosedur pengukuran yang benar-benar sempurna walau halitu telah diusahakan secara baik. Suatu pengukuran terhadap kemampuan tertentuyang dilakukan dua kali dalam kondisi dan subjek yang sama, tidak akanmenghasilkan data yang persis sama. Misalnya, kita melakukan pengukurankemampuan membaca pemahaman siswa. Dengan melakukan pengukuran, kita bermaksudmendapatkan skor yang sesungguhnya yang dicapai seorang siswa, misalnya skorkemampuan membaca pemahaman tersebut.

Palingtidak ada beberapa faktor yang mempengaruhi reliabilitas, namun secara garisbesar, dapat dikelompokkan menjadi dua, yaitu: (1) faktor instrument, mencakupjumlah butir soal, homogenitas isi butir soal, dan tingkat kesulitan soal; dan(2) faktor subjek/individu, mencakup heterogenitas kemampuan individu,kemampuan memahami cara mengerjakan soal, dan motivasi, kesehatan, dankelelahan individu.

Koefisien Reliabilitas

Tinggi rendahnya reliabilitas alat ukur atau tes tidakdapat ditentukan dengan pasti. Namun demikian,  kita masih dapat melakukan estimasi terhadap tinggirendahnya reliabilitas suatu alat ukur. Ada beberapa pendekatan yang sering dilakukanuntuk mencari koefisien reliabilitas suatu alat ukur yaitu dengan cara :

  1. Ukur ulang (testretest)
  2. Ukur setara (parallelform/equivalent form/alternative form)
  3. Sekali ukur (oneshot)

Pengukuran atau tes hanya diberikan satu kali pada sekelompoksobjek. Alat ukur atau tes yang disusun haruslah memiliki cukup banyak butir(pertanyaan/pernyataan) yang mengukur aspek yang sama. Jumlah butir bisa sekitar30-60. Pendekatan sekali ukur ini menghasilkan informasi mengenai konsistensiinternal (internal consistency) alat ukur. Teknik estimasi reliabilitasyang dapat digunakan untuk pengukuran satu kali, yaitu dengan membelah suatu tesmenjadi beberapa bagian (dua bagian, tiga bagian atau bisa multi bagian).

Ada juga pakar yang membagi pendekatan terhadap reliabilitasmenjadi:

Uji-Uji Ulang (koefisien reliabilitas stabilitas)

Yaitu suatu pengukuran atau tes diberikan kepada kelompoksobjek yang sama sebanyak dua kali dengan memberi tenggang waktu antara pengukuranpertama dan kedua. Selang waktu tersebut sebaiknya tidak terlalu dekat (cepat)dan tidak terlalu jauh (lambat). Kalau waktunya terlalu dekat, maka ada kemungkinansobjek masih ingat tentang pengukuran (tes) yang diberikan. Kalau terlalu lama,maka sobjek telah mengalami banyak perubahan dalam sikap, tingkah laku, maupun pengetahuanyang dimilikinya. Adapun tenggang waktu sebaiknya berkisar antara 15-30 hari. Reliabilitasdiperoleh dengan menghitung korelasi antara skor pada pengukuran pertama dan skorpengukuran kedua.

Tes ujiulang ini adalahteknik memperkirakan tingkat kepercayaan tes dengan melakukan kegiatanpengukuran dua kali terhadap tes yang sama kepada siswa yang sama pula. Hasiltes pertama dan kedua kemudian dikorelasikan. Jika koefisien korelasi yangdiperoleh cukup tinggi, tes yang diujicobakan itu dinyatakan terpercaya. Tekniktes ulang uji sebagai pengukur tingkat ketepercayaan tes mempunyai beberapakelemahan. Kelemahan-kelemahan yang dimaksud adalah sebagai berikut:

  1. Sulit untuk menghilangkan pengaruh jawaban tesyang pertama. Hal ini akan lebih terasa untuk butir-butir tes yang mengukursesuatu yang bersifat ingatan dan pemahaman, dan tenggang waktu antara tespertama dan kedua secara relatif tidak lama.
  2. Mungkin terdapat berbagai faktor yangmempengaruhi hasil tes kedua, misalnya berupa meningkatnya kemampuan siswasebagai hasil belajar. Masalah initerjadi terutama jika tenggang waktu antarates pertama dan kedua cukup lama.
  3. Sulit untuk menciptakan dua kondisidiselenggarakannya dua kali tes yang sama. Ada berbagai faktor yangmempengaruhi kondisi tersebut, baik berasal dari pihak siswa (faktor internal)maupun pihak di luar siswa (faktor eksternal) seperti situasi dan kondisi yangada di sekolah itu sendiri.
  4. Menuntut siswa untuk mengalami dua kali tes.Hal ini dirasa kurang menguntungkan dan memberatkan siswa.

Teknikulang uji sebagai teknik pengukur ketepercayaan tes banyak kelemahannya, makauntuk keperluan tersebut disarankan mempergunakan teknik lain yang lebihmenguntungkan.

Uji Paralel

Pengujiantingkat reliabilitas tes dengan teknik butir paralel dilakukan terhadap, adanyadua perangkat tes yang bersifat paralel. Kedua perangkat tes itu dimaksudkanuntuk mengukur tujuan atau kemampuan yang sama, dengan jumlah butir, susunan,dan tingkat kesulitan yang kurang lebih sama pula. Untuk menguji tingkatketepercayaan tes, kedua perangkat tes tersebut diujicobakan kepada sejumlahsubjek yang sama, kemudian hasilnya dikorelasikan. Tinggi rendahnya koefisienkorelasi yang diperoleh mencerminkan tinggi rendahnya tingkat ketepercayaankedua perangkat tes itu.

Teknikini ada persamaannya dengan teknik ulang uji jika dilihat dari banyaknya tesyang dialami siswa, sama-sama menuntut dua kali tes. Akan tetapi, teknik bentukparalel mengujikan perangkat tes yang tidak sama. Hal ini dipandang sebagaikeuntungan dibanding dengan teknik ulang uji karena adanya “pengaruh jawabandari tes pertama” tidak akan terjadi pada tes yang kedua. Akan tetapi,menyiapkan dua perangkat tes yang paralel bukan merupakan pekerjaan yang mudah.Hal ini dipandang sebagai kelemahan teknik bentuk paralel sebagai pengukurtingkat ketepercayaan tes.

C. Kepraktisan

Selainvaliditas dan realibilitas, tes yang baik juga harus memiliki kriteriakepraktisan. Suharsimi Arikunto (2005) menyebutkan empat kriteria tes yangpraktis sebagai berikut:

  1. Mudah dilaksanakan, misalnya tidak memerlukanperalatan yang banyak dan memberi kebebasan kepada peserta tes untukmengerjakan terlebih dahulu bagian yang dianggap mudah oleh peserta tes
  2. Mudah pemeriksaannya, artinya tes tersebutdilengkapi dengan kunci jawaban atau pedoman penskorannya dan lembar jawaban.
  3. Dilengkapi dengan petunjuk cara mengerjakansoal tes dengan jelas
  4. Ekonomis,pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal, tenaga yangbanyak, dan waktu yang lama.

Related Posts

Leave a Comment