การวิเคราะห์แบบทดสอบเพื่อคัดเลือกบุคคลเข้าทำงาน
ทำไมต้องสนใจเรื่องการวิเคราะห์แบบทดสอบ?
การลงทุนขององค์การเพื่อการสร้างแบบทดสอบที่ใช้ในการคัดเลือกบุคคลเข้าทำงาน จะไม่เกิดผลอันใดเลย ถ้าหากผู้ใช้แบบทดสอบบอกไม่ได้ว่าแบบทดสอบนั้นดีหรือไม่ เพียงใด
เพราะหากท่านยังคงฝืนใช้แบบทดสอบนั้นๆ โดยบอกไม่ได้ว่าแบบทดสอบนั้นๆ เป็นแบบทดสอบที่ดี ผลการคัดเลือกก็จะไม่ได้ รับความเชื่อถือจากฝ่ายต่างๆ ซึ่งหากเป็นเช่นนี้ ก็เปล่าประโยชน์ที่จะมีแบบทดสอบ
อย่างไรก็ดี การกล่าวเช่นนี้มิได้หมายความว่า หากยังไม่รู้วิธีการวิเคราะห์แบบทดสอบแล้ว แบบทดสอบจะไม่ใช่สิ่งที่จำเป็นต่อองค์การ ตรงกันข้ามแบบทดสอบเป็นสิ่งจำเป็นและเป็นประโยชน์ต่อองค์การเป็นอย่างยิ่งที่แต่ละองค์การควรนำมาใช้ควบคู่กับการสัมภาษณ์งาน
ดังนั้น ไม่ว่าแบบทดสอบนั้นจะเกิดจากการที่ท่านสร้างขึ้นมาเอง หรือจ้างผู้อื่นที่เชี่ยวชาญมาสร้างให้ ก็จำเป็นอยู่ดีที่จะต้องบอกได้ว่า แบบทดสอบนั้น ดีหรือไม่
ข้อสอบมีคุณภาพดีแค่ไหน ดูได้จากไหน?
การจะวิเคราะห์แบบทดสอบว่าดีหรือไม่ควรพิจารณาประเด็นต่อไปนี้คือ
ความยากง่าย (Difficulty)
อำนาจจำแนก (Discrimination)
ความเป็นปรนัย (Objectivity)
ความมีประสิทธิภาพ (Efficiency)
ความยุติธรรม (Fairness)
ความเที่ยงตรงของแบบทดสอบ (Validity)
ความเชื่อมั่น (Reliability)
ความยากง่าย (Difficulty)
ข้อสอบที่ดีควรมีลักษณะที่ยากง่ายปานกลาง ข้อสอบที่ยากเกินไปจนกระทั่งคนเก่งก็ทำผิด คนไม่เก่งก็ตอบไม่ได้ ทุกคนหรือเกือบทุกคนตอบถูก ถือว่าเป็นข้อสอบที่ไม่ดี จะต้องปรับปรุงให้มีความยากง่ายปานกลาง มีผู้ตอบผิดบ้าง ถูกบ้า
สูตรการหาค่าความยากง่ายของแบบทดสอบรายข้อ
การหาค่าความยากง่ายของแบบทดสอบมีสูตรดังนี้
P | = | ( H + L)/ N |
P | = | ค่าความยากง่าย |
H | = | จำนวนคนที่ตอบข้อสอบนั้นถูกในกลุ่มคนเก่ง (ตามสูตรนี้ คนเก่งคือคนที่ได้คะแนนสูงสุด 25 % แรกของกลุ่มผู้สอบทั้งหมด) |
L | = | จำนวนคนที่ตอบข้อสอบข้อนั้นถูกในกลุ่มคนไม่เก่ง (ตามสูตรนี้ คนไม่เก่งคือคนที่ได้คะแนนต่ำสุด 25% ท้ายของกลุ่มผู้สอบทั้งหมด) |
N | = | จำนวนคนทั้ง 2 กลุ่มรวมกัน |
ค่าความยากง่ายและความหมายของค่า
ค่าของความยากง่ายแทนด้วย P ซึ่งจะมีค่าอยู่ระหว่าง 0 1.00 โดยค่าที่ได้จะอ่านความหมายได้ดังนี้
ค่า P = 0 - .19 | หมายความว่า เป็นข้อสอบที่ยากมาก เป็นข้อสอบที่ไม่ดีต้องปรับปรุงให้ง่ายขึ้น |
ค่า P = .20 -.39 | หมายความว่า เป็นข้อสอบที่ค่อนข้างยาก เป็นข้อสอบที่ดี |
ค่า P = .40 - .60 | หมายความว่า เป็นข้อสอบที่ยากง่ายปานกลาง เป็นข้อสอบที่ดี |
ค่า P = .61 - .80 | หมายความว่าเป็นข้อสอบที่ค่อนข้างง่าย เป็นข้อสอบที่ดี |
ค่า P = .81 1.00 | หมายความว่าเป็นข้อสอบที่ง่ายมาก เป็นข้อสอบที่ไม่ดี ต้องปรับปรุงให้ยากขึ้น |
วิธีเก็บข้อมูลเพื่อหาค่าตามสูตร
สมมุติว่ามีข้อสอบ 3 ข้อ มีผู้เข้าสอบทั้งหมด 40 คน
กลุ่มคนเก่ง | หมายถึง คนที่สอบได้ที่ 1 ถึงที่ 10 (25% แรกของ 40 คน) |
กลุ่มคนไม่เก่ง | หมายถึง คนที่สอบได้ที่ 31 ถึงที่ 40 (25% ท้ายของ 40 คน) |
กลุ่มคนเก่ง 10 คนแรกและ 10 คนสุดท้ายต่างทำข้อสอบถูกรายข้อดังนี้
ข้อ 1. กลุ่มคนคะแนนตอบถูก 9 คน กลุ่มคนคะแนนต่ำตอบข้อนี้ถูก 1 คน | |
ดังนั้น ค่า H = 9 และ ค่า L = 1 | |
ข้อ 2. กลุ่มคนคะแนนสูงตอบถูก 2 คน กลุ่มคนคะแนนต่ำตอบถูก 8 คน | |
ดังนั้น ค่า H = 2 และ ค่า L = 8 | |
ข้อ 3. กลุ่มคนคะแนนสูงตอบถูก 5 คน กลุ่มคนคะแนนต่ำตอบถูก 5 คน | |
ดังนั้น ค่า H = 5 และ ค่า L = 5 |
เมื่อนำผลการทดสอบที่เก็บข้อมูลได้มาแทนค่าในสูตรจะได้ผลค่าความยากง่ายแต่ละข้อดังนี้
ข้อ | แทนค่าสูตร | ค่าความยากง่าย |
สูตร | (H + L)/N | |
1. | (9 + 1)/20 | .5 |
2. | (2 + 8)/20 | .5 |
3. | (5 + 5)/20 | .5 |
ผลของคะแนน 3 ข้อนี้ ค่าความยากง่ายออกมา = .5 ซึ่งเท่ากัน (โดยบังเอิญ) แต่ถ้าหากผลการวิเคราะห์ข้อสอบออกมาที่ค่า .5 ลักษณะนี้สามารถอ่านค่าได้ว่าข้อสอบทั้ง 3 ข้อ เป็นข้อสอบที่มีความยากง่าย ปานกลางควรจะนำมาใช้ทดสอบได้
อย่างไรก็ดี ข้อสอบนั้นดีหรือไม่ ไม่ได้ดูที่ความยากง่ายอย่างเดียวแต่จะต้องพิจารณาประเด็นอื่นๆ ประกอบด้วยซึ่งจะได้กล่าวต่อไป
อำนาจจำแนก (Discrimination)
ข้อสอบที่ดีต้องมีอำนาจจำแนกคนที่เก่งออกจากคนที่ไม่เก่งได้
กล่าวคือ คนเก่งควรตอบถูก และคนไม่เก่งควรตอบผิด ข้อสอบใดที่ คนเก่งก็ตอบถูก คนไม่เก่งก็ตอบได้ เป็นข้อสอบที่ไม่ดี เพราะตอบแล้วจะไม่รู้ว่าใครเก่ง ใครไม่เก่ง หรืออีกกรณีหนึ่งคือ คนเก่งก็ตอบไม่ได้ คนไม่เก่งก็ตอบไม่ได้ เช่นนี้ก็เรียกว่าข้อสอบนั้นไม่มีอำนาจจำแนก
บางกรณียิ่งแล้วไปใหญ่คือ คนเก่งตอบผิด คนไม่เก่งกลับตอบถูกแบบนี้เรียกว่า จำแนกกลับ ข้อสอบแบบนี้ก็ต้องตัดทิ้ง
สูตรการหาอำนาจจำแนกของแบบทดสอบ
ใช้สูตร r = (H - L)/n1
r | = | อำนาจจำแนก |
H | = | จำนวนคนที่ตอบข้อสอบข้อนั้นถูกในกลุ่มคนเก่ง (ตัวเดียวกับสูตรหาความยากง่าย) |
L | = | จำนวนคนที่ตอบข้อสอบข้อนั้นถูกในกลุ่มคนไม่เก่ง (ตัวเดียวกับค่า L ในสูตรหาความยากง่าย) |
n1 | = | จำนวนคนในกลุ่มคนเก่ง (25 % แรก) หรือกลุ่มคนไม่เก่ง (25 %ท้าย) กลุ่มใดกลุ่มหนึ่งซึ่งมีค่าเท่ากันอยู่แล้ว |
ค่าของอำนาจจำแนกและความหมายของค่า
ค่าของอำนาจจำแนกแทนด้วยค่า r โดยค่า r จะมีค่าอยู่ระหว่าง 1.00 ถึง +1.00 โดยค่า r แต่ละค่าจะมีความหมายดังนี้
ค่า r = .20 ถึง 1.00 | หมายความว่า เป็นข้อสอบที่สามารถจำแนกได้ เป็นข้อสอบที่ดี |
ค่า r = -.19 ถึง +.19 | หมายความว่า เป็นข้อสอบที่จำแนกไม่ได้ เป็นข้อสอบที่ไม่ดี ต้องปรับปรุง |
ค่า r = -.20 ถึง -1.00 | หมายความว่า เป็นข้อสอบที่จำแนกกลับ คือคนเก่งตอบผิด แต่คนไม่เก่งกลับตอบถูก คือว่าเป็นข้อสอบที่ไม่ดี ต้องปรับปรุง |
วิธีการเก็บข้อมูลเพื่อหาค่าตามสูตร
จากข้อมูลเกี่ยวกับที่เก็บได้ในข้อ 1.3 นอกจากใช้วิเคราะห์ความยากง่ายได้แล้ว ยังนำมาใช้วิเคราะห์อำนาจจำแนกได้ดังนี้
ข้อ | แทนค่าสูตร | ค่าอำนาจจำแนก | ประเมินค่าข้อสอบจำแนกได้ว่า | ||||||
สูตร |
| ||||||||
ข้อ 1 |
| .8 | เป็นข้อสอบที่ดี จำแนกคนเก่งกับไม่เก่งได้ดี | ||||||
ข้อ 2. |
| -.6 | เป็นข้อสอบที่ไม่ดีจำแนกกลับกล่าวคือ คนเก่งตอบผิดคนไม่เก่งตอบถูก ต้องปรับปรุง หรือตัดออก | ||||||
ข้อ 3. |
| .0 | เป็นข้อสอบที่จำแนกคนเก่งกับไม่เก่งไม่ได้ เป็นข้อสอบที่ไม่ดี ต้องปรับปรุง |
จากผลวิเคราะห์ข้อสอบทั้ง 3 ข้อ โดยสูตรความยากง่าย และอำนาจจำแนกดังกล่าวข้างตน จะเห็นได้ว่า ข้อสอบที่ใช้ได้มีเพียงข้อเดียวคือ ข้อ 1 เพราะมีความยากง่ายพอเหมาะ (.5) และมีอำนาจจำแนกได้ดี (.8) ส่วนข้อ 2 แม้มีความยากง่ายพอเหมาะ (.5) แต่มีอำนาจจำแนกกลับ (-.6) จึงเป็นข้อสอบที่ไม่ดี ต้องปรับปรุง หรือตัดออก และสำหรับข้อ 3 แม้ว่าจะมีความยากง่ายพอเหมาะ (.5) แต่ไม่มีอำนาจจำแนก (0)
- ความเป็นปรนัย (Objectivity)
ความเป็นปรนัย ในที่นี้ไม่ได้หมายถึง ข้อสอบปรนัยอย่างที่เรา ๆ เข้าใจกัน แต่หมายความถึง ข้อสอบนั้นต้องมีความชัดเจน ถูกต้องและเข้าใจตรงกัน ทั้งนี้โดยยึดถือความถูกต้องทางวิชาการเป็นเกณฑ์ ไม่ใช่เป็นความถูกต้องตามความเห็น ความรู้สึกของบุคคล ซึ่งอาจเป็นและรู้สึกไม่ตรงกันได้
ในการสร้างข้อสอบนั้น ต้องมีหลักเกณฑ์ที่เป็นที่ยอมรับของทุกคน ไม่ใช่เป็นที่ยอมรับของเราคนเดียว แต่ไม่มีหลักวิชาที่จะให้ผู้อื่นยอมรับ ซึ่งคุณสมบัติของแบบทดสอบที่ถือว่าเป็นปรนัย คือ
ชัดเจนในความหมายของคำตอบ ทุกคนที่มีอ่านข้อสอบนั้นจะต้องเข้าใจตรงกัน ไม่ว่าจะเป็นผู้สอบ ผู้ตรวจข้อสอบ หรือผู้ใช้ผลของ ข้อสอบนั้น ข้อสอบที่จะนำมาใช้ จึงมักจะต้องทดสอบกับคนกลุ่มต่าง ๆ ก่อนให้แน่ใจว่า ใครมาอ่านก็เข้าใจเหมือนกันจึงจะเกิดความมั่นใจ และนำมาใช้
ตรวจให้คะแนนได้ตรงกัน หมายความว่า เฉลยของข้อสอบต้องตรงกัน ไม่ว่าจะให้ใครมาตรวจ ข้อสอบที่ผู้ตรวจแล้วเป็นผลเฉลยไปคนละอย่าง แบบนี้ถือว่าไม่มีความเป็นปรนัย จะนำมาใช้ไม่ได้
แปลความหมายของคะแนนได้ตรงกัน เช่นตอบถูกได้ 1 คะแนน ตอบผิดได้ 0 คะแนน ไม่ใช่ใครมาตรวจแล้วให้คะแนนได้ไม่เหมือนกัน
- ความมีประสิทธิภาพ (Efficiency)
แบบทดสอบที่มีประสิทธิภาพ หมายถึง แบบทดสอบที่ทำให้ได้ ข้อมูลถูกต้อง เชื่อถือได้ โดยลงทุนเวลา แรงงาน และเงินน้อยที่สุด เพื่อการสร้าง การทำข้อสอบ การตรวจแบบทดสอบที่ไม่มีประสิทธิภาพเช่น :-
ลงทุนมาก แต่ใช้ประโยชน์ได้น้อย และยังเชื่อถือไม่ได้
พิมพ์ตก ๆ หล่น ๆ ไม่ชัด เรียงหน้าสลับ อ่านยาก รูปแบบเรียงไม่เป็นระเบียบ ทำให้ผู้ตอบสับสน จนอาจเข้าใจผิด ตอบผิด ใส่ช่องคำตอบผิด และเสียคะแนนสอบ เป็นต้น
หากข้อสอบไม่มีประสิทธิภาพดังกล่าวข้างต้น ก็ถือว่าเป็นแบบทดสอบที่ไม่ดี ต้องปรับปรุง
- ความยุติธรรม (Fairness)
ข้อสอบที่ยุติธรรม ต้องไม่เปิดโอกาสให้มีการได้เปรียบเสียเปรียบกัน ในระหว่างผู้ทดสอบ เช่น บางคนเคยทำข้อสอบนี้มาแล้ว ไม่ว่าเป็นเพราะเหตุใด อาจเป็นเพราะเคยมาสมัครงานกับบริษัทเราแล้ว เคยทดสอบข้อสอบนี้มาแล้ว เมื่อสอบไม่ผ่าน วนกลับมาสอบใหม่ โดยเรายังใช้ข้อสอบเดิมลักษณะนี้ ก็จะเกิดความไม่ยุติธรรม ระหว่างผู้สอบได้
ทางแก้ไขจึงต้องมีข้อสอบไว้หลาย ๆ ชุด หรือเรียกว่ามี ธนาคารข้อสอบ หรือคลังข้อสอบ เพื่อนำมาหมุนเวียนใช้จนผู้เข้าสอบไม่สามารถทราบได้ว่า เราจะใช้ข้อสอบชุดไหน เป็นต้น
เท่าที่กล่าวมาแล้วทั้ง 5 เครื่องมือในการวัดว่าแบบทดสอบนั้นดีหรือไม่ จะเห็นว่าสามารถนำมาวิเคราะห์ข้อสอบคัดเลือกได้เป็นอย่างดี อย่างไรก็ดี ยังมีเครื่องมือที่สำคัญในการวิเคราะห์คุณภาพของแบบทดสอบ คือเรื่อง ความเที่ยงตรงของแบบทดสอบ (Validity) และความเชื่อมั่นของแบบทดสอบ (Reliability) ซึ่งมีเนื้อหาอีกหลายประเด็น ตลอดจนมีสูตรสำคัญ ๆ ที่ต้องการ การอธิบายอีกมากพอสมควร