ก่อนจะเริ่มการอบรม ผมทำแบบทดสอบก่อนเรียนเกี่ยวกับการวัดผลประเมินและการออกสอบ จำนวน ๕๐ ข้อ ๕๐ คะแนน หากท่านผู้อ่านที่อยากลองดู เชิญดาวน์โหลดที่นี่ โดยเฉพาะอาจารย์ท่านที่อยากจะทบทวนความรู้ที่เคยได้รับจากการอบรมในหลักสูตรนี้
ผลการสืบค้นพบว่า องค์ความรู้เรื่องการวัดและการประเมินด้านการศึกษาค้นหาได้ไม่ยากเลย เว็บที่มีข้อมูลครบถ้วนมากๆ คือเว็บไซต์ของอาจารพเยาว์ เนตรประชา (คลิกที่นี่)
ในทางการศึกษา คำว่า "การวัดผล" มีความหมายแตกต่างจาก "การประเมินผล" การวัดผลการศึกษา คือ กระบวนการเพื่อให้ได้มาซึ่งปริมาณที่แสดงเป็นตัวเลขหรือสัญลักษณ์ที่มีความหมายแทนคุณลักษณะหรือคุณภาพของสิ่งที่จะวัด ส่วนการประเมินผลการศึกษา หมายถึง กระบวนการตัดสินคุณค่าหรือมูลค่าของสิ่งต่างๆ เปรียบเทียบกับเกณฑ์ที่มีมาตรฐานซึ่งกำหนดขึ้นอย่างเป็นระบบ การประเมินผลอาจจะแสดงผลเป็นเชิงปริมาณหรือตัวเลข หรืออาจนำเสนอเป็นระดับคุณภาพก็ได้ .... สรุปสั้นๆ คือ การวัดผลจะต้องได้ผลเป็นตัวเลข ส่วนการประเมินผลจะต้องมีเกณฑ์ที่ชัดเจน
- การวัดแบ่งได้เป็น ๒ ประเภทใหญ่ ๆ ได้แก่ การวัดทางกายภาพศาสตร์ หรือการวัดทางวิทยาศาสตร์ วัดสิ่งที่เป็นรูปธรรม เช่น ความยาว น้ำหนัก เวลา พื้นที่ ฯลฯ และการวัดทางสังคมศาสตร์ วัดสิ่งที่เป็นนามธรรม เช่น การวัดทางการศึกษา การวัดทางจิตวิทยา การวัดทางพฤติกรรมศาสตร์ เป็นต้น
- ขั้นตอนการวัด มาตรฐานอย่างน้อยต้องมี ๔ ขั้นตอนนี้
- ๑) เริ่มจากกำหนดคุณลักษณะที่จะวัดก่อน จะวัดอะไร K(knowledge) P (กระบวนการหรือทักษะ) หรือ A (Attitute) เจตคติ
- ๒) สร้างเครื่องมือวัด หรือเลือกเครื่องมือวัดที่เหมาะสมและมีคุณภาพ
- ๓) ดำเนินการวัด อย่างรอบคอบ ระมัดระวังปัจจัยภายนอกที่จะมีผลทำให้เกิดความคาดเคลื่อน
- ๔) สรุปและนำเสนอผลการวัด ต่อผู้ที่นำใช้ให้เป็นประโยชน์ต่อไป
- การวัดทางการศึกษาเป็นการวัดที่จัดอยู่ในด้านการวัดทางสังคมศาสตร์
- ลักษณะที่สำคัญของการวัดทางการศึกษา ที่สำคัญๆ คือ
- เป็นการวัดทางอ้อม
- วัดได้เป็นบทางส่วน
- ค่าที่ได้มีลักษณะเชิงเปรียบเทียบ
- มีความคลาดเคลื่อนเสมอ
- มารตวัดละเอียดไม่เพียงพอ
- หน่วยที่ช้มีหลากหลาย มีขนาดไม่เท่ากัน
- สมการพื้นฐานของการวัดทางการศึกษา แสดงได้ด้วยสมการ X = T + E เมื่อ T คือค่าจริง (True) ส่วน E คือค่าคลาดเคลื่อน Error
- การวัดที่ได้ค่าคะแนนเท่ากัน เช่น นายแดงและนานเหลือง ได้ ๗ คะแนน แต่หากความคลาดเคลื่อนสูงถึง ๔๐ เปอร์เซ็น นานแดงและเหลืองอาจมีคะแนนต่างกันถึง ๔ คะแนน ได้
- จุดเน้นของการวัดผลประเมินผลด้านการศึกษา ที่สำคัญ ได้แก่
- ควรประเมินตามสภาพจริง ไม่ใช่ประเมินกับกลุ่มเป้าหมายที่ไม่อยู่สภาพจริงๆ
- วัดผลประเมินให้ครบ ๓ ด้าน คือ ความรู้ ทักษะ/กระบวนการ และคุณธรรมจริยธรรมหรือค่านิยม
- ควรวัดและประเมินผลควบคู่ไปกับการจัดการเรียนรู้ ไม่ใช่รอประเมินหลังการเรียนรู้เท่านั้น
- เนื่องจากการวัดแต่ละเครื่องมือเป็นการวัดได้เพียงบางส่วน จึงควรใช้การวัดด้วยวิธีการที่หลากหลายเพื่อลดความคลาดเคลื่อนลง
- ไม่ควรเป็นการประเมินเพื่อสรุปผลหลังการเรียนรู้ (Summative) เช่น การสอบปลายภาคเรียนเท่านั้น ควรมีการประเมินระหว่างการเรียนการสอนด้วย เช่น การทดสอบท้ายบทเรียน การทดสอบกลางภาคเรียน การสังเกตจากผลงานหรือชิ้นงาน หรือการสังเกตพฤติกรรม เป็นต้น
- สได์ด้านบนนี้ แสดงประโยชน์หรือความสำคัญของการวัดผลต่อผู้เรียนและผู้สอน
- กระบวนการประเมิน ควรมีทั้ง ก่อนเรียน ระหว่างเรียน และหลังเรียน โดยมีวัตถุประสงค์แต่ละช่วงแตกต่างกัน ดังนี้
- การวัดก่อนเรียน เพื่อ ให้ทราบความรู้และทักษะพื้นฐานที่จำเป็นต่อการเรียนรู้มโนทัศน์ใหม่มากน้อยเพียงใด หากไม่มีหรือมีไม่พอ ผู้สอนต้องออกแบบการเรียนรู้เพื่อเตรียมพร้อมก่อนเรียน
- การวัดระหว่างเรียน เพื่อตรวจสอบว่า ผู้เรียนเข้าใจมโทัศน์ใหม่ที่กำลังศึกษาหรือไม่ เข้าใจคลาดเคลื่อนหรือไม่ ผู้สอนจะได้ปรับกระบวนการเรียนรู้ได้ทันที
- การวัดหลังเรียน เพื่อตรวจสอบว่า ผู้เรียนเรียนรู้มโนทัศน์ใหม่ได้ครบถ้วนตามที่ได้ระบุไว้ในแผนการจัดการเรียนรู้หรือไม่และพร้อมที่จะเรียนรู้ในระดับต่อไปได้หรือไม่
- กระบวนการทางการศึกษา มีองค์ประกอบ ๓ ประการได้แก่ เป้าหมายการเรียนรู้ (Objective) การจัดการเรียนรู้ (Learning Experience) และการประเมินผลการศึกษา (Evaluation)
- ทั้ง ๓ ส่วนต้องเชื่อมโยงสอดคล้องกัน
- การศึกษาให้การยอมรับทฤษฎีการเรียนรู้ของบลูม (Benjamin S. Bloom) และทีมงาน ซึ่งเสนอขอบเขตในการศึกษาเป็น ๓ ส่วน ได้แก่ การศึกษาให้เกิดปัญญา (จากการคิด) เรียกว่า พุทธิพิสัย (Cognetive Domain) การศึกษาให้เกิดทักษะ เรียกว่า ทักษะพิสัย (Psychromotor) และการศึกษาเพื่อพัฒนาเจตคติ เรียกว่า จิตพิสัย (Attitude)
- ในกรณีของรายวิชาศึกษาทั่วไป ส่วนที่เกี่ยวข้องมากที่สุดคือ การศึกษาพัฒนาปัญญาด้าน พุทธิพิสัย ๖ ขั้นตอนดังสไลด์
- ลักษณะของพฤติกรรมตามทฤษฎีการเรียนรู้ของบลูม จะเป็นลำดับขั้น (Bloom Taxnomy) ทักษะทางปัญญาที่สูงขึ้น จำเป็นต้องมีพื้นฐานทักษะทางปัญญามาตามลำดับก่อน
- ผมวาดรูปสรุการเรียนรู้ของตนเองอีกครั้งดังสไลด์ด้านบนนี้
- ความรู้จำแบ่งออกเป็น ๓ กลุ่ม ความจำเนื้อหา กระบวนการ และความรู้รวบยอด (Concept)
- ความเข้าใจ มี ๓ ลักษณะ ได้แก่ การแปลความ การตีความ และการขยายความ
- การวิเคราะห์ แบ่งเป็น ๓ ระดับ ได้แก่ การวิเคราะห์ความสำคัญ วิเคราะห์ความสัมพันธ์ และวิเคราะห์หลักการ
- การประเมิน แบ่งได้เป็น ๒ แบบ คือ การประเมินตัดสินโดยใช้ข้อเท็จจริงในเรื่องและนอกเรื่อง
- เครื่องมือวัดหลักทางการศึกษามีเพียง ๔ ประเภท ได้แก่ แบบทดสอบ แบบสอบถาม แบบสัมภาษณ์ และแบบสังเกต
- บางทีอาจมีผู้ใช้คำว่า แบบวัด เช่น แบบวัดความสามารถ แบบวัดภาคปฏิบัติ ฯลฯ เหล่านี้อาจเป็นการวัดจากการสังเกตเทียบกับเกณฑ์ ซึ่งก็คือแบบสังเกตนั่นเอง เช่น แบบสังเกตจากแฟ้มสะสมงาน สังเกตจากรายงานผล สังเกตจากการเขียนบันทึกสะท้อนผล การสังเกตพฤติกรรมการอภิราย แบบบันทึกการสังเกตแบบฝึกหัด ฯลฯ
- เครื่องมือประเมินที่นิยมใช้วัดด้านพุทธิพิสัย ได้แก่ แบบทดสอบ (ข้อสอบกลางภาค ปลายภาค) แบบสังเกตพฤติกรรม แบบสังเกตแฟ้มสะสมงาน แบบสัมภาษณ์ ฯลฯ
- เครื่องมือวัดสำหรับด้านทักษะพิสัย ได้แก่ แบบสังเกตพฤติกรรม แบบทดสอบ แบบสังเกตแฟ้มสะสมงาน ฯลฯ
- การวัดผลประเมินผลด้านคุณลักษณะอันพึงประสงค์ เครื่องมือที่นิยม ได้แก่ แบบสังเกตพฤติกรรม แบบสอบถาม (การสำรวจ) แบบวัดเจตคติ (มักเป็นแบบสอบถาม) แบบสัมภาษณ์ แบบสังเกตผลงาน ฯลฯ
- คุณสมบัติของแบบทดสอบที่ดี มี ๕ ปริมาณ ได้แก่ ความเที่ยงตรง (Validity) ความเชื่อมั่น (Reliability) ความเป็นปรนัย (Objectivity) ความยาก (Difficulty) และ ค่าอำนาจจำแนก (Discrimination)
- ความเที่ยงตรง (Validity) หรือหากเป็นศิษย์จุฬาฯ มักเรียกว่า ความตรง ศิษย์ มศว. เรียกความเที่ยงตรง
- ความเที่ยงตรง หมายถึง คุณภาพของเครื่องมือว่า สามารถวัดคุณลักษณะที่ต้องการจะวัด (วัตถุประสงค์ของการวัด) ได้หรือไม่ วัดได้ครอบคลุม ครบถ้วน และสอดคล้องกับคุณลักษณะจริงๆ หรือไม่ ถือเป็นปริมาณที่สำคัญที่สุดของแบบทดสอบ
- ความเที่ยงตรงแบ่งได้เป็น ๓ ประเภท ได้แก่
- ความเที่ยงตรงตามเนื้อหา (content validity) บอกว่า ข้อสอบนั้นสามารถวัดได้ตรงตามวัตถุประสงค์ตามหลักสูตร วัดเนื้อหาได้ครบถ้วน ครอบคลุมมากเพียงใด
- ความเที่ยงตรงตามเกณฑ์สัมพันธ์ (Criterion-Relate Validity) มีสองส่วน ได้แก่
- ความเที่ยงตรงตามสภาพ (Concurrent Validity) บอกว่า ข้อสอบนั้นสามารถวัดได้ตรงตามสภาพจริงได้หรือไม่ หลังการวัดต้องนำผลการวัดไปเปรียบเทียบกับสภาพจริงที่เกิดขึ้น ... เหมือนการทวนสอบคำตอบ
- ความเที่ยงตรงตามการพยากรณ์ (Predictive Validity) บอกว่า เครื่องมือนั้นสามารถวัดได้ตรงตามเหตุการร์ที่จะเกิดขึ้นภายหน้าได้
- ความเที่ยงตรงเชิงโครงสร้าง (Construct Validity) บอกว่า เครื่องมือสามารถวัดพฤติกรรมและสมรรถนะต่างๆ ครบถ้วนตามจุดมุ่งหมายและเป็นไปตามทฤษฎีอย่างครบถ้วน
- ความเชื่อมั่น (Reliability) หมายถึง ความคงเส้นคงวาของคะแนนในการวัดแต่ละครั้ง เครื่องมือที่มีความเชื่อมั่นสูง คือ เครื่องมือที่วัดครั้งใดๆ ก็ได้ผลเหมือนเดิม
- ปัจจัยที่มีผลต่อความเชื่อมั่นของข้อสอบ ๗ ประการคือ ความเป็นเอกพันธ์ของผู้ตอบ จำนวนผู้ตอบ จำนวนข้อคำถาม ตัวผู้ตอบ การให้คะแนน สภาพแวดล้อม และค่าอำนาจจำแนกและความยากของข้อสอบ
- การวัดความเชื่อมั่นของข้อสอบ สามารถทำได้หลายวิธี เช่น
- การวัดความคงที่ (Stability) ใช้เครื่องมือนั้นวัดซ้ำๆ ผลการวัดใกล้เคียงกันคือมีความเชื่อมั่นสูง
- การวัดความสมมูลกัน (Equivalence) ใช้แบบทดสอบคู่ขนาน วัดในเวลาไล่เลี่ยกัน
- การวัดความสอดคล้องภายใน ด้วยสถิติของ Richardson (KR20) หรือ วิธีของ Cronbach (alpha Coefficient)
- ความเป็นรนัยสูง หมายความว่า ทุกๆ ฝ่าย มีความเห็นสอดคล้องกันในเรื่องของคำถาม การประเมิน เกณฑ์การประเมิน ซึ่ง จำเป็นที่ข้อสอบจะต้องมี
- คำถาม หรือ ข้อคำถาม ที่มีความชัดเจน
- การให้คะแนนตรงกัน มีเกณฑ์การให้คะแนนแน่นอน ไม่ขึ้นกับอารมณ์หรือเวลาที่ตรวจ
- การแปลความหมายของคะแนนที่ตรงกัน มีเกณฑ์การแปลความหมายของคะแนนชัดเจน
- ค่าอำนาจจำแนกของข้อสอบ คือความสามารถในการแยกแยะความแตกต่างระหว่างสิ่งที่วัดได้อย่างชัดเจน สามารถแบ่งแยกผู้เรียนออกได้ทุกระดับ ตั้งแต่ เก่ง กลาง อ่อน
- ความยากง่าย (Difficulty) แทนด้วยสัญลักษณ์ p เรียกว่า ค่าพี ข้อสอบที่ดีควรมีค่า p อยู่ในช่วง 0.20 - 0.80
- ความยุติธรรม (Fair) คือ ลักษณะของข้อสอบที่ไม่สร้างความได้เปรียบให้กับผู้เข้าสอบกลุ่มใดกลุ่มหนึ่ง
- แบบทดสอบเป็นเพียงสิ่งเร้าให้เราสังเกตพฤติกรรมได้
- ข้อสอบแบบปรนัย ไม่ได้มีแต่แบบเลือกตอบ หลายตัวเลือกเท่านั้น ข้อสอบแบบถูก-ผิด แบบจับคู่ ก็เรียกว่าข้อสอบปรนัย
- ข้อสอบแบบปรนัย มีหลายแบบ แบบคำถามเดี่ยว แบบตัวเลือกคงที่ หรือแบบสถานการณ์
- ขั้นตอนในการทำข้อสอบ มีถึง ๗ ขั้นตอน เริ่มจาก การวิเคราะห์หลักสูตรและจัดทำตารางวิเคราะห์หลักสูตร -> กำหนดรูปแบบข้อคำถาม -> เขียนข้อสอบ -> ตรวจทานข้อสอบ -> ตรวจสอบความเที่ยงตรงโดยผู้เชี่ยวชาญ -> นำไปทดลองใช้และวิเคราะห์หาคุณภาพ ค่าพีค่าอาร์ -> คัดเลือก ปรับปรุง และจัดชุดข้อสอบ
- การจัดทำข้อสอบแบบอิงเกณ์ มีขั้นตอนเพิ่มขึ้นเป็น ๘ ขั้นตอน เริ่มจาก การวิเคราะห์หลักสูตรและจัดทำตารางวิเคราะห์หลักสูตร -> กำหนดพฤติกรรมย่อย -> กำหนดรูปแบบข้อคำถาม -> เขียนข้อสอบ -> ตรวจทานข้อสอบ -> ตรวจสอบความเที่ยงตรงโดยผู้เชี่ยวชาญ -> นำไปทดลองใช้และวิเคราะห์หาคุณภาพแบบอิงเกณฑ์ -> คัดเลือก ปรับปรุง และจัดชุดข้อสอบ
- ลักษณะของข้อสอบที่ดีมี ๗ ประการ ได้แก่ ตรงวัตถุประสงค์ เป็นประโยคคำถามที่สมบูรณ์ มีความเป็นปรนัย ไม่ใช้คำฟุ่มเฟือย หลีกเลี่ยงคำปฏิเสธ มีความยุติธรรม และไม่แนะนำคำตอบ
- การหาคุณภาพข้อสอบ มีลำดับขั้นดังสไลด์นี้
- การหาความเที่ยงตรง ที่นิยมคือ วิธีการถามผู้เชี่ยวชาญ เพื่อถามความเห็นว่า ข้อสอบข้อนั้นตรงกับวัตถุประสงค์หรือไม่ เรียกว่า วิธี Index of Consistancy (IOC)
- ค่าความยาก คำนวณจากสูตรดังสไลด์ด้านบนนี้
- ในกรณีที่จำนวนผูสอบมีจำนวนมาก นิยามจัดเอาเฉพาะผู้ตอบกลุ่มบนและกลุ่มล่างเท่านั้น ไม่ใช้จำนวนนิสิตทั้งหมด
- ค่า p เท่ากับ 1.00 หมายถึง ตอบถูกทุกคน ค่า p 0.80 หมายถึง ร้อยคนตอบถูก 80 คน
- ค่าอำนาจจำแนก r ยิ่งมากยิ่งดี ค่าอำนาจจำแนก 1.0 หมายถึง จำแนกได้อย่างสมบูรณ์
ในหลักสูตร เวลาส่วนใหญ่เป็นการ Workshop ออกข้อสอบ แล้วนำเสนอ วิพากษ์ และแลกเปลี่ยนเรียนรู้กัน ผม AAR ว่า น่าจได้ผลไม่มากก็ไม่น้อย
ขอขอบพระคุณท่านอาจารย์ญาณภัทร สีหะมงคล อีกครั้งครับ
ไม่มีความคิดเห็น:
แสดงความคิดเห็น