การหาคุณภาพเครื่องมือวิจัย

ผลงานวิจัยที่ดีย่อมมาจากกระบวนการทำวิจัยที่ดี ซึ่งหนึ่งในนั้นคือเครื่องมือวิจัยที่มีคุณภาพ ผ่านระบบการตรวจสอบที่มีมาตรฐาน เป็นที่ยอมรับในวง
วิชาการ เนื่องจากงานวิจัยที่มีคุณภาพ คือ งานวิจัยที่สามารถถูกนำไปใช้อ้างอิงในการทำวิจัยหรือการศึกษาอื่นๆ ต่อไปได้โดยได้รับความน่าเชื่อถือ ซึ่งเครื่องมือวิจัยที่กล่าวถึงนี้ ได้แก่ แบบสอบถาม แบบสอบข้อเขียน แบบสอบวัดประเมินผล แบบตรวจสอบรายการ แบบสอบสัมภาษณ์อย่างมีโครงสร้าง เหล่านี้ ล้วนแล้วแต่เป็นตัวอย่างของเครื่องมือวิจัยทั้งสิ้น การหาคุณภาพเครื่องมือวิจัย เป็นขั้นตอนสำคัญของการทำวิจัยที่มีคุณภาพและได้รับการยอมรับในแวดวงวิชาการทุกระดับ

การตรวจสอบคุณภาพเครื่องมือวิจัยขั้นพื้นฐาน ได้แก่ การนำเครื่องมือไปทดสอบหาความ เที่ยงตรง ความเชื่อมั่น และ ความเข้าใจที่ตรงกัน ไปจนถึงความเป็นปรนัยของข้อความของข้อคำถาม เกณฑ์การตัดสิน หรือการประเมินผล รวมทั้งความยากง่ายและอำนาจจำแนก ซึ่งมีวิธีดำเนินการในลักษณะ แตกต่างกัน โดยอาศัยหลักเกณฑ์ทางสถิติวิเคราะห์อาทิเช่น ค่าความเชื่อมั่นภายในของครอนบาค ค่าสัมประสิทธิ์ สหสัมพันธ์ของเพียร์สัน ทั้งนี้เพื่อมั่นใจได้ว่าเครื่องมือที่ใช้วัดมีคุณภาพสูงสอดคล้องกับวัตถุประสงค์ที่ต้องการศึกษา

ความสำคัญของ การหาคุณภาพเครื่องมือวิจัย

การพัฒนาเครื่องมือวิจัย การแปลเครื่องมือวิจัยจากต่างประเทศ หรือการนำครื่องมือวิจัย ที่ได้รับการตีพิมพ์แล้ว เช่น แบบสอบข้อเขียน แบบสอบวัดประเมินผล แบบตรวจสอบรายการ แบบสอบถาม ฯลฯ มาใช้โดยไม่ได้ผ่านการตรวจสอบคุณภาพ จะทำให้ผลงานวิจัยนั้นไม่มีความน่าเชื่อถือ แม้ว่าผลงานวิจัยฉบับนั้นจะทันสมัย มีความน่าสนใจก็ตาม ผู้วิจัยที่ขาดความรู้ความเข้าใจ และไม่เปิดเผยกระบวนการตรวจสอบคุณภาพเครื่องมือวิจัย จะทำให้งานวิจัยไม่ได้รับ
การพิจารณาจากกองบรรณาธิการ ตลอดจนการพิจารณาจากคณะกรรมการ ผู้ประเมินคุณสมบัติการขอตำแหน่งทางวิชาการ เนื่องจากคุณภาพเครื่องมือวิจัยเป็นเครื่องสะท้อนถึงความเที่ยงตรง และ ความน่าเชื่อถือของผลงาน ด้วยเหตุนี้ ผู้วิจัยจึงควรตรวจสอบคุณภาพของเครื่องมือที่สร้างว่ามีคุณภาพดีหรือไม่ ก่อนที่จะนำไปเก็บรวบรวมข้อมูลในการวิจัย
เครื่องมือวิจัยไม่ว่าจะเป็นแบบทดสอบข้อเขียน(paper-pencil test) แบบสอบถาม (questionnaire) แบบสอบสัมภาษณ์อย่างมีโครงสร้าง (structured interview) แบบประเมินผล (performance appraisal) หรือแบบตรวจสอบรายการ (checklist) เปรียบได้กับไม้บรรทัดที่สร้างขึ้น ซึ่งจำเป็นอย่างยิ่งที่จะต้องได้รับการตรวจสอบคุณภาพ ก่อนนำไปใช้ ให้มีความถูกต้องในเชิงโครงสร้างทฤษฎีและเนื้อหา มีความเที่ยง ตรงแม่นยำในการวัด มีความยากง่ายเหมาะสมกับกลุ่มเป้าหมายที่นำไปใช้ ตลอดจนสามารถสื่อความหมายได้ตรงประเด็นตามวัตถุประสงค์ ทั้งนี้เพื่อให้มั่นใจว่า ผลของการวัดที่เกิดขึ้นจากการใช้เครื่องมือที่สร้างขึ้นใหม่นี้มีคุณภาพมาตรฐาน เที่ยงตรงน่าเชื่อถือ สามารถนำไปใช้เป็นบรรทัดฐานในงานวิจัย หรือใช้เป็นแบบอย่างอ้างอิงได้ต่อไป

การตรวจสอบคุณภาพเครื่องมือวิจัย

ตามที่ได้กล่าวไปแล้วว่า การวิจัยที่ดีต้องใช้เครื่องมือวัดที่มีคุณภาพน่าเชื่อถือเที่ยงตรง เพื่อให้การวัดมีความแม่นยำ ไม่คลาดเคลื่อนจากความจริงมากเกินไปนัก อันนำมาซึ่งผลงานวิจัยที่ถูกต้องเป็นที่ยอมรับโดยทั่วไป การตรวจสอบคุณภาพเครื่องมือวิจัยขั้นพื้นฐานได้แก่ การนำเครื่องมือที่พัฒนาขึ้นเพื่อทดสอบหาความเที่ยงตรง (validity), ความเชื่อมั่น (reliability), ความเข้าใจที่ตรงกันหรือความเป็น ปรนัย (objectivity) ของข้อความข้อคำถาม เกณฑ์การตัดสินหรือการประเมินผล ความยากง่าย (difficulty) และอํานาจจําแนก (discrimination) ความเที่ยงตรงและความเชื่อมั่น

ความเที่ยงตรง

จากการศึกษาของ Trochim2 (1999) ได้เสนอว่า ความเที่ยงตรงมีองค์ประกอบในเชิงโครงสร้าง ที่เรียกว่า construct validity ซึ่ง แบ่งออกได้เป็น 2 ส่วน คือ translation validity และ criterion-related validity

Construct validity ความเที่ยงตรงเชิงโครงสร้าง

1. Translation Validity
1.1 Face Validity
1.2 Content Validity ความเที่ยงตรงเชิงเนื้อหา
2. Criterion-related Validity ความเที่ยงตรงตามเกณฑ์สัมพันธ์

2.1 Predictive Validity ความเที่ยงตรงเชิงพยากรณ์

2.2 Concurrent Validity ความเที่ยงตรงตามสภาพเราทุกคนเมื่อมีความฝัน มโนภาพ (concept) หรือความคาดหวังในเรื่องใด เราก็ต้องการให้ ความฝันนั้นกลายเป็นความจริง (reality) กระบวนการแปลงความคิดแผนการต่างๆ ที่เก็บไว้ในใจออกมาเป็นเรื่องราวที่สามารถนำไปปฏิบัติได้ในชีวิตจริง เรียกว่า operationalization

กระบวนการทางสถิติ
1. Content Validity
ดังที่ได้กล่าวข้างต้นแล้ว เนื้อหาจะมีความเที่ยงตรงได้ก็ต่อเมื่อมีความสอดคล้องกับข้อกำหนด หรือวัตถุประสงค์ที่ได้จากการทบทวนวรรณกรรมเป็นบรรทัดฐาน โดยอาจอาศัยผู้เชี่ยวชาญหรือผู้มี ประสบการณ์ในการประเมินวิเคราะห์(face validity) และหาค่าสัมประสิทธิ์ความสอดคล้อง (Index
of Item-Objective Congruence, IOC) ซึ่งมีสูตรคำนวณดังนี้

IOC ความสอดคล้องระหว่างวัตถุประสงค์กับเนื้อหา
SR ผลรวมของคะแนนจากผู้เชี่ยวชาญทั้งหมด
N จำนวนผู้เชี่ยวชาญ
เกณฑ์การให้คะแนนเป็น 3 ระดับ คะแนน 1+ เมื่อเนื้อหามีความสอดคล้อง-1 เมื่อเนื้อหาไม่สอดคล้อง และ 0 เมื่อไม่แน่ใจ แบบทดสอบหรือข้อสอบที่ถือว่ามีความเที่ยงตรงตามเนื้อหาในระดับดี สามารถนำไปวัดผลได้ จะต้องมีค่า IOC เกินกว่า 0.5 เป็นต้นไป ถือว่ามีความสอดคล้อง

2. Concurrent & Predictive validity
ความเที่ยงตรงเชิงสภาพเป็นการนำเอาเครื่องมือที่พัฒนาขึ้นไปหาความสัมพันธ์กับเครื่องมือที่เป็นมาตรฐานสูงสุดหรือได้รับการยอมรับในปัจจุบัน ส่วนความเที่ยงตรงเชิงพยากรณ์เป็นการนำเอา เครื่องมือที่พัฒนาขึ้นไปหาความสัมพันธ์กับเครื่องมือที่เป็นเกณฑ์ในอนาคต และคำนวณหาค่า สัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน (Pearson’s correlation coefficient)

จากผลการคำนวณตามสูตรดังกล่าวนี้ หากค่า rxy เข้าใกล้ 1 แสดงว่าเครื่องมือมีความเที่ยงตรงเชิงสภาพสูง หากเข้าใกล้ 0 หมายถึง เครื่องมือมีค่าความเที่ยงตรงเชิงสภาพหรือความเที่ยงตรงเชิงพยากรณ์ต่ำ

ความเชื่อมั่น
หากเครื่องมือวิจัยที่พัฒนาขึ้นเช่น แบบทดสอบข้อเขียนหรือแบบสอบถาม มีความยากง่าย หรือมีจำนวนข้อที่เหมาะสมไม่มากหรือน้อยเกินไป เมื่อนำไปทดลองกับกลุ่มตัวอย่างที่มีความแตกต่าง กันด้วยวิธีการทางสถิติที่เหมาะสมให้ผลการวัดที่แน่นอนไม่ว่าจะวัดกี่ครั้งก็ตาม สามารถคำนวณเป็นตัวเลขได้ด้วยวิธีการต่างๆ และถ้าค่าที่คำนวณได้มีค่าเข้าใกล้ 1 แสดงว่าแบบทดสอบนั้นมีค่าความเชื่อมั่นสูง

กระบวนการทางสถิติ
ก. Test-retest
เป็นการนำเครื่องมือที่พัฒนาขึ้นไปทดสอบกับกลุ่มตัวอย่างเพียงกลุ่มเดียว 2 ครั้ง ในระยะเวลาที่ห่างกันประมาณ2 สัปดาห์เป็นการตัดปัญหาการจำคำถามหรือคำตอบได้(carry over effect) แล้วนำผลที่ได้มาหาค่าสัมประสิทธิ์สหสัมพันธ์ค่าที่วัดได้ควรมีค่าใกล้เคียงกัน (coefficient of stability) โดยมีข้อตกลงเบื้องต้น 3 ประการ คือ – คะแนนที่ได้จากเครื่องมือวัดครั้งที่สองไม่ใช่เป็นผลเนื่องมาจากการสอบครั้งแรก

– ความรู้ที่ได้จากการสอบครั้งแรกไม่มีผลทำให้คะแนนสอบครั้งหลังเพิ่มขึ้น
– การสอบซ้ำผู้สอบมีแรงจูงใจที่จะทำการสอบอย่างเท่าเทียมกัน
ข. Parallel form
เป็นการตรวจสอบแบบคู่ขนานนี้ เพื่อหลีกเลี่ยงการสอบ2 ครั้ง โดยใช้แบบทดสอบ 2 ฉบับ มีลักษณะเหมือนกันทุกประการ นำผลที่ได้มาหาค่าสัมประสิทธิ์สหสัมพันธ์ตามสูตรของเพียร์สัน (r) ค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้เรียกว่าสัมประสิทธิ์ของความเท่าเทียมกัน

ค.Cronbach’s alpha (α) reliability coefficient
เครื่องมือวิจัย เช่น แบบทดสอบอัตนัย แบบวัดเจตคติ ซึ่งมีการให้คะแนนแบบตอบถูกให้ 1 คะแนน ผิดให้ 0 คะแนนการหาความเชื่อมั่นจะใช้ Cronbach’s alpha reliability coefficient

ความเป็นปรนัย (Objectivity)
จากที่ได้อธิบายเนื้อหามาตั้งแต่ต้น จะพบว่า คุณสมบัติที่สำคัญของเครื่องมือวิจัยทุกประเภท คือ ความเป็นปรนัย ยกตัวอย่าง เช่น หากเครื่องมือเป็นแบบทดสอบ ซึ่งโดยมากพบใน งานวิจัยเชิงปริมาณ จะต้องมีลักษณะข้อคำถามที่ชัดเจนไม่คลุมเครืออ่านแล้วเกิดความ เข้าใจตรงกัน ไม่ต้องตีความ การตรวจให้คะแนนมีหลักเกณฑ์ที่แน่นอน ใครก็สามารถตัดสินให้คะแนนได้และง่ายต่อการแปลผลชี้ชัดว่า ผู้ผ่านการทดสอบมีความสามารถในระดับใด การตรวจสอบความเป็นปรนัยของเครื่องมือวิจัยนิยมอาศัยผู้เชี่ยวชาญหรือกลุ่มตัวอย่างเล็กๆ ด้วยการหาค่าสัมประสิทธิ์ความสอดคล้อง (IOC) เพื่อตรวจสอบสำนวนภาษาให้มีความเหมาะสม เกณฑ์การให้คะแนนและการแปลผล ความหมายของคะแนนก่อนนำเครื่องมือวิจัยที่มีคุณภาพไปใช้ กับกลุ่มเป้าหมายต่อไป

ความยากง่าย (Difficulty)
เครื่องมือวิจัยที่เป็นแบบทดสอบที่มุ่งวัดคะแนนผลสัมฤทธิ์ทางการเรียน (achievement score) โดยเฉพาะความรู้ทางด้านพุทธิปัญญา (Cognitive domain) มีความจำเป็นที่จะต้องประเมิน ความยากง่ายรายข้อหรือทั้งฉบับดังนี้
P = R / N
P ค่าความยากง่าย
R จำนวนผู้เรียนที่ทำข้อนั้นถูก
N จำนวนผู้เรียนทั้งหมด
ความยากง่ายของแบบทดสอบมีค่าที่ยอมรับได้อยู่ระหว่าง 0.2 ถึง 0.8 ข้อที่มีค่า > 0.80 แสดงว่าง่ายเกินไป ถ้ามีค่า < 0.2 แสดงว่าข้อนั้นยากเกินไป ทั้งสองกรณีนี้จำเป็นต้องตัดออกและปรับปรุงข้อสอบใหม่

ค่าอำนาจจำแนก (Discrimination)
ในการนำเครื่องมือวิจัย เช่น แบบสอบข้อเขียน ไปตรวจวัดประเมินกับกลุ่มเป้าหมาย ซึ่งเป็น นักเรียนนักศึกษา จำเป็นที่เครื่องมือต้องสามารถจำแนกผู้เรียนที่มีผลสัมฤทธิ์ทางการเรียนสูง (กลุ่มนักเรียนเก่ง) กับกลุ่มที่มีผลสัมฤทธิ์ทางการเรียนต่ำ (กลุ่มนักเรียนอ่อน) ได้ความสามารถของแบบทดสอบ ในการจำแนกกลุ่มออกเป็นกลุ่มต่างๆ เช่น เก่ง-อ่อน เห็นด้วย- ไม่เห็นด้วย เขียนแทนด้วย r มีค่าระหว่าง -1.00 ถึง +1.00 มีความหมายดังนี้ :
ค่าอำนาจจำแนกมีค่ามากกว่า 0.40 ถือว่าข้อคำถามข้อนั้นมีอำนาจจำแนกดีมาก
ค่าอยู่ระหว่าง 0.30-0.39 ถือว่าข้อคำถามข้อนั้นมีอำนาจจำแนกดี
ค่าอยู่ระหว่าง 0.20-0.29 ถือว่าข้อคำถามข้อนั้นควรปรับปรุงใหม่
ค่าตำกว่า 0.20 ถือว่าข้อคำถามข้อนั้นมีค่าอำนาจจำแนกไม่ดี ต้องตัดข้อสอบข้อนั้นทิ้งไป
การคำนวณหาค่าอำนาจจำแนกสามารถทำได้หลายวิธี เช่น วิธีการตรวจให้คะแนน วิธีการใช้ สัดส่วน หรือวิธีการใช้ค่าสหสัมพันธ์แบบพอยท์-ไบซีเรียล (point biserial correlation)

อ้างอิง