การใช้STATA

บทความนี้ นำเสนอความรู้ที่สำคัญเกี่ยวกับ การใช้STATA เพื่อการวิเคราะห์ข้อมูล สำหรับการทำวิจัยทุกประเภท

STATA เป็นโปรแกรมสำเร็จรูปทางสถิติที่มีการใช้งานอย่างแพร่หลายในกลุ่มนักวิจัยสาขาต่าง ๆ โดยเฉพาะการวิจัยในสาขาด้านวิทยาศาสตร์สุขภาพ เนื่องจากโปรแกรมมีศักยภาพ ครอบคลุม ทั้งด้านการวิเคราะห์ข้อมูล ด้านการจัดการข้อมูล ด้านการน าเสนอข้อมูลและด้านการจัดการผลลัพธ์ โปรแกรมมีระบบการท างานที่ง่ายต่อการเรียนรู้และใช้งาน มีระบบการสนับสนุนช่วยเหลือผ่านเว็บไซต์ของโปรแกรม การใช้STATA ในปัจจุบันเป็นเรื่องที่ไม่ยากนัก มีคู่มือการใช้งานที่เข้าถึงได้อย่างง่ายดายจำนวนมาก

การวิเคราะห์ข้อมูลด้วยโปรแกรม STATA สำหรับข้อมูลจากแบบสอบถาม

วิเคราะห์สถิติ ความถี่ (Frequency) ค่าเฉลี่ย (Mean) ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) และร้อยละ (Percentage)
ทดสอบสมมุติฐานค่าเฉลี่ย การทดสอบค่าซี (Z-test) และการทดสอบค่าที (T-test)
การวิเคราะห์ความแปรปรวน F-Test (ANOVA)
ทดสอบสถิติแบบพาราเมตริกและนอนพาราเมตริก (Parametric and nonparametric statistics)
การทดสอบไคร์สแควร์ (Chi-Square)
ทดสอบความเป็นอิสระ (Testof independent)
การวิเคราะห์สหสัมพันธ์ (correlation)
การวิเคราะห์การถดถอยอย่างง่าย (Sample Regression Analysis)
ตรวจสอบคุณภาพเครื่องมือ

การใช้STATA สำหรับข้อมูลทุติยภูมิ (Secondary Data) และ ข้อมูลอนุกรมเวลา (Time Series Data)

ในการวิเคราะห์ข้อมูลทุติยภูมิ หรือ Secondary Data แบบอนุกรมเวลา หรือ Time Series Data ทั้งแบบรายปี รายไตรมาส รายเดือน รายสัปดาห์ หรือแม้กระทั่งรายวัน ที่ทำการเก็บรวบรวมข้อมูลจำนวนมาก อาจจะ10 ปี 5 ปี 3 ปี เป็นต้น ซึ่งการวิเคราะห์ข้อมูลอนุกรมเวลา ที่มีช่วงระยะเวลาติดต่อกันยาวนาน นักวิจัย จะต้องทำการทดสอบปัญหาตัวแบบเศรษฐมิติ ที่สำคัญ ซึ่งปัญหาเหล่านี้ หากไม่มีการทดสอบ วิเคราะห์ หรือกำจัดปัญหาเหล่านี้ให้หมดไป ก่อนการไปวิเคราะห์ตามแบบจำลองที่กำหนด เช่น Multiple Regression ด้วยวิธี OLS จะทำให้ประสิทธิภาพของค่าพยากรณ์หรือตัวแบบเหล่านั้นเกิดปัญหาด้านความน่าเชื่อถือได้

(1) การทดสอบปัญหา multicollinearity

ปัญหา Multicollinearity เกิดขึ้น เมื่อตัวแปรอิสระ หรือ Independent Variable สองตัว มีค่าสหสัมพันธ์ค่อนข้างสูงแต่ไม่สมบูรณ์ ซึ่งจะส่งผลต่อค่าสัมประสิทธฺ์การกำหนดและค่าประมาณการกำลังสองน้อยที่สุด(R – square) มีค่าสูง และค่าทดสอบ t มีค่าตํ่ามากจนทำให้ผู้ใช้อาจแปรค่าได้ว่าตัวแปรอิสระไม่มีความสัมพันธ์ทางสถิติ ซึ่งเป็นการตัดสินใจที่ผิดพลาด

การตรวจสอบข้อมูลว่ามีปัญหา Multicollinearity หรือไม่

การสังเกตว่าข้อมูลมีปัญหา Multicollinearity หรือไม่สังเกตุได้ดังนี้

ตัวประมาณค่าสัมประสิทธิ์ของตัวเเปรแต่ละคู่(r)มีค่าความแตกต่างจาก 0 อย่างมีนัยสำคัญ
ตัวสถิติทดสอบ t เกือบทั้งหมดไม่มีนัยสำคัญทางสถิติ แต่ตัวทดสอบ F มีนัยสำคัญ
ค่าสัมประสิทธิ์ความชันและจุดตัดแกนมีเครื่องหมายบวกหรือลบแตกต่างที่คาดไว้

การแก้ปัญหา Multicollinearity

การแก้ปัญหา Multicollinearity เป็นปัญหาตัวแบบเบื้องต้นทางเศรษฐมิติ ซึ่งสามารถทดสอบปัญหานี้ได้ด้วยโปรแกรม EVIEW ทำได้โดยนำตัวแปรอิสระที่ไม่มีนัยสำคัญบ้างตัวออกจากแบบจำลองเชิงถดถอยจนไม่เกิดปัญหา Multicollinearity การที่จะเลือกตัวแปรใหนออกอาจสามารถทำได้โดยใช้การสร้างแบบจำลอง Stepwise Regression โดยสามารถวิเคราะห์ปัญหา นี้ได้จากการใช้โปรแกรม EVIEW หรือ โปรแกรมอื่นๆได้เช่นกัน เช่น โปรแกรม SPSS หรือ STATA เป็นต้น

(2) การตรวจสอบปัญหา heteroscedasticity

นักวิจัย สามารถตรวจสอบปัญหา Heteroskedasticity ด้วย การทดสอบ Breusch — Pagan. Breusch and Pagan (1979) แนะนำให้ทดสอบ Regress the squared residuals จากสมการการถดถอยโดยประมาณของตัวแปรอิสระในการถดถอย หากไม่มีปัญหา conditional heteroskedasticity ตัวแปรอิสระจะไม่สามารถอธิบายค่าคลาดเคลื่อนได้ ซึ่งโปรแกรม EVIEW สามารถวิเคราะห์ปัญหาและแก้ไขปัญหานี้ได้เป็นอย่างดี

Breusch และ Pagan เป็นการทดสอบ เพื่อพิสูจน์ ว่าภายใต้สมมติฐานหลักนั้น ไม่มีความแตกต่างแบบมีเงื่อนไข nR2 (จากการถดถอยของส่วนที่เหลือกำลังสองบนตัวแปรตามจากการถดถอยเดิม) และเป็นตัวแปรสุ่มχ2ที่มีจำนวนองศาอิสระเท่ากับ จำนวนตัวแปรอิสระในการถดถอย ดังนั้น สมมติฐานว่าง จึงระบุว่า ข้อผิดพลาด กำลังสองของการถดถอย ไม่เกี่ยวข้องกับตัวแปรอิสระ สมมติฐานทางเลือก ระบุว่า ข้อผิดพลาดกำลังสอง มีความสัมพันธ์กับตัวแปรอิสระ

(3) การตรวจสอบปัญหา autocorrelation

อีกหนึ่งปัญหาที่พบบ่อยการทำสมการถดถอย คือ ค่าคลาดเคลื่อนมีความสัมพันธ์กันเมื่อค่าคลาดเคลือนการถดถอยมีความสัมพันธ์กันในการสังเกตเราจะบอกว่ามีความสัมพันธ์ตามลำดับ (หรือสัมพันธ์อัตโนมัติ) ความสัมพันธ์แบบอนุกรมมักเกิดขึ้นในการถดถอยข้อมูลอนุกรมเวลา ทำนองเดียวกันกับ การทดสอบปัญหา heteroskedasticity

ปัญหาหลักที่เกิดจาก Serial Correlation ในการถดถอยเชิงเส้นคือการประมาณค่าคลาดเคลื่อนของค่าสัมประสิทธิ์การถดถอยที่ไม่ถูกต้องซึ่งคำนวณโดยโปรแกรมสำเร็จรูปทางสถิติ โดยตัวปรอิสระมักมีความสัมพันธ์กับตัวแปรก่อนหน้า อย่างไรก็ตามหากตัวแปรอิสระตัวใดตัวหนึ่งเป็นค่าที่ล้าหลังของตัวแปรตามตัวอย่างเช่นหากผลตอบแทน T-bill จากเดือนก่อนหน้าเป็นตัวแปรอิสระในการถดถอยผลของฟิชเชอร์

สหสัมพันธ์แบบอนุกรมในเงื่อนไขข้อผิดพลาดจะทำให้เกิด พารามิเตอร์ทั้งหมดที่ประมาณค่าจากการถดถอยเชิงเส้นไม่สอดคล้องกันและจะไม่ใช่ค่าประมาณที่ถูกต้องของพารามิเตอร์จริง

เนื่องจาก การพัฒนาตัวแบบการประมาณค่าในสมการถดถอย ดำเนินการตามข้อตกลงการถดถอย ทั้งนี้ การตกลงก็ไม่สามารถทำได้ตามใจ แต่เป็นไปตามเหตุผลดงัไดก้ล่าวมาแลว้ ดงัน้ันผลการวิเคราะห์ การถดถอยในขั้นปฏิบัติ จึงต้องสอดคล้องกันกับข้อตกลง มิเช่นนั้น ผลการศึกษาจะคลาดเคลื่อนและ
นำไปสู่การสรุปผลผิดพลาด (miss-leading)

ทั้งนี้ หากนำผลการศึกษาไปใช้ในระดับนโยบายหรือในระดับปฏิบัติการ อาจก่อให้เกิดความเสียหายได้ หากกระบวนการวิเคราะห์การถดถอยนั้น มีข้อผิดพลาด ดั้งนั้น ก่อนการนำตัวแปรต่างๆ เข้าสู่ตัวแบบจำลองหลัก เช่น กระบวนการวิเคราะห์การถดถอย จะต้องมีการวิเคราะห์ปัญหาตัวแบบที่สำคัญและจำเป็นตามที่ได้กล่าวไปแล้ว ซึ่งโปรแกรม EVIEW สามารถทำการวิเคราะห์ได้อย่างถูกต้อง ครบถ้วน และใช้งานไม่ยากลำบากนัก

สำหรับ โปรแกรม Stata ที่วางจำหน่ายและนิยมใช้งานมากในประเทศไทย มีดังต่อไปนี้

1. Stata /BE 17 Education License

โปรแกรมวิเคราะห์ข้อมูล สถิติ รุ่นเริ่มต้น (BE หรือ Basic Edition) สำหรับสถานศึกษา ลิขสิทธิ์โปรแกรมราคาถูก เพื่อการใช้งานใน โรงเรียน มหาวิทยาลัย สถานศึกษา โดยมีรายละเอียดดังนี้ 1. ตัวแปร (Variables) ในการวิเคราะห์ข้อมูลสถิติได้สูงสุด 2,048 ตัว 2.ค่าสังเกต (Observation) ได้สูงสุด 2.14 พันล้านตัว 3. ตัวแปรอิสระ (Independent Variables) ได้สูงสุด 798 ตัว

2. Stata/SE 17 Business License

โปรแกรมวิเคราะห์ข้อมูล สถิติ รุ่นมาตรฐาน (SE หรือ Standard Edition) สำหรับองค์กรธุรกิจ รองรับงานด้านสถิติได้ยืดหยุ่นกว่า โปรแกรมในเวอร์ชัน BE โดยที่ 1. ตัวแปร (Variables) ในการวิเคราะห์ข้อมูลสถิติได้สูงสุดถึง 32,767 ตัว 2.ค่าสังเกต (Observation) ได้สูงสุด 2.14 พันล้านตัว 3.ตัวแปรอิสระ (Independent Variables) ได้สูงสุด 10,998 ตัว

3. โปรแกรมStata/MP 17 Education License

โปรแกรมวิเคราะห์ข้อมูล สถิติ รุ่นหลายแกนประมวลผล (MP หรือ Multi Processors) สำหรับสถานศึกษา ลิขสิทธิ์โปรแกรมราคาถูก เพื่อการใช้งานใน โรงเรียน มหาวิทยาลัย สถานศึกษา ประสิทธิภาพการคำนวณด้านสถิติสูงกว่า และคำนวณได้เร็วกว่า โปรแกรมในเวอร์ชัน BE และ SE (ยิ่งใช้แกนประมวลผลจำนวนมากยิ่งทำงานได้เร็ว) สำหรับการใช้งานบนเครื่อง คอมพิวเตอร์/เซิร์ฟเวอร์ ที่มีหลาย แกนประมวล (Cores) หรือมีหน่วยประมวลผลหลายตัว (Processors) โดยมีเวอร์ชันโปรแกรมให้เลือกซื้อ ทั้งแบบ 2-core (สองแกนประมวลผล), 4-core (สี่แกนประมวลผล) และเวอร์ชัน >4 cores (ใช้ได้มากกว่า 4 แกนประมวลผล)

Stata คือโปรแกรมที่ช่วยให้นักวิจัยทำงานได้รวดเร็วขึ้น

โปรแกรมวิเคราะห์ข้อมูล โปรแกรมสถิติ Stata ช่วยให้งานของนักวิจัย หรือนักวิทยาศาสตร์ข้อมูล ง่ายขึ้นด้วยความสามารถในการสร้างแผนภูมิในรูปแบบภาพความละเอียดสูง ที่เหมาะสำหรับการนำไปเผยแพร่ผลงานวิจัยทางสถิติ สั่งงานเพื่อการสร้างภาพแผนภูมิที่เรากำหนดค่าเองได้ตามต้องการ สามารถเขียนสคริปต์เพื่อสร้างกราฟแบบอัตโนมัติได้นับร้อยรูปแบบ และสามารถทำซ้ำได้

โปรแกรมวิเคราะห์ข้อมูล โปรแกรมสถิติ Stata รองรับการส่งออกข้อมูล (Export) ในรูปแบบของกราฟ ความละเอียดสูงในไฟล์รูปแบบ EPS หรือ TIFF ซึ่งเหมาะสำหรับการนำไปเผยแพร่งานวิจัย หรือ Export กราฟในฟอร์แมต PNG หรือ SVG เพื่อการเผยแพร่ผ่านเว็บ หรือไฟล์เอกสาร PDF เพื่อการเผยแพร่ในช่องทางทั่วๆ ไป นอกจากนี้ Stata ยังมีเครื่องมือแก้ไขกราฟ (Graph Editor) ที่มีอยู่ใน โปรแกรมวิเคราะห์ข้อมูล โปรแกรมสถิติ Stata จะเข้ามาช่วยทำให้เราสามารถปรับแต่งกราฟได้ในทุกรายละเอียด ไม่ว่าจะเป็นการเพิ่ม ชื่อกราฟ ใส่ข้อความโน้ต ใส่เส้น ลูกศร และเพิ่มข้อความต่างๆ ได้ตามต้องการ

ความสามารถของโปรแกรม Stata

STATA สามารถวิเคราะห์และประมวลผลข้อมูลได้อย่างหลากหลาย และครอบคลุมการวิเคราะห์และการทดสอบสมมติฐาน ดังต่อไปนี้

– Introduction to Market Research

– The Market Research Process

– Data

– Getting Data

– Descriptive Statistics

– Hypothesis Testing & ANOVA

– Regression Analysis

– Principal Component and Factor Analysis

– Cluster Analysis

– Communicating the Results

ตัวอย่างคำสั่ง : การสร้างกราฟจากข้อมูล ด้วยโปรแกรม Stata

1.คำสั่งนำเข้าข้อมูล

clear

input sales marketing research development

12 14 2 8

end

2.กำหนดป้ายชื่อให้กับแต่ละตัวแปร

label var sales “Sales”

“——–” market “Marketing”

“——–” research “Research”

“——–” develop “development”

3.สร้างกราฟด้วยคำสั่ง “graph pie “

graph pie sales marketing research development, plabel(_all name, size(*1.5) color(white)) legend(off) title(“Expenditures, XYZ Corp.”) subtitle(“2002”) note(“source: 2002 Financial Report”)

หลังจากการสร้างชุดคำสั่งนี้ในโปรแกรม Stata จะสามารถสร้างกราฟ สำหรับใช้ประกอบผลการวิเคราะห์ข้อมูลหรืองานวิจัย ซึ่งปัจจุบันเราสามารถทำกราฟสวย ๆ ได้ในทั้งโปรแกรม EXCEL โปรแกรมออนไลน์อีกมากมาย

รับวิเคราะห์stata จ้างวิเคราะห์ stata โดยนักเศรษฐศาสตร์ เชี่ยวชาญการวิเคราะห์ข้อมูลอนุกรมเวลาทุกโมเดล มีความรู้ความเข้าใจเกี่ยวกับสถิติ เศรษฐมิติ ตลาดทุน ตลาดการเงิน ทำให้สามารถวิเคราะห์และเขียนผลเกี่ยวกับการใช้โปรแกรม STATA ได้อย่างถูกต้อง รวดเร็ว

รับทำวิจัย รับทำวิทยานิพนธ์

Tag : การทำ is จ้างทำ is จ้างทำวิจัย จ้างทำวิทยานิพนธ์ จ้างทํางานวิจัย จ้างทําวิจัย ป.ตรี ราคา จ้างทําวิจัยราคา จ้างทําวิจัยราคาประหยัด จ้างทําวิจัย ราคาเท่าไหร่ จ้างทําวิทยานิพนธ์ จ้างทําวิทยานิพนธ์ราคา จ้างวิจัย ทําวิทยานิพนธ์ ทำงานวิจัย ทำงานวิทยานิพนธ์ บริการรับทำวิจัย รับจัดหน้าวิทยานิพนธ์ รับจ้างทำ is รับจ้างทํางานวิจัย ราคาถูก รับจ้างทํารายงาน รับจ้างทําวิทยานิพนธ์ รับจ้างทําวิทยานิพนธ์ ราคาถูก รับจ้างเขียนรายงาน รับทำ is รับทำ powerpoint รับทำ spss รับทำ thesis รับทำดุษฎีนิพนธ์ รับทำวิจัย รับทำวิจัยราคาถูก รับทำวิทยานิพนธ์ รับทำสารนิพนธ์ รับทำแบบสอบถาม รับทำโปรเจคจบ รับทํา thesis รับทํางานวิจัย รับทําปริญญานิพนธ์ รับทํารายงาน รับทําวิจัย ป.ตรี รับทําวิทยานิพนธ์ รับวิเคราะห์STATA จ้างทำSTATA รับวิเคราะห์ข้อมูล ด้วย โปรแกรม STATA

อ้างอิง

การใช้ STATA