Linear regression with multiple variables
การวิเคราะห์การถดถอยพหุคูณ
Multiple Linear Regression Analysis
การวิเคราะห์การถดถอยเชิงพหุคูณ
ในหัวข้อนี้ จะศึกษาความสัมพันธ์ระหว่าง ตัวแปรตาม (Response ,Dependent variable, Y ) หนึ่งตัวกับตัวแปรอิสระ (Predictor, Independent variable,X ) มากกว่าหนึ่งตัว แต่ความสัมพันธ์ดังกล่าวยังคงเป็นแบบเส้นตรงอยู่ในชีวิตจริงแล้ว จะมีน้อยมากที่ปัจจัยหนึ่งจะขึ้นอยู่กับปัจจัยหนึ่งเพียงอย่างเดียว ส่วนมากแล้วตัวแปรตามมักจะขึ้นอยู่กับตัวแปรอิสระหลายตัว พูดง่ายๆภาษานักสถิติคือ Y มักจะขึ้นอยู่ X หลายตัว
ตัวอย่างที่ 1
ในการจะศึกษาประสิทธิภาพการใช้น้ำมันของรถยนต์ เราไม่สามารถจะเอาขนาดของเครื่องยนต์มาเป็น ตัวกำหนดเพียงอย่างเดียว จะต้องคำนึงถึงน้ำหนักตัวรถ น้ำหนักคนขับ อายุของเครื่องยนต์ ความเสียดทานต่อผิวถนนของล้อรถ พูดง่ายๆคือหากต้องการพยากรณ์อัตราความสิ้น เปลืองของน้ำมันเชื้อเพลิง หรืออัตราการใช้น้ำมัน (กิโลเมตร/ลิตร) แล้วจะต้องคำนึงถึงตัวแปรอิสระมากกว่าหนึ่งตัวแปร
วิธีการคัดเลือกตัวแปรอิสระเพื่อให้ได้สมการถดถอยที่เหมาะสม
1.) Enter Method
เป็นวิธีการเอาตัวแปรอิสระทุกตัวทั้งตัวแปรอิสระที่มีความสัมพันธ์ กับตัวแปรตามอย่างมีนัยสำคัญทางสถิติและไม่มีนัยสำคัญทางสถิติเข้าไปวิเคราะห์ในสมการถดถอย
2.) Stepwise Method
เป็นวิธีการคัดเลือกตัวแปรอิสระเข้าสู่สมการโดยจะนำตัวแปร อิสระที่มีความสัมพันธ์กับตัวแปรตามมากที่สุดเข้าเป็นสมการแรกและทดสอบความมีนัยสำคัญทางสถิติ ถ้าพบว่าไม่มีนัยสำคัญทางสถิติก็จะถือว่าสิ้นสุดการคัดเลือก
3.) Backward Method
P เป็น วิธีการคัดเลือกตัวแปรอิสระออกจากสมการทีละตัวแปร โดยเริ่ม จากการสร้างสมการถดถอยที่รวมเอาตัวแปรอิสระทุกตัวเข้าสสู่ มการแรกก่อนแล้วจึงคัดเลือกตัว แปรอิสระออกทีละตัว โดยพิจารณาตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตามน้อยที่สุดถูกคัดออก
4.) Forward Method
เป็นวิธีการคัดเลือกตัวแปรอิสระเข้าสู่สมการทีละตัว ตามลำดับ ความสัมพันธ์กับตัวแปรตาม โดยตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตามมากที่สุดจะถูกคัดเลือกเข้าก่อน จากนั้นจะทำการคัดเลือกตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตาม อันดับถัดมาเข้าสมการ
5.) Remove Method
เป็นวิธีที่กำหนดให้นำตัวแปรอิสระที่ถูกคัดออกจากการ วิเคราะห์ของสมการพยากรณ์ หลังจากวิเคราะห์โดยวิธี Enter แล้ว
รูปแบบของสมการถดถอย
Regression Equation
ตัวอย่างการเขียนผลการวิเคราะห์
ตาราง ผลการวิเคราะห์การถดถอยพหุคูณแบบ Stepwise ในการพยากรณ์ดัชนีมวลกายของกลุ่มเสี่ยงเบาหวาน
ตัวอย่างการเขียนผลการวิเคราะห์
การศึกษาปัจจัยที่สามารถร่วมกันทำนายดัชนีมวลกายของกลุ่มเสี่ยงเบาหวาน พบว่ามีตัวแปรรอบเอวเพศ(หญิง) และ อายุที่ร่วมกันทำนายดัชนีมวลกายของกลุ่มเสี่ยงเบาหวานได้อย่างมีนัยสำคัญทางสถิติ (p value < 0.001) ซึ่งตัวแปรทั้งสองสามารถอธิบายการผันแปรดัชนีมวลกาย ได้ร้อยละ 40.0 (R2 = 0.400)
สามารถเขียนสมการพยากรณ์ในรูปคะแนนดิบได้ดังต่อไปนี้
(ดัชนีมวลกาย) = -10.903 + 0.360 (รอบเอว) + 3.089 (เพศหญิง) + .091(อายุ) เขียนสมการพยากรณ์ในรูปคะแนนมาตรฐานได้ดังต่อไปนี้ Z ดัชนีมวลกาย = 0.515 (Zรอบเอว) + 0.379 (Zเพศหญิง) + 0.203 (Zอายุ)
การวิเคราะห์ข้อมูลเป็นอีกขั้นตอนหนึ่งที่มีความสำคัญมาก เพราะการเลือกใช้สถิติที่เหมาะสมเป็นเรื่องยากแต่ปัจจุบันปัญหาลดน้อยลงเนื่องจากมีเอกสารตำราให้ค้นมากมาย รวมทั้ง มีโปรแกรมสำเร็จรูปให้เลือกใช้ได้หลากหลาย ซึ่งจะช่วยลดเวลาที่ต้องวิเคราะห์เองด้วยมือ รวมทั้ง ลดโอกาสที่จะคำนวณผิดอีกด้วย