การวิเคราะห์สถิติหลายมิติ การวิเคราะห์เชิงสถิติหลายมิติเบื้องต้น - การประเมิน Kalinina ของฟังก์ชั่นการพยากรณ์เชิงเส้น

13.04.2021

อ่าน

Cheesets สำหรับคู่รักในหม้อหุงช้า

บ้านขนม: ทำอาหาร Pancho Cake กับ Cherry Pancho Cake กับครีมเชอร์รี่และครีม

Cube Soup Reznaya สูตร

สลัดกับแฮมรมควัน

สูตรการทำอาหารสำหรับข้าวฟ่างโจ๊กกับเนื้อสัตว์

มีสถานการณ์เช่นใดที่ความแปรปรวนแบบสุ่มแสดงโดยตัวแปรสุ่มหนึ่งหรือสองตัวคุณสมบัติ

ตัวอย่างเช่นในการศึกษาการรวมสถิติของผู้คนเรามีความสนใจในการเติบโตและน้ำหนัก ในสถานการณ์เช่นนี้ไม่ว่าจะมีกี่คนในการรวมสถิติเราสามารถสร้างแผนภาพการกระเจิงและดูภาพรวมโดยทั่วไป อย่างไรก็ตามหากสัญญาณมีสามตัวอย่างเช่นมีการเพิ่มสัญญาณ - อายุของบุคคลดังนั้นแผนภาพการกระเจิงจะต้องสร้างขึ้นในพื้นที่สามมิติ นำเสนอคะแนนจำนวนทั้งสิ้นในพื้นที่สามมิตินั้นค่อนข้างยาก

ในความเป็นจริงในทางปฏิบัติการสังเกตแต่ละครั้งจะไม่แสดงตัวเลขหนึ่งหรือสองสาม แต่ชุดตัวเลขที่เห็นได้ชัดบางอย่างที่อธิบายถึงสัญญาณหลายสิบสัญญาณ ในสถานการณ์นี้พื้นที่หลายมิติจะต้องสร้างแผนภาพการกระเจิง

ส่วนสถิติเกี่ยวกับการศึกษาการทดลองที่มีการสังเกตหลายมิติเรียกว่าการวิเคราะห์ทางสถิติหลายมิติ

การวัดสัญญาณหลายสัญญาณ (คุณสมบัติวัตถุ) ในการทดลองเดียวโดยทั่วไปเป็นธรรมชาติมากกว่ามิติของหนึ่งสอง ดังนั้นการวิเคราะห์ทางสถิติที่อาจเกิดขึ้นหลายมิติจึงมีสนามกว้างสำหรับการใช้งาน

ส่วนต่อไปนี้รวมถึงการวิเคราะห์ทางสถิติหลายมิติ:

การวิเคราะห์ปัจจัย

การวิเคราะห์การจำแนก;

การวิเคราะห์คลัสเตอร์;

การปรับขนาดหลายมิติ;

วิธีการควบคุมคุณภาพ

การวิเคราะห์ปัจจัย

ในการศึกษาวัตถุและระบบที่ซับซ้อน (ตัวอย่างเช่นในจิตวิทยาชีววิทยาสังคมวิทยา ฯลฯ ) ของค่า (ปัจจัย) คุณสมบัติการกำหนดของวัตถุเหล่านี้มันเป็นไปไม่ได้ที่จะวัดโดยตรงและบางครั้งก็ถึง จำนวนและความหมายที่มีความหมาย แต่ค่าอื่น ๆ อาจมีให้สำหรับการวัดไม่ทางใดก็ทางหนึ่งขึ้นอยู่กับปัจจัยที่น่าสนใจ ในเวลาเดียวกันเมื่อผลกระทบของปัจจัยที่ไม่ทราบสาเหตุของปัจจัยที่น่าสนใจมีการวัดในหลาย ๆ คุณสมบัติที่วัดได้คุณสมบัติเหล่านี้อาจตรวจจับความสัมพันธ์ที่ใกล้ชิดระหว่างตัวเองและจำนวนปัจจัยทั้งหมดอาจน้อยกว่าจำนวนตัวแปรที่วัดได้

ในการตรวจจับปัจจัยที่มีผลต่อตัวแปรที่วัดได้ใช้วิธีการวิเคราะห์ปัจจัย

ตัวอย่างของการประยุกต์ใช้การวิเคราะห์ปัจจัยสามารถศึกษาคุณสมบัติบุคลิกภาพตามการทดสอบทางจิตวิทยา คุณสมบัติของบุคลิกภาพไม่ได้คล้อยตามการวัดโดยตรงพวกเขาสามารถตัดสินได้เฉพาะกับพฤติกรรมของมนุษย์หรือลักษณะของคำตอบสำหรับปัญหาบางอย่าง เพื่ออธิบายผลลัพธ์ของการทดลองพวกเขาอาจมีการวิเคราะห์ปัจจัยซึ่งช่วยให้คุณสามารถระบุคุณสมบัติส่วนบุคคลที่มีผลต่อพฤติกรรมของบุคคลของบุคคล

ในหัวใจของการวิเคราะห์ปัจจัยหลายรุ่นอยู่ที่สมมติฐานต่อไปนี้: พารามิเตอร์ที่สังเกตได้หรือที่วัดได้เป็นเพียงลักษณะทางอ้อมของวัตถุที่กำลังศึกษาหรือปรากฏการณ์ในความเป็นจริงมีภายใน (ซ่อนอยู่ แฝงไม่พบพารามิเตอร์และคุณสมบัติโดยตรง) จำนวนที่มีขนาดเล็กและกำหนดค่าของพารามิเตอร์ที่สังเกตได้ พารามิเตอร์ภายในเหล่านี้เรียกว่าปัจจัย

งานของการวิเคราะห์ปัจจัยมันเป็นตัวแทนของพารามิเตอร์ที่สังเกตได้ในรูปแบบของการผสมผสานเชิงเส้นของปัจจัยและบางทีการก่อกวนเพิ่มเติมที่ไม่เกี่ยวข้อง

ขั้นตอนแรกของการวิเคราะห์ปัจจัยตามกฎคือการเลือกสัญญาณใหม่ที่มีการผสมผสานเชิงเส้นของอดีตและ "ดูดซับ" ส่วนใหญ่ของความแปรปรวนโดยรวมของข้อมูลที่สังเกตได้และส่งข้อมูลส่วนใหญ่ที่สรุปไว้ในการสังเกตเบื้องต้น . โดยปกติจะทำโดยใช้ วิธีการของส่วนประกอบหลักแม้ว่าเทคนิคอื่น ๆ จะใช้บางครั้ง (วิธีความจริงสูงสุด)

วิธีการขององค์ประกอบหลักจะลดลงในการเลือกระบบพิกัดมุมฉากใหม่ในพื้นที่ของการสังเกต ในฐานะที่เป็นองค์ประกอบหลักแรกทิศทางได้รับการเลือกตั้งซึ่งอาร์เรย์การสังเกตมีการกระจายที่ยิ่งใหญ่ที่สุดทางเลือกของแต่ละองค์ประกอบหลักที่เกิดขึ้นเกิดขึ้นเพื่อให้มีการกระจายการสังเกตคือสูงสุดและส่วนประกอบหลักนี้เป็นมุมฉากต่อส่วนประกอบหลักอื่น ๆ ที่เลือกไว้ก่อนหน้านี้ . อย่างไรก็ตามปัจจัยที่ได้จากวิธีการหลักมักจะไม่สามารถตีความภาพได้อย่างเพียงพอ ดังนั้นขั้นตอนต่อไปของการวิเคราะห์ปัจจัยคือการเปลี่ยนแปลงการหมุนของปัจจัยเพื่ออำนวยความสะดวกในการตีความ

การวิเคราะห์การจำแนก

ให้มีการผสมผสานของวัตถุแตกเป็นหลายกลุ่มและสำหรับแต่ละวัตถุสามารถกำหนดได้ว่ากลุ่มใดที่อ้างถึง สำหรับแต่ละวัตถุมีการวัดลักษณะเชิงปริมาณหลายอย่าง จำเป็นต้องหาวิธีดังกล่าวตามพื้นฐานของลักษณะเหล่านี้คุณสามารถค้นหากลุ่มที่วัตถุเป็นของ สิ่งนี้จะช่วยให้กลุ่มระบุว่าวัตถุใหม่นั้นรวมกันเหมือนกัน เพื่อแก้ปัญหางานที่ใช้ วิธีการวิเคราะห์การจำแนก

การวิเคราะห์การจำแนก- สถิติส่วนนี้เนื้อหาที่มีการพัฒนาวิธีการแก้ปัญหาความแตกต่าง (การเลือกปฏิบัติ) ของวัตถุการสังเกตสำหรับคุณสมบัติบางอย่าง

พิจารณาตัวอย่างบางส่วน

การวิเคราะห์แบบแยกแยะสะดวกเมื่อประมวลผลผลการทดสอบบุคคลเมื่อพูดถึงการรับสัญญาณหนึ่งตำแหน่งหรืออีกตำแหน่งหนึ่ง ในกรณีนี้ผู้สมัครทุกคนจะต้องแบ่งออกเป็นสองกลุ่ม: "เหมาะสม" และ "ไม่เหมาะ"

การใช้การวิเคราะห์การเลือกปฏิบัติเป็นไปได้โดยการบริหารงานธนาคารเพื่อประเมินสถานะทางการเงินของกิจการลูกค้าเมื่อออกสินเชื่อ ธนาคารสำหรับสัญญาณจำนวนหนึ่งจัดเรียงไว้ในที่เชื่อถือได้และไม่น่าเชื่อถือ

การวิเคราะห์แบบแยกแยะสามารถดึงดูดได้ว่าเป็นวิธีการแยกชุดของผู้ประกอบการเข้ากับกลุ่มที่เป็นเนื้อเดียวกันหลายกลุ่มเกี่ยวกับค่าของตัวบ่งชี้การผลิตและกิจกรรมทางเศรษฐกิจใด ๆ

วิธีการวิเคราะห์ที่ผิดเพี้ยนทำให้สามารถสร้างฟังก์ชั่นของลักษณะที่วัดได้ค่าที่และอธิบายการแยกวัตถุออกเป็นกลุ่ม เป็นที่พึงปรารถนาที่หน้าที่เหล่านี้ (สัญญาณจำแนก)เป็นนิดหน่อย ในกรณีนี้ผลการวิเคราะห์นั้นง่ายต่อการตีความ

เนื่องจากความเรียบง่ายการวิเคราะห์การเลือกปฏิบัติเชิงเส้นจะเล่นตามบทบาทพิเศษซึ่งเลือกคุณสมบัติการจำแนกประเภทนี้เป็นฟังก์ชั่นเชิงเส้นจากสัญญาณหลัก

การวิเคราะห์คลัสเตอร์

วิธีการวิเคราะห์คลัสเตอร์ช่วยให้คุณทำลายชุดของวัตถุที่ศึกษาเป็นกลุ่มของวัตถุ "ที่คล้ายกัน" ที่เรียกว่า Clusters

คำ คลัสเตอร์ต้นกำเนิดภาษาอังกฤษ - คลัสเตอร์แปลว่า แปรง, มัด, กลุ่ม, ฝูง, คลัสเตอร์

การวิเคราะห์คลัสเตอร์แก้ปัญหางานต่อไปนี้:

ดำเนินการจำแนกประเภทของวัตถุที่มีสัญญาณเหล่านั้นทั้งหมดที่มีลักษณะวัตถุ ความเป็นไปได้มากของการจำแนกประเภทส่งเสริมให้เราทราบถึงความเข้าใจในเชิงลึกมากขึ้นเกี่ยวกับการรวมและวัตถุที่ถือว่ารวมอยู่ในนั้น

มันทำให้ภารกิจของการตรวจสอบสถานะของโครงสร้างหรือการจำแนกประเภทที่กำหนดไว้ในจำนวนทั้งสิ้น การตรวจสอบดังกล่าวทำให้สามารถใช้ประโยชน์จากรูปแบบการวิจัยทางวิทยาศาสตร์และการนิรนัยมาตรฐานมาตรฐาน

วิธีการจัดกลุ่มส่วนใหญ่ (กลุ่มลำดับชั้น) คือ agglomerative(comriginal) - พวกเขาเริ่มต้นด้วยการสร้างกลุ่มระดับประถม, แต่ละแห่งประกอบด้วยการสังเกตแหล่งหนึ่ง (หนึ่งจุด) และในแต่ละขั้นตอนต่อมากลุ่มที่ใกล้เคียงที่สุดทั้งสองจะถูกรวมเข้ากับหนึ่ง

ช่วงเวลาของการหยุดกระบวนการนี้สามารถกำหนดได้โดยนักวิจัย (ตัวอย่างเช่นบ่งบอกถึงจำนวนคลัสเตอร์ที่ต้องการหรือระยะทางสูงสุดที่การผสานถึง)

ภาพกราฟิกของกระบวนการรวมคลัสเตอร์สามารถรับได้โดย dendrograms- ทรีผสมผสานกลุ่ม

พิจารณาตัวอย่างต่อไปนี้ เราจะจำแนกองค์กรห้าแห่งซึ่งแต่ละแห่งมีลักษณะสามตัวแปร:

x 1- มูลค่าเฉลี่ยต่อปีของโรงงานผลิตหลักพันล้านรูเบิล;

x 2- ต้นทุนวัสดุสำหรับ 1 ถู ผลิตผลิตภัณฑ์ตำรวจ;

x 3- ปริมาณของผลิตภัณฑ์ที่ผลิตพันล้านรูเบิล

การแนะนำของ PEVM ในการจัดการเศรษฐกิจของประเทศนั้นเกี่ยวข้องกับการเปลี่ยนผ่านจากวิธีการแบบดั้งเดิมสำหรับการวิเคราะห์องค์กรในแบบจำลองการจัดการเศรษฐกิจขั้นสูงที่ให้กระบวนการเชิงลึกที่จะเปิดเผย

การใช้งานอย่างกว้างขวางในการศึกษาทางเศรษฐกิจของวิธีการสถิติทางคณิตศาสตร์ทำให้สามารถทำการวิเคราะห์ทางเศรษฐกิจอย่างลึกซึ้งยิ่งขึ้นปรับปรุงคุณภาพของข้อมูลในการวางแผนและการทำนายตัวบ่งชี้การผลิตและการวิเคราะห์ประสิทธิผลของมัน

ความซับซ้อนและความหลากหลายของความสัมพันธ์ของตัวชี้วัดทางเศรษฐกิจกำหนดหลายมิติของสัญญาณและการเชื่อมต่อกับสิ่งนี้จำเป็นต้องใช้เครื่องมือทางคณิตศาสตร์ที่ซับซ้อนที่สุด - วิธีการวิเคราะห์ทางสถิติหลายมิติ

แนวคิดของ "การวิเคราะห์ทางสถิติหลายมิติ" หมายถึงจำนวนวิธีการที่ออกแบบมาเพื่อสำรวจการรวมกันของสัญญาณที่สัมพันธ์กัน เรากำลังพูดถึงการแยกออกจากกัน (แยก) ของการรวมกันภายใต้การพิจารณาซึ่งเป็นตัวแทนของสัญญาณหลายมิติในจำนวนที่ค่อนข้างน้อย

ในเวลาเดียวกันการเปลี่ยนแปลงจากสัญญาณจำนวนมากไปยังผู้น้อยนั้นถูกหลอกหลอนโดยเป้าหมายในการลดมิติของพวกเขาและการเพิ่มขึ้นของภาชนะที่ให้ข้อมูล เป้าหมายดังกล่าวเกิดขึ้นได้จากการระบุข้อมูลซ้ำ ๆ ที่สร้างขึ้นโดยสัญญาณที่สัมพันธ์กันการสร้างความเป็นไปได้ของการรวมตัว (การเชื่อมโยงการรวม) สำหรับสัญญาณบางอย่าง หลังเกี่ยวข้องกับการเปลี่ยนแปลงของโมเดลจริงในแบบจำลองที่มีสัญญาณปัจจัยที่น้อยลง

วิธีการวิเคราะห์ทางสถิติหลายมิติช่วยให้คุณสามารถระบุสิ่งที่มีอยู่อย่างเป็นกลาง แต่ชัดเจนว่าไม่มีรูปแบบที่แสดงออกในปรากฏการณ์ทางเศรษฐกิจสังคมบางอย่าง สิ่งนี้ต้องจัดการกับสิ่งนี้ในการแก้ปัญหาการปฏิบัติจำนวนมากในสาขาเศรษฐศาสตร์ โดยเฉพาะอย่างยิ่งที่ถูกครอบครองหากจำเป็นต้องสะสม (แก้ไข) ในเวลาเดียวกันค่าของลักษณะเชิงปริมาณหลายอย่าง (คุณสมบัติ) บนวัตถุที่กำลังศึกษาเมื่อแต่ละลักษณะมีแนวโน้มที่จะมีแนวโน้มที่จะไม่สามารถควบคุมได้ (ในบริบทของวัตถุ) แม้จะมีความสม่ำเสมอของวัตถุสังเกตการณ์

ตัวอย่างเช่นการสำรวจภาวะที่เป็นเนื้อเดียวกัน (ตามสภาพเศรษฐกิจธรรมชาติและประเภทของความเชี่ยวชาญ) ขององค์กรสำหรับตัวบ่งชี้ประสิทธิภาพการทำงานจำนวนมากเราเชื่อมั่นว่าในการเปลี่ยนจากวัตถุหนึ่งไปยังอีกวัตถุหนึ่งเกือบแต่ละลักษณะที่เลือก (เหมือนกัน) ความหมายที่ไม่เท่ากันนั่นคือมันพบว่าการพูดกระจาย (สุ่ม) ที่ควบคุมไม่ได้ ลักษณะ "สุ่ม" ของสัญญาณดังกล่าวตามกฎแล้วภายใต้แนวโน้ม (ธรรมชาติ) ทั้งในแง่ของสัญญาณที่เฉพาะเจาะจงอย่างเพียงพอรอบซึ่งการเปลี่ยนแปลงและในแง่ของระดับและการพึ่งพาซึ่งกันและกันของการเปลี่ยนแปลงของตัวเอง ออก.

ข้างต้นนำไปสู่คำจำกัดความของตัวแปรสุ่มแบบหลายมิติเป็นชุดของคุณสมบัติเชิงปริมาณค่าของแต่ละอันมีการกระจายที่ไม่สามารถควบคุมได้ในระหว่างการทำซ้ำของกระบวนการนี้การสังเกตทางสถิติประสบการณ์การทดลอง ฯลฯ

ก่อนหน้านี้เคยกล่าวไว้ว่าการวิเคราะห์หลายมิติผสมผสานวิธีการหลายอย่าง เราเรียกพวกเขาว่า: การวิเคราะห์ปัจจัย, วิธีการส่วนประกอบหลัก, การวิเคราะห์คลัสเตอร์, การรับรู้ภาพ, การวิเคราะห์แบบแยกแยะและอื่น ๆ สามวิธีแรกของวิธีการเหล่านี้ได้รับการพิจารณาในย่อหน้าต่อไปนี้

เช่นเดียวกับทางคณิตศาสตร์อื่น ๆ - วิธีการทางสถิติการวิเคราะห์หลายมิติสามารถมีประสิทธิภาพในการใช้งานของมันภายใต้ข้อมูลเริ่มต้นสูงและมวลของการสังเกตเหล่านี้ได้รับการประมวลผลโดยใช้ PEVM

แนวคิดพื้นฐานของวิธีการวิเคราะห์ปัจจัยสาระสำคัญของงานที่แก้ไขได้โดยพวกเขา

เมื่อวิเคราะห์ (อย่างเท่าเทียมกันและตรวจสอบ) ปรากฏการณ์ทางสังคมและเศรษฐกิจมักพบในกรณีที่มีวัตถุสังเกตการณ์ความหลากหลาย (Bagatoparametricity) มีความจำเป็นต้องยกเว้นสัดส่วนของพารามิเตอร์หรือแทนที่ด้วยฟังก์ชั่นบางอย่างที่น้อยลงโดยไม่ก่อให้เกิด ความสมบูรณ์ของข้อมูลความสมบูรณ์ (เต็ม) การแก้ปัญหาของงานดังกล่าวทำให้รู้สึกภายในรูปแบบที่แน่นอนและเป็นเพราะโครงสร้างของมัน ตัวอย่างของแบบจำลองดังกล่าวที่เหมาะสมที่สุดสำหรับสถานการณ์จริงจำนวนมากคือรูปแบบการวิเคราะห์ปัจจัยวิธีการที่ทำให้เป็นไปได้ที่จะมีสมาธิกับสัญญาณ (ข้อมูลเกี่ยวกับพวกเขา) โดย "การควบแน่น" ของน้อยกว่าจำนวนมากข้อมูลที่มีความจุมากขึ้น ในกรณีนี้ "คอนเดนเสท" ที่ได้รับข้อมูลจะต้องแสดงด้วยลักษณะเชิงปริมาณที่สำคัญที่สุดและกำหนด

แนวคิดของ "การวิเคราะห์ปัจจัย" ไม่จำเป็นต้องผสมกับแนวคิดที่แพร่หลายของการวิเคราะห์ความสัมพันธ์เชิงสาเหตุเมื่ออิทธิพลของปัจจัยต่าง ๆ (การรวมกันของพวกเขารวมกัน) กำลังศึกษาอยู่ในพื้นฐานการผลิต

สาระสำคัญของวิธีการวิเคราะห์ปัจจัยคือการยกเว้นคำอธิบายของลักษณะที่หลากหลายของการศึกษาและการแทนที่ด้วยจำนวนข้อมูลที่น้อยลงและตัวแปรที่มีความกว้างมากขึ้นซึ่งเรียกว่าปัจจัยและสะท้อนถึงคุณสมบัติที่สำคัญที่สุดของปรากฏการณ์ ตัวแปรดังกล่าวเป็นคุณสมบัติบางอย่างของสัญญาณต้นทาง

การวิเคราะห์ตามที่คุณ Perch 9 ช่วยให้คุณมีลักษณะโดยประมาณแรกของรูปแบบที่อยู่ภายใต้ปรากฏการณ์ที่กำหนดไว้ก่อนหน้าข้อสรุปทั่วไปเกี่ยวกับทิศทางที่ควรดำเนินการวิจัยเพิ่มเติม นอกจากนี้ยังบ่งบอกถึงสมมติฐานหลักของการวิเคราะห์ปัจจัยซึ่งลดลงสู่ความจริงที่ว่าปรากฏการณ์แม้จะมีความแตกต่างและความแปรปรวนของมันสามารถอธิบายได้โดยหน่วยการทำงานจำนวนน้อยพารามิเตอร์หรือปัจจัย วันที่เหล่านี้เรียกว่าแตกต่างกัน: อิทธิพล, สาเหตุ, พารามิเตอร์, หน่วยการทำงาน, ความสามารถ, ตัวบ่งชี้พื้นฐานหรืออิสระ การใช้คำหนึ่งหรืออีกคำเกิดขึ้นเนื่องจาก

Okun I. การวิเคราะห์ปัจจัย: ต่อ จาก. พื้น. M.: สถิติ 1974.- P.16

บริบทของปัจจัยและความรู้เกี่ยวกับสาระสำคัญของปรากฏการณ์ที่ศึกษา

ขั้นตอนการวิเคราะห์ปัจจัยมีการเปรียบเทียบปัจจัยต่าง ๆ ของปัจจัยและตัวเลือกต่าง ๆ ต่อกลุ่มที่มีการรวมการปิดและประเมินความน่าเชื่อถือของความแตกต่างระหว่างกลุ่ม

V.M. Zhukovska และ I.B. Mutnik 10 พูดถึงสาระสำคัญของงานของการวิเคราะห์ปัจจัยที่อ้างว่าหลังไม่จำเป็นต้องมีการแบ่งแยะของตัวแปรที่พึ่งพาและเป็นอิสระเนื่องจากตัวแปรทั้งหมดได้รับการพิจารณาว่าเท่ากัน

งานการวิเคราะห์ปัจจัยจะลดลงให้กับแนวคิดบางอย่างจำนวนและลักษณะของลักษณะการทำงานที่สำคัญที่สุดและมีความเป็นอิสระมากที่สุดของปรากฏการณ์เมตรหรือพารามิเตอร์พื้นฐาน - ปัจจัย ตามที่ผู้เขียนคุณสมบัติที่สำคัญที่สำคัญของการวิเคราะห์ปัจจัยคือช่วยให้คุณสำรวจตัวแปรที่มีความสัมพันธ์กันจำนวนมากโดยไม่มีสมมติฐานเกี่ยวกับ "ความคงค้างของเงื่อนไขอื่น ๆ ทั้งหมด" ตามความจำเป็นเมื่อใช้วิธีการวิเคราะห์อื่น ๆ จำนวนมาก นี่คือข้อได้เปรียบที่ยอดเยี่ยมของการวิเคราะห์ปัจจัยเป็นเครื่องมือการศึกษาที่มีค่าของปรากฏการณ์เนื่องจากความหลากหลายและโรงกลั่นที่ซับซ้อนของการเชื่อมต่อ

การวิเคราะห์ส่วนใหญ่ขึ้นอยู่กับการตรวจสอบความแปรปรวนที่แตกต่างกันตามธรรมชาติ

1. เมื่อใช้การวิเคราะห์ปัจจัยชุดตัวแปรที่ศึกษาจากมุมมองของลิงก์ระหว่างพวกเขาไม่ได้เลือกโดยพลการ: วิธีนี้ช่วยให้คุณสามารถระบุปัจจัยหลักที่มีผลกระทบอย่างมีนัยสำคัญในพื้นที่นี้

2. การวิเคราะห์ไม่จำเป็นต้องมีสมมติฐานเบื้องต้นในทางตรงกันข้ามตัวมันเองสามารถใช้เป็นสมมติฐานที่ขยายไปรวมถึงการทำหน้าที่เป็นเกณฑ์ของสมมติฐานตามข้อมูลที่ได้จากวิธีอื่น

3. การวิเคราะห์ไม่ต้องการการคาดเดาก่อนที่ตัวแปรใดที่มีความเป็นอิสระและขึ้นอยู่กับมันไม่ได้เป็น hypertrophies การสื่อสารเชิงสาเหตุและแก้ไขปัญหาในขอบเขตของกระบวนการวิจัยเพิ่มเติม

รายการงานที่เฉพาะเจาะจงแก้ไขโดยใช้วิธีการวิเคราะห์ปัจจัยจะเป็นเช่นนั้น (โดย V.M. Zhukovskoy) มาเรียกหลักการหลักในสาขาการวิจัยทางเศรษฐกิจและสังคม:

Zhukovskaya V.M. , Muchnik I.B. การวิเคราะห์ปัจจัยในการวิจัยทางเศรษฐกิจและสังคม -Station, 1976 P.4

1. การกำหนดลักษณะหลักของความแตกต่างระหว่างวัตถุสังเกต (คำอธิบายการย่อขนาดเล็ก)

2. ถ้อยคำของสมมติฐานเกี่ยวกับลักษณะของความแตกต่างระหว่างวัตถุ

3. การตรวจจับโครงสร้างของความสัมพันธ์ระหว่างสัญญาณ

4. ตรวจสอบสมมติฐานเกี่ยวกับความสัมพันธ์และการสลับการเชื่อมต่อของสัญญาณ

5. การเปรียบเทียบโครงสร้างชุดลักษณะ

6. การย่อยสัดคองของการสังเกตวัตถุสำหรับคุณสมบัติทั่วไป

ข้างต้นหมายถึงความเป็นไปได้ที่ยอดเยี่ยมของการวิเคราะห์ปัจจัยใน

การศึกษาปรากฏการณ์ทางสังคมที่ตามกฎแล้วมันเป็นไปไม่ได้ที่จะควบคุม (ทดลอง) อิทธิพลของปัจจัยแต่ละอย่าง

มันค่อนข้างมีประสิทธิภาพในการใช้ผลลัพธ์ของการวิเคราะห์ปัจจัยในแบบจำลองการถดถอยหลายแบบ

การมีรูปแบบการถดถอยที่มีความสัมพันธ์ที่กำหนดไว้ในปรากฏการณ์การศึกษาในรูปแบบของสัญญาณที่มีความสัมพันธ์โดยใช้การวิเคราะห์ปัจจัยคุณสามารถเป็นชุดของสัญญาณเพื่อเปลี่ยนเป็นตัวเลขที่เล็กลงอย่างมีนัยสำคัญโดยการรวม ในกรณีนี้ควรสังเกตว่าการเปลี่ยนแปลงดังกล่าวไม่เสื่อมสภาพในทางใดทางหนึ่งและกรอกข้อมูลเกี่ยวกับปรากฏการณ์ที่พิจารณา สัญญาณรวมที่สร้างขึ้นนั้นไม่เกี่ยวข้องและแสดงการผสมผสานเชิงเส้นของสัญญาณหลัก ด้วยด้านทางคณิตศาสตร์อย่างเป็นทางการการตั้งค่างานในกรณีนี้อาจมีการแก้ปัญหาหลายอย่างที่ไม่มีที่สิ้นสุด แต่จะต้องจำไว้ว่าเมื่อศึกษาปรากฏการณ์ทางเศรษฐกิจและสังคมสัญญาณรวมที่ได้รับจะต้องมีการตีความทางเศรษฐกิจ กล่าวอีกนัยหนึ่งในกรณีใด ๆ ของการใช้เครื่องมือทางคณิตศาสตร์ก่อนอื่นใดที่สามารถมองเห็นความรู้เกี่ยวกับสาระสำคัญทางเศรษฐกิจของปรากฏการณ์ที่ศึกษา

ดังนั้นข้างต้นข้างต้นช่วยให้คุณสรุปการวิเคราะห์ปัจจัยนั้นเป็นวิธีการศึกษาที่เฉพาะเจาะจงซึ่งดำเนินการบนพื้นฐานของอาร์เซนอลของวิธีการของสถิติทางคณิตศาสตร์

การวิเคราะห์ปัจจัยแรกพบการใช้งานจริงในสาขาจิตวิทยา ความสามารถในการลดการทดสอบทางจิตวิทยาจำนวนมากให้กับปัจจัยจำนวนเล็กน้อยทำให้สามารถอธิบายความสามารถของความฉลาดของมนุษย์

ในการศึกษาปรากฏการณ์ทางเศรษฐกิจและสังคมที่มีปัญหาในการแยกอิทธิพลของตัวแปรแต่ละตัวสามารถใช้การวิเคราะห์ปัจจัยได้สำเร็จ การใช้เทคนิคของมันช่วยให้การคำนวณบางอย่างเป็น "โปรไฟล์" สัญญาณที่ไม่มีนัยสำคัญและดำเนินการวิจัยต่อไปในทิศทางที่ลึกซึ้งยิ่งขึ้น

ประสิทธิผลของวิธีการนี้เห็นได้ชัดในการศึกษาปัญหาดังกล่าว (ปัญหา): ในเศรษฐกิจ - ความเชี่ยวชาญและความเข้มข้นของการผลิตความเข้มของการจัดการเศรษฐกิจงบประมาณของครอบครัวการก่อสร้างตัวบ่งชี้ทั่วไปทั่วไป อื่น ๆ

การวิเคราะห์ทางสถิติหลายมิติ

ส่วนคณิตศาสตร์ สถิติที่ทุ่มเทให้กับคณิตศาสตร์ วิธีการสำหรับการสร้างแผนการเก็บรวบรวมที่ดีที่สุดการจัดระบบและการประมวลผลสถิติสถิติหลายมิติ ข้อมูลมีวัตถุประสงค์เพื่อระบุลักษณะและโครงสร้างของความสัมพันธ์ระหว่างส่วนประกอบของลักษณะหลายมิติภายใต้การศึกษาและมีไว้สำหรับการรับทางวิทยาศาสตร์และการปฏิบัติ บทสรุป ภายใต้เครื่องหมายหลายมิติตัวบ่งชี้ P-DIMENSION (สัญญาณตัวแปร) อาจเป็น: เชิงปริมาณ, I.e. , วัดในระดับที่เฉพาะเจาะจงของการรวมตัวของวัตถุที่กำลังศึกษา, N-ROW (หรือ ordinal), i.e. อนุญาตให้เรียงลำดับการวิเคราะห์ วัตถุตามระดับของการรวมตัวของทรัพย์สินภายใต้การศึกษา และการจำแนกประเภท (หรือระบุ), I.e. อนุญาตให้ทำลายชุดของวัตถุสำหรับชุดที่ไม่ใช่การสั่งซื้อ (ตามคุณสมบัติการวิเคราะห์) ผลการวัดของตัวบ่งชี้เหล่านี้

แต่ละส่วนของการศึกษาภายใต้การศึกษาการสังเกตหลายมิติเกิดขึ้นหรืออาร์เรย์ต้นฉบับของข้อมูลหลายมิติสำหรับ M. S แต่. ส่วนสำคัญของ M. S แต่. ให้บริการสถานการณ์ที่คุณลักษณะหลายมิติที่ศึกษาถูกตีความว่าเป็นหลายมิติและตามลำดับของการสังเกตหลายมิติ (1) มาจากประชากรทั่วไป ในกรณีนี้การเลือกวิธีการประมวลผลสถิติสถิติแหล่งที่มาของการประมวลผล ข้อมูลและการวิเคราะห์คุณสมบัติของพวกเขานั้นเกิดขึ้นบนพื้นฐานของสมมติฐานบางอย่างเกี่ยวกับลักษณะของกฎหมายหลายมิติ (ร่วม) ของการกระจายความน่าจะเป็น

การวิเคราะห์ทางสถิติหลายมิติของการแจกแจงหลายมิติและลักษณะหลักครอบคลุมเฉพาะสถานการณ์ที่การสังเกตที่ผ่านการประมวลผล (1) มีลักษณะที่น่าจะเป็นไปได้นั่นคือการตีความว่าเป็นตัวอย่างจากประชากรทั่วไปที่สอดคล้องกัน งานหลักของส่วนย่อยนี้รวมถึง: สถิติ การประเมินผลการจัดจำหน่ายหลายมิติศึกษาลักษณะและพารามิเตอร์หลักของพวกเขา การศึกษาคุณสมบัติของสถิติที่ใช้แล้ว ประมาณการ; การสอบสวนการแจกแจงความน่าจะเป็นสำหรับสถิติจำนวนมากมีการสร้างสถิติโดยใช้ To-Rykh เกณฑ์สำหรับการตรวจสอบสมมติฐานต่าง ๆ เกี่ยวกับลักษณะที่น่าจะเป็นของข้อมูลหลายมิติที่วิเคราะห์ ผลลัพธ์หลักหมายถึงกรณีส่วนตัวเมื่อคุณสมบัติการศึกษาถูกด้อยค่าเป็นกฎหมายการจัดจำหน่ายปกติหลายมิติฟังก์ชั่นความหนาแน่นของ K-Pogo ได้รับจากความสัมพันธ์

ที่ไหน - คณิตศาสตร์เวกเตอร์ องค์ประกอบที่คาดหวังของตัวแปรสุ่ม i.e. - เมทริกซ์ Covariance ของเวกเตอร์สุ่ม T E. -Covariance ของส่วนประกอบของเวกเตอร์ (ถือว่าเป็นกรณี nondegenerate เมื่อมิฉะนั้น IE ในระหว่างอันดับผลลัพธ์ทั้งหมดยังคงเป็นธรรม แต่เกี่ยวข้องกับพื้นที่ย่อยของขนาดเล็ก มิติมันกลายเป็นความเข้มข้นของเวกเตอร์สุ่มแบบพื้นฐาน)

ดังนั้นถ้า (1) เป็นลำดับของการสังเกตอิสระที่สร้างตัวอย่างแบบสุ่มจากการประมาณการความเป็นไปได้สูงสุดสำหรับพารามิเตอร์และการเข้าร่วมใน (2) เป็นสถิติตาม (ดู)

และเวกเตอร์สุ่มขึ้นอยู่กับกฎหมายปกติ P-Dimensional และไม่ได้ขึ้นอยู่กับและการกระจายข้อต่อขององค์ประกอบของเมทริกซ์อธิบายโดย T.N การกระจายของ Wisha RR A (ดู) เพื่อ

ภายในกรอบรูปแบบเดียวกันการกระจายและช่วงเวลาของลักษณะการคัดเลือกดังกล่าวของตัวแปรสุ่มแบบหลายมิติเป็นค่าสัมประสิทธิ์ของคู่ที่เป็นส่วนตัวและความสัมพันธ์ที่หลากหลายทั่วไป (เช่น) สถิติทั่วไปของ Wishligh (See) ถูกตรวจสอบ . โดยเฉพาะอย่างยิ่ง (ดู) หากกำหนดให้เป็น Matrix Covariance ที่คัดเลือกประมาณการกล่าวคือ "ในความล้มเหลว" คือ:

จากนั้นตัวแปรสุ่ม พยายามเมื่อและตัวแปรสุ่ม

ผู้ใต้บังคับบัญชากับการกระจาย F กับจำนวนองศาของอิสรภาพตามลำดับ (P, P-P) และ (p, P 1 + P 2 -R-1) ในความสัมพันธ์ (7) p 1 และ N 2 เป็นปริมาณของตัวอย่างอิสระสองตัวอย่าง (1) สกัดจากการรวมทั่วไปเดียวกัน - ประมาณการของแบบฟอร์ม (3) และ (4) - (5) สร้างขึ้นตามตัวอย่างที่ i-th และ

ความแปรปรวนร่วมแบบเลือกทั่วไปสร้างขึ้นตามการประมาณการและ

การวิเคราะห์ทางสถิติหลายมิติของธรรมชาติและโครงสร้างของการเชื่อมโยงองค์ประกอบของคุณสมบัติหลายมิติที่ศึกษารวมแนวคิดและผลลัพธ์ที่ให้บริการวิธีการดังกล่าวและรุ่น M. S เช่นเดียวกับหลายมิติหลายมิติ การวิเคราะห์การกระจายตัว และ การวิเคราะห์ความแปรปรวนการวิเคราะห์ปัจจัย และวิธีการหลักองค์ประกอบการวิเคราะห์ของ Canonical ความสัมพันธ์ ผลลัพธ์ที่ประกอบไปด้วยเนื้อหาของส่วนย่อยนี้สามารถแบ่งเป็นสองประเภทหลัก

1) การสร้างสถิติที่ดีที่สุด (ในบางอย่าง) ประมาณการสำหรับพารามิเตอร์ของรุ่นที่กล่าวถึงและการวิเคราะห์คุณสมบัติของพวกเขา (ความถูกต้องและในการกำหนดความน่าจะเป็นของกฎหมายของการกระจายของพวกเขาที่เชื่อถือได้: ภูมิภาค ฯลฯ ) ดังนั้นให้คุณลักษณะหลายมิติที่ศึกษาตีความว่าเป็นการสุ่มเวกเตอร์, ผู้ใต้บังคับบัญชากับการกระจายปกติของ p-dimensional และถูกผ่าโดยสองเซกเตอร์ - คอลัมน์และมิติของ Q และ P-Qsensity สิ่งนี้จะกำหนดการย่อยสลายของเวกเตอร์คณิตศาสตร์ที่สอดคล้องกัน ความคาดหวัง, การประชุมทางทฤษฎีและการคัดเลือก covariance, คือ:

จากนั้น (ดู) ของมิเตอร์ (หากว่าผู้สนับสนุนที่สองยอมรับค่าคงที่) จะเป็นปกติ) ในกรณีนี้การประมาณการของการเชื่อสูงสุด สำหรับเมทริกซ์ของค่าสัมประสิทธิ์การถดถอยและ Covariatsin ของรุ่นหลายมิติคลาสสิกของการถดถอยหลายครั้ง

จะมีสถิติอิสระร่วมกันตามลำดับ

ที่นี่การกระจายการประเมินจะด้อยสิทธิตามกฎหมายระหว่างประเทศ และการประมาณการของ P - กฎหมายที่มีความสุขกับพารามิเตอร์และ (องค์ประกอบของเมทริกซ์ Covariance จะแสดงในแง่ขององค์ประกอบของเมทริกซ์)

ผลลัพธ์หลักในการก่อสร้างการประมาณการพารามิเตอร์และการศึกษาคุณสมบัติของพวกเขาในรูปแบบของปัจจัย "การวิเคราะห์องค์ประกอบหลักและบัญญัติความสัมพันธ์หมายถึงการวิเคราะห์สถิติความน่าจะเป็นคุณสมบัติของคุณค่าของตัวเอง (ลักษณะ) และเวกเตอร์ ของการเลือกความแปรปรวนใจที่หลากหลาย

ในรูปแบบที่ไม่เหมาะกับกรอบของคลาสสิก แบบจำลองปกติและมากขึ้นดังนั้นในกรอบรูปแบบที่น่าจะเป็นผลลัพธ์หลักหมายถึงการสร้างอัลกอริทึม (และการศึกษาคุณสมบัติของพวกเขา) การคำนวณการประมาณการของพารามิเตอร์ที่ดีที่สุดในแง่ของ NE-PORO ของ รูปแบบการทำงานที่มีคุณภาพที่ระบุไว้ภายนอก (อ้างอิง)

2) การสร้างสถิติ เกณฑ์สำหรับการทดสอบสมมติฐานต่าง ๆ เกี่ยวกับโครงสร้างของความสัมพันธ์ระหว่างการศึกษา เป็นส่วนหนึ่งของโมเดลปกติหลายมิติ (ลำดับของการสังเกตของแบบฟอร์ม (1) มันถูกตีความว่าเป็นตัวอย่างสุ่มจากการรวมทั่วไปทั่วไปหลายมิติที่สอดคล้องกัน) เช่นสถิติ เกณฑ์สำหรับการตรวจสอบสมมติฐานต่อไปนี้

I. สมมติฐานเกี่ยวกับความเท่าเทียมกันของคณิตศาสตร์เวกเตอร์ ความคาดหวังของตัวชี้วัดภายใต้การศึกษาที่ระบุเวกเตอร์เฉพาะ; ตรวจสอบด้วยความช่วยเหลือของสถิติของ WishLigh ด้วยการเปลี่ยนตัวในสูตร (6)

ครั้งที่สอง สมมติฐานเกี่ยวกับความเท่าเทียมกันของเวกเตอร์คณิตศาสตร์ ความคาดหวังในการรวมทั่วไปสองครั้ง (เหมือนกัน แต่ไม่ทราบความแปรปรวนในการแปรปรวน) ที่แสดงโดยสองตัวอย่าง; ตรวจสอบกับสถิติ (ดู)

สาม. สมมติฐานเกี่ยวกับความเท่าเทียมกันของเวกเตอร์คณิตศาสตร์ ความคาดหวังในการทำงานร่วมกันทั่วไปหลายครั้ง (ที่มีเหตุการณ์เดียวกัน แต่ไม่ทราบ Covariance Matrices) ส่งตัวอย่างของพวกเขา; ตรวจสอบโดยสถิติ

ใน Ki-Roy มีการสังเกต IE แบบมิติในตัวอย่างของปริมาณที่แสดงถึง Jr. รวมทั่วไป A และ - ประมาณการของแบบฟอร์ม (3) สร้างแยกต่างหากสำหรับแต่ละตัวอย่างและในตัวอย่างรวมของ ระดับเสียง

IV สมมติฐานเกี่ยวกับการเทียบเท่ากับการรวมทั่วไปทั่วไปหลายครั้งที่ส่งโดยตัวอย่างของพวกเขาจะถูกตรวจสอบโดยสถิติ

ใน Ki-Roy - การประเมินแบบฟอร์ม (4) สร้างแยกต่างหากโดยการสังเกต j- yexibers, j \u003d 1, 2, ... , k.

V. สมมติฐานในความเป็นอิสระร่วมกันของคอลัมน์ Lizenness รองรับตามลำดับบน K-RYE เผยแพร่เวกเตอร์ P-Dimensional เริ่มต้นของตัวบ่งชี้การทดสอบจะถูกตรวจสอบโดยสถิติ

ใน K-Roy และ - Matrices Covariance แบบเลือกของแบบฟอร์ม (4) สำหรับเวกเตอร์ทั้งหมดและสถานที่ของมัน เอ็กซ์ (i) ตามลำดับ

การวิเคราะห์ทางสถิติหลายมิติของโครงสร้างทางเรขาคณิตของชุดการตรวจสอบการสังเกตหลายมิติผสมผสานแนวคิดและผลลัพธ์ของรูปแบบและรูปแบบดังกล่าวเป็น การวิเคราะห์การจำแนก ส่วนผสมของการกระจายความน่าจะเป็นการวิเคราะห์คลัสเตอร์และอนุกรมวิธาน, การปรับขนาดหลายมิติ แนวคิดของระยะทาง (มาตรการความใกล้เคียงมาตรการความคล้ายคลึงกัน) ระหว่างองค์ประกอบที่วิเคราะห์นั้นเป็นโหนดในรูปแบบเหล่านี้ทั้งหมด ในเวลาเดียวกันกับวัตถุจริงค่าของตัวบ่งชี้จะถูกบันทึกการวิเคราะห์ในแต่ละอันจากนั้น Geometrich ภาพของวัตถุที่สำรวจ I-TH จะเป็นจุดในพื้นที่ P-Dimensional ที่สอดคล้องกันและตัวบ่งชี้ตัวเองเองนั้น Geometrich ตัวบ่งชี้ L-TH จะเป็นจุดในพื้นที่ N-Dimensional ที่สอดคล้องกัน

วิธีการและผลลัพธ์ของการวิเคราะห์แบบแยกแยะ (ดู ,,) ถูกส่งไปที่งานต่อไป มันเป็นที่รู้จักเกี่ยวกับการมีอยู่ของจำนวนรวมของการรวมทั่วไปและนักวิจัยมีหนึ่งตัวอย่างจากแต่ละทั้งหมด ("ตัวอย่างการฝึกอบรม") จำเป็นต้องสร้างตัวอย่างการจำแนกประเภทที่ดีที่สุดในความหมายซึ่งช่วยให้คุณสามารถระบุองค์ประกอบใหม่ใหม่ (การสังเกต) ให้กับประชากรทั่วไปของคุณในสถานการณ์ที่นักวิจัยไม่เป็นที่รู้จักในการรวมองค์ประกอบนี้ เป็นของ โดยปกติภายใต้กฎการจำแนกลำดับของการกระทำที่เข้าใจ: ในการคำนวณฟังก์ชั่นสเกลาร์จากตัวบ่งชี้การทดสอบภายใต้ผู้ตรวจสอบตามค่าของ K-Roy การตัดสินใจจะถูกสร้างขึ้นเพื่อกำหนดองค์ประกอบหนึ่งใน ชั้นเรียน (สร้างฟังก์ชั่นการจำแนก); ในการสั่งตัวบ่งชี้ตัวเองตามระดับของข้อมูลของพวกเขาในแง่ของการระบุที่เหมาะสมขององค์ประกอบในการเรียน โดยการคำนวณความน่าจะเป็นที่สอดคล้องกันของการจำแนกประเภทที่ผิดพลาด

ภารกิจในการวิเคราะห์ส่วนผสมของการแจกแจงความน่าจะเป็น (ดู) บ่อยที่สุด (แต่ไม่เสมอไป) เกิดขึ้นในการเชื่อมต่อกับการศึกษา "โครงสร้างทางเรขาคณิต" ของประชากรทั้งหมด ในกรณีนี้แนวคิดของชั้นเรียนที่เป็นเนื้อเดียวกัน R-TH ได้รับความช่วยเหลือจากประชากรทั่วไปที่อธิบายโดยกฎหมายการจัดจำหน่ายบางอย่าง (ตามกฎเกณฑ์ที่แตกต่างกัน) เพื่อให้การกระจายของชุดทั่วไปทั่วไปตัวอย่าง (1 ) สกัดจากฝูงถูกอธิบายโดยส่วนผสมของการกระจายของสปีชีส์ที่ PR - ความน่าจะเป็น Priori (องค์ประกอบเฉพาะ) ของคลาส R ในประชากรทั่วไปทั่วไป งานคือสถิติ "ดี" การประเมิน (ตามตัวอย่าง) ของพารามิเตอร์ที่ไม่รู้จักและบางครั้งและ ถึง. โดยเฉพาะอย่างยิ่งช่วยให้คุณสามารถลดงานการจำแนกองค์ประกอบให้กับโครงการวิเคราะห์แบบแยกแยะแม้ว่าในกรณีนี้ไม่มีตัวอย่างการฝึกอบรม

วิธีการและผลการวิเคราะห์คลัสเตอร์ (การจำแนกประเภทอนุกรมวิธานการรับรู้ของภาพ "โดยไม่มีครู" ดู ,,) มีวัตถุประสงค์เพื่อแก้ปัญหาต่อไปนี้ Geometrich ชุดการวิเคราะห์องค์ประกอบจะได้รับจากพิกัดของจุดที่สอดคล้องกัน (i.e. , matrix ... , n) , หรือชุดของ Geometrich ลักษณะของสถานที่ร่วมกันของพวกเขาตัวอย่างเช่นเมทริกซ์ของระยะทางคู่ จำเป็นต้องทุบชุดขององค์ประกอบที่มีการศึกษาในชั้นเรียนที่ค่อนข้างเล็ก (รู้จักหรือไม่) เพื่อให้องค์ประกอบของคลาสเดียวกันอยู่ในระยะทางสั้น ๆ ในขณะที่คลาสที่แตกต่างกันจะเชื่อมต่อกันจากกันและกันและจะ ไม่แบ่งออกเป็นส่วนต่าง ๆ ที่ถูกลบออกจากกัน

ปัญหาของการปรับสเกลหลายมิติ (ดู) หมายถึงสถานการณ์เมื่อจำนวนทั้งสิ้นขององค์ประกอบถูกตั้งค่าโดยใช้คู่ของระยะทางคู่คู่และมีสาเหตุมาจากองค์ประกอบแต่ละองค์ประกอบของจำนวนที่กำหนด (p) ของพิกัดเพื่อให้โครงสร้างของคู่ ระยะทางซึ่งกันและกันระหว่างองค์ประกอบที่วัดโดยใช้พิกัดเสริมเหล่านี้โดยเฉลี่ยมีความแตกต่างกันน้อยที่สุดจากที่ระบุ ควรสังเกตว่าผลลัพธ์หลักและวิธีการวิเคราะห์คลัสเตอร์และการปรับสเกลหลายมิติมักจะมีการพัฒนาโดยไม่มีข้อสันนิษฐานของลักษณะที่น่าจะเป็นของแหล่งข้อมูล

วัตถุประสงค์ที่ประยุกต์ใช้ของการวิเคราะห์ทางสถิติหลายมิติประกอบด้วยการให้บริการปัญหาสามประการต่อไปนี้

ปัญหาการศึกษาทางสถิติของการพึ่งพาระหว่างตัวบ่งชี้วิเคราะห์ สมมติว่าชุดการศึกษาของตัวบ่งชี้ที่บันทึกไว้ทางสถิติของ Xbrit ตามความหมายที่มีความหมายของตัวบ่งชี้เหล่านี้และวัตถุประสงค์สุดท้ายของการศึกษาใน Q-Mernene การสนับสนุน (ขึ้นอยู่กับ) ตัวแปร (PQ) -Mer-Dimensional Suspension (อิสระ) ตัวแปรอาจกล่าวได้ว่าปัญหาคือการตรวจสอบบนพื้นฐานของตัวอย่าง (1) ของฟังก์ชั่นเวกเตอร์ Q-Dimensional จากคลาสของโซลูชันที่อนุญาต f, K-Paradium จะให้สิ่งที่ดีที่สุดในบางความหมายการประมาณพฤติกรรมของตัวบ่งชี้ของตัวบ่งชี้ ขึ้นอยู่กับประเภทของการทำงานที่เฉพาะเจาะจงของคุณภาพของการประมาณและธรรมชาติตัวชี้วัดที่วิเคราะห์มาถึงเหล่านั้นหรือแผนการอื่น ๆ ของการถดถอยหลายการกระจายความแปรปรวนร่วมหรือการวิเคราะห์การข่มขู่

ปัญหาของการจำแนกประเภทขององค์ประกอบ (วัตถุหรือตัวบ่งชี้) ในสูตรทั้งหมด (ไม่ใช่จังหวะ) คือชุดการวิเคราะห์ทั้งหมดขององค์ประกอบซึ่งเป็นรายการทางสถิติในรูปแบบของเมทริกซ์หรือเมทริกซ์แบ่งออกเป็นจำนวนที่ค่อนข้างน้อย ของเนื้อที่แข็งในบางความหมายกลุ่ม ขึ้นอยู่กับลักษณะของข้อมูล A Priori และประเภทของการทำงานที่เฉพาะเจาะจงซึ่งระบุเกณฑ์คุณภาพการจำแนกประเภทนี้มาที่แผนการการวิเคราะห์แบบแยกแยะการวิเคราะห์คลัสเตอร์ (อนุกรมวิธานการจดจำภาพ "โดยไม่มีครู") .

ปัญหาของการลดมิติของการศึกษาพื้นที่ของปัจจัยและการเลือกตัวบ่งชี้ที่ให้ข้อมูลมากที่สุดคือการกำหนดชุดของจำนวนที่ค่อนข้างเล็กที่พบในชั้นเรียนการแปลงที่อนุญาตของตัวบ่งชี้แหล่งที่มา อันดับต้น ๆ ของมาตรการพิเศษที่ระบุของสารสนเทศของระบบ M-Dimensional ของสัญญาณสามารถทำได้ใน K-ROM (ดู) สเปคของการใช้งานการกำหนดมาตรการของ AutoInformativity (เช่นมีวัตถุประสงค์เพื่อเพิ่มการเก็บรักษาข้อมูลที่มีอยู่ในสถิติอาร์เรย์ (1) เมื่อเทียบกับสัญญาณแหล่งที่มา) โดยเฉพาะอย่างยิ่งกับแผนการวิเคราะห์ปัจจัยต่าง ๆ และส่วนประกอบหลัก วิธีการของสัญญาณที่รุนแรงของสัญญาณ ฟังก์ชั่นการกำหนดมาตรการของข้อมูลภายนอก I.e. มุ่งเป้าไปที่การสกัดจาก (1) ข้อมูลสูงสุดที่สัมพันธ์กับอื่น ๆ ไม่ได้อยู่ใน F, บ่งบอกหรือปรากฏการณ์นำไปสู่วิธีการที่หลากหลายของการเลือกตัวบ่งชี้ที่ให้ข้อมูลมากที่สุดในรูปแบบสถิติ การศึกษาการพึ่งพาและการวิเคราะห์แบบแยกแยะ

เครื่องมือทางคณิตศาสตร์หลักของ M. S แต่. วิธีการพิเศษของการทฤษฎีของระบบสมการเชิงเส้นและทฤษฎีของเมทริกซ์ (วิธีการแก้ปัญหาที่เรียบง่ายและทั่วไปของ Eigenvalues \u200b\u200bและเวกเตอร์ได้ทำการรักษาอย่างง่ายและการก่อตัวแบบหลอกของเมทริกซ์; ขั้นตอนสำหรับ diagonalization ของเมทริกซ์ ฯลฯ .) และอัลกอริทึมการเพิ่มประสิทธิภาพบางอย่าง (วิธีการประสานการผันผวนแบบคอนจูเกตสาขาและเส้นขอบรุ่นต่าง ๆ ของการค้นหาแบบสุ่มและสโตรสแตร์การประมาณ ฯลฯ )

ไฟ: Anderson T. , บทนำสู่การวิเคราะห์ทางสถิติหลายมิติ, ต่อ จากภาษาอังกฤษ, M. , 1963; Kendall M. J. , Stouture A. , การวิเคราะห์ทางสถิติหลายมิติและแถวชั่วคราวต่อ จากภาษาอังกฤษ, M. , 1976; Bolshev L. N. , "Bull. Int สถิติ.", 1969, หมายเลข 43, p. 425-41; Wishhart .j., "Biometrika", 1928, v. 20a, p. 32-52: Hotelling H. , "แอนคณิตศาสตร์สถิติ.", 1931, v. 2, p. 360-78; [ใน] Cruskal J. V. , "Psychometrika", 1964, v. 29, p. 1-27; Ivazyan S. A. , Bejaev 3. I. . Starovrov O. V. การจำแนกประเภทของการสังเกตหลายมิติ, M. , 1974

S. A. Awazyan

สารานุกรมคณิตศาสตร์ - ม.: สารานุกรมโซเวียต. I. M. Vinogradov 2520-2528

ไดเรกทอรีนักแปลทางเทคนิค

ส่วนของสถิติทางคณิตศาสตร์ (ดู) ทุ่มเทให้กับคณิตศาสตร์ วิธีการที่มีวัตถุประสงค์เพื่อระบุลักษณะและโครงสร้างของความสัมพันธ์ระหว่างองค์ประกอบของลักษณะหลายมิติภายใต้การศึกษา (ดู) และมีไว้สำหรับการรับทางวิทยาศาสตร์ และการปฏิบัติ ... ...

ในความรู้สึกกว้างส่วนของสถิติทางคณิตศาสตร์ (ดูสถิติทางคณิตศาสตร์) ซึ่งรวมวิธีการศึกษาข้อมูลทางสถิติที่เกี่ยวข้องกับวัตถุที่โดดเด่นด้วยคุณภาพสูงหรือเชิงปริมาณ ... สารานุกรมโซเวียตที่ยิ่งใหญ่

การวิเคราะห์สถิติหลายมิติ - ส่วนของสถิติทางคณิตศาสตร์ที่ออกแบบมาเพื่อวิเคราะห์การเชื่อมโยงระหว่างสามตัวแปรและอื่น ๆ คุณสามารถจัดสรรอย่างมีเงื่อนไขสามงานระดับพื้นฐานกันน. นี่คือการศึกษาโครงสร้างของการเชื่อมโยงระหว่างตัวแปรและการลดขนาดของพื้นที่ ... สังคมวิทยา: สารานุกรม

การวิเคราะห์ความแปรปรวนร่วม - - ชุดวิธีคณิตศาสตร์ สถิติที่เกี่ยวข้องกับการวิเคราะห์แบบจำลองของค่าเฉลี่ยของค่าเฉลี่ยของตัวแปรสุ่มบางตัว Y จากชุดของปัจจัยที่ไม่เงียบและพร้อมกันจากชุดของปัจจัยเชิงปริมาณ X ด้วยความเคารพต่อ y ... สารานุกรมสังคมวิทยารัสเซีย

ส่วนคณิตศาสตร์ สถิติเนื้อหาของ Ryo คือการพัฒนาและศึกษาสถิติ วิธีการแก้ปัญหาความแตกต่างดังต่อไปนี้ (การเลือกปฏิบัติ): ขึ้นอยู่กับผลของการสังเกตกำหนดว่าเป็นไปได้หลายประการ ... สารานุกรมคณิตศาสตร์, Orlova Irina Valenovna, End Natalya Valerievna, Turununaevsky Viktor Borisovich หนังสือเล่มนี้อุทิศให้กับการวิเคราะห์ทางสถิติหลายมิติ (MSA) และองค์กรการคำนวณบน MES ในการใช้วิธีการสถิติหลายมิติโปรแกรมการเขียนโปรแกรมใช้สถิติ ...

การวิเคราะห์ทางสถิติหลายมิติใช้ในการแก้ปัญหาต่อไปนี้:

* ศึกษาความสัมพันธ์ระหว่างสัญญาณ
* การจำแนกประเภทของวัตถุหรือสัญญาณที่ระบุโดยเวกเตอร์;
* ลดมิติของสัญญาณของสัญญาณ

ในกรณีนี้ผลลัพธ์ของการสังเกตคือเวกเตอร์ของค่าของจำนวนคงที่ของเชิงปริมาณและบางครั้งสัญญาณคุณภาพสูงที่วัดได้ที่วัตถุ คุณสมบัติเชิงปริมาณเป็นสัญญาณของหน่วยที่สังเกตได้ซึ่งสามารถแสดงได้โดยตรงจากจำนวนและหน่วยการวัด คุณสมบัติเชิงปริมาณตรงข้ามกับเชิงคุณภาพ - สัญญาณของหน่วยที่สังเกตได้กำหนดโดยการมอบหมายให้หนึ่งในสองหมวดหมู่ตามเงื่อนไข (หากมีสองหมวดหมู่สัญญาณเรียกว่าเป็นทางเลือก) การวิเคราะห์เชิงสถิติของสัญญาณคุณภาพสูงเป็นส่วนหนึ่งของสถิติของวัตถุที่ไม่ใช่ธรรมชาติ คุณสมบัติเชิงปริมาณแบ่งออกเป็นสัญญาณที่วัดได้ในเครื่องชั่งช่วงความสัมพันธ์ความแตกต่างอย่างแน่นอน

และคุณภาพสูง - บนสัญญาณที่วัดในสเกลชื่อและลำดับลำดับ วิธีการประมวลผลข้อมูลควรได้รับการประสานงานกับเครื่องชั่งที่มีการวัดสัญญาณภายใต้การพิจารณา

วัตถุประสงค์ของการศึกษาความสัมพันธ์ระหว่างสัญญาณคือการพิสูจน์ความพร้อมของการสื่อสารระหว่างสัญญาณและการศึกษาการเชื่อมต่อนี้ เพื่อพิสูจน์ความพร้อมของพันธะระหว่างสองสุ่ม x และ y การวิเคราะห์ความสัมพันธ์ที่ใช้ หากการแจกจ่ายร่วม X และ Y เป็นเรื่องปกติข้อสรุปทางสถิติจะขึ้นอยู่กับค่าสัมประสิทธิ์แบบเลือกของความสัมพันธ์เชิงเส้นในกรณีอื่น ๆ ใช้สัมประสิทธิ์ของ Kendalla และสัดส่วนค่าสัมประสิทธิ์สหสัมพันธ์และสำหรับสัญญาณคุณภาพสูง - เกณฑ์ของ Chi- จัตุรัส.

การวิเคราะห์การถดถอยใช้เพื่อศึกษาการพึ่งพาฟังก์ชั่นของคุณสมบัติเชิงปริมาณจากเครื่องหมายเชิงปริมาณ x (1), x (2), ... , x (k) การพึ่งพานี้เรียกว่าการถดถอยหรือสั้น ๆ การถดถอย รูปแบบความน่าจะเป็นที่ง่ายที่สุดของการวิเคราะห์การถดถอย (ในกรณีของ K \u003d 1) ใช้เป็นข้อมูลเริ่มต้นชุดของพารามิเตอร์ของการสังเกต (xi, yi), i \u003d 1, 2, ... , n, และมีลักษณะที่ปรากฏ

yi \u003d axi + b + ei, i \u003d 1, 2, ... , n,

ที่ EI - ข้อผิดพลาดการสังเกต บางครั้งสันนิษฐานว่า EI เป็นตัวแปรสุ่มอิสระที่มีการกระจายปกติแบบเดียวกัน N (0, U2) เนื่องจากการกระจายข้อผิดพลาดในการสังเกตมักจะแตกต่างจากปกติขอแนะนำให้พิจารณารูปแบบการถดถอยในสูตรที่ไม่ใช่พารามิเตอร์ I.E ด้วยการกระจายโดยพลการของ EI

ภารกิจหลักของการวิเคราะห์การถดถอยคือการประเมินพารามิเตอร์ที่ไม่รู้จัก A และ B โดยระบุการพึ่งพาเส้นตรง Y ของ x เพื่อแก้ปัญหานี้มันถูกใช้โดย Still K. Gauses ในปี ค.ศ. 1794 วิธีการจัตุรัสน้อยที่สุด I.E. ค้นหาการประมาณการของพารามิเตอร์โมเดลที่ไม่รู้จักและ B จากเงื่อนไขเพื่อลดผลรวมของกำลังสองให้น้อยที่สุด

สลับ A และ B

การวิเคราะห์การกระจายตัวจะใช้เพื่อศึกษาอิทธิพลของสัญญาณคุณภาพสูงบนตัวแปรเชิงปริมาณ ตัวอย่างเช่นให้ตัวอย่าง K ของผลการวัดของตัวบ่งชี้เชิงปริมาณของคุณภาพของหน่วยของผลิตภัณฑ์ที่วางจำหน่ายในเครื่อง K, I.e. ชุดตัวเลข (x1 (j), x2 (j), ... , xn (j), ที่ j คือหมายเลขเครื่อง, j \u003d 1, 2, ... , k, และ n - ขนาดของ ตัวอย่าง. ในสูตรทั่วไปของการวิเคราะห์การกระจายตัวจะถือว่าผลการวัดมีความเป็นอิสระและในแต่ละตัวอย่างมีการกระจายปกติ n (m (j), U2) ที่มีการกระจายตัวเดียวกัน

การตรวจสอบความสม่ำเสมอของคุณภาพของผลิตภัณฑ์ I.E การขาดอิทธิพลของจำนวนเครื่องเกี่ยวกับคุณภาพของผลิตภัณฑ์จะลดลงเพื่อตรวจสอบสมมติฐาน

H0: m (1) \u003d m (2) \u003d ... \u003d m (k)

การวิเคราะห์การกระจายตัวที่พัฒนาขึ้นเพื่อตรวจสอบสมมติฐานดังกล่าว

Hypothesis H0 ได้รับการทดสอบกับสมมติฐานทางเลือก H1 ตามที่สมการเหล่านี้อย่างน้อยหนึ่งข้อนี้ไม่ได้ปฏิบัติตาม การตรวจสอบสมมติฐานนี้ขึ้นอยู่กับ "การสลายตัวของการกระจายตัว" ต่อไปนี้ระบุโดย R.A Fisher:

โดยที่ S2 เป็นการกระจายตัวเลือกในตัวอย่างรวม I.e.

ดังนั้นคำแรกในด้านขวาของสูตร (7) สะท้อนถึงการกระจายตัวของ Intresproup ในที่สุดการกระจายระหว่างกรุ๊ป

ขอบเขตของสถิติแอปพลิเคชันที่เกี่ยวข้องกับการสลายตัวของการกระจายตัวของประเภทของสูตร (7) เรียกว่าการวิเคราะห์การกระจายตัว ในฐานะที่เป็นตัวอย่างของปัญหาการวิเคราะห์การกระจายตัวเราพิจารณาการทดสอบสมมติฐาน H0 ที่กล่าวถึงข้างต้นภายใต้ข้อสันนิษฐานว่าผลลัพธ์การวัดมีความเป็นอิสระและในแต่ละตัวอย่างมีการกระจายปกติ N (m (j), U2) ที่มีการกระจายตัวเดียวกัน . ด้วยความยุติธรรมของ H0 ในระยะแรกในด้านขวาของสูตร (7) หารด้วย U2 มีการกระจายไคสแควร์กับ K (N-1) องศาอิสระและคำที่สองหารด้วย U2 ก็มี การกระจายไคลสแควร์ แต่มี (K-1) องศาอิสระและคำแรกและคำที่สองมีความเป็นอิสระเป็นตัวแปรสุ่ม ดังนั้นจำนวนสุ่ม

มันมีการกระจายของฟิชเชอร์กับ (K-1) องศาอิสระของ Freedom of the Memerator และ K (N-1) องศาอิสระของตัวหาร hypothesis h0 ได้รับการยอมรับถ้า f< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

วิธีการแก้ปัญหาการแก้ปัญหาแบบคลาสสิกโดยเฉพาะอย่างยิ่งการทดสอบสมมติฐาน H0 ได้รับการพัฒนา

งานประเภทต่อไปนี้ของการวิเคราะห์ทางสถิติหลายมิติ - งานจำแนกประเภท พวกเขาแบ่งออกเป็นสามประเภทพื้นฐานที่แตกต่างกัน - การวิเคราะห์การเลือกปฏิบัติการวิเคราะห์คลัสเตอร์งานการจัดกลุ่ม

งานของการวิเคราะห์การเลือกปฏิบัติคือการค้นหากฎการกำหนดวัตถุที่สังเกตได้เป็นหนึ่งในคลาสที่อธิบายไว้ก่อนหน้านี้ ในกรณีนี้วัตถุอธิบายไว้ในแบบจำลองทางคณิตศาสตร์โดยใช้เอนเตอร์ที่มีพิกัดเป็นผลลัพธ์ของการสังเกตจำนวนสัญญาณจากแต่ละวัตถุ คลาสจะอธิบายไว้โดยตรงในแง่คณิตศาสตร์หรือใช้ตัวอย่างการฝึกอบรม ตัวอย่างการฝึกอบรมเป็นตัวอย่างสำหรับแต่ละองค์ประกอบที่ระบุว่าคลาสที่อ้างถึง

พิจารณาตัวอย่างของการใช้การวิเคราะห์การจำแนกการตัดสินใจในการวินิจฉัยทางเทคนิค ให้ผลลัพธ์ของการวัดจำนวนพารามิเตอร์ของผลิตภัณฑ์จำนวนหนึ่งจำเป็นต้องสร้างการแสดงตนหรือไม่มีข้อบกพร่อง ในกรณีนี้องค์ประกอบของตัวอย่างการฝึกอบรมเป็นข้อบกพร่องที่ตรวจพบในระหว่างการศึกษาเพิ่มเติมเช่นดำเนินการหลังจากระยะเวลาที่กำหนด การวิเคราะห์แบบแยกแยะช่วยให้คุณลดปริมาณการควบคุมเช่นเดียวกับการทำนายพฤติกรรมของผลิตภัณฑ์ในอนาคต การวิเคราะห์การเลือกปฏิบัตินั้นคล้ายคลึงกับการถดถอย - ครั้งแรกที่ให้คุณสามารถทำนายคุณค่าของคุณสมบัติเชิงคุณภาพและการวิเคราะห์เชิงปริมาณที่สอง ในสถิติของวัตถุที่ไม่ใช่ลักษณะที่ไม่ระบุรูปแบบทางคณิตศาสตร์ได้รับการพัฒนาซึ่งเป็นกรณีพิเศษของการถดถอยและการทดสอบแบบแยกแยะ

การวิเคราะห์คลัสเตอร์จะใช้เมื่ออยู่ในข้อมูลทางสถิติที่จำเป็นในการแบ่งองค์ประกอบของตัวอย่างในกลุ่ม นอกจากนี้องค์ประกอบทั้งสองของกลุ่มจากกลุ่มเดียวกันต้อง "ปิด" โดยชุดของค่าของสัญญาณที่วัดในนั้นและองค์ประกอบสองอย่างจากกลุ่มที่แตกต่างกันควรเป็น "ระยะไกล" ในความหมายเดียวกัน ตรงกันข้ามกับการวิเคราะห์แบบแยกแยะคลาสไม่ได้ระบุในคลัสเตอร์การวิเคราะห์และเกิดขึ้นระหว่างการประมวลผลข้อมูลสถิติ ตัวอย่างเช่นการวิเคราะห์คลัสเตอร์สามารถนำไปใช้เพื่อแยกผลรวมของเกรดเหล็ก (หรือตู้เย็นยี่ห้อ) เป็นกลุ่มที่คล้ายกันในหมู่พวกเขา

การวิเคราะห์คลัสเตอร์อีกประเภทหนึ่งคือพาร์ทิชันของสัญญาณของกลุ่มคนที่คุณรัก ตัวบ่งชี้ของความใกล้ชิดของสัญญาณสามารถทำหน้าที่เป็นสัมประสิทธิ์การคัดเลือกของสหสัมพันธ์ วัตถุประสงค์ของการกำหนดลักษณะของสัญญาณอาจมีการลดลงของจำนวนพารามิเตอร์ที่ควบคุมซึ่งทำให้สามารถลดต้นทุนการควบคุมได้อย่างมีนัยสำคัญ สำหรับสิ่งนี้จากกลุ่มของคุณสมบัติที่เกี่ยวข้องอย่างใกล้ชิด (ซึ่งสัมประสิทธิ์ความสัมพันธ์ใกล้เคียงกับ 1 ถึงค่าสูงสุด) วัดค่าของหนึ่งและค่าที่เหลือจะถูกคำนวณโดยใช้การวิเคราะห์การถดถอย

งานของกลุ่มกำลังตัดสินใจเมื่อไม่ได้ระบุชั้นเรียนล่วงหน้าและไม่จำเป็นต้อง "ห่างไกล" จากกันและกัน ตัวอย่างคือการจัดกลุ่มนักเรียนในกลุ่มศึกษา เทคนิคการแก้ปัญหาการจัดกลุ่มมักเป็นชุดพารามิเตอร์ - ขนาดที่เป็นไปได้ถูกจัดกลุ่มตามองค์ประกอบของชุดพารามิเตอร์ ในเอกสารวรรณคดีข้อบังคับและเอกสารและแนวทางปฏิบัติในสถิติการประยุกต์ใช้การจัดกลุ่มผลการสังเกตบางครั้งก็ใช้ (ตัวอย่างเช่นเมื่อสร้างฮิสโตแกรม)

งานของการจำแนกประเภทได้รับการแก้ไขไม่เพียง แต่ในการวิเคราะห์ทางสถิติหลายมิติ แต่ยังเมื่อผลลัพธ์ของการสังเกตคือตัวเลขฟังก์ชั่นหรือวัตถุที่ไม่ใช่ธรรมชาติ ดังนั้นอัลกอริทึมการวิเคราะห์คลัสเตอร์จำนวนมากใช้เพียงระยะทางระหว่างวัตถุ ดังนั้นจึงสามารถนำไปใช้กับการจำแนกประเภทของวัตถุที่ไม่ใช่ธรรมชาติหากตั้งค่าเพียงระยะทางระหว่างพวกเขาเท่านั้น งานการจำแนกประเภทที่ง่ายที่สุดมีดังนี้: ตัวอย่างอิสระสองตัวอย่างจะต้องมีการกำหนดพวกเขาเป็นตัวแทนของสองคลาสหรือหนึ่ง ในสถิติเดียวงานนี้จะลดลงเพื่อตรวจสอบสมมติฐานที่เป็นเนื้อเดียวกัน

ส่วนที่สามของการวิเคราะห์ทางสถิติหลายมิติเป็นหน้าที่ของมิติที่ลดลง (การบีบอัดข้อมูล) เป้าหมายของการแก้ปัญหาของพวกเขาคือการกำหนดชุดของตราสารอนุพันธ์ที่ได้รับจากการเปลี่ยนแปลงของสัญญาณเริ่มต้นเช่นจำนวนของอนุพันธ์มีน้อยกว่าจำนวนสัญญาณแหล่งที่มา แต่พวกเขามีข้อมูลส่วนใหญ่ที่มีอยู่ในข้อมูลสถิติต้นฉบับ . งานลดขนาดที่ได้รับการแก้ไขโดยใช้วิธีการสเกลหลายมิติส่วนประกอบหลักการวิเคราะห์ปัจจัย ฯลฯ ตัวอย่างเช่นในรูปแบบที่ง่ายที่สุดของการปรับขนาดหลายมิติข้อมูลเริ่มต้นเป็นระยะทางคู่ระหว่างวัตถุ K และวัตถุประสงค์ของการคำนวณคือการแสดง วัตถุไปยังจุดบนเครื่องบิน สิ่งนี้ทำให้เป็นไปได้ในความรู้สึกตามตัวอักษรของคำเพื่อดูว่าวัตถุที่เกี่ยวข้องซึ่งกันและกันอย่างไร เพื่อให้บรรลุเป้าหมายนี้จำเป็นต้องใส่วัตถุแต่ละชิ้นให้สอดคล้องกับจุดบนเครื่องบินเพื่อให้ห่างจากการแข่งขัน SIJ ระหว่างจุดที่สอดคล้องกับวัตถุที่มีตัวเลข I และ J เป็นไปได้ที่จะทำซ้ำระยะทางของ Sijd ของเหล่านี้ได้แม่นยำยิ่งขึ้น วัตถุ. ตามแนวคิดพื้นฐานของวิธีการจัตุรัสน้อยที่สุดมีจุดบนระนาบเพื่อให้ขนาด

ถึงค่าที่เล็กที่สุด มีการตั้งค่าอื่น ๆ อีกมากมายสำหรับการลดมิติและการสร้างภาพข้อมูล

ความน่าจะเป็นสถิติทางคณิตศาสตร์คุณภาพ

วัตถุทางสังคมและเศรษฐกิจมักจะโดดเด่นด้วยพารามิเตอร์จำนวนมากเพียงพอที่สร้างเวกเตอร์หลายมิติและงานในการศึกษาความสัมพันธ์ระหว่างส่วนประกอบของเวกเตอร์เหล่านี้มีความสำคัญอย่างยิ่งในการศึกษาทางเศรษฐกิจและสังคมและความสัมพันธ์เหล่านี้จำเป็นต้องตรวจพบบนพื้นฐาน ของการสังเกตหลายมิติจำนวน จำกัด

การวิเคราะห์ทางสถิติหลายมิติเรียกว่าส่วนสถิติทางคณิตศาสตร์ซึ่งศึกษาวิธีการรวบรวมและประมวลผลข้อมูลสถิติหลายมิติการจัดระบบและการประมวลผลเพื่อระบุลักษณะและโครงสร้างของความสัมพันธ์ระหว่างส่วนประกอบของการศึกษาคุณสมบัติหลายมิติ สรุปการปฏิบัติ

โปรดทราบว่าวิธีการรวบรวมข้อมูลอาจแตกต่างกันไป ดังนั้นหากมีการตรวจสอบเศรษฐกิจโลกเป็นเรื่องธรรมดาที่จะใช้เป็นวัตถุที่ค่าของเวกเตอร์ X ประเทศถูกสังเกตหากมีการศึกษาระบบเศรษฐกิจแห่งชาติจากนั้นปฏิบัติตามความหมายของ Vector X เช่นเดียวกัน (จากความสนใจของนักวิจัย) ที่จุดต่าง ๆ ในเวลา

วิธีการทางสถิติเช่นการวิเคราะห์สหสัมพันธ์และการถดถอยหลายอย่างในหลักสูตรของทฤษฎีของความน่าจะเป็นและสถิติทางคณิตศาสตร์วินัย "เศรษฐมิติ" อุทิศให้กับการพิจารณาของประเด็นการวิเคราะห์การถดถอย

วิธีการอื่นในการศึกษามวลรวมทั่วไปหลายมิติบนพื้นฐานของข้อมูลทางสถิติที่ทุ่มเทให้กับคู่มือนี้

วิธีการลดขนาดของมิติของพื้นที่หลายมิติที่อนุญาตโดยไม่มีการสูญเสียข้อมูลอย่างมีนัยสำคัญย้ายจากระบบเริ่มต้นของปัจจัยการเชื่อมต่อที่สังเกตได้จำนวนมากไปยังระบบของปัจจัยที่ซ่อนอยู่ (ไม่สามารถใช้งานได้) จำนวนน้อยกว่าที่กำหนดความแปรปรวนของ สัญญาณเริ่มต้น บทแรกอธิบายถึงวิธีการวิเคราะห์องค์ประกอบและปัจจัยการใช้ซึ่งคุณสามารถระบุที่มีอยู่อย่างเป็นกลาง แต่ไม่ได้สังเกตรูปแบบโดยตรงกับความช่วยเหลือของส่วนประกอบหลักหรือปัจจัยหลัก

วิธีการจำแนกหลายมิติมีวัตถุประสงค์เพื่อแยกชุดของวัตถุ (โดดเด่นด้วยคุณสมบัติจำนวนมาก) ลงในชั้นเรียนในแต่ละอันควรมีวัตถุในบางแง่มุมที่เป็นเนื้อเดียวกันหรือญาติ การจำแนกประเภทนี้ขึ้นอยู่กับข้อมูลทางสถิติเกี่ยวกับค่าของคุณสมบัติในวัตถุสามารถดำเนินการได้โดยวิธีการวิเคราะห์กลุ่มและการวิเคราะห์ข้อมูลในบทที่สอง (การวิเคราะห์ทางสถิติหลายมิติโดยใช้ "Statistica")

การพัฒนาอุปกรณ์คอมพิวเตอร์และซอฟต์แวร์มีส่วนช่วยในการแนะนำวิธีการวิเคราะห์ทางสถิติหลายมิติที่แพร่หลาย แพคเกจโปรแกรมแอปพลิเคชันที่มีส่วนต่อประสานผู้ใช้ที่สะดวกเช่น SPSS, Statistica, SAS ฯลฯ ลบความยากลำบากในการประยุกต์ใช้วิธีการเหล่านี้ซึ่งประกอบด้วยความซับซ้อนของอุปกรณ์ทางคณิตศาสตร์ที่ใช้พีชคณิตเชิงเส้นทฤษฎีความน่าจะเป็นและ สถิติทางคณิตศาสตร์และการคำนวณที่ยุ่งยาก

อย่างไรก็ตามการใช้โปรแกรมที่ไม่มีความเข้าใจเกี่ยวกับสาระสำคัญทางคณิตศาสตร์ของอัลกอริทึมที่ใช้มีส่วนช่วยในการพัฒนาภาพลวงตาของความเรียบง่ายของการใช้วิธีการทางสถิติหลายมิติซึ่งสามารถนำไปสู่ผลลัพธ์ที่ไม่ถูกต้องหรือไม่สมเหตุสมผล ผลการปฏิบัติที่สำคัญสามารถรับได้เฉพาะบนพื้นฐานของความรู้ระดับมืออาชีพในพื้นที่สาขาวิชาเสริมด้วยการครอบครองวิธีการทางคณิตศาสตร์และแพ็คเกจแอปพลิเคชันที่ใช้วิธีการเหล่านี้

ดังนั้นสำหรับแต่ละวิธีที่อยู่ระหว่างการพิจารณาในหนังสือเล่มนี้จะได้รับข้อมูลเชิงทฤษฎีหลักรวมถึงอัลกอริทึม; การดำเนินการตามวิธีการเหล่านี้และอัลกอริทึมในแพ็คเกจแอปพลิเคชันจะกล่าวถึง วิธีการที่อยู่ระหว่างการพิจารณาจะแสดงโดยตัวอย่างของแอปพลิเคชันเชิงปฏิบัติในระบบเศรษฐกิจโดยใช้แพ็คเกจ SPSS

คู่มือมีการเขียนบนพื้นฐานของประสบการณ์การอ่านหลักสูตร "วิธีการทางสถิติหลายมิติ" ของนักเรียนของมหาวิทยาลัยการจัดการของรัฐ สำหรับการศึกษารายละเอียดเพิ่มเติมเกี่ยวกับวิธีการวิเคราะห์เชิงสถิติหลายมิติที่ใช้แล้วหนังสือแนะนำหนังสือ

สันนิษฐานว่าผู้อ่านคุ้นเคยกับหลักสูตรของพีชคณิตเชิงเส้น (ตัวอย่างเช่นในขอบเขตของตำราเรียนและภาคผนวกไปยังตำรา) ทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ (เช่นในปริมาณของตำราเรียน .