Analiza višedimenzionalna statistička. Uvod u višedimenzionalnu statističku analizu - Kalinina procjena linearne prognostičke funkcije

Analiza višedimenzionalna statistička. Uvod u višedimenzionalnu statističku analizu - Kalinina procjena linearne prognostičke funkcije
Analiza višedimenzionalna statistička. Uvod u višedimenzionalnu statističku analizu - Kalinina procjena linearne prognostičke funkcije

Postoje takve situacije u kojima je nasumična varijabilnost bila zastupljena jednom ili dvije slučajne varijable, funkcije.

Na primjer, u istraživanju statističkog agregata ljudi zainteresovani smo za rast i težinu. U ovoj situaciji, bez obzira koliko ljudi u statističkom agregatu uvijek možemo izgraditi diagram rasipanja i vidjeti cijelu sliku uopšte. Međutim, ako su znakovi tri, na primjer, dodaje se znak - starost osobe, a zatim dijagram rasipanja mora biti izgrađen u trodimenzionalnom prostoru. Predstaviti ukupnost bodova u trodimenzionalnom prostoru već je prilično teška.

U stvarnosti u praksi, svako zapažanje predstavi se ne jednim ili dva tri brojevima, već i neki primjetni skup brojeva koji opisuju desetine znakova. U ovoj situaciji, višedimenzionalni prostori bi trebali konstruirati dijagram rasipanja.

Odjeljenje za statistiku o studijama eksperimenata s višedimenzionalnim zapažanjima naziva se višedimenzionalna statistička analiza.

Mjerenje nekoliko znakova (svojstva objekata) u jednom eksperimentu uopšte, prirodnije od dimenzije bilo kojeg, dva. Stoga, potencijalno višedimenzionalna statistička analiza ima široko polje za upotrebu.

Sljedeći odjeljci uključuju višedimenzionalnu statističku analizu:

Faktorska analiza;

Diskriminantna analiza;

Analiza klastera;

Višedimenzionalna skalizacija;

Metode kontrole kvaliteta.

Analiza faktora

U studiji složenih objekata i sistema (na primjer, u psihologiji, biologiji, sociologiji itd.) Vrijednosti (faktora), definirajuća svojstva ovih objekata, vrlo je često nemoguće mjeriti direktno, a ponekad i čak i njihov broj i smisleno značenje. Ali druge vrijednosti mogu biti dostupne za mjerenje, na ovaj ili onaj način, ovisno o faktorima interesa. Istovremeno, kada se utjecaj nepoznatog faktora interesa očituje u nekoliko izmjerenih značajki, ove funkcije mogu otkriti blisku vezu između sebe i ukupni broj faktora može biti mnogo manji od broja varijabli izmjerenih varijabli.

Za otkrivanje faktora koji utječu na izmjerene varijable, koriste se metode analize faktora.

Primjer primjene faktorske analize može biti proučavanje svojstava ličnosti zasnovane na psihološkim testovima. Svojstva ličnosti nisu podložne direktnom mjerenju, mogu se suditi samo na ljudskom ponašanju ili prirodi odgovora na određena pitanja. Da bi se objasnio rezultati eksperimenata, podvrgnuti su faktorskim analizi, što vam omogućava identifikaciju tih osobnih svojstava koje utječu na ponašanje predmeta pojedinaca.


U srcu raznih modela faktorske analize nalazi se sljedeća hipoteza: promatrani ili izmjereni parametri samo su indirektne karakteristike proučavanja ili pojave, u stvarnosti, u stvarnosti postoje interni (skriveni) latentannije promatrano direktno) parametri i svojstva, od kojih je broj mali i koji definiraju vrijednosti opaženih parametara. Ovi unutrašnji parametri nazivaju se faktorima.

Zadatak analize faktorato je zastupljenost promatranih parametara u obliku linearnih kombinacija faktora i, možda, neke dodatne, nebitne uznemirenosti.

Prva faza faktorske analize u pravilu je izbor novih znakova koji su linearne kombinacije bivše i "apsorbiraju" većinu ukupne varijabilnosti promatranih podataka i stoga prenose većinu informacija zaključenih u početnim zapažanjima . To se obično radi pomoću upotrebe metoda glavnih komponenti,iako se druge tehnike koriste ponekad (maksimalna metoda istine).

Metoda glavne komponente svodi se na izbor novog ortogonalnog koordinatnog sustava u prostoru zapažanja. Kao prva glavna komponenta bira se smjer, po kojem se posmatrač ima najveći rasipanje, izbor svake naredne glavne komponente događa tako da je rasipana zapažanja maksimalna i da je ova glavna komponenta ortogonalna za ostale glavne komponente odabrane ranijem drugim glavnim komponentama odabranim ranijim . Međutim, faktori dobiveni glavnom metodom komponente obično nisu dovoljno vizualne interpretacije. Stoga je sljedeći korak faktorske analize transformacija, rotacija faktora za olakšavanje tumačenja.

Diskriminantna analiza

Neka postoji kombinacija predmeta, razbijene u nekoliko grupa, a za svaki se objekt može odrediti na koju se grupi odnosi. Za svaki objekt postoje mjerenja nekoliko kvantitativnih karakteristika. Potrebno je pronaći način, kao na osnovu ovih karakteristika, možete saznati grupu kojoj objekt pripada. To će omogućiti specificiranje grupa na koje su novi objekti isti agregat. Za rješavanje primijenjenog zadatka metode diskriminantne analize.

Diskriminantna analiza- ovaj dio statistike, čiji sadržaj je razviti metode za rješavanje problema razlike (diskriminacije) opažajućih objekata za određene karakteristike.

Razmotrite nekoliko primjera.

Diskriminantna analiza je zgodna prilikom obrade rezultata ispitivanja pojedinaca kada je u pitanju prijem na jednom ili drugom položaju. U ovom slučaju, svi kandidati su dužni podijeliti na dvije grupe: "Pogodno" i "Nije prikladno".

Bankarska uprava moguća je upotreba diskriminantne analize za procjenu financijskog stanja kupaca za izdavanje kredita. Banka za brojne znakove klasificira ih na pouzdanu i nepouzdanu.

Diskriminantna analiza može se privući kao metoda razdvajanja skupa preduzeća u nekoliko homogenih grupa o vrijednostima bilo kojeg pokazatelja proizvodnje i ekonomskih aktivnosti.

Načini diskriminantne analize omogućuju izgradnju funkcija izmjerenih karakteristika, vrijednosti od kojih u vrijednostima objašnjavaju odvajanje predmeta u grupe. Poželjno je da ove funkcije (diskriminantni znakovi)je bilo malo. U ovom slučaju, rezultati analize su lakši za tumačenje.

Zbog svoje jednostavnosti, linearna diskriminantna analiza igra posebna uloga, u kojoj se klasificiraju karakteristike odabrane kao linearne funkcije od primarnih znakova.

Analiza klastera

Metode klastera omogućavaju vam da probijete proučeni skup objekata u grupe "sličnih" predmeta pod nazivom Clusters.

Reč klasterenglish Porijeklo - klaster prevodi kao Četkica, snop, grupa, roj, klaster.

Analiza klastera rješava sljedeće zadatke:

Provodi klasifikaciju objekata sa svim tim znakovima koji karakterišu objekt. Sama mogućnost klasifikacije promovira nas na dublju razumijevanje razmatranih agregata i objekata uključenih u njega;

To postavlja zadatak da provjeri prisustvo priori definirane strukture ili klasifikacije u postojećem ukupnošću. Takav ček omogućava iskorištavanje standardne hipotetičke i deduktivne sheme naučnih istraživanja.

Većina metoda klasteriranja (hijerarhijske grupe) su aglomerativni(Comriginal) - Oni počinju sa stvaranjem osnovnih klastera, od kojih se svaki sastoji od samo jednog sopstvenog posmatranja (jedna tačka), a na svakom narednom koraku, dva najbliže klastere kombiniraju se u jednu.

Trenutak zaustavljanja ovog procesa može definirati istraživač (na primjer, navođenjem željenog broja klastera ili maksimalne udaljenosti u kojoj se pojavljuje spajanje).

Grafička slika procesa kombiniranja klastera može se dobiti pomoću dendrogrami- Treber kombinira klastere.

Razmotrite sljedeći primjer. Klasificirat ćemo pet preduzeća, od kojih svaka odlikuje tri varijable:

x 1- prosječna godišnja vrijednost glavnih proizvodnih pogona, milijardu rubalja;

x 2- Materijalni troškovi za 1 rub. Proizvodi proizvedeni proizvodi, policajac;

x 3- Zapremina proizvedenih proizvoda, milijardu rubalja.

Uvođenje Pevma u upravljanje nacionalnom ekonomijom uključuje tranziciju iz tradicionalnih metoda za analizu preduzeća u naprednijim modelima gospodarstva ekonomije koji omogućavaju otkrivanje svojih dubinskih procesa.

Rasprostranjena upotreba u ekonomskim studijama metoda matematičke statistike omogućava produbljivanje ekonomske analize, poboljšanju kvalitete informacija u planiranju i predviđanju pokazatelja proizvodnje i analizu njegove učinkovitosti.

Složenost i raznolikost odnosa ekonomskih pokazatelja određuju višedimenzionalnost znakova i u vezi s tim zahtijevaju korištenje najkompleksnijih matematičkih aparata - metode višedimenzionalne statističke analize.

Koncept "višedimenzionalne statističke analize" podrazumijeva niz metoda dizajnirane za istraživanje kombinacije međusobno povezanih znakova. Govorimo o rashlađujući (cijepanje) kombinacije koja se razmatra, koja predstavlja višedimenzionalni znakovi na relativno malom iznosu.

Istovremeno, prelazak iz velikog broja znakova na manje proganja je cilj smanjenja njihove dimenzije i povećanje informativnog kontejnera. Takav je cilj postignut identificiranjem informacija, ponovljenim, generiranim međusobnoj znakovima, uspostavljanju mogućnosti agregacije (udruženja, zbrajanja) za neke znakove. Potonji uključuje transformaciju stvarnog modela u modelu s manjim brojem faktorskih znakova.

Metoda višedimenzionalne statističke analize omogućava vam identifikaciju objektivno postojećih, ali jasno nisu izraženi obrasci koji se očituju u određenim socio-ekonomskim pojavama. To se mora baviti ovim u rješavanju više praktičnih zadataka u oblasti ekonomije. Konkretno, da je potrebno ako je potrebno akumulirati (popraviti) ujedno vrijednosti nekoliko kvantitativnih karakteristika (funkcija) na objektu koji se proučava kada je svaka karakteristika sklona nekontroliranom varijantu (u kontekstu objekata) , uprkos homogenosti opažajućih objekata.

Na primjer, istraživanje homogenih (prirodnim ekonomskim uvjetima i vrsti specijalizacije) preduzeća za brojne pokazatelje performansi, uvjereni smo da u prelasku iz jednog objekta u drugu, gotovo svaku od odabranih karakteristika (identična) ima Neravnotelno značenje, odnosno nalazi se da bi tako govorio nekontrolirano (nasumično) rasipanje. Takva "slučajna" karakterizacija znakova, u pravilu, podložna je nekim (prirodnim) trendovima, kako u pogledu dovoljno specifičnih veličina znakova, oko koje varijacije i u smislu diplome i međuovisnosti same varijacije nose se Napolje.

Gore navedeno dovodi do definicije višedimenzionalne slučajne varijable kao skupa kvantitativnih funkcija, vrijednost svakog od kojih je podložan nekontroliranim rasipanjima tijekom ponavljanja ovog procesa, statističkog promatranja, iskustva, eksperimenta itd.

Ranije je rečeno da višedimenzionalna analiza kombinira brojne metode; Nazivamo ih: Faktor analize, glavna metoda komponente, analiza klastera, prepoznavanje slike, diskriminatorne analize i itd. Prva tri od ovih metoda smatraju se u sljedećim paragrafima.

Kao i drugi matematičar - statističke metode, višedimenzionalna analiza može biti učinkovita u svojoj aplikaciji podložna visokom kvalitetu početnih informacija i masu ovih zapažanja, obrađuju se pomoću pevm-a.

Osnovni pojmovi metode faktorske analize, suština zadataka koje su riješili

Prilikom analize (jednako i istraženih), socijalni i ekonomski pojave često se nalaze u slučajevima kada se među raznolikošću (bagatoparametričnost) opažaju objekte, potrebno je isključiti udio parametara ili ih zamijeniti manjim brojem određenih funkcija, bez uzroka Integritet integriteta (punih) podataka. Rješenje takvog zadatka ima smisla u određenom modelu i zbog njegove strukture. Primjer takvog modela koji je najprikladniji za mnoge stvarne situacije je model analize faktora, čiji su metode čine moguće koncentrirati znakove (informacije o njima) "kondenzacijom" velikog broja manje, informativnih informacija. U ovom slučaju, dobiveni "kondenzat" informacija mora biti zastupljen najznačajnijim i određujući kvantitativne karakteristike.

Koncept "Faktorske analize" ne treba miješati sa širokim konceptom analize kauzalnih odnosa, kada se na produktivnu osnovu proučava utjecaj različitih faktora (njihove kombinacije, kombinacije).

Suština metode faktorske analize je isključenje opisa više karakteristika proučavanja i zamjene po manjem broju informacija i velikih varijabli, koji se nazivaju faktorima i odražavaju najznačajniju svojstva fenomena. Takve varijable su neke karakteristike izvornih znakova.

Analiza, prema Ya. Perch 9, omogućava vam da prve približne karakteristike obrazaca u osnovi pojava, formuliraju prvi, opći zaključci o uputama u kojima treba izvršiti daljnje istraživanje. Nadalje, ukazuje na glavnu pretpostavku faktorske analize, što se smanjuje na činjenicu da se pojava, uprkos njenoj heterogenosti i varijabilnosti može opisati malim brojem funkcionalnih jedinica, parametara ili faktora. Ti se datumi nazivaju drugačije: utjecaj, uzroci, parametri, funkcionalne jedinice, sposobnosti, osnovni ili neovisni pokazatelji. Upotreba jednog ili drugog termina je zbog

Okun I. Faktorska analiza: po. od. . M.: Statistika, 1974.- str.16.

kontekst faktora i znanja suštine proučarenog pojava.

Faze faktorske analize su uzastopne usporedbe različitih skupova faktora i opcija za grupe sa njihovim uključivanjem, isključivanjem i evaluacijom pouzdanosti razlika između grupa.

V.M. Zhukovska i I.b. Mutnik 10, govoreći o suštini zadataka faktora analize, tvrde da ovo ne zahtijeva priori podjelu varijabli o zavisnom i neovisnom, jer se u njemu smatraju jednakim varijantima.

Zadatak faktorske analize smanjuje se na određeni koncept, broj i prirodu najznačajnijih i relativno neovisnih funkcionalnih karakteristika fenomena, njenih brojila ili osnovnih parametara - faktora. Prema riječima autora, važna karakteristična karakteristika faktorske analize je da vam omogućuje istovremeno istraživanje velikog broja međusobno povezanih varijabli bez pretpostavki o "nepromjenljivosti svih ostalih uvjeta", po potrebi kada se koriste brojne druge metode analize. Ovo je velika prednost faktorske analize kao vrijedan studijski alat fenomena zbog složene raznolikosti i rafinerija veza.

Analiza se oslanja uglavnom za nadgledanje prirodne varijacije.

1. Pri korištenju faktorske analize, skup varijabli koji se proučavaju sa stanovišta veza između njih ne biraju se proizvoljno: Ova metoda vam omogućuje identificiranje glavnih faktora koji obavljaju značajan utjecaj na ovom području.

2. Analiza ne zahtijeva preliminarne hipoteze, naprotiv, sama može poslužiti kao hipoteze koje se protežu, kao i da djeluju kao kriterij hipoteza na osnovu podataka dobivenih drugim metodama.

3. Analiza ne zahtijeva priori nagađanja o tome koje su varijable neovisne, a ovise, ne hipertrofije uzročne komunikacije i rješava pitanje njihove mjere u procesu daljnjeg istraživanja.

Lista specifičnih zadataka riješenih metodama faktorske analize bit će takva (od V.M. Zhukovskoy). Nazovimo glavne na polju socio-ekonomskog istraživanja:

Zhukovskaya V.M., Muchisnik I.B. Analiza faktora u društveno-ekonomskom istraživanju. -Pati, 1976. P.4.

1. Određivanje glavnih aspekata razlika između opažajućih objekata (opis minimiziranja).

2. Riječenje hipoteza o prirodi razlika između objekata.

3. Otkrivanje strukture odnosa između znakova.

4. Provjera hipoteza o odnosu i razmjenljivost znakova.

5. Poređenje karakterističnih skupa seta.

6. Rastavljanje opažanja objekata za tipične karakteristike.

Gore navedeno ukazuje na velike mogućnosti faktorske analize u

studija društvenih pojava, gdje, u pravilu, nemoguće je kontrolirati (eksperimentalno) utjecaj pojedinih faktora.

Sasvim je efikasno koristiti rezultate faktora analize u više regresijskim modelima.

Imati unaprijed određeni model korelacije-regresije proučenog fenomena u obliku korelacijskih znakova, koristeći faktorske analize, možete takav skup znakova da se pretvori u znatno manji broj po agregaciji. U ovom slučaju treba napomenuti da se takva transformacija ne pogoršava ni na koji način i dovrši informacije o razmatranom pojavu. Stvoreni agregirani znakovi su neukomrelirani i predstavljaju linearnu kombinaciju primarnih znakova. Sa formalnom matematičkom stranom, postavljanje zadataka u ovom slučaju mogu imati beskonačne više rješenja. Ali mora se imati na umu da prilikom proučavanja društveno-ekonomskih pojava, dobiveni zbirni znakovi moraju imati ekonomski informiranu tumačenje. Drugim riječima, u svakom slučaju korištenja matematičkog aparata, prije svega previdi znanje ekonomske suštine studiranih pojava.

Stoga gore navedeno omogućava vam da sažete da je analiza faktora specifična metoda studije, koja se provodi na temelju arsenala metoda matematičke statistike.

Faktorska analiza prvo je pronašla svoju praktičnu primjenu u području psihologije. Sposobnost smanjenja velikog broja psiholoških testova na malog broja faktora omogućio je objasniti sposobnosti ljudske inteligencije.

U istraživanju društveno-ekonomskih pojava, gdje postoje poteškoće u izoliranom utjecaju pojedinih varijabli, faktorska analiza može se uspješno koristiti. Upotreba njegovih tehnika omogućava određene proračune za "profil" beznačajne znakove i nastaviti istraživanje u smjeru produbljivanja.

Efikasnost ove metode vidljiva je u istraživanju takvih pitanja (problemi): u ekonomiji - specijalizacija i koncentracija proizvodnje, intenzitet upravljanja ekonomije, proračun porodica radnika, izgradnja različitih općih pokazatelja. itd

Višedimenzionalna statistička analiza

Sektor Matematika. Statistika posvećena matematici. Metode za izgradnju optimalnih planova za prikupljanje, sistematizaciju i preradu višedimenzionalnih statističkih statističkih statističkih. Podaci su usmjereni na identificiranje prirode i strukture međusobnih veza između komponenti višedimenzionalne osobine pod proučavanjem i namijenjene za dobivanje naučnog i praktičnog. Zaključci. Pod multidimenzionalnim znakom mogu biti P-dimenzionalni indikatori (znakovi, varijable): kvantitativni, i.e., skalarno mjeren u određenoj skali manifestacije objekta koji se proučava, n-redni (ili redni), I.E. omogućava sortiranje analiziranih predmeti prema stupnju manifestacije imovine u studiju; i klasifikacija (ili nominalno), I.E. omogućava prekid proučarenog skupa objekata za naručivačke uniforme (prema analiziranim nekretninama). Rezultati mjerenja ovih pokazatelja

svaki od dijelova iz studija, formirani su višedimenzionalna zapažanja ili izvor višedimenzionalnih podataka za M. s. Ali. Značajan dio M. s. Ali. Služi situacijama, u kojima je studirala višedimenzionalna značajka tumačena kao višedimenzionalna i, u skladu s tim, slijed višedimenzionalnih zapažanja (1) je iz opće populacije. U ovom slučaju, izbor metoda za preradu izvora statističke statističke. Podaci i analiza njihovih nekretnina donose se na osnovu određenih pretpostavki o prirodi višedimenzionalnog (zajedničkog) zakona o raspodjeli vjerojatnosti

Multidimenzionalna statistička analiza višedimenzionalnih distribucija i njihovih glavnih karakteristika obuhvaćaju samo situacije u kojima procesna zapažanja (1) imaju verovatnoću prirodu, odnosno tumače kao uzorak iz odgovarajuće opće populacije. Glavni zadaci ovog pododjeljka uključuju: statističku statistiku. Evaluacija proučavanih višedimenzionalnih distribucija, njihovih glavnih numeričkih karakteristika i parametara; Proučavanje svojstava korištenog statističkog. procjene; Istraživanje distribucija vjerojatnosti za brojne statistike, statističko se gradi pomoću do-rykh. Kriteriji za provjeru različitih hipoteza o vjerojatnoj prirodi analiziranih višedimenzionalnih podataka. Glavni rezultati odnose se na privatni slučaj kada je proučavana značajka podređena višedimenzionalnim zakon o distribuciji, funkcija gustoće K-Poga daje se s odnosom

gde - vektor matematike. Očekivanost Komponenta slučajne varijable, I.E. - kovarijantna matrica slučajnog vektora, t. e.-covarijanta komponente vektora (smatra se negovatenim slučajem, kada; u suprotnom, tj. Za vrijeme ranga, svi su rezultati, ali u odnosu na podlogu manjih Dimenzija, pokaže se da je koncentriran u osnovnom slučajnom vektoru).

Dakle, ako je (1) niz neovisnih zapažanja koja čine slučajni uzorak od te maksimalne procjene vjerojatnosti za parametre i sudjelovanje u (2) su u skladu s tim u skladu s tim.

a slučajni vektor podložan je P-dimenzionalnom normalnom zakonu. i ne ovisi o tome, a zajednička raspodjela elemenata matrice opisana je T.N. Distribucija Wisha Rr. A (vidi), na

U okviru iste sheme, distribucija i trenuci takvih selektivnih karakteristika višedimenzionalne slučajne varijable, kao koeficijenti para, privatne i višestruke korelacije, generalizirane (tj.), Generalizirani statistiku želja (vidi) su istraženi (vidi) . Posebno (vidi), ako se definira kao selektivna kovarijantna matrica, procjena, naime "na neuspjehu", naime:

tada slučajna varijabla Težite kada i slučajne varijable

podređeni f-distribucijama s brojem stupnjeva slobode, odnosno (P, P-P) i (P, P 1 + P 2 -R-1). U odnosu na (7) P 1. i n 2 su količine dva neovisna uzoraka obrasca (1) izvučena iz istog općeg agregata - procjene obrasca (3) i (4) - (5), izgrađenih prema I-TH uzorak, i

Opći selektivni kovarijanci, izgrađen po procjenama i

Višedimenzionalna statistička analiza prirode i strukture međusobnih spojeva Komponenta studirane multidimenzionalne funkcije kombinira koncepte i rezultate koji poslužuju takve metode i modele M. s. kao i višestruki, višedimenzionalni disperzijska analiza i Analiza kovarijane, analiza faktora i glavna metoda komponente, analiza kanališta. Korelacije. Rezultati koji čine sadržaj ovog pododjeljka mogu se uvjetno podijeliti u dvije glavne vrste.

1) Izgradnja najbolje (u određenom smislu) statistiku. Procjene za parametre spomenute modela i analizu njihovih svojstava (tačnost i u vjerojatnoj formulaciji zakona njihove distribucije, pouzdane: regije itd.). Dakle, neka se proučavana višedimenzionalna karakteristika tumači kao vektorski slučaj, podređen p-dimenzionalnoj normalnoj distribuciji i secira se dva sektora - stupac i dimenzija Q i P-Qsenziny. Ovo određuje odgovarajuće raspuštanje matematičkog vektora. Očekivanja, teorijske i selektivne matrice kovarijanata, naime:

Zatim (vidi,) brojila (pod uslovom da drugi zagovornik prihvatio fiksnu vrijednost) također će biti normalan). U ovom slučaju, procjene maksimalnog vjerovanja. Za matrice regresijskih koeficijenata i kovariatsina ovog klasičnog višedimenzionalnog modela višestruke regresije

bit će međusobno neovisne statistike

ovdje je distribucija procjene podređena normalnom zakonu , a procjene P - zakon o želji sa parametrima i (elementi kovarijantne matrice izraženi su u pogledu elemenata matrice).

Glavni rezultati izgradnje procjena parametara i proučavanja njihovih svojstava u modelima analize faktora ", glavne komponente i kanonski. Korelacije se odnose na analizu vjerojatnosti statističke. Svojstva vlastitih (karakterističnih) vrijednosti i vektora različitih selektivnih matrica za kovarijance.

U shemama koje se ne uklapaju u okvir klasike. Normalan model, pa još više u okviru bilo kojeg vjerojatnog modela, glavni rezultati odnose se na izgradnju algoritama (i proučavanja njihovih nekretnina) izračunavanje procjena parametara, što je najbolje u pogledu ne-popo an Egzogeno specificirani funkcionalni (referentni) model.

2) Izgradnja statističkog. Kriteriji za testiranje različitih hipoteza o strukturi međusobnih odnosa u studiju. Kao dio višedimenzionalnog normalnog modela (niz opažanja obrasca (1), to se tumači kao slučajni uzorci iz odgovarajućih višedimenzionalnih normalnih općih agregata), na primjer, statistički. Kriteriji za provjeru sljedećih hipoteza.

I. Hipoteze o ravnopravnosti vektorske matematike. Očekivanja pokazatelja u okviru studije određenog određenog vektora; Provjereno uz pomoć Statistike Wishligh sa zamjenom u formuli (6)

II. Hipoteze o ravnopravnosti vektora matematike. očekivanja u dva općeg agregata (sa istim, ali nepoznatim matricama za kovarijance) zastupljene su dva uzorka; Provjereno sa statistikama (vidi).

III. Hipoteze o ravnopravnosti vektora matematike. očekivanja u nekoliko općih suradnji (sa istim, ali nepoznatim matricama kovarijanata) dostavljene po njihovim uzorcima; Provjereno od strane statistike

u KI-Roy-u postoji i tj. Pdimenzionalno promatranje u uzorku volumena koji predstavlja opći agregat Jr., A i - procjene obrasca (3), izgrađene odvojeno za svaki uzorci i na kombinirani uzorak jačinu

IV. Hipoteze o ekvivalenciji nekoliko normalnih općih agregata koje su podnijeli njihovim uzorcima provjerava statistiku

u Ki-Roy - procjena obrasca (4), izgrađena odvojeno po zapažanjima j- Yexibers, J \u003d 1, 2, ..., k.

V. Hipoteze na međusobnoj neovisnosti nosača lizenness stupca, na K-Rye distribuira, originalni P-dimenzionalni vektor pokazatelja ispitivanja provjerava statistiku

u K-Roy i - selektivnim kovarijantnim matricama obrasca (4) za cijeli vektor i za svoje mjesto x. (i), respektivno.

Višedimenzionalna statistička analiza geometrijske strukture istraženog skupa višedimenzionalnih zapažanja kombinira koncepte i rezultate takvih modela i shema kao diskriminantna analiza Mješavine vjerojatničkih distribucija, analize klastera i taksonomije, višedimenzionalno skaliranje. Koncept udaljenosti (mjere blizine, mjere sličnosti) između analiziranih elemenata je nodalni u svim tim shemama. Istovremeno, kao i stvarni objekti, vrijednosti pokazatelja se bilježe analizirane, na svakom od kojih je tada Geometrich. Slika I-TH Anketirani objekt bit će tačaka u odgovarajućem p-dimenzionalnom prostoru, a sami pokazatelji su tada Geometrich. L-TH pokazatelj bit će tačaka u odgovarajućem N-dimenzionalnom prostoru.

Metode i rezultati diskriminantne analize (vidi ,,) su usmjereni na sljedeći zadatak. Poznato je o postojanju određenog broja općeg agregata, a istraživač ima jedan uzorak iz svake ukupno ("uzorak obuke"). Potrebno je izgraditi najbolje klasificiranje uzoraka u određenom smislu, što vam omogućava da pripisujete novi novi element (zapažanje) u opću populaciju u situaciji u kojoj se istraživač nije poznat unaprijed u koji od agregata ovaj element pripada. Obično, pod pravilom razvrstavanja, redoslijed radnji se razumije: za izračunavanje skalarne funkcije iz ispitivanih pokazatelja pod istražiteljima, u skladu s vrijednostima K-Roya, dodjeljuje se odluka za dodjelu jednog od njih časovi (izgradnja diskriminantne funkcije); u određivanju samih pokazatelja stepenom svoje informativnosti u smislu prave atribucije elemenata na nastavu; Izračunavanjem odgovarajućih verovatnoća pogrešne klasifikacije.

Zadatak analize mješavina raspodjela vjerojatnosti (vidi) najčešće (ali ne uvijek) nastaje u vezi s proučavanjem "geometrijske strukture" ukupnog stanovništva. U ovom slučaju, koncept R-TH homogene klase formaliziran je uz pomoć opće populacije koju neki (u pravilu, variraju) zakon o distribuciji opisuje tako da raspodjela generalnog generalnog seta, uzorak (1 ) izvlače se iz roja, opisano je mješavinom raspodjele vrsta u kojima je PR - priori vjerovatnoća (specifični elementi) r klase u općoj općoj populaciji. Zadatak je "dobar" statistički. procjena (uzorkom) nepoznatih parametara i ponekad i do. To vam posebno omogućava smanjiti zadatak klasifikacijskih elemenata na diskriminacijsku shemu analize, iako u ovom slučaju nije bilo uzoraka treninga.

Metode i rezultati klasterskih analize (klasifikacija, taksonomija, priznavanje slika "bez učitelja", vidi ,,) usmjereni su na rješavanje sljedećeg zadatka. Geometrich. Analizirani skup elemenata daju se koordinatama odgovarajućih točaka (I.E., matrice ..., P) , ili set geometriha. Karakteristike njihove međusobne lokacije, na primjer, matrica parovih udaljenosti. Potrebno je razbiti studirani skup elemenata na relativno male (poznate ili ne) časove tako da su elementi iste klase na maloj udaljenosti jedan od drugog, dok bi različite klase bile prilično međusobno međusobno međusobno međusobno međusobno povezane i bi ne treba podijeliti u tako iste dijelove uklonjene jedna od druge.

Problem višedimenzionalnog skaling (vidi) odnosi se na situaciju kada se ukupnost elemenata postavlja pomoću parova parovih udaljenosti i pripisuje se svakom elementu određenog broja (p) koordinate tako da se koordinata Međusobne udaljenosti između elemenata mjerenih pomoću ovih pomoćnih koordinata, u prosjeku, najmanje su se razlikovale od navedenog. Treba napomenuti da se glavni rezultati i metode klastera i višedimenzionalnih skaliranja obično razvijaju bez ikakve pretpostavke o vjerojatnoj prirodi izvornih podataka.

Primjerena svrha višedimenzionalne statističke analize sastoji se uglavnom od servisiranja sljedećih tri problema.

Problem statističkih studija zavisnosti između analiziranih pokazatelja. Pod pretpostavkom da je studijski skup statistički zabilježili pokazatelji Xbrit-a, zasnovan na smislenom značenju ovih pokazatelja i konačnih ciljeva studije, na Q-MerNenu varijable i (PQ) -Mere-dimenzionalno suspenzija (neovisno) Varijable, može se reći da je problem utvrditi na temelju uzorka (1) takve Q-dimenzionalne vektorske funkcije iz klase dopuštenih rješenja. F, K-Paradium bi dao najbolje, u određenom smislu, aproksimacijom ponašanja pokazatelja pokazatelja. Ovisno o specifičnoj vrsti funkcionalnosti kvalitete aproksimacije i prirode, analizirani pokazatelji dolaze na one ili druge sheme višestruke regresije, disperzije, kovarijantne ili montaže.

Problem klasifikacije elemenata (objekata ili pokazatelja) u ukupnoj (nedlog) formulaciji je da je čitav analizirani skup elemenata, statistički predstavljen u obliku matrice ili matrice, podijeljen u relativno mali broj homogena, u određenom smislu, grupe. Ovisno o prirodi priori informacija i specifičnoj vrsti funkcionalnosti, što određuje kriterij kvalitete klasifikacije, dođite do tih ili drugih shema diskriminantne analize, analize klastera (taksonomija, prepoznavanje slike "), bez nastavnika") .

Problem smanjenja dimenzije u studiju faktorskog prostora i odabir većine informativnih pokazatelja je utvrđivanje takvog skupa relativno malog broja pokazatelja u klasi dozvoljenih transformacija pokazatelja izvora Vrh posebne exopete-ove mjere informativnosti M-dimenzionalnog sustava znakova postiže se na K-ROM-u (vidi). Specifikacija funkcionalnog definiranja mjere autoinformativnosti (tj. Cilj maksimiziranja očuvanja podataka sadržanih u statističkom. Struk (1) u odnosu na same izvornih signala), posebno u različite sheme faktora i glavnih komponenti , na metode ekstremnih znakova znakova. Funkcije koje definiraju mjeru vanjske informativnosti, I.E., čiji je cilj izvlačenje iz (1) maksimalne informacije u odnosu na neki drugi, a ne direktno sadržani u f, indikativnim ili pojavama, dovode do različitih metoda odabira najčešće informativnih pokazatelja u statističkim shemama. Studije zavisnosti i diskriminantne analize.

Glavni matematički instrument za M. s. Ali. Posebne metode teorije sistema linearnih jednadžbi i teoriju matrica (metode za rješavanje jednostavnog i generaliziranog problema eigenvalue i vektora su izrađene; jednostavan tretman i pseudo-formiranje matrica; postupci za dijagonalizaciju matrica itd .) I neke algoritme za optimizaciju (metode koordinatnog porijekla konjugata gradijenata, grana i granica, razne verzije slučajne pretrage i stochastich. Približavanje itd.).

Lit.: Anderson T., uvod u višedimenzionalnu statističku analizu, po. Sa engleskog, M., 1963; Kendall M. J., Stoure A., višedimenzionalna statistička analiza i privremeni redovi, po. Sa engleskog, M., 1976; Boljšev L. N., "Bull. Int. Stat. Inst.", 1969., br. 43, str. 425-41; Wishart .j., "Biometrika", 1928, v. 20a, str. 32-52: Hotelling H., "Ann. Math. Stat.", 1931, v. 2, str. 360-78; [in] Cruskal J. V., "Psyshometrika", 1964, v. 29, str. 1-27; Ivazyan S. A., Bejaev 3. I., . Starovrov O. V., Klasifikacija višedimenzionalnih zapažanja, M., 1974.

S. Awatyan.


Matematička enciklopedija. - M.: Sovjetska enciklopedija. I. M. Vinogradov. 1977-1985.

Katalog tehničkih prevoditelja

Odjeljak matematičke statistike (vidi), posvećen matematici. Metode usmjerene na identificiranje prirode i strukture odnosa između komponenti višedimenzionalne osobine pod proučavanjem (vidi) i namijenjene za dobivanje naučnih. I praktičan. ... ... ...

U širokom smislu, dio matematičke statistike (vidi matematičku statistiku) koji kombinira metode proučavanja statističkih podataka koji se odnose na objekte koji karakteriziraju nekoliko visokokvalitetnih ili kvantitativnih ... ... Sjajna sovjetska enciklopedija

Analiza višedimenzionalna statistička - Odjeljak matematičke statistike, dizajniran za analizu veza između tri i više varijabli. Možete uvjerljivo dodijeliti tri zadatka osnovne klase A.M.S. Ovo je proučavanje strukture veza između varijabli i smanjenja veličine prostora ... Sociologija: enciklopedija

Analiza kovarijane - - skup matematičkih metoda. Statistika koja se odnosi na analizu modela srednje vrijednosti prosječne vrijednosti neke slučajne varijable y iz skupa nehihnih faktora f i istovremeno iz seta kvantitativnih faktora X. S obzirom na y ... ... Ruska sociološka enciklopedija

Sektor Matematika. Statistika, sadržaj RYO je razvoj i proučavanje statističke. Metode rješavanja sljedećeg problema razlike (diskriminacije): Na osnovu rezultata zapažanja, odredite koji od nekoliko mogućih ... ... Matematička enciklopedija, Orlova Irina Valenovna, kraj Natalya Valerievana, Turununaevsky Viktor Borisovich. Knjiga je posvećena višedimenzionalnoj statističkoj analizi (MSA) i organizaciji izračuna na MES-u. Za provođenje višedimenzionalnih metoda statistike, Programiranje se koristi statističkom ...


Višedimenzionalna statistička analiza koristi se u rješavanju sljedećih zadataka:

  • * proučavanje odnosa između znakova;
  • * Klasifikacija predmeta ili znakova navedenih od vektora;
  • * Smanjenje dimenzije znakova znakova.

U ovom slučaju rezultat zapažanja je vektor vrijednosti fiksnog broja kvantitativnih, a ponekad i visokokvalitetnih znakova mjerenih na objektu. Kvantitativna funkcija znak je promatrane jedinice, koji se može izravno izraziti brojem i jedinicom mjerenja. Kvantitativna karakteristika suprotna je kvalitativnom - znak promatrane jedinice, utvrđen zadatkom na jednu od dvije ili više uvjetovanih kategorija (ako postoje točno dvije kategorije, znak se naziva alternativa). Statistička analiza visokokvalitetnih znakova dio je statistika objekata ne-prirode. Kvantitativne karakteristike podijeljene su u znakove izmjerene u intervalnim vagama, odnosima, razlikama, apsolutnim.

I kvalitetan - na znakovima izmjerenim u skali na ime i redni skal. Metode obrade podataka trebaju biti koordinirane sa vagama u kojima se mjere znakovi koji se razmatraju.

Ciljevi proučavanja odnosa između znakova dokaz su dostupnosti komunikacije između znakova i proučavanja ove veze. Da biste dokazali raspoloživost veza između dva slučajna X i Y, koristi se korelacijska analiza. Ako su zajednička distribucija X i Y normalna, statistički zaključci zasnivaju se na selektivnom koeficijentu linearne korelacije, u drugim slučajevima koriste koeficijente Kendalla i koeficijenata koeficijenata Spirteala i za kvalitetne znakove - kriterij chi--a Trg.

Regresijska analiza koristi se za proučavanje funkcionalne ovisnosti kvantitativne funkcije od kvantitativnih znakova x (1), x (2), ..., x (k). Ova ovisnost naziva se regresija ili, nakratko, regresija. Najjednostavniji model vjerojatnosti regresijske analize (u slučaju K \u003d 1) koristi kao početne informacije Komplet parametara opažanja (XI, Yi), I \u003d 1, 2, ..., N, i ima izgled

yi \u003d Axi + B + EI, I \u003d 1, 2, ..., n,

gde je EI - posmatračke greške. Ponekad se pretpostavlja da su EI neovisne slučajne varijable s istim normalnim distribucijom n (0, U2). Budući da se distribucija grešaka za promatranje obično razlikuje od normalnog, preporučljivo je razmotriti regresijski model u neparaptričkoj formulaciji, I.E. Sa proizvoljnim distribucijom EI-ja.

Glavni zadatak regresijske analize je procjena nepoznatih parametara A i B, navodeći linearnu ovisnost Y iz X. Da biste riješili ovaj problem, koristi ga još uvijek K. Gauses 1794. Metoda najmanje kvadrata, I.E. Pronađite procjene nepoznatih parametara modela i B iz uvjeta za minimiziranje zbroja kvadrata

naizmenično a i b.

Disperzijska analiza koristi se za proučavanje utjecaja visokokvalitetnih znakova na kvantitativnu varijablu. Na primjer, neka K uzorci mjernih rezultata kvantitativnog pokazatelja kvalitete proizvoda objavljene na K mašine, I.E. Set brojeva (X1 (J), X2 (J), ..., XN (J)), gdje je J Je li strojni broj, J \u003d 1, 2, ..., K i N - veličina Uzorak. U zajedničkoj formulaciji disperzijskog analize, pretpostavlja se da su rezultati mjerenja neovisni i u svakom uzorku imaju normalnu distribuciju n (m (j), u2) s istom disperzijom.

Provjera homogenosti kvaliteta proizvoda, I.E. Nedostatak utjecaja broja stroja na kvalitetu proizvoda svodi se na provjeru hipoteze

H0: m (1) \u003d m (2) \u003d ... \u003d m (k).

Disperzijska analiza razvila je metode za provjeru takvih hipoteza.

Hipoteza H0 testira se u odnosu na alternativnu hipotezu H1, prema kojoj se barem jedna od tih jednadžbi nije ispunjena. Verifikacija ove hipoteze zasniva se na sljedećem "disperzijskom raspadanju" naznačenom od R.A. Fisher:

gde je S2 selektivna disperzija u kombiniranom uzorku, I.E.

Dakle, prvi termin na desnoj strani formule (7) odražava disperziju intragroh. Konačno, raspršivanje međusobnih grupa,

Opseg statistike aplikacija povezanih s disperzijskim raspadanjem vrste formule (7) naziva se disperzijska analiza. Kao primjer disperzijskog analize, razmatramo test gore spomenute hipoteze H0 pod pretpostavkom da su rezultati mjerenja neovisni i u svakom uzorku imaju normalnu distribuciju n (m (j), u2) s istom disperzijom . Sa pravdom H0, prvi termin na desnoj strani formule (7) podijeljen sa U2 ima distribuciju Chi-kvadrata s K (N-1) stupnjevima slobode, a drugi termin podijeljen u U2 također ima i Distribucija Chi-kvadrata, ali sa (K-1) stupnjevima slobode, a prvi i drugi pojmovi su neovisni kao slučajne varijable. Stoga slučajni iznos

ima distribuciju Fisher-a sa (K-1) stupnjevima slobode brojeva i K (N-1) stupnjeva slobode nazivnika. Hipoteza H0 je prihvaćena ako je f< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Razvijene su neusporedične metode rješavanja klasičnih problema disperzijske analize, posebno testiranje hipoteza H0 H0.

Sljedeća vrsta zadataka višedimenzionalne statističke analize - klasifikacijski zadaci. Podijeljeni su u tri temeljne različite vrste - diskriminantna analiza, analiza klastera, grupiranje zadataka.

Zadatak diskriminantne analize je pronaći pravilo dodjele promatranog objekta jednom od prethodno opisanih nastava. U ovom slučaju, predmeti su opisani u matematičkom modelu pomoću vektora čije koordinate su rezultati promatranja niza znakova iz svakog objekta. Časovi su opisane ili direktno u matematičkim pojmovima ili koristeći uzorke treninga. Uzorak treninga je uzorak, za svaki element koji je naveden u koji se klasa odnosi.

Razmotrite primjer primjene diskriminantne analize za donošenje odluka u tehničkoj dijagnostici. Obavijestite rezultate mjerenja niza parametara proizvoda, potrebno je uspostaviti prisutnost ili odsutnost oštećenja. U ovom slučaju, elementi uzorka obuke su oštećeni otkriveni tokom dodatne studije, na primjer, provedene nakon određenog perioda rada. Diskriminantna analiza omogućava vam da smanjite količinu kontrole, kao i predviđaju buduće ponašanje proizvoda. Diskriminantna analiza slična je regresiji - prva vam omogućava da predviđate vrijednost kvalitativne karakteristike, a druga - kvantitativna. U statistikama objekata ne-nominalne prirode razvijena je matematička šema koja su posebni slučajevi regresije i diskriminatornih testova.

Analiza klastera koristi se kada je na statističkim podacima potrebno podijeliti elemente uzorka na grupu. Štaviše, dva elementa grupe iz iste grupe moraju biti "zatvori" skup vrednosti znakova koji su mjereni u njima, a dva elementa iz različitih grupa trebaju biti "udaljeni" u istom smislu. Za razliku od diskriminantne analize, klase nisu navedene u klasteru analize i formiraju se tokom prerade statističkih podataka. Na primjer, analiza klastera može se primijeniti na podijeljenju ukupnosti čeličnih razreda (ili marki hladnjaka) u grupe sličnih među sobom.

Druga vrsta analize klastera je particija znakova grupa voljenih. Pokazatelj blizine znakova može poslužiti kao selektivan koeficijent korelacije. Svrha klastera karakterizacije znakova može se sastojati od smanjenja broja kontroliranih parametara, što omogućava značajno smanjenje troškova kontrole. Za to, iz grupe usko povezanih značajki (u kojima je koeficijent korelacije blizu 1 do svoje maksimalne vrijednosti) mjeri vrijednost jedne, a preostale vrijednosti izračunavaju se pomoću regresijske analize.

Zadaci grupe odlučuju se kada nastave nisu navedene unaprijed i nisu dužne biti "udaljene" jedan od drugog. Primjer je grupiranje studenata na studijskim grupama. Rešavanje tehnike je problem grupiranja često parametrična serija - moguće veličine grupirane prema elementima parametrijske serije. U literaturi, regulatornim i tehničkim i smjernicama za statistiku aplikacija ponekad se koristi grupiranje rezultata promatranja (na primjer, prilikom izgradnje histograma).

Zadaci klasifikacije rješavaju se ne samo u višedimenzionalnoj statističkoj analizi, već i kada su rezultati zapažanja brojevi, funkcije ili predmeti ne-prirode. Dakle, mnoge algoritmi analize klastera koriste samo udaljenosti između objekata. Stoga se mogu primijeniti i na klasifikaciju objekata ne-prirode, ako su postavljene samo udaljenosti između njih. Najjednostavniji zadatak klasifikacije je sljedeći: dva su neovisna uzoraka, potrebno je odrediti, predstavljaju dvije klase ili jednu. U jednodimenzionalnoj statistici, ovaj se zadatak svodi na provjeru hipoteze homogenosti.

Treći dio višedimenzionalne statističke analize je zadatak smanjene dimenzije (kompresija informacija). Cilj njihovog rješenja je odrediti skup derivata dobivenih transformacijom početnih znakova, takav da je broj derivata znatno manji od broja izvornih znakova, ali sadrže većinu informacija dostupnih u izvornim statističkim podacima . Zadaci smanjenja dimenzija rješavaju se pomoću višedimenzionalnih metoda, glavne komponente, faktorske analize itd. Na primjer, u najjednostavnijem modelu višedimenzionalnih skaliranja, početni podaci su parove udaljenosti između K objekata, a svrha proračuna je za predstavljanje predmeti u bodovima u avionu. To omogućava u doslovnom smislu te riječi da vidi kako se predmeti odnose jedni s drugima. Da bi se postigao ovaj cilj, potreban je da se svaki objekt u skladu sa točkom u avionima tako da parovite udaljenosti Sij između točaka odgovara objektima sa brojevima I i J, moguće je preciznije reproducirati ih u rijeci ovih Predmeti. Prema osnovnoj ideji metode najmanje kvadrata, postoje bodovi u avionu, tako da je veličina

dostigao je svoju najmanju vrijednost. Postoji mnogo drugih postavki za snižavanje dimenzije i vizualizacije podataka.

vjerojatnost Matematička kvaliteta statistike

Socijalni i ekonomski predmeti obično karakterišu dovoljno veliki broj parametara koji formiraju višedimenzionalni vektori, a zadaci proučavanja odnosa između komponenti ovih vektora posebno su važni u ekonomskim i socijalnim studijama, a na osnovu ovih odnosa treba otkriti na osnovu ograničenog broja višedimenzionalnih zapažanja.

Višedimenzionalna statistička analiza naziva se odjeljkom matematičke statistike, koji proučava metode prikupljanja i prerade višedimenzionalnih statističkih podataka, njihove sistematizacije i obrade kako bi se identificirala priroda i strukturu odnosa između komponenti razvrstavanja višedimenzionalne mogućnosti, dobivanje Praktični zaključci.

Imajte na umu da metode prikupljanja podataka mogu varirati. Ako se globalna ekonomija istraže, prirodno je poduzeti kao predmete na kojima se primjenjuju vrijednosti vektora X, zemlje, ako se uči na nacionalnom ekonomskom sistemu, tada prirodno promatra značenja X vektora Isto (od interesa za istraživaču) u raznim poenima na vrijeme.

Statističke metode kao što su višestruke korelacijske i regresijske analize tradicionalno su proučavaju u tečajevima teorije vjerojatnosti i matematičke statistike, disciplina "ekonometrična" posvećena je razmatranju primijenjenih aspekata regresijske analize.

Druge metode za proučavanje višedimenzionalnih općih agregata na temelju statističkih podataka posvećene su ovom priručniku.

Metode smanjenja dimenzije višedimenzionalnog prostora omogućavaju, bez značajnog gubitka informacija, premještanje iz početnog sustava velikog broja promatranih međusobno povezanih faktora na sustav znatno manjih brojeva skrivenih (neupadljivih) faktora koji određuju varijaciju Početni znakovi. Prvo poglavlje opisuje metode komponente i faktorske analize, koristeći objektivno postojeće, ali direktno ne promatrane obrasce uz pomoć glavnih komponenti ili faktora.

Metode višedimenzionalne klasifikacije namijenjene su razdvajanjem skupova objekata (karakterizirano velikim brojem značajki) u klase, u svakoj od kojih treba sadržavati predmete, u određenom smislu, homogenu ili rođaku. Ova klasifikacija na temelju statističkih podataka o vrijednostima karakteristika na objektima može se izvesti metodama klastera i diskriminantne analize razmatrane u drugom poglavlju (višedimenzionalna statistička analiza upotrebom "statistike").

Razvoj računarske opreme i softvera doprinosi širokom uvođenju višedimenzionalnih metoda statističke analize. Paketi aplikativnih programa sa prikladnim korisničkim sučeljem, poput SPSS, statistike, SAS itd., Uklonite poteškoće u primjeni ovih metoda, koji se sastoje od složenosti matematičkog aparata na osnovu linearne algebre i matematičke statistike i glomazna računanja.

Međutim, upotreba programa bez razumijevanja matematičke suštine algoritama korištenih doprinosi razvoju iluzije jednostavnosti upotrebe višedimenzionalnih statističkih metoda, što može dovesti do netačnih ili nerazumnih rezultata. Značajni praktični rezultati mogu se dobiti samo na temelju profesionalnog znanja u predmetnom području, ojačanom posjedom matematičkih metoda i aplikacijskih paketa u kojima se ove metode provode.

Stoga su za svaku od metoda koja se razmatra u ovoj knjizi, daju se glavne teorijske informacije, uključujući algoritme; Raspravlja se o provedbi ovih metoda i algoritma u aplikacijskim paketima. Metode koji se razmatraju ilustriraju primjerima njihove praktične primjene u ekonomiji koristeći SPSS paket.

Priručnik je napisano na temelju iskustva čitanja tečaja "višedimenzionalnih statističkih metoda" studenti Državnog univerziteta u upravljanju. Za detaljnije proučavanje metoda primijenjene višedimenzionalne statističke analize preporučuju se knjige.

Pretpostavlja se da je čitač dobro upoznat sa kursevima linearne algebre (na primjer, u opsegu udžbenika i Priloga udžbenika), teoriju vjerojatnosti i matematičke statistike (na primjer, u količini udžbenika ).