1. Conceptul, tipurile și sarcinile analizei factoriale.
2. Metode de măsurare a influenţei factorilor în analiza deterministă.
Fiecare indicator de performanță depinde de numeroși și variați factori. Cu cât influența factorilor asupra valorii indicatorului efectiv este studiată mai detaliat, cu atât rezultatele analizei și evaluării calității muncii întreprinderilor sunt mai precise. Prin urmare, o problemă metodologică importantă în analiză este studiul și măsurarea influenței factorilor asupra valorii indicatorilor economici studiați.
Sub analiza factorială (diagnostic) se referă la metodologia și studiul și măsurarea sistematică a impactului factorilor asupra mărimii indicatorilor de performanță.
Există următoarele tipuri de analiză factorială:
Determinist (funcțional) și stocastic (corelație);
Direct (deductiv) și invers (inductiv);
cu o singură etapă și cu mai multe etape;
Static si dinamic;
Retrospectivă și prospectivă (prognoză).
Analiza factorială deterministă este o metodologie de studiere a influenței factorilor a căror relație cu indicatorul de performanță este de natură funcțională, i.e. indicatorul efectiv poate fi reprezentat ca un produs, sumă privată sau algebrică de factori.
Analiza factorială stocastică este o metodologie de studiere a influenței factorilor a căror relație cu indicatorul de performanță, spre deosebire de cel funcțional, este incompletă, probabilistă (corelație). Dacă cu o dependență funcțională cu o modificare a argumentului există întotdeauna o modificare corespunzătoare a funcției, atunci cu o relație de corelare, o modificare a argumentului poate da mai multe valori ale creșterii funcției, în funcție de combinația de alţi factori care determină acest indicator. De exemplu, productivitatea muncii la același nivel al raportului capital-muncă poate să nu fie aceeași în întreprinderi diferite. Depinde de combinația optimă a altor factori care afectează acest indicator.
La direct analiza factorială, studiul se realizează într-un mod deductiv - de la general la particular. Înapoi analiza factorială realizează studiul relațiilor cauză-efect prin metoda inducției logice - de la factori privați, individuali, la cei generali.
Analiza factorială poate fi cu o singură etapă și cu mai multe etape. Primul tip este folosit pentru a studia factorii unui singur nivel (o etapă) de subordonare, fără a le detalia în părțile lor constitutive. De exemplu, y = a - b. În analiza factorilor în mai multe etape, factorii a și b sunt detaliați în elementele lor constitutive pentru a studia comportamentul lor. Detalierea factorilor poate fi continuată în continuare. ÎN acest caz se studiază influenţa factorilor de diferite niveluri de subordonare.
Static analiza este utilizată atunci când se studiază influența factorilor asupra indicatorilor de performanță pentru data relevantă. Dinamic analiza este o tehnică de studiere a relațiilor cauză-efect în dinamică.
Retrospectiv analiza factorială studiază motivele modificărilor indicatorilor de performanță pentru perioadele trecute și promitatoare - explorează comportamentul factorilor și indicatorilor de performanță în viitor.
Principalele sarcini ale analizei factoriale sunt următoarele:
selectarea factorilor care determină indicatorii de performanță studiați;
clasificarea și sistematizarea factorilor pentru a asigura posibilitățile unei abordări sistematice;
· definirea formei de dependenţă între factori şi: indicator efectiv;
Modelarea relației dintre indicatorii de performanță și factori;
calculul influenței factorilor și evaluarea rolului fiecăruia dintre ei în modificarea valorii indicatorului efectiv;
· lucrul cu model factorial, i.е. utilizarea sa practică pentru gestionarea proceselor economice.
Selecția factorilor pentru analiza unuia sau altui indicator se realizează pe baza cunoștințelor teoretice și practice dobândite în această industrie. Procedând astfel, de obicei provin de la principiu: cu cât factorii sunt studiați mai complexi, cu atât rezultatele analizei vor fi mai exacte.
Totodată, trebuie avut în vedere că dacă acest complex de factori este considerat ca o sumă mecanică, fără a ține cont de interacțiunea lor, fără a evidenția principalii determinanți, atunci concluziile pot fi eronate. În analiza economică, prin sistematizarea acestora se realizează un studiu interconectat al influenței factorilor asupra mărimii indicatorilor de performanță.
În analiza deterministă pentru a determina amploarea influenței factorilor individuali asupra modificării indicatorilor de performanță se folosesc următoarele metode: substituție în lanț, indice, diferențe absolute, diferențe relative, diviziune proporțională, integrală și logaritmi.
Cele mai simple modele matematice deterministe utilizat pe scară largă în analiza factorială. În practica analizei se folosesc diverse tipuri și tipuri de modele.
Modelele aditive sunt o sumă algebrică de indicatori și au următoarea formă:
Astfel de modele, de exemplu, includ indicatori de cost împreună cu elementele de cost de producție și elementele de cost; un indicator al volumului producției în relația sa cu volumul producției de produse individuale sau volumul producției în divizii individuale.
Modelele multiplicative într-o formă generalizată pot fi reprezentate prin următoarea formulă.
Un exemplu de model multiplicativ este un model de volum de vânzări cu doi factori:
unde H este numărul mediu de angajați;
CB este producția medie pe lucrător.
Modele multiple:
Un exemplu de model multiplu este indicatorul perioadei de rulare a mărfurilor (în zile) - T OB.T:
unde ST este stocul mediu de mărfuri;
RR - volumul vânzărilor pe o zi.
Modelele mixte sunt o combinație a modelelor enumerate mai sus și pot fi descrise folosind expresii speciale:
Exemple de astfel de modele sunt indicatori de cost pentru 1 rublă. produse comercializabile, indicatori de rentabilitate etc.
Cel mai versatil dintre modele deterministe complexe este calea substituție de lanț. Esența sa constă în luarea în considerare consecventă a influenței factorilor individuali asupra rezultatului general. În acest caz, de bază sau indicatori planificați actual și comparați noul rezultat obținut în urma înlocuirii cu cel anterior.
În general, aplicarea metodei de fixare a lanțului poate fi descrisă după cum urmează:
unde a 0 , b 0 , c 0 sunt valorile de bază ale factorilor care influențează indicatorul generalizator y;
a 1 , b 1 , c 1 – valorile reale ale factorilor;
y a , y b - modificări intermediare ale indicatorului rezultat asociate cu o modificare a factorilor a, respectiv b.
Modificarea totală ∆y=y 1 -y 0 este suma modificărilor indicatorului rezultat datorită modificărilor fiecărui factor cu valori fixe ale celorlalți factori:
Metoda diferenței absolute este o modificare a metodei de substituție a lanțului. Modificarea indicatorului efectiv datorată fiecărui factor prin metoda diferenței este definită ca produsul abaterii factorului studiat cu valoarea de bază sau de raportare a altui factor, în funcție de secvența de substituție selectată:
Metoda diferențelor relative este utilizată pentru măsurarea influenței factorilor asupra creșterii indicatorului efectiv în modelele multiplicative și mixte de forma y = (a - c) x s. Este utilizat în cazurile în care datele inițiale conțin abateri relative definite anterior ale indicatorilor factoriali în procente.
Pentru modelele multiplicative de tip y = a x în x c, tehnica de analiză este următoarea:
Găsiți abaterea relativă a fiecărui indicator factor:
Determinați abaterea indicatorului efectiv y datorată fiecărui factor
Metoda substituțiilor de lanț și metoda diferențelor absolute au un dezavantaj comun, a cărui esență este apariția unui rest necompunebil, care se adaugă la valoarea numerică a influenței ultimului factor. În acest sens, amploarea influenței factorilor asupra modificării indicatorului efectiv variază în funcție de locul în care se plasează un sau altul factor în modelul determinist.
Pentru a scăpa de acest neajuns, se utilizează analiza factorială deterministă în modele multiplicative, multiple și mixte integrală metodă. Utilizarea metodei integrale face posibilă obținerea unor rezultate mai precise la calculul influenței factorilor în comparație cu metodele de substituție a lanțului, diferențe absolute și relative și evitarea unei aprecieri ambigue a influenței factorilor deoarece în acest caz rezultatele nu nu depinde de localizarea factorilor în model, ci de o creștere suplimentară a indicatorului efectiv, care se formează din interacțiunea factorilor, descompusi între ei proporțional cu impactul lor izolat asupra indicatorului de performanță.
În unele cazuri, pentru a determina amploarea influenței factorilor asupra creșterii indicatorului efectiv, se poate folosi metoda împărțirea proporțională. De exemplu, randamentul activelor a scăzut cu 5% din cauza creșterii activelor companiei cu 200 de mii de ruble. În același timp, costul active imobilizate a crescut cu 300 de mii de ruble, iar circulant - a scăzut cu 100 de mii de ruble. Deci, datorită primului factor, nivelul de profitabilitate a scăzut, iar datorită celui de-al doilea, a crescut:
∆Р principal = *300 = -7,5%;
∆Р aproximativ \u003d * (-100) \u003d + 2,5%.
index metoda se bazează pe indicatori relativi care exprimă raportul dintre nivelul unui fenomen dat și nivelul acestuia din trecut sau la nivelul unui fenomen similar luat ca bază. Orice indice este calculat prin compararea valorii de raportare cu valoarea de bază.
Problema clasică rezolvată prin metoda indexului este calculul influenței factorilor cantităților și prețului asupra volumului vânzărilor conform schemei:
∑q 1 p 1 - ∑q 0 p 0 = (∑q 1 p 0 - ∑q 0 p 0) + (∑q 1 p 1 - ∑q 1 p 0),
unde ∑q 1 p 0 - ∑q 0 p 0 este influența mărimii;
∑q 1 p 1 - ∑q 1 p 0 – influența prețului.
Atunci indicele volumului vânzărilor (cifra de afaceri), luat în prețurile anilor corespunzători, are forma:
Și indicele comerțului fizic:
Metoda jurnalului folosit pentru a măsura influența factorilor în modelele multiplicative. În acest caz, rezultatele calculului, ca și în cazul integrării, nu depind de locația factorilor în model, iar în comparație cu metoda integrală, se asigură o precizie mai mare a calculelor. Dacă, la integrare, câștigul suplimentar din interacțiunea factorilor este distribuit în mod egal între ei, atunci folosind logaritmul, rezultatul acțiunii combinate a factorilor este distribuit proporțional cu ponderea influenței izolate a fiecărui factor la nivel. a indicatorului efectiv. Acesta este avantajul său, iar dezavantajul este domeniul limitat de aplicare a acestuia.
O persoană își poate recunoaște abilitățile doar încercând să le aplice. (Seneca)
Analiza variatiei
Prezentare generală introductivă
În această secțiune, vom trece în revistă metodele de bază, ipotezele și terminologia ANOVA.
Rețineți că în literatura engleză, analiza varianței este de obicei numită analiza variației. Prin urmare, pentru concizie, mai jos vom folosi uneori termenul ANOVA (Un analiză o f va riation) pentru ANOVA convențională și termenul MANOVA pentru analiza multivariată a varianței. În această secțiune, vom lua în considerare secvențial ideile principale ale analizei varianței ( ANOVA), analiza covarianței ( ANCOVA), analiza multivariată a varianței ( MANOVA) și analiza covarianței multivariate ( MANCOVA). După o scurtă discuție asupra meritelor analizei contrastului și testelor post-hoc, să ne uităm la ipotezele pe care se bazează metodele ANOVA. Spre sfârșitul acestei secțiuni, avantajele abordării multivariate pentru analiza măsurilor repetate sunt explicate față de abordarea tradițională unidimensională.
Idei cheie
Scopul analizei varianței. Scopul principal al analizei varianței este de a studia semnificația diferenței dintre medii. Capitol (Capitolul 8) oferă o scurtă introducere în testarea semnificației statistice. Dacă doar comparați mediile a două eșantioane, analiza varianței va da același rezultat ca și analiza normală. t- criteriu pentru mostre independente (dacă două grupuri independente de obiecte sau observații sunt comparate) sau t- criteriu pentru eșantioanele dependente (dacă două variabile sunt comparate pe același set de obiecte sau observații). Dacă nu sunteți familiarizat cu aceste criterii, vă recomandăm să consultați prezentarea generală introductivă a capitolului (Capitolul 9).
De unde a venit numele Analiza variatiei? Poate părea ciudat că procedura de comparare a mediilor se numește analiză a varianței. De fapt, acest lucru se datorează faptului că atunci când examinăm semnificația statistică a diferenței dintre medii, de fapt analizăm variațiile.
Împărțirea sumei pătratelor
Pentru o dimensiune a eșantionului de n, varianța eșantionului este calculată ca suma abaterilor pătrate de la media eșantionului împărțită la n-1 (dimensiunea eșantionului minus unu). Astfel, pentru o dimensiune fixă a eșantionului n, varianța este o funcție a sumei pătratelor (abaterilor), notate, pentru concizie, SS(din engleză Sum of Squares - Sum of Squares). Analiza varianței se bazează pe împărțirea (sau împărțirea) varianței în părți. Luați în considerare următorul set de date:
Mediile celor două grupuri sunt semnificativ diferite (2 și, respectiv, 6). Suma abaterilor pătrate interior din fiecare grupă este 2. Adunându-le, obținem 4. Dacă acum repetăm aceste calcule excluzând apartenența la grup, adică dacă calculăm SS pe baza mediei combinate a celor două eșantioane, obținem 28. Cu alte cuvinte, varianța (suma pătratelor) bazată pe variabilitatea în interiorul grupului are ca rezultat valori mult mai mici decât atunci când este calculată pe baza variabilității totale (relativ la totalul Rău). Motivul pentru aceasta este, evident, diferența semnificativă dintre medii, iar această diferență între medii explică diferența existentă între sumele pătratelor. Într-adevăr, dacă folosim modulul Analiza variatiei, se vor obtine urmatoarele rezultate:
După cum se poate observa din tabel, suma totală a pătratelor SS=28 împărțit în suma pătratelor datorită intragrup variabilitate ( 2+2=4 ; vezi al doilea rând al tabelului) și suma pătratelor datorită diferenței dintre valorile medii. (28-(2+2)=24; vezi prima linie a tabelului).
SS greșeli șiSS efect. variabilitate intragrup ( SS) se numește de obicei varianță erori. Aceasta înseamnă că de obicei nu poate fi prezis sau explicat atunci când se efectuează un experiment. Pe de altă parte, SS efect(sau variabilitatea intergrupurilor) poate fi explicată prin diferența dintre mediile din grupurile studiate. Cu alte cuvinte, apartenența la un anumit grup explică variabilitate intergrup, deoarece știm că aceste grupuri au mijloace diferite.
Verificarea semnificației. Ideile principale de testare a semnificației statistice sunt discutate în acest capitol Concepte elementare de statistică(Capitolul 8). Același capitol explică motivele pentru care multe teste folosesc raportul dintre varianța explicată și cea inexplicabilă. Un exemplu al acestei utilizări este analiza varianței în sine. Testarea semnificației în ANOVA se bazează pe compararea varianței datorate variației între grupuri (numită efectul pătrat mediu sau DOMNIȘOARĂefectul) și dispersie din cauza răspândirii în interiorul grupului (numită eroare pătrată medie sau DOMNIȘOARĂgreşeală). Dacă ipoteza nulă este adevărată (egalitatea mediilor în cele două populații), atunci ne putem aștepta la o diferență relativ mică în mediile eșantionului din cauza variabilității aleatorii. Prin urmare, sub ipoteza nulă, varianța intra-grup va coincide practic cu varianța totală calculată fără a lua în considerare apartenența la grup. Varianțele rezultate în cadrul grupului pot fi comparate folosind F- test care verifică dacă raportul varianțelor este semnificativ mai mare decât 1. În exemplul de mai sus, F- Testul arată că diferența dintre medii este semnificativă statistic.
Logica de bază a ANOVA.În concluzie, putem spune că scopul analizei varianței este de a testa semnificația statistică a diferenței dintre medii (pentru grupuri sau variabile). Această verificare se efectuează utilizând analiza varianței, adică prin împărțirea variației totale (variația) în părți, dintre care una se datorează erorii aleatorii (adică variabilitatea intragrup), iar a doua este asociată cu diferența de valori medii. Ultima componentă a varianței este apoi utilizată pentru a analiza semnificația statistică a diferenței dintre medii. Dacă această diferență este semnificativă, se respinge ipoteza nulă și se acceptă ipoteza alternativă că există o diferență între medii.
Variabile dependente și independente. Variabilele ale căror valori sunt determinate de măsurători în timpul unui experiment (de exemplu, un scor acordat la un test) sunt numite dependent variabile. Variabilele care pot fi manipulate într-un experiment (de exemplu, metode de antrenament sau alte criterii care vă permit să împărțiți observațiile în grupuri) sunt numite factori sau independent variabile. Aceste concepte sunt descrise mai detaliat în capitol Concepte elementare de statistică(Capitolul 8).
Analiza multivariată a varianței
În exemplul simplu de mai sus, puteți calcula imediat testul t eșantion independent folosind opțiunea de modul corespunzătoare Statistici de bază și tabele. Rezultatele obţinute, desigur, coincid cu rezultatele analizei de varianţă. Cu toate acestea, analiza varianței conține flexibilă și puternică mijloace tehnice, care poate fi folosit pentru studii mult mai complexe.
O mulțime de factori. Lumea este în mod inerent complexă și multidimensională. Situațiile în care un fenomen este complet descris de o variabilă sunt extrem de rare. De exemplu, dacă încercăm să învățăm cum să creștem roșii mari, ar trebui să luăm în considerare factorii legați de structura genetică a plantelor, tipul de sol, lumină, temperatură etc. Astfel, atunci când desfășurați un experiment tipic, trebuie să vă ocupați de un număr mare de factori. Motivul principal pentru care utilizarea ANOVA este de preferat recomparării a două mostre la niveluri diferite de factori t- criteriul este că analiza varianței este mai mult efectivși, pentru mostre mici, mai informativ.
Managementul factorilor. Să presupunem că în exemplul analizei cu două eșantioane discutat mai sus, adăugăm încă un factor, de exemplu, Podea- Gen. Fiecare grup este format din 3 bărbați și 3 femei. Designul acestui experiment poate fi prezentat sub forma unui tabel 2 cu 2:
Experiment. Grupa 1 | Experiment. Grupa 2 | |
---|---|---|
Bărbați | 2 | 6 |
3 | 7 | |
1 | 5 | |
Media | 2 | 6 |
femei | 4 | 8 |
5 | 9 | |
3 | 7 | |
Media | 4 | 8 |
Înainte de a face calculele, puteți vedea că în acest exemplu varianța totală are cel puțin trei surse:
(1) eroare aleatorie (în cadrul varianței grupului),
(2) variabilitatea asociată cu apartenența la grupul experimental și
(3) variabilitatea datorată genului obiectelor observate.
(Rețineți că există o altă sursă posibilă de variabilitate - interacțiunea factorilor, despre care vom discuta mai târziu). Ce se întâmplă dacă nu includem podea –gen ca factor în analiză și calculați obișnuit t-criteriu? Dacă calculăm sume de pătrate, ignorând podea -gen(adică, combinarea obiectelor de sexe diferite într-un singur grup atunci când se calculează varianța în interiorul grupului, obținând în același timp suma pătratelor pentru fiecare grup egală cu SS=10 și suma totală a pătratelor SS= 10+10 = 20), atunci obținem o valoare mai mare a dispersiei intragrup decât într-o analiză mai precisă cu împărțire suplimentară în subgrupe conform semi- gen(în acest caz, mediile intragrup vor fi egale cu 2, iar suma totală a pătratelor intragrup va fi egală cu SS = 2+2+2+2 = 8). Această diferență se datorează faptului că valoarea medie pentru bărbați - masculi mai putin decat media pt femei -Femeie, iar această diferență de medii crește variabilitatea totală în cadrul grupului dacă sexul nu este luat în considerare. Controlul variației erorii crește sensibilitatea (puterea) testului.
Acest exemplu arată un alt avantaj al analizei varianței față de analiza convențională. t-criteriul pentru două probe. Analiza varianței vă permite să studiați fiecare factor controlând valorile altor factori. Acesta, de fapt, este principalul motiv pentru puterea sa statistică mai mare (sunt necesare dimensiuni mai mici ale eșantionului pentru a obține rezultate semnificative). Din acest motiv, analiza varianței, chiar și pe eșantioane mici, oferă rezultate mai semnificative statistic decât una simplă. t- criteriu.
Efecte de interacțiune
Există un alt avantaj al utilizării ANOVA față de analiza convențională. t- criteriu: analiza varianței vă permite să detectați interacţiuneîntre factori și, prin urmare, permite studierea unor modele mai complexe. Pentru a ilustra, luați în considerare un alt exemplu.
Efecte principale, interacțiuni perechi (cu doi factori). Să presupunem că există două grupuri de elevi, iar din punct de vedere psihologic elevii din prima grupă sunt adaptați la îndeplinirea sarcinilor atribuite și sunt mai intenționați decât elevii din a doua grupă, care este formată din elevi mai leneși. Să împărțim fiecare grup aleatoriu în jumătate și să oferim unei jumătăți din fiecare grup o sarcină dificilă, iar celeilalte una ușoară. După aceea, măsurăm cât de mult lucrează elevii la aceste sarcini. Mediile pentru acest studiu (fictiv) sunt prezentate în tabel:
Ce concluzie se poate trage din aceste rezultate? Se poate concluziona că: (1) elevii lucrează mai mult la o sarcină dificilă; (2) elevii motivați muncesc mai mult decât leneșii? Niciuna dintre aceste afirmații nu reflectă esența naturii sistematice a mediilor date în tabel. Analizând rezultatele, mai corect ar fi să spunem că doar elevii motivați lucrează mai mult la sarcini complexe, în timp ce doar elevii leneși lucrează mai mult la sarcini ușoare. Cu alte cuvinte, natura studenților și complexitatea sarcinii interacționând reciproc afectează cantitatea de efort necesar. Acesta este un exemplu interacțiunea perechilorîntre natura elevilor şi complexitatea sarcinii. Rețineți că afirmațiile 1 și 2 descriu efectele principale.
Interacțiunile de ordine superioare.În timp ce interacțiunile în perechi sunt relativ ușor de explicat, interacțiunile de ordin superior sunt mult mai dificil de explicat. Să ne imaginăm că în exemplul considerat mai sus se mai introduce un factor podea -Genși am obținut următorul tabel de medii:
Ce concluzii se pot trage acum din rezultatele obținute? Graficele medii facilitează interpretarea efectelor complexe. Modulul de analiză a varianței vă permite să construiți aceste grafice cu aproape un clic.
Imaginea din graficele de mai jos reprezintă interacțiunea în trei căi studiată.
Privind graficele, putem spune că există o interacțiune între natura și dificultatea testului pentru femei: femeile motivate lucrează mai mult la o sarcină dificilă decât la una ușoară. La bărbați, aceeași interacțiune este inversată. Se poate observa că descrierea interacțiunii dintre factori devine mai confuză.
Mod general de descriere a interacțiunilor.În cazul general, interacțiunea dintre factori este descrisă ca o modificare a unui efect sub influența altuia. În exemplul discutat mai sus, interacțiunea cu doi factori poate fi descrisă ca o modificare a efectului principal al factorului care caracterizează complexitatea sarcinii, sub influența factorului care descrie caracterul elevului. Pentru interacțiunea celor trei factori din paragraful anterior, putem spune că interacțiunea a doi factori (complexitatea sarcinii și caracterul elevului) se modifică sub influența gen – Gen. Dacă se studiază interacțiunea a patru factori, putem spune că interacțiunea a trei factori se modifică sub influența celui de-al patrulea factor, adică. există diferite tipuri de interacțiuni la diferite niveluri ale celui de-al patrulea factor. S-a dovedit că în multe domenii interacțiunea a cinci sau chiar mai mulți factori nu este neobișnuită.
Planuri complexe
Planuri intergrup și intragrup (planuri de remăsurare)
Când se compară două grupuri diferite, se utilizează de obicei t- criteriu pentru mostre independente (din modulul Statistici de bază și tabele). Când două variabile sunt comparate pe același set de obiecte (observații), se utilizează t-criteriul pentru probele dependente. Pentru analiza varianței, este de asemenea important dacă eșantioanele sunt sau nu dependente. Dacă există măsurători repetate ale acelorași variabile (în condiții diferite sau în momente diferite) pentru aceleași obiecte, apoi spun despre prezență factor de măsurători repetate(numit si un factor intragrup deoarece suma pătratelor din cadrul grupului este calculată pentru a-i evalua semnificația). Dacă sunt comparate diferite grupuri de obiecte (de exemplu, bărbați și femei, trei tulpini de bacterii etc.), atunci diferența dintre grupuri este descrisă factor intergrup. Metodele de calcul a criteriilor de semnificație pentru cele două tipuri de factori descriși sunt diferite, dar logica și interpretarea lor generală sunt aceleași.
Planuri inter și intra-grup.În multe cazuri, experimentul necesită includerea atât a unui factor între grupuri, cât și a unui factor de măsuri repetate în proiectare. De exemplu, abilitățile de matematică ale elevilor și studenților sunt măsurate (unde podea -Gen-factor intergrup) la începutul şi la sfârşitul semestrului. Cele două dimensiuni ale abilităților fiecărui elev formează factorul în cadrul grupului (factorul măsuri repetate). Interpretarea principalelor efecte și interacțiuni pentru factorii de măsură între grup și repetate este aceeași și ambele tipuri de factori pot interacționa în mod evident între ele (de exemplu, femeile dobândesc abilități în timpul semestrului, iar bărbații le pierd).
Planuri incomplete (imbricate).
În multe cazuri, efectul de interacțiune poate fi neglijat. Acest lucru se întâmplă fie atunci când se știe că nu există un efect de interacțiune în populație, fie atunci când implementarea completă factorial planul este imposibil. De exemplu, se studiază efectul a patru aditivi de combustibil asupra consumului de combustibil. Sunt selectați patru mașini și patru șoferi. Deplin factorial experimentul presupune ca fiecare combinație: supliment, șofer, mașină, să apară cel puțin o dată. Acest lucru necesită cel puțin 4 x 4 x 4 = 64 de grupuri de testare, ceea ce necesită prea mult timp. În plus, nu există aproape nicio interacțiune între șofer și aditivul de combustibil. Având în vedere acest lucru, puteți utiliza planul pătrate latine, care conține doar 16 grupuri de teste (patru aditivi sunt desemnați prin literele A, B, C și D):
Pătratele latine sunt descrise în majoritatea cărților de design experimental (de exemplu, Hays, 1988; Lindman, 1974; Milliken și Johnson, 1984; Winer, 1962) și nu vor fi discutate în detaliu aici. Rețineți că pătratele latine sunt nundeplin planuri care nu includ toate combinațiile de niveluri de factori. De exemplu, șoferul 1 conduce mașina 1 numai cu aditiv A, șoferul 3 conduce mașina 1 numai cu aditiv C. Nivelurile factorilor aditivi ( A, B, C și D) imbricate în celulele tabelului auto X conducător auto - ca ouăle într-un cuib. Această regulă mnemonică este utilă pentru înțelegerea naturii imbricat sau imbricat planuri. Modul Analiza variatiei oferă modalități simple de analiză a planurilor de acest tip.
Analiza covarianței
Ideea principală
In sectiune Idei cheie S-a discutat pe scurt ideea factorilor de control și cum includerea factorilor aditivi poate reduce suma erorilor pătrate și crește puterea statistică a designului. Toate acestea pot fi extinse la variabile cu un set continuu de valori. Atunci când astfel de variabile continue sunt incluse ca factori în proiectare, ele sunt numite covariate.
Covariate fixe
Să presupunem că comparăm abilitățile matematice ale a două grupuri de elevi care au fost predați din două manuale diferite. Să presupunem, de asemenea, că avem date despre coeficientul de inteligență (IQ) pentru fiecare elev. Putem presupune că IQ-ul este legat de abilitățile de matematică și putem folosi aceste informații. Pentru fiecare dintre cele două grupe de elevi se poate calcula coeficientul de corelație dintre IQ și competențele matematice. Folosind acest coeficient de corelație, este posibil să se facă distincția între ponderea varianței în grupuri explicată prin influența IQ și ponderea inexplicabilă a varianței (vezi, de asemenea, Concepte elementare de statistică(capitolul 8) și Statistici de bază și tabele(Capitolul 9)). Fracțiunea rămasă a varianței este utilizată în analiză ca varianță de eroare. Dacă există o corelație între IQ și abilitățile de matematică, atunci variațiile de eroare pot fi reduse semnificativ. SS/(n-1) .
Efectul covariatelor asupraF- criteriu. F- criteriul evaluează semnificația statistică a diferenței dintre valorile medii din grupuri, în timp ce se calculează raportul varianței intergrup ( DOMNIȘOARĂefect) la varianța erorii ( DOMNIȘOARĂeroare) . Dacă DOMNIȘOARĂeroare scade, de exemplu, când se ia în considerare factorul IQ, valoarea F crește.
O mulțime de covariabile. Raționamentul folosit mai sus pentru o singură covariabilă (IQ) se extinde cu ușurință la mai multe covariate. De exemplu, pe lângă IQ, puteți include măsurarea motivației, gândirea spațială etc. În locul coeficientului de corelație obișnuit, se folosește un coeficient de corelație multiplă.
Când valoareaF -criteria scade. Uneori, introducerea covariatelor în proiectarea experimentului reduce valoarea F- criterii . Acest lucru indică de obicei că covariatele sunt corelate nu numai cu variabila dependentă (cum ar fi abilitățile de matematică), ci și cu factori (cum ar fi diferite manuale). Să presupunem că IQ-ul este măsurat la sfârșitul semestrului, după ce două grupuri de studenți au petrecut aproape un an studiind două manuale diferite. Deși elevii au fost împărțiți în grupuri aleatoriu, se poate dovedi că diferența dintre manuale este atât de mare încât atât IQ-ul, cât și abilitățile de matematică în grupuri diferite va varia foarte mult. În acest caz, covariatele nu numai că reduc varianța erorii, ci și varianța între grupuri. Cu alte cuvinte, după controlul pentru diferența de IQ între grupuri, diferența de aptitudini matematice nu va mai fi semnificativă. Se poate spune altfel. După „eliminarea” influenței IQ-ului, influența manualului asupra dezvoltării abilităților matematice este exclusă din neatenție.
Medii ajustate. Când covariata afectează factorul dintre grupuri, ar trebui să se calculeze medii ajustate, adică astfel de mijloace, care sunt obținute după eliminarea tuturor estimărilor covariatelor.
Interacțiunea dintre covariate și factori. Așa cum interacțiunile dintre factori sunt explorate, interacțiunile dintre covariate și între grupuri de factori pot fi explorate. Să presupunem că unul dintre manuale este potrivit în special pentru studenții inteligenți. Al doilea manual este plictisitor pentru studenții inteligenți, iar același manual este dificil pentru studenții mai puțin inteligenți. Ca urmare, există o corelație pozitivă între IQ și rezultatele învățării în primul grup (elevi mai inteligenți, rezultate mai bune) și o corelație negativă zero sau mică în a doua grupă (cu cât elevul este mai inteligent, cu atât este mai puțin probabil să dobândească abilități matematice). din al doilea manual). În unele studii, această situație este discutată ca exemplu de încălcare a ipotezelor analizei covarianței. Cu toate acestea, deoarece modulul Analiza varianței folosește cele mai comune metode de analiză a covarianței, este posibil, în special, să se evalueze semnificația statistică a interacțiunii dintre factori și covariate.
Covariabile variabile
În timp ce covariabilele fixe sunt discutate destul de des în manuale, covariabilele variabile sunt mult mai puțin frecvent menționate. De obicei, atunci când efectuăm experimente cu măsurători repetate, ne interesează diferențele de măsurători ale acelorași cantități în momente diferite de timp. Și anume, ne interesează semnificația acestor diferențe. Dacă o măsurătoare covariabilă este efectuată în același timp cu măsurătorile variabilei dependente, se poate calcula corelația dintre variabila covariabilă și variabila dependentă.
De exemplu, puteți studia interesul pentru matematică și abilitățile de matematică la începutul și la sfârșitul semestrului. Ar fi interesant de verificat dacă modificările interesului pentru matematică sunt corelate cu modificările aptitudinilor matematice.
Modul Analiza variatieiîn STATISTICI evaluează automat semnificația statistică a modificărilor covariatelor din acele planuri, acolo unde este posibil.
Proiecte multivariate: ANOVA multivariată și analiza covarianței
Planuri intergrupuri
Toate exemplele luate în considerare mai devreme au inclus doar o variabilă dependentă. Când există mai multe variabile dependente în același timp, crește doar complexitatea calculelor, iar conținutul și principiile de bază nu se modifică.
De exemplu, se efectuează un studiu pe două manuale diferite. În același timp, se studiază și succesul studenților în studiul fizicii și matematicii. În acest caz, există două variabile dependente și trebuie să aflați cum două manuale diferite le afectează simultan. Pentru a face acest lucru, puteți utiliza analiza multivariată a varianței (MANOVA). În loc de un unidimensional F criteriu, multidimensional F test (Wilks l-test) bazat pe compararea matricei de covarianță a erorilor și a matricei de covarianță intergrup.
Dacă variabilele dependente sunt corelate între ele, atunci această corelație trebuie luată în considerare la calcularea testului de semnificație. Evident, dacă aceeași măsurătoare se repetă de două ori, atunci nu se poate obține nimic nou în acest caz. Dacă o dimensiune corelată cu aceasta se adaugă unei dimensiuni existente, atunci se obțin informații noi, dar noua variabilă conține informații redundante, care se reflectă în covarianța dintre variabile.
Interpretarea rezultatelor. Dacă criteriul general multivariat este semnificativ, putem concluziona că efectul corespunzător (de exemplu tipul manualului) este semnificativ. Cu toate acestea, se ridică următoarele întrebări. Tipul de manual afectează doar îmbunătățirea abilităților de matematică, numai abilităților fizice sau a ambelor. De fapt, după obținerea unui criteriu multivariat semnificativ, pentru un singur efect principal sau interacțiune, unidimensional F criteriu. Cu alte cuvinte, variabilele dependente care contribuie la semnificația testului multivariat sunt examinate separat.
Planuri cu măsurători repetate
Dacă aptitudinile matematice și fizice ale elevilor sunt măsurate la începutul semestrului și la sfârșitul semestrului, atunci acestea sunt măsurători repetate. Studiul criteriului de semnificație în astfel de planuri este o dezvoltare logică a cazului unidimensional. Rețineți că metodele ANOVA multivariate sunt, de asemenea, utilizate în mod obișnuit pentru a investiga semnificația factorilor de măsuri repetate univariate care au mai mult de două niveluri. Aplicațiile corespunzătoare vor fi discutate mai târziu în această parte.
Însumarea valorilor variabilelor și analiza multivariată a varianței
Chiar și utilizatorii experimentați de ANOVA univariată și multivariată devin adesea confuzi atunci când obțin rezultate diferite atunci când aplică ANOVA multivariată la, de exemplu, trei variabile și când aplică ANOVA univariată la suma acestor trei variabile ca o singură variabilă.
Idee însumare variabile este că fiecare variabilă conține o variabilă adevărată, care este investigată, precum și o eroare de măsurare aleatorie. Prin urmare, atunci când se face media valorilor variabilelor, eroarea de măsurare va fi mai aproape de 0 pentru toate măsurătorile, iar valorile medii vor fi mai fiabile. De fapt, în acest caz, aplicarea ANOVA la suma variabilelor este rezonabilă și o tehnică puternică. Cu toate acestea, dacă variabilele dependente sunt de natură multivariată, însumarea valorilor variabilelor este inadecvată.
De exemplu, să fie variabilele dependente formate din patru măsuri succes în societate. Fiecare indicator caracterizează o latură complet independentă a activității umane (de exemplu, succesul profesional, succesul în afaceri, bunăstarea familiei etc.). Adunarea acestor variabile este ca și cum ați adăuga un măr și o portocală. Suma acestor variabile nu ar fi o măsură univariată adecvată. Prin urmare, astfel de date trebuie tratate ca indicatori multidimensionali în analiza multivariată a varianței.
Analiza contrastului și teste post-hoc
De ce se compară seturi individuale de medii?
De obicei, ipotezele despre datele experimentale sunt formulate nu doar în termeni de efecte sau interacțiuni principale. Un exemplu este următoarea ipoteză: un anumit manual îmbunătățește abilitățile matematice doar la elevii de sex masculin, în timp ce un alt manual este aproximativ la fel de eficient pentru ambele sexe, dar totuși mai puțin eficient pentru bărbați. Se poate prezice că performanța manuală interacționează cu sexul elevilor. Cu toate acestea, această predicție se aplică și natură interacțiuni. O diferență semnificativă între sexe este de așteptat pentru studenții dintr-o carte și rezultate practic independente de gen pentru studenții din cealaltă carte. Acest tip de ipoteză este de obicei explorat folosind analiza contrastului.
Analiza contrastului
Pe scurt, analiza contrastului ne permite să evaluăm semnificația statistică a unor combinații liniare de efecte complexe. Analiza contrastului este elementul principal și indispensabil al oricărui plan ANOVA complex. Modul Analiza variatiei are o varietate destul de mare de capabilități de analiză a contrastului care vă permit să selectați și să analizați orice tip de comparație de medii.
a posteriori comparatii
Uneori, ca urmare a procesării unui experiment, se descoperă un efect neașteptat. Deși în cele mai multe cazuri un cercetător creativ va putea explica orice rezultat, acest lucru nu oferă oportunități de analiză ulterioară și de obținere a estimărilor pentru prognoză. Această problemă este una dintre cele pentru care criterii post-hoc, adică criterii care nu folosesc a priori ipoteze. Pentru a ilustra, luați în considerare următorul experiment. Să presupunem că 100 de cărți conțin numere de la 1 la 10. După ce am introdus toate aceste cărți în antet, selectăm aleatoriu de 20 de ori 5 cărți și calculăm valoarea medie pentru fiecare probă (media numerelor scrise pe cărți). Ne putem aștepta să existe două eșantioane ale căror medii sunt semnificativ diferite? Acest lucru este foarte plauzibil! Alegând două eșantioane cu media maximă și minimă, se poate obține o diferență de medie foarte diferită de diferența de medii, de exemplu, a primelor două eșantioane. Această diferență poate fi investigată, de exemplu, folosind analiza contrastului. Fără a intra în detalii, există mai multe așa-zise a posteriori criterii care se bazează exact pe primul scenariu (luând medii extreme din 20 de eșantioane), adică aceste criterii se bazează pe alegerea celor mai diferite mijloace pentru a compara toate mijloacele din proiect. Aceste criterii sunt aplicate pentru a nu obține un efect artificial pur întâmplător, de exemplu, pentru a găsi o diferență semnificativă între mijloace atunci când nu există. Modul Analiza variatiei oferă o gamă largă de astfel de criterii. Când se întâlnesc rezultate neașteptate într-un experiment care implică mai multe grupuri, a posteriori proceduri de examinare a semnificaţiei statistice a rezultatelor obţinute.
Suma pătratelor de tip I, II, III și IV
Regresia multivariată și analiza varianței
Există o relație strânsă între metoda regresiei multivariate și analiza varianței (analiza variațiilor). În ambele metode, este studiat un model liniar. Pe scurt, aproape toate modelele experimentale pot fi explorate folosind regresia multivariată. Luați în considerare următorul plan simplu încrucișat 2 x 2.
DV | A | B | AxB |
---|---|---|---|
3 | 1 | 1 | 1 |
4 | 1 | 1 | 1 |
4 | 1 | -1 | -1 |
5 | 1 | -1 | -1 |
6 | -1 | 1 | -1 |
6 | -1 | 1 | -1 |
3 | -1 | -1 | 1 |
2 | -1 | -1 | 1 |
Coloanele A și B conțin coduri care caracterizează nivelurile factorilor A și B, coloana AxB conține produsul a două coloane A și B. Putem analiza aceste date folosind regresia multivariată. Variabil DV definită ca o variabilă dependentă, variabile din A inainte de AxB ca variabile independente. Studiul semnificației pentru coeficienții de regresie va coincide cu calculele din analiza varianței semnificației principalelor efecte ale factorilor. AȘi Bși efect de interacțiune AxB.
Planuri dezechilibrate și echilibrate
Când se calculează matricea de corelație pentru toate variabilele, de exemplu, pentru datele prezentate mai sus, se poate observa că principalele efecte ale factorilor AȘi Bși efect de interacțiune AxB necorelat. Această proprietate a efectelor se mai numește și ortogonalitate. Ei spun că efectele AȘi B - ortogonală sau independent unul de altul. Dacă toate efectele din plan sunt ortogonale între ele, ca în exemplul de mai sus, atunci se spune că planul este echilibrat.
Planurile echilibrate au „proprietatea bună”. Calculele în analiza unor astfel de planuri sunt foarte simple. Toate calculele sunt reduse la calcularea corelației dintre efecte și variabilele dependente. Deoarece efectele sunt ortogonale, corelații parțiale (ca în totalitate multidimensionale regresiile) nu sunt calculate. Cu toate acestea, în viata reala planurile nu sunt întotdeauna echilibrate.
Luați în considerare date reale cu un număr inegal de observații în celule.
Factorul A | Factorul B | |
---|---|---|
B1 | B2 | |
A1 | 3 | 4, 5 |
A2 | 6, 6, 7 | 2 |
Dacă codificăm aceste date ca mai sus și calculăm matricea de corelație pentru toate variabilele, atunci se dovedește că factorii de proiectare sunt corelați între ei. Factorii din plan nu sunt acum ortogonali și astfel de planuri sunt numite dezechilibrat. Rețineți că în acest exemplu, corelația dintre factori este în întregime legată de diferența de frecvențe de 1 și -1 în coloanele matricei de date. Cu alte cuvinte, proiectele experimentale cu volume celulare inegale (mai precis, volume disproporționate) vor fi dezechilibrate, ceea ce înseamnă că principalele efecte și interacțiuni se vor amesteca. În acest caz, pentru a calcula semnificația statistică a efectelor, trebuie să calculați complet regresia multivariată. Există mai multe strategii aici.
Suma pătratelor de tip I, II, III și IV
Suma pătratelor tipeuȘiIII. Pentru a studia semnificația fiecărui factor într-un model multivariat, se poate calcula corelația parțială a fiecărui factor, cu condiția ca toți ceilalți factori să fie deja luați în considerare în model. De asemenea, puteți introduce factori în model pas cu pas, reparând toți factorii deja introduși în model și ignorând toți ceilalți factori. În general, aceasta este diferența dintre tip IIIȘi tipeu sume de pătrate (această terminologie a fost introdusă în SAS, vezi de exemplu SAS, 1982; o discuție detaliată poate fi găsită și în Searle, 1987, p. 461; Woodward, Bonett și Brecht, 1990, p. 216; sau Milliken și Johnson, 1984, p. 138).
Suma pătratelor tipII. Următoarea strategie de formare a modelului „intermediar” este: să controleze toate efectele principale în studiul semnificației unui singur efect principal; în controlul tuturor efectelor principale și al tuturor interacțiunilor perechi, atunci când se examinează semnificația unei singure interacțiuni perechi; în controlul tuturor efectelor principale ale tuturor interacțiunilor perechi și ale tuturor interacțiunilor a trei factori; în studiul unei interacțiuni separate a trei factori etc. Se numesc sumele pătratelor pentru efectele calculate în acest fel tipII sume de pătrate. Asa de, tipII sumele de pătrate controlează toate efectele de același ordin și mai jos, ignorând toate efectele de un ordin superior.
Suma pătratelor tipIV. În cele din urmă, pentru unele planuri speciale cu celule lipsă (planuri incomplete), este posibil să se calculeze așa-numitele tip IV sume de pătrate. Această metodă va fi discutată mai târziu în legătură cu planuri incomplete (planuri cu celule lipsă).
Interpretarea sumei pătratelor tipurilor I, II și III
suma patratelor tipIII cel mai usor de interpretat. Amintiți-vă că sumele pătratelor tipIII examinați efectele după ce ați controlat toate celelalte efecte. De exemplu, după găsirea unui semn statistic semnificativ tipIII efect pentru factor Aîn modul Analiza variatiei, putem spune că există un singur efect semnificativ al factorului A, după introducerea tuturor celorlalte efecte (factori) și interpretați acest efect în consecință. Probabil că în 99% din toate aplicațiile de analiză a varianței, acest tip de criteriu este de interes pentru cercetător. Acest tip de sumă de pătrate este de obicei calculată în modul Analiza variatiei implicit, indiferent dacă opțiunea este selectată Abordarea regresiei sau nu (abordări standard adoptate în modul Analiza variatiei discutate mai jos).
Efecte semnificative obținute folosind sume de pătrate tip sau tipII sumele de pătrate nu sunt atât de ușor de interpretat. Ele sunt cel mai bine interpretate în contextul regresiei multivariate trepte. Dacă se utilizează suma pătratelor tipeu efectul principal al factorului B a fost semnificativ (după includerea factorului A în model, dar înainte de adăugarea interacțiunii dintre A și B), se poate concluziona că există un efect principal semnificativ al factorului B, cu condiția să nu existe interacţiunea dintre factorii A şi B. (Dacă la utilizarea criteriului tipIII, factorul B s-a dovedit a fi de asemenea semnificativ, atunci putem concluziona că există un efect principal semnificativ al factorului B, după introducerea tuturor celorlalți factori și a interacțiunilor acestora în model).
În ceea ce priveşte mijloacele marginale ale ipotezei tipeuȘi tipII de obicei nu au o interpretare simplă. În aceste cazuri, se spune că nu se poate interpreta semnificația efectelor luând în considerare doar mijloacele marginale. mai degrabă prezentate p valorile medii sunt legate de o ipoteză complexă care combină mediile și dimensiunea eșantionului. De exemplu, tipII ipotezele pentru factorul A din exemplul simplu de proiectare 2 x 2 discutat mai devreme ar fi (vezi Woodward, Bonett și Brecht, 1990, p. 219):
nij- numărul de observații într-o celulă
uij- valoarea medie într-o celulă
n. j- medie marginală
Fără a intra în detalii (pentru mai multe detalii vezi Milliken și Johnson, 1984, capitolul 10), este clar că acestea nu sunt simple ipoteze și în cele mai multe cazuri nici una dintre ele nu prezintă un interes deosebit pentru cercetător. Cu toate acestea, există cazuri în care ipotezele tipeu poate fi de interes.
Abordarea implicită de calcul în modul Analiza variatiei
Implicit dacă opțiunea nu este bifată Abordarea regresiei, modul Analiza variatiei utilizări modelul mediu celular. Este caracteristic acestui model faptul că sumele pătratelor pentru diferite efecte sunt calculate pentru combinații liniare de medii celulare. Într-un experiment factorial complet, rezultă sume de pătrate care sunt aceleași cu sumele de pătrate discutate mai devreme ca tip III. Totuși, în opțiune Comparații programate(La fereastră Analiza rezultatelor varianței), utilizatorul poate formula ipoteze despre orice combinație liniară de mijloace celulare ponderate sau neponderate. Astfel, utilizatorul poate testa nu numai ipoteze tipIII, dar ipoteze de orice tip (inclusiv tipIV). Această abordare generală este deosebit de utilă atunci când se examinează proiecte cu celule lipsă (așa-numitele modele incomplete).
Pentru proiectele factoriale complete, această abordare este utilă și atunci când se dorește să se analizeze mediile marginale ponderate. De exemplu, să presupunem că în designul simplu 2 x 2 considerat mai devreme, dorim să comparăm ponderea (în termeni de niveluri de factori) B) medii marginale pentru factorul A. Acest lucru este util atunci când distribuția observațiilor pe celule nu a fost pregătită de experimentator, ci a fost construită aleatoriu, iar această aleatorie se reflectă în distribuția numărului de observații pe niveluri ale factorului B în agregat. .
De exemplu, există un factor - vârsta văduvelor. Un posibil eșantion de respondenți este împărțit în două grupe: mai tineri de 40 de ani și mai mari de 40 de ani (factorul B). Al doilea factor (factorul A) din plan este dacă văduvele au primit sau nu sprijin social de la o agenție (în timp ce unele văduve au fost selectate aleatoriu, altele au servit drept martori). În acest caz, distribuția de vârstă a văduvelor din eșantion reflectă distribuția efectivă de vârstă a văduvelor în populație. Evaluarea eficacității grupului de sprijin social pentru văduve toate varstele va corespunde mediei ponderate pentru cele două grupe de vârstă (cu ponderi corespunzătoare numărului de observații din grup).
Comparații programate
Rețineți că suma raporturilor de contrast introduse nu este neapărat egală cu 0 (zero). În schimb, programul va face automat ajustări, astfel încât ipotezele corespunzătoare să nu se amestece cu media generală.
Pentru a ilustra acest lucru, să ne întoarcem la planul simplu 2 x 2 discutat mai devreme. Amintiți-vă că numărul de celule din acest design dezechilibrat este -1, 2, 3 și 1. Să presupunem că vrem să comparăm mediile marginale ponderate pentru factorul A (ponderat cu frecvența nivelurilor factorului B). Puteți introduce rapoarte de contrast:
Rețineți că acești coeficienți nu se adună până la 0. Programul va seta coeficienții astfel încât să adună până la 0, menținând în același timp valorile relative, adică:
1/3 2/3 -3/4 -1/4
Aceste contraste vor compara mediile ponderate pentru factorul A.
Ipotezele despre mijlocul principal. Ipoteza că media principală neponderată este 0 poate fi explorată folosind coeficienți:
Ipoteza că media principală ponderată este 0 este testată cu:
În niciun caz programul nu corectează rapoartele de contrast.
Analiza planurilor cu celule lipsă (planuri incomplete)
Proiectele factoriale care conțin celule goale (prelucrarea combinațiilor de celule în care nu există observații) se numesc incomplete. În astfel de proiecte, unii factori nu sunt de obicei ortogonali și unele interacțiuni nu pot fi calculate. În general, nu există o metodă mai bună de a analiza astfel de planuri.
Abordarea regresiei
În unele programe mai vechi care se bazează pe analiza modelelor ANOVA folosind regresia multivariată, factorii din proiectele incomplete sunt stabiliți implicit în mod obișnuit (ca și cum planul ar fi complet). O analiză de regresie multivariată este apoi efectuată pentru acești factori codificați inactiv. Din păcate, această metodă duce la rezultate foarte greu, dacă nu imposibil, de interpretat deoarece nu este clar cum contribuie fiecare efect la combinarea liniară a mijloacelor. Luați în considerare următorul exemplu simplu.
Factorul A | Factorul B | |
---|---|---|
B1 | B2 | |
A1 | 3 | 4, 5 |
A2 | 6, 6, 7 | ratat |
Dacă regresia multivariată a formei Variabila dependenta = Constanta + Factorul A + Factorul B, atunci ipoteza despre semnificația factorilor A și B în ceea ce privește combinațiile liniare de medii arată astfel:
Factorul A: Celula A1,B1 = Celula A2,B1
Factorul B: Celula A1,B1 = Celula A1,B2
Acest caz este simplu. În mai mult planuri complicate este imposibil să se determine efectiv ce anume va fi investigat.
Celulele medii, abordarea analizei varianței , ipoteze de tip IV
O abordare care este recomandată în literatura de specialitate și care pare a fi de preferat este studiul semnificativ (în ceea ce privește sarcinile de cercetare) a priori ipoteze despre mijloacele observate în celulele planului. O discuție detaliată a acestei abordări poate fi găsită în Dodge (1985), Heiberger (1989), Milliken și Johnson (1984), Searle (1987) sau Woodward, Bonett și Brecht (1990). Sumele pătratelor asociate cu ipoteze despre o combinație liniară de medii în proiecte incomplete, care investighează estimări ale unei părți din efecte, sunt numite și sume de pătrate. IV.
Generarea automată a ipotezelor de tipIV. Atunci când modelele multivariate au un model de celule complex lipsă, este de dorit să se definească ipoteze ortogonale (independente) a căror investigare este echivalentă cu investigarea efectelor sau interacțiunilor principale. Strategiile algoritmice (computaționale) (bazate pe matricea de proiectare pseudo-inversă) au fost dezvoltate pentru a genera ponderi adecvate pentru astfel de comparații. Din păcate, ipotezele finale nu sunt definite în mod unic. Desigur, ele depind de ordinea în care au fost definite efectele și rareori sunt ușor de interpretat. Prin urmare, se recomandă să se studieze cu atenție natura celulelor lipsă, apoi să se formuleze ipoteze tipIV, care sunt cele mai relevante pentru obiectivele studiului. Apoi explorați aceste ipoteze folosind opțiunea Comparații programate La fereastră rezultate. Cel mai simplu mod de a specifica comparații în acest caz este de a solicita introducerea unui vector de contraste pentru toți factorii împreună La fereastră Comparații programate. După apelarea casetei de dialog Comparații programate vor fi afișate toate grupurile planului curent și cele care sunt omise vor fi marcate.
Celulele ignorate și verificarea efectului specific
Există mai multe tipuri de planuri în care localizarea celulelor lipsă nu este aleatorie, ci atent planificată, ceea ce permite o analiză simplă a principalelor efecte fără a afecta alte efecte. De exemplu, atunci când numărul necesar de celule dintr-un plan nu este disponibil, planurile sunt adesea folosite. pătrate latine pentru a estima efectele principale ale mai multor factori cu un număr mare de niveluri. De exemplu, un design factorial 4 x 4 x 4 x 4 necesită 256 de celule. În același timp, puteți utiliza Piața greco-latină pentru a estima efectele principale, având doar 16 celule în plan (cap. Planificarea experimentului, Volumul IV, conține o descriere detaliată a unor astfel de planuri). Proiectele incomplete în care efectele principale (și unele interacțiuni) pot fi estimate folosind combinații liniare simple de medii sunt numite planuri incomplete echilibrate.
În proiectele echilibrate, metoda standard (implicit) de generare a contrastelor (greutăților) pentru efectele și interacțiunile principale va produce apoi o analiză a tabelului de varianță în care sumele pătratelor pentru efectele respective nu se amestecă între ele. Opțiune Efecte specifice fereastră rezultate va genera contraste lipsă scriind zero în celulele planului lipsă. Imediat după ce se solicită opțiunea Efecte specifice pentru un utilizator care studiază o ipoteză, apare un tabel de rezultate cu ponderile reale. Rețineți că într-un proiect echilibrat, sumele pătratelor efectelor respective sunt calculate numai dacă acele efecte sunt ortogonale (independente) față de toate celelalte efecte și interacțiuni principale. În caz contrar, utilizați opțiunea Comparații programate pentru a explora comparații semnificative între mijloace.
Celulele lipsă și efectele/membrii de eroare combinate
Dacă opțiunea Abordarea regresieiîn panoul de lansare al modulului Analiza variatiei nu este selectat, modelul mediilor celulelor va fi utilizat la calcularea sumei pătratelor pentru efecte (setare implicită). Dacă designul nu este echilibrat, atunci când combinați efecte non-ortogonale (vezi discuția de mai sus a opțiunii Celulele lipsă și efect specific) se poate obține o sumă de pătrate constând din componente neortogonale (sau suprapuse). Rezultatele obţinute în acest fel nu sunt de obicei interpretabile. Prin urmare, trebuie să fiți foarte atenți atunci când alegeți și implementați proiecte experimentale incomplete complexe.
Există multe cărți cu discuții detaliate despre diferite tipuri de planuri. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken și Johnson, 1984; Searle, 1987; Woodward și Bonett, 1990), dar acest tip de informații se află în afara domeniului de aplicare al acestui manual. Cu toate acestea, o analiză a diferitelor tipuri de planuri va fi demonstrată mai târziu în această secțiune.
Ipoteze și efecte de încălcare a ipotezelor
Abatere de la ipoteza distribuțiilor normale
Să presupunem că variabila dependentă este măsurată pe o scară numerică. Să presupunem, de asemenea, că variabila dependentă are o distribuție normală în cadrul fiecărui grup. Analiza variatiei conține o gamă largă de grafice și statistici pentru a susține această ipoteză.
Efecte de încălcare. Deloc F criteriul este foarte rezistent la abaterea de la normalitate (vezi Lindman, 1974 pentru rezultate detaliate). Dacă kurtoza este mai mare decât 0, atunci valoarea statisticii F poate deveni foarte mic. Ipoteza nulă este acceptată, deși poate să nu fie adevărată. Situația este inversată atunci când kurtoza este mai mică de 0. Neregularea distribuției are de obicei un efect redus asupra F statistici. Dacă numărul de observații dintr-o celulă este suficient de mare, atunci abaterea de la normalitate nu contează prea mult din cauza teorema limitei centrale, conform căruia, distribuția valorii medii este apropiată de normal, indiferent de distribuția inițială. Discuție detaliată despre sustenabilitate F statisticile pot fi găsite în Box și Anderson (1955) sau Lindman (1974).
Omogenitatea dispersiei
Ipoteze. Se presupune că variațiile diferitelor grupuri ale planului sunt aceleași. Această ipoteză se numește ipoteză omogenitatea dispersiei. Reamintim că la începutul acestei secțiuni, atunci când descriem calculul sumei erorilor pătrate, am efectuat însumarea în cadrul fiecărui grup. Dacă variațiile din două grupuri diferă una de cealaltă, atunci adăugarea lor nu este foarte naturală și nu oferă o estimare a variației totale în cadrul grupului (deoarece în acest caz nu există nicio variație generală). Modul Analiza de dispersie -ANOVA/MANOVA conține un set mare de criterii statistice pentru detectarea abaterii de la ipotezele de omogenitate a varianței.
Efecte de încălcare. Lindman (1974, p. 33) arată că F criteriul este destul de stabil în ceea ce privește încălcarea ipotezelor de omogenitate a varianței ( eterogenitate dispersie, vezi și Box, 1954a, 1954b; Hsu, 1938).
Caz special: corelarea mediilor și varianțelor. Sunt momente când F statisticile pot induce în eroare. Acest lucru se întâmplă atunci când valorile medii din celulele de proiectare sunt corelate cu varianța. Modul Analiza variatiei vă permite să construiți diagrame de dispersie ale varianței sau abaterii standard față de mijloacele de detectare a unei astfel de corelații. Motivul pentru care o astfel de corelație este periculoasă este următorul. Să ne imaginăm că în plan sunt 8 celule, dintre care 7 au aproape aceeași medie, iar într-o celulă media este mult mai mare decât restul. Apoi F testul poate detecta un efect semnificativ statistic. Dar să presupunem că într-o celulă cu o valoare medie mare și varianța este mult mai mare decât celelalte, i.e. media și varianța din celule sunt dependente (cu cât media este mai mare, cu atât varianța este mai mare). În acest caz, media mare nu este de încredere, deoarece poate fi cauzată de o variație mare a datelor. dar F statistici bazate pe Unit varianța în interiorul celulelor va capta o medie mare, deși criteriile bazate pe variația în fiecare celulă nu vor considera toate diferențele dintre medii ca fiind semnificative.
Această natură a datelor (medie mare și varianță mare) este adesea întâlnită atunci când există observații aberante. Una sau două observații aberante modifică puternic media și măresc foarte mult varianța.
Omogenitatea varianței și covarianței
Ipoteze.În proiectele multivariate, cu măsuri dependente multivariate, se aplică și ipotezele de omogenitate a varianței descrise mai devreme. Cu toate acestea, deoarece există variabile dependente multivariate, este de asemenea necesar ca corelațiile lor încrucișate (covarianțele) să fie uniforme în toate celulele planului. Modul Analiza variatiei oferă modalități diferite de a testa aceste ipoteze.
Efecte de încălcare. Analog multidimensional F- criteriu - λ-testul lui Wilks. Nu se cunosc multe despre stabilitatea (robustețea) testului Wilks λ în ceea ce privește încălcarea ipotezelor de mai sus. Cu toate acestea, din moment ce interpretarea rezultatelor modulului Analiza variatiei se bazează de obicei pe semnificația efectelor univariate (după stabilirea semnificației criteriului comun), discuția despre robustețe vizează în principal analiza univariată a varianței. Prin urmare, semnificația efectelor unidimensionale ar trebui examinată cu atenție.
Caz special: analiza covarianței.Încălcări deosebit de severe ale omogenității varianței/covarianței pot apărea atunci când covariatele sunt incluse în proiect. În special, dacă corelația dintre covariate și măsurile dependente este diferită în diferite celule ale designului, poate urma interpretarea greșită a rezultatelor. Trebuie amintit că în analiza covarianței, în esență, se efectuează o analiză de regresie în cadrul fiecărei celule pentru a izola acea parte a varianței care corespunde covariatei. Ipoteza de omogenitate a varianței/covarianței presupune că această analiză de regresie este efectuată sub următoarea constrângere: toate ecuațiile de regresie (pantele) pentru toate celulele sunt aceleași. Dacă acest lucru nu este intenționat, atunci pot apărea erori mari. Modul Analiza variatiei are mai multe criterii speciale pentru a testa această ipoteză. Poate fi recomandabil să folosiți aceste criterii pentru a vă asigura că ecuațiile de regresie pentru diferite celule sunt aproximativ aceleași.
Sfericitatea și simetria complexă: motive pentru utilizarea unei abordări cu măsuri repetate multivariate în analiza varianței
În proiectele care conțin factori de măsură repetate cu mai mult de două niveluri, aplicarea analizei univariate a varianței necesită ipoteze suplimentare: ipoteze de simetrie complexe și ipoteze de sfericitate. Aceste ipoteze sunt rareori îndeplinite (vezi mai jos). Prin urmare, în ultimii ani, analiza multivariată a varianței a câștigat popularitate în astfel de planuri (ambele abordări sunt combinate în modul Analiza variatiei).
Ipoteza de simetrie complexă Ipoteza de simetrie complexă este că varianțele (total în interiorul grupului) și covarianțele (pe grup) pentru diferite măsuri repetate sunt uniforme (aceleași). Aceasta este o condiție suficientă pentru ca un test F cu măsuri repetate univariate să fie valid (adică, valorile F raportate sunt, în medie, în concordanță cu distribuția F). Cu toate acestea, în acest caz, această condiție nu este necesară.
Asumarea sfericității. Asumarea sfericității este o condiție necesară și suficientă pentru ca criteriul F să fie justificat. Constă în faptul că în cadrul grupelor toate observațiile sunt independente și distribuite egal. Natura acestor ipoteze, precum și impactul încălcărilor lor, nu sunt de obicei bine descrise în cărțile despre analiza varianței - aceasta va fi descrisă în paragrafele următoare. De asemenea, se va arăta că rezultatele abordării univariate pot diferi de rezultatele abordării multivariate și se va explica ce înseamnă aceasta.
Nevoia de independență a ipotezelor. Modul general de a analiza datele în analiza varianței este potrivirea modelului. Dacă, în raport cu modelul corespunzător datelor, există unele a priori ipotezele, apoi varianța este împărțită pentru a testa aceste ipoteze (criterii pentru efectele principale, interacțiuni). Din punct de vedere computațional, această abordare generează un set de contraste (set de comparații de medii în proiectare). Totuși, dacă contrastele nu sunt independente unele de altele, împărțirea variațiilor devine lipsită de sens. De exemplu, dacă două contraste AȘi B sunt identice și partea corespunzătoare este selectată din varianță, apoi aceeași parte este selectată de două ori. De exemplu, este o prostie și inutil să evidențiem două ipoteze: „media din celula 1 este mai mare decât media din celula 2” și „media din celula 1 este mai mare decât media din celula 2”. Deci ipotezele trebuie să fie independente sau ortogonale.
Ipoteze independente în măsurători repetate. Algoritm general implementat în modul Analiza variatiei, va încerca să genereze contraste independente (ortogonale) pentru fiecare efect. Pentru factorul măsuri repetate, aceste contraste dau naștere la multe ipoteze despre diferențeîntre nivelurile factorului considerat. Cu toate acestea, dacă aceste diferențe sunt corelate în cadrul grupurilor, atunci contrastele rezultate nu mai sunt independente. De exemplu, în formarea în care cursanții sunt măsurați de trei ori într-un semestru, se poate întâmpla ca schimbările între dimensiunea 1 și a 2-a să fie corelate negativ cu schimbarea dintre dimensiunea a 2-a și a 3-a a subiectelor. Cei care au stăpânit cea mai mare parte a materialului între dimensiunile 1 și a 2-a stăpânesc o parte mai mică în timpul care a trecut între dimensiunile a 2-a și a 3-a. De fapt, pentru majoritatea cazurilor în care analiza varianței este utilizată în măsurători repetate, se poate presupune că modificările nivelurilor sunt corelate între subiecți. Cu toate acestea, atunci când se întâmplă acest lucru, ipotezele complexe de simetrie și sfericitate nu sunt îndeplinite și contrastele independente nu pot fi calculate.
Impactul încălcărilor și modalitățile de corectare a acestora. Atunci când ipotezele complexe de simetrie sau sfericitate nu sunt îndeplinite, analiza varianței poate produce rezultate eronate. Înainte ca procedurile multivariate să fie suficient dezvoltate, au fost făcute mai multe ipoteze pentru a compensa încălcările acestor ipoteze. (Vezi, de exemplu, Greenhouse & Geisser, 1959 și Huynh & Feldt, 1970). Aceste metode sunt încă utilizate pe scară largă astăzi (de aceea sunt prezentate în modul Analiza variatiei).
Abordarea analizei multivariate a varianței la măsurile repetate.În general, problemele de simetrie complexă și sfericitate se referă la faptul că seturile de contraste incluse în studiul efectelor factorilor de măsuri repetate (cu mai mult de 2 niveluri) nu sunt independente unele de altele. Cu toate acestea, ele nu trebuie să fie independente dacă sunt utilizate. multidimensionale un criteriu pentru testarea simultană a semnificației statistice a două sau mai multe măsuri repetate ale contrastelor factorilor. Acesta este motivul pentru care metodele de analiză multivariată a varianței au devenit din ce în ce mai utilizate pentru a testa semnificația factorilor de măsuri repetate univariate cu mai mult de 2 niveluri. Această abordare este utilizată pe scară largă deoarece, în general, nu necesită ipoteza unei simetrii complexe și ipoteza sfericității.
Cazuri în care abordarea analizei multivariate a varianței nu poate fi utilizată. Există exemple (planuri) când abordarea analizei multivariate a varianței nu poate fi aplicată. Acestea sunt de obicei cazuri în care există un număr mic de subiecte în proiectare și multe niveluri în factorul de măsuri repetate. Atunci pot fi prea puține observații pentru a efectua o analiză multivariată. De exemplu, dacă există 12 entități, p = 4 factor de măsurători repetate, iar fiecare factor are k = 3 niveluri. Atunci interacțiunea a 4 factori se va „cheltui” (k-1)P = 2 4 = 16 grade de libertate. Cu toate acestea, există doar 12 subiecți, prin urmare un test multivariat nu poate fi efectuat în acest exemplu. Modul Analiza variatiei va detecta în mod independent aceste observații și va calcula doar criterii unidimensionale.
Diferențe în rezultatele univariate și multivariate. Dacă studiul include un număr mare de măsuri repetate, pot exista cazuri în care abordarea ANOVA cu măsuri repetate univariate oferă rezultate foarte diferite de cele obținute cu abordarea multivariată. Aceasta înseamnă că diferențele dintre nivelurile măsurătorilor repetate respective sunt corelate între subiecți. Uneori, acest fapt prezintă un anumit interes independent.
Analiza multivariată a varianței și modelarea structurală a ecuațiilor
În ultimii ani, modelarea ecuațiilor structurale a devenit populară ca alternativă la analiza de dispersie multivariată (vezi, de exemplu, Bagozzi și Yi, 1989; Bagozzi, Yi și Singh, 1991; Cole, Maxwell, Arvey și Salas, 1993). Această abordare vă permite să testați ipoteze nu numai despre mediile din diferite grupuri, ci și despre matricele de corelație ale variabilelor dependente. De exemplu, puteți relaxa ipotezele despre omogenitatea varianței și covarianței și puteți include în mod explicit erori în model pentru fiecare grup de varianță și covarianță. Modul STATISTICIModelarea ecuațiilor structurale (SEPATH) (vezi Volumul III) permite o astfel de analiză.
Pentru a analiza variabilitatea unei trăsături sub influența variabilelor controlate se folosește metoda dispersiei.
Pentru a explora relația dintre valori − metoda factorilor. Să luăm în considerare instrumentele analitice mai detaliat: metode factoriale, de dispersie și de dispersie cu doi factori pentru evaluarea variabilității.
ANOVA în Excel
Condițional, scopul metodei de dispersie poate fi formulat după cum urmează: să izolați din variabilitatea totală a parametrului 3 variabilitatea particulară:
- 1 - determinată de acţiunea fiecăreia dintre valorile studiate;
- 2 - dictate de relaţia dintre valorile studiate;
- 3 - aleatoriu, dictat de toate circumstanțele nesocotite.
În Microsoft Excel, analiza varianței poate fi efectuată folosind instrumentul „Analiza datelor” (fila „Date” - „Analiză”). Acesta este un supliment pentru foi de calcul. Dacă programul de completare nu este disponibil, trebuie să deschideți „Opțiuni Excel” și să activați setarea pentru analiză.
Lucrarea începe cu proiectarea mesei. Reguli:
- Fiecare coloană ar trebui să conțină valorile unui factor studiat.
- Aranjați coloanele în ordine crescătoare/descrescătoare a valorii parametrului studiat.
Luați în considerare analiza varianței în Excel folosind un exemplu.
Psihologul companiei a analizat folosind o tehnică specială strategia comportamentului angajaților într-o situație conflictuală. Se presupune că comportamentul este influențat de nivelul de studii (1 - gimnaziu, 2 - gimnaziu specializat, 3 - studii superioare).
Introduceți datele într-o foaie de calcul Excel:
Parametrul semnificativ este umplut cu culoare galbenă. Deoarece valoarea P între grupuri este mai mare decât 1, testul lui Fisher nu poate fi considerat semnificativ. În consecință, comportamentul într-o situație conflictuală nu depinde de nivelul de educație.
Analiza factorială în Excel: un exemplu
Analiza factorială este o analiză multivariată a relațiilor dintre valorile variabilelor. Folosind această metodă, puteți rezolva cele mai importante sarcini:
- descrieți cuprinzător obiectul măsurat (mai mult, cu capacitate, compact);
- identificarea valorilor variabilelor ascunse care determină prezența corelațiilor statistice liniare;
- clasificarea variabilelor (determinarea relației dintre ele);
- reduce numărul de variabile necesare.
Luați în considerare exemplul analizei factoriale. Să presupunem că cunoaștem vânzările oricăror bunuri din ultimele 4 luni. Este necesar să se analizeze ce articole sunt solicitate și care nu.
Acum puteți vedea clar care vânzări de produse dau creșterea principală.
Analiza bidirecțională a varianței în Excel
Arată modul în care doi factori afectează modificarea valorii unei variabile aleatoare. Luați în considerare analiza bidirecțională a varianței în Excel folosind un exemplu.
O sarcină. Un grup de bărbați și femei au fost prezentate cu sunete de diferite volume: 1 - 10 dB, 2 - 30 dB, 3 - 50 dB. Timpul de răspuns a fost înregistrat în milisecunde. Este necesar să se determine dacă genul afectează răspunsul; Afectează zgomotul răspunsul?
Pentru a gestiona eficient vânzările, este necesar să se evalueze corect factorii care afectează veniturile. Există multe exemple de analiză factorială a veniturilor în Excel pe web. Cu toate acestea, cele mai multe dintre ele sunt scrise pentru a arăta aspecte metodologice și sunt de puțină utilitate practică.
Scopul acestui articol este de a arăta cum să dezvolte un model de venituri factoriale în conformitate cu nevoile afacerii. În practică, un astfel de model poate fi destul de complex și, pentru a nu pierde timpul efectuând analize factoriale în Excel, vom folosi add-on-ul Fincontrollex® Variances Analysis Tool, care vă permite să automatizați complet acest proces. Cu această abordare, ne vom putea concentra pe analiza datelor, și nu pe dezvoltarea formulelor în Excel.
Cum se dezvoltă un model de venit factorial
Vindeți un produs care are un preț. Pentru a calcula veniturile, trebuie să înmulțiți numărul (sau volumul) de produse vândute cu prețul lor:
Acesta este modelul de bază de calcul al veniturilor. Toate celelalte modele sunt derivate ale acestuia și detaliază factorul de volum, prețul sau evidențiază influența altor factori în funcție de o anumită condiție. Forma finală a formulei va depinde de procesul de afaceri de vânzări care trebuie gestionat. Să ne uităm la cele mai comune dintre ele.
Dacă vindeți mai multe tipuri de produse la prețuri diferite, atunci puteți gestiona sortimentul de vânzări. Pentru a face acest lucru, împărțiți factorul de volum la volumul total de vânzări al tuturor produselor și ponderea fiecărui produs în volumul total:
În practică, managerii de vânzări nu înțeleg adesea esența acestui factor, ceea ce duce la o înțelegere greșită a rezultatelor analizei. Acest factor ar trebui interpretat ca o modificare a structurii volumelor de vânzări către produse cu un preț mai mare sau mai mic. De exemplu, dacă factorul de sortimentare a avut un efect pozitiv, aceasta înseamnă că ponderea produselor cu preț mai mare a crescut în structura vânzărilor, în timp ce ponderea produselor cu preț mai mic a scăzut. Dacă factorul de sortiment a avut un impact negativ, atunci imaginea va fi inversă: o creștere a ponderii produselor cu preț mai mic și o scădere a ponderii produselor cu preț mai mare. Nu confundați influența acestui factor cu modificările de preț, deoarece la calcularea factorului de sortiment, influența altor factori este eliminată (exclusă).
Dacă compania dvs. folosește diferite moduri de a-și livra produsele pe piață (canale de vânzări), atunci pentru a evalua impactul structurii canalelor de vânzări, trebuie să adăugați cota fiecărui canal la formula de calcul a veniturilor. De exemplu, modelul factorial al veniturilor pe lanțuri și puncte de vânzare cu amănuntul poate arăta astfel:
Creștere orizontală și verticală
Într-o structură de tranzacționare în rețea, de multe ori devine necesară evaluarea modificării volumelor ca urmare a deschiderii de noi puncte de vânzare sau a modificărilor volumului vânzărilor în punctele existente. O astfel de evaluare se poate face prin evidențierea factorilor modificărilor orizontale și verticale ale volumelor vânzărilor.
Modificările orizontale sunt modificări ale volumelor de vânzări ca urmare a deschiderii de noi puncte de vânzare.
Schimbarea verticală este o modificare a volumelor de vânzări în punctele de vânzare existente.
Pentru a evidenția aceste modificări, la modelul de calcul al veniturilor trebuie adăugate următoarele condiții. Dacă în luna curentă a existat o vânzare la un punct de vânzare unde produsele nu fuseseră vândute înainte, acestea sunt modificări orizontale. Dacă produsul a fost deja vândut într-un punct de vânzare, atunci vorbim de o schimbare pe verticală.
Introducerea de noi produse
Dacă în sortiment se introduce un produs nou, este indicat să se evalueze impactul acestei decizii asupra veniturilor totale. Pentru a face acest lucru, este necesar să excludeți influența produsului din toți factorii și să separați veniturile din acest produs într-un factor separat.
Pentru a face acest lucru, este necesar să adăugați o condiție pentru a verifica dacă produsul este nou pentru toți factorii modelului. Un produs este considerat nou dacă nu a fost vândut în perioada anterioară.
Puteți separa veniturile dintr-un produs nou într-un factor separat utilizând următoarea condiție:
Ca rezultat, veți obține ștergerea factorilor de impactul noilor produse și o sumă separată de venituri pentru produsele noi. Acest lucru vă va permite să estimați cu exactitate creșterea veniturilor ca urmare a introducerii de noi produse.
Scoaterea produselor din sortiment
Evaluarea efectului retragerii produselor din sortiment se realizează în mod similar cu evaluarea efectului introducerii de noi produse, singura diferență fiind că efectul produsului retras este exclus din factori. Un produs este considerat retras dacă a fost vândut în perioada anterioară, dar nu și în cea actuală.
Puteți aloca veniturile dintr-un produs derivat într-un factor separat utilizând următoarea condiție:
Ca urmare, vei putea evalua scăderea veniturilor din cauza retragerii produselor din sortiment.
Evaluând simultan introducerea de noi produse și retragerea produselor vechi, puteți evalua eficiența schimbării sortimentului.
Managementul conversiilor
Dacă lucrezi într-o afacere cu amănuntul, probabil știi că nu toți vizitatorii magazinului fac o achiziție. Pentru a estima ce procent de vizitatori fac o achiziție, trebuie să calculați rata de conversie:
Rata de conversie depinde de eficienta personalului care inchide vanzarile. Dacă doriți să o evaluați termeni valorici, atunci ar trebui să-l adăugați la modelul factorial. Numărul de cumpărători este utilizat pentru a calcula rata de conversie, așa că pentru a evidenția acest factor în modelul factorului de venit, trebuie să adăugați un indicator care va lega prețul de numărul de cumpărători. De exemplu, dimensiunea cecului mediu.
Gestionarea mărimii cecului mediu
Oferind produse similare, vă puteți crește vânzările generale. Pentru a evalua eficacitatea acestui proces, este necesar să se calculeze dimensiunea verificării medii:
Mărimea cecului mediu, precum și rata de conversie, depind de eficiența muncii personalului care închide vânzările. Prin urmare, dacă doriți să evaluați eficacitatea acestor indicatori, atunci ar trebui să îi adăugați la modelul factorial.
Pentru a încuraja vânzările, puteți oferi reduceri. Mărimea reducerii poate depinde de diferite condiții: volume de vânzări, termene de plată etc. Pentru a evalua impactul reducerii asupra veniturilor, trebuie să adăugați acest factor la model:
Când analizați o reducere, nu trebuie să uitați de scopul principal al acordării unei reduceri - creșterea vânzărilor. Prin urmare, factorul de actualizare trebuie evaluat împreună cu factorul volum.
Daca esti producator de produse, atunci ai ocazia sa stimulezi intensitatea vanzarilor marfurilor tale in lanturile de retail cu ajutorul bonusurilor retro. Un bonus retro este o recompensă plătită distribuitorilor și dealerilor pentru promovarea produselor. Pentru a evalua eficiența promovării vânzărilor folosind bonusuri retro, se calculează de obicei procentul de bonusuri retro față de venituri (excluzând reducerile). Pentru a evalua impactul bonusurilor retro asupra veniturilor, trebuie să adăugați acest factor la model:
Pune totul împreună: un model factorial pentru veniturile producătorilor de FMCG
Ca exemplu, să luăm în considerare un model de venituri factoriale pentru un producător de FMCG. Este obișnuit ca producătorii de FMCG să-și vândă produsele prin canalele de distribuție, oferind reduceri suplimentare de volum. Pentru a reflecta această caracteristică, să adăugăm la modelul de bază de calcul al veniturilor formulele de gestionare a sortimentului, reducerilor și bonusurilor retro pe care le-am discutat mai sus.
Modelul nostru factorial conține cinci factori: vânzări totale, sortiment, preț, reducere și bonus retro. Ordinea în care sunt calculați factorii depinde de gradul de control pe care întreprinderea îl are asupra acestor indicatori (de la mai mare la mai mic). Prin urmare, le vom calcula în următoarea secvență:
- Volumul total
- Gamă
- Bonus retro
- O reducere
Modelul factorilor este gata, iar acum puteți trece la analiza factorială în Excel.
Analiza factorială a veniturilor în Excel - este ușor!
Efectuarea analizei factorilor în Excel este o sarcină destul de laborioasă chiar și pentru un utilizator experimentat. Prin urmare, pentru a o simplifica semnificativ, vom folosi un add-in special pentru Excel. Pentru a activa versiunea de încercare gratuită, veți avea nevoie de dvs E-mail, care va primi un mesaj cu o cheie de activare și un link de descărcare.
Acest program de completare vă scutește de a introduce formule pentru calcularea fiecărui factor într-un registru de lucru Excel, creează în mod independent un raport rezumat pentru toți factorii și un raport detaliat pentru produse și, de asemenea, dacă utilizați Excel 2016 sau Office 365, creează o diagramă cascadă(Dacă nu sunteți familiarizat cu această diagramă, atunci asigurați-vă că citiți articolul, deoarece această diagramă este o modalitate excelentă de a arăta rezultatele analizei factorilor).
În acest articol, nu ne vom opri asupra tuturor caracteristicilor acestui supliment, deoarece. puteți viziona recenzia video de mai jos sau puteți să o citiți singur și să treceți imediat la configurarea modelului factorial.
Ca date inițiale, folosim date condiționate din raportul de vânzări pentru ianuarie și februarie. Puteți descărca o arhivă cu un exemplu de pe acest link.
Pentru a rula un program de completare pe panglică excela accesați fila site-ul web iar în grup Instrument de analiză a variațiilor apasa butonul Alerga. Se va deschide fereastra de completare.
Introduceți numele modelului
Următorul pas este introducerea formulei matematice a modelului factorial. Pentru a face acest lucru, introduceți modelul nostru factorial în câmpul de formulă și apăsați butonul introduce.
Add-in-ul va determina automat numele tuturor factorilor și va completa prima coloană a tabelului cu setările factorilor cu aceștia. Rămâne să ajustăm parametrii acestor factori.
Acum să stabilim ordinea de calcul a factorilor. Factorii se calculează în ordinea în care apar în tabel: factorul din partea de sus a tabelului va fi calculat primul, iar cel din partea de jos a tabelului va fi calculat ultimul. Tragând factorii din prima coloană, trebuie să ajustați ordinea de calcul pe care am definit-o în secțiunea anterioară. Pentru a face acest lucru, faceți clic stânga pe numele factorului din prima coloană și, fără a elibera butonul mouse-ului, trageți factorul pe linia dorită și eliberați butonul. Ca rezultat, ar trebui să obținem o secvență ca în imaginea de mai jos.
Ultimul parametru l-am lăsat neconfigurat: o gamă cu nume de produse. Hai să-l setăm. Pe banda Instrument de analiză a variațiilor Fincontrollex® fila Acasăîntr-un grup Model apasa butonul Gama de titluri.
Totul este gata și acum puteți efectua analiza factorială. Pentru a face acest lucru, pe bandă Instrument de analiză a variațiilor Fincontrollex® fila Acasăîntr-un grup Analiză apasa butonul Alerga. În câteva secunde, veți obține rezultatul analizei factoriale, care va fi creat într-un nou registru de lucru Excel.
Pe baza rezultatelor analizei factoriale se poate concluziona că creșterea vânzărilor totale în luna februarie față de ianuarie s-a realizat datorită scăderii prețurilor de bază și modificării gamei de vânzări către produse cu preț mai mic. Pentru a înțelege ce produse au suferit modificări majore, puteți analiza suplimentar fișa „Detalii” din raport.
Concluzie
Ne-am uitat la modelul de bază al veniturilor și la formulele de bază pentru a-l alinia nevoilor afacerii. Aceste formule sunt oferite ca exemplu și pot servi ca punct de plecare pentru dezvoltarea unui model de factor de venit în conformitate cu scopurile și obiectivele dumneavoastră. Folosind suplimentul Instrument de analiză a variațiilor Fincontrollex® pentru analiza factorială vă permite să analizați modele de orice complexitate. Acest lucru vă va permite să vă concentrați pe gestionarea factorilor care afectează veniturile din afacerea dvs.
Un articol este permis pentru publicare gratuită numai dacă conținutul rămâne neschimbat și se face referire la sursa. Utilizarea imaginilor în afara acestui articol nu este permisă și reprezintă o încălcare a drepturilor de autor.
Toate procesele de afaceri ale întreprinderilor sunt interconectate și interdependente. Unele dintre ele sunt direct legate între ele, altele se manifestă indirect. În acest fel, problema importantaîn analiza economică este evaluarea influenței unui factor asupra unui anumit indicator economic, iar pentru aceasta se folosește analiza factorială.
Analiza factorială a întreprinderii. Definiție. Goluri. feluri
Analiza factorială se referă la literatura stiintifica la secțiunea privind analiza statistică multivariată, unde variabilele observate sunt estimate folosind matrice de covarianță sau corelație.
Analiza factorială a fost folosită pentru prima dată în psihometrie și este utilizată în prezent în aproape toate științele, de la psihologie la neurofiziologie și științe politice. Conceptele de bază ale analizei factoriale au fost definite de psihologul englez Galton și apoi dezvoltate de Spearman, Thurstone și Cattell.
Poate fi distins 2 obiective ale analizei factoriale:
– determinarea relaţiei dintre variabile (clasificare).
– reducerea numărului de variabile (clustering).
Analiza factorială a întreprinderii- o metodologie cuprinzătoare pentru studiul și evaluarea sistematică a impactului factorilor asupra valorii indicatorului efectiv.
Se pot distinge următoarele tipuri de analiză factorială:
- Funcțional, unde indicatorul efectiv este definit ca un produs sau o sumă algebrică de factori.
- Corelația (stochastică) - relația dintre indicatorul de performanță și factori este probabilistică.
- Direct / Reverse - de la general la specific și invers.
- O singură etapă / mai multe etape.
- Retrospectivă / prospectivă.
Să aruncăm o privire mai atentă la primele două.
Pentru a putea este necesară analiza factorială:
Toți factorii trebuie să fie cantitativi.
- Numărul de factori este de 2 ori mai mare decât indicatorii de performanță.
– Probă omogenă.
– Distribuția normală a factorilor.
Analiza factorilor realizat în mai multe etape:
Etapa 1. Factori selectați.
Etapa 2. Factorii sunt clasificați și sistematizati.
Etapa 3. Relația dintre indicatorul de performanță și factori este modelată.
Etapa 4. Evaluarea influenței fiecărui factor asupra indicatorului de performanță.
Etapa 5 Utilizarea practică a modelului.
Sunt evidențiate metodele de analiză factorială deterministă și metodele de analiză factorială stocastică.
Analiza factorială deterministă- un studiu în care factorii afectează funcțional indicatorul de performanță. Metode de analiză factorială deterministă - metoda diferențelor absolute, metoda logaritmului, metoda diferențelor relative. Acest tip de analiză este cel mai frecvent datorită ușurinței sale de utilizare și vă permite să înțelegeți factorii care trebuie modificați pentru a crește/scădea indicatorul efectiv.
Analiza factorială stocastică- un studiu în care factorii afectează probabil indicatorul de performanță, i.e. atunci când un factor se modifică, pot exista mai multe valori (sau un interval) ale indicatorului rezultat. Metode de analiză factorială stocastică - teoria jocurilor, programare matematică, analiza corelațiilor multiple, modele matriceale.