ANOVA (varianciaanalízis)
Az ANOVA a varianciaanalízist jelenti. Az ANOVA-t Ronald Fisher alapította 1918-ban. A Varianciaanalízis elnevezés azon a megközelítésen alapszik, amelyben a módszer a variancia alapján határozza meg az eszköz különbségét vagy egyenlőségét.
Ez egy statisztikai módszer, amely a két vagy több eszköz közötti különbségek tesztelésére szolgál. Az általános különbségek tesztelésére használják, nem pedig az eszközök közötti különbségekre. Becsül egy vagy több tényező jelentőségét azáltal, hogy összehasonlítja a válasz változó átlagait különböző tényezőszinteken.
A nulla hipotézis azt állítja, hogy az összes népesség egyenlő. Az alternatív hipotézis azt bizonyítja, hogy legalább egy populáció átlaga eltér
Ez lehetővé teszi a különféle nullhipotézisek egyszerre tesztelését.
Az ANOVA általános célja
Az ANOVA végrehajtásának oka annak megfigyelése, hogy van-e különbség a változó csoportjai között. Manapság a kutatók sokféle módon használják az ANOVA-t. Az ANOVA használata teljesen függ a kutatás tervezésétől.
Használhat t-tesztet két minta átlagának összehasonlításához, de ha kettőnél több mintát kell összehasonlítani, akkor az ANOVA a legjobb módszer.
Az ANOVA feltételezései
Négy fő feltevés létezik
- A hibák várható értéke nulla
- Az összes hiba varianciája egyenlő
- A hibák függetlenek
- Általában eloszlik
ANOVA típusok
-
Egy út a csoportok között
Az egyirányú ANOVA ellenőrzi, hogy van-e szignifikáns különbség három vagy több egymással független csoport átlagai között. Elsősorban a nullhipotézist teszteli.
H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ
Ahol µ jelentése csoport átlagot és x a csoportok számát jelenti. Az egyirányú ANOVA jelentős eredményt ad. Az ANOVA egyirányú omnibusz tesztstatisztika, és nem fogja tudni, hogy melyik csoport különbözött egymástól. Annak érdekében, hogy megismerje az adott csoportot vagy csoportokat, amelyek különböznek a többiektől, post hoc tesztet kell végeznie.
Példa az egyirányú ANOVA-ra
20 embert választottak ki öt különböző gyakorlat hatásának tesztelésére. 20 embert 4 csoportra osztanak, egyenként 5 taggal. Súlyukat néhány nap múlva rögzítik. Összehasonlítottuk a gyakorlatok hatását a férfiak 5 csoportjára. Itt csak a súly a tényező.
Feltételezések
A függő változó általában eloszlik az egyes csoportokban
Van variancia homogenitás
A megfigyelések függetlensége
-
Az ANOVA egyirányú mérése
Az ismételt intézkedések ANOVA többé-kevésbé megegyezik az egyirányú ANOVA-val, de összetett csoportokhoz használják. Az ismételt mérések során megvizsgálják az átlagos pontszámok változásait három vagy több időponton keresztül
2. az átlagértékek különbségei különböző körülmények között.
Példa az ismételt intézkedésekre
Megvizsgálhatja egy 6 hónapos testmozgás program hatását egyes egyének súlycsökkentésére. Az edzésidőszak alatt három különböző időpontban kiszámítja a súlyt, hogy kidolgozzon egy idő-tanfolyamot bármilyen gyakorlati hatáshoz.
Előfordulhat, hogy ugyanazt az egyént különféle súlycsökkentő ételek fogyasztására fogyasztja, és ízlés szerint értékeli őket.
Ebben a példában ugyanazt az embercsoportot többször mérik ugyanazon függő változón.
-
Kétirányú csoportok között
Az ANOVA kétirányú összehasonlítja a két tényezőre felosztott csoportok közötti átlagos különbséget. A kétirányú ANOVA fő célja annak megállapítása, hogy van-e kölcsönhatás a két független változó között a függő változókon. Azt is tudatja, hogy az egyik független változó hatása a függő változóra azonos-ea többi független változó összes értéke esetén.
Példa
A műtrágyák rizs hozamára gyakorolt hatásának kutatása. Öt különböző, minõségû műtrágyát alkalmaz az öt rizstermelésre szánt parcellán. Az egyes parcellák hozamát feljegyzik, és megfigyelik az egyes parcellák közötti különbséget. Itt meg lehet vizsgálni a parcellák termékenységének hatását is. Ezért két tényező létezik: műtrágya és termékenység.
Feltételezések
Mielőtt megkezdené a kétutas ANOVA-t, az adatoknak hat feltételezésen kell keresztülmenniük, hogy megbizonyosodjanak arról, hogy rendelkeznek-e adatokkal a kétirányú ANOVA végrehajtásához. Az alábbiakban felsoroljuk a hat feltételezést
- Az Ön függõ változóját folyamatos szinten kell mérni
- A két független változónak mindegyikéhez két vagy több kategorikus független csoportot kell tartalmaznia
- A megfigyeléseknek függetlennek kell lenniük
- Kerülje az esetleges túlmutatásokat
- Az Ön függő változóját általában el kell osztani a két független változó csoportjainak minden egyes kombinációjára
- Az eltérések homogenitása
-
Kétirányú ismételt mérés
Kétirányú ismétlés méri a csoportok közti különbségeket, amelyeket a független változókon belül ketté osztottak. A kétirányú ismétlődő mérést gyakran használják a kutatásban, ahol egy függő változót kettőnél többször mérnek kettő vagy több körülmények között.
Példa
Egy egészségkutató azt akarja megtalálni, hogy miként lehet csökkenteni az emberek szenvedését a krónikus ízületi fájdalmakkal. A kutató két különféle kezelési módot választott a fájdalom csökkentése érdekében. A kezelések két típusát „feltételeknek” nevezik. Az A kezelés egy masszázsprogram, a B kezelés egy akupunktúrás program. Mindkét kezelést 8 hét alatt az összes beteg kapja.
A betegeket három időpontban tesztelik - a program elején, a program közepén és a program végén.
A kutató 30 beteget választott ki a kutatásba. De amikor az első 15 beteg átengedi az A kezelést, a másik 15 beteg átesti a B kezelést, és fordítva.
8 hét végén a kutató az ANOVA kétirányú ismételt mérését használja, hogy kiderítse, van-e változás a fájdalomban a kezelés típusa és az adott időpont közötti kölcsönhatás eredményeként.
Feltételezések
Az adatainak öt feltételezésen kell átmenniük, amelyek szükségesek az ANOVA kétirányú ismételt méréséhez, hogy pontos eredményt kapjanak.
- Az Ön függõ változóját folyamatos szinten kell mérni
- A tárgyi tényezőkben szereplő kettőnek legalább két kategorikus kapcsolódó csoportból kell állnia
- Nem szabad kiugrani
- A függő változót általában el kell osztani a kapcsolódó csoportok minden egyes kombinációja között
- A rokon csoportok összes kombinációja közötti különbségek varianciáinak egyenlőnek kell lenniük
Paraméteres és nem paraméteres ANOVA teszt
Ha a populációra vonatkozó adatok paramétereikkel teljesen ismertek, akkor az elvégzett statisztikai tesztet paraméteres tesztnek nevezzük.
Ha a populációra vagy a paraméterekre vonatkozó információ nem ismert, de a hipotézis teszteléséhez mégis szükség van, akkor ezt nem parametrikus tesztnek nevezzük.
Ha kategorikus adatokkal rendelkezik, akkor nem tudja használni az ANOVA módszert, Chi négyzet próbát kell használnia, amely az ANOVA interakcióval foglalkozik.
Hipotézis vizsgálati eljárás - ANOVA egyirányú
- Ellenőrizze a szükséges feltételezéseket, és írjon nulla és alternatív hipotézist
Az ANOVA egyirányú végrehajtásához bizonyos feltételezéseknek létezniük kell. A feltételezések a következők
- Minden minta független véletlenszerű minta
- A válaszváltozó eloszlása a normál eloszlást követi
- A populációs eltérések a csoportszintű válaszok között azonosak. Ezt úgy lehet megtudni, hogy a legnagyobb mintavételi szórást elosztjuk a legkisebb mintával, és ez nem haladja meg a kettőt, ha feltételezzük, hogy a populáció varianciája egyenlő.
- Számítsa ki a megfelelő vizsgálati statisztikát
Az ANOVA az egyik módja az F teszt statisztika. A kézi számítások sok lépést igényelnek az F-arány kiszámításához, de az olyan statisztikai szoftver, mint az SPSS, kiszámítja az F-arányt az Ön számára, és elkészíti az ANOVA forrástáblát.
Az ANOVA táblázat információkat nyújt a csoportok közötti és a csoportokon belüli változásokról. A táblázat megadja az összes képletet. Az alábbiakban egy példa az ANOVA táblára
Forrás | SS | DF | KISASSZONY | F |
kezelések | SST | k-1 | SST / (k-1) | MST / MSE |
Hiba | SSE | Nk | SSE / (Nk) | |
Összesen (javítva) | SS | N-1 |
SST: a kezelések négyzeteinek összege, SSE: a hibák négyzeteinek összege
A DFT, amely k-1, a kezelés szabadságának mértékét jelenti, DFE, amely Nk jelenti a hiba szabadságának mértékét.
- Határozzuk meg a teszt statisztikájához társított ap értéket
- Határozzuk meg a nulla és az alternatív hipotézis között
Ha a nullhipotézis hamis, akkor az MST-nek nagyobbnak kell lennie, mint az MSE
- Adjon következtetést
Az eredmények alapján írjon le egy következtetést az anova kutatási kérdése alapján.
Több összehasonlító teszt
Ha úgy találja, hogy szignifikáns különbség van a csoportok között, amely nem kapcsolódik a mintavételi hibához, akkor több t tesztet kell futtatni a csoportok közötti átlag tesztelésére. Számos tesztet végeztek az első típusú hibaarány ellenőrzésére.
- Scheffe-teszt
- Módosított Bonferroni teszt
- Dunnette tesztje
- Tukey tesztje
számítások
Az ANOVA számításokat háromféle módon lehet elvégezni - kézi számítások, Excel lap és SPSS szoftver. Az alábbiakban részletesen megismerheti az összes számítást
-
ANOVA kézi számítások
- 1. lépés
CM kiszámítása
CM = (az összes megfigyelés összesen) 2 / N Összesen
- 2. lépés
Számítsa ki a teljes SS-t
Összes SS = az összes megfigyelés négyzetösszege - CM
- 3. lépés
Számítsuk ki az SST-t (Kezelési négyzetek összege)
SST = i 3 i = 1 T2i / n i - CM
- 4. lépés
Számítsuk ki az SSE-t (a hibákhoz tartozó négyzetek összege)
SSE = SS (összesen) - SST
- 5. lépés
Számítsuk ki az MST-t, az MSE-t és ezek arányát F
MST = SST / k-1
MSE = SSE / Nk
F = MST / MSE
-
ANOVA az Excel segítségével
Az ANOVA egy tényező excelben történő végrehajtásához kövesse ezeket az egyszerű lépéseket
- Lépjen az Adat fülre
- Kattintson az Adatelemzés elemre
- Válassza az Anova: Single factor elemet, majd kattintson az OK gombra (vannak olyan lehetőségek is, mint Anova: két faktor replikációval és Anova: két faktor replikáció nélkül)
- Kattintson a Beviteli tartomány mezőre, és válassza ki a tartományt
- Kattintson a Kimeneti tartomány mezőre, válassza ki a kimeneti tartományt, majd kattintson az OK gombra
- Az eredmény megjelenik az excel lapon
- Ha F nagyobb, mint F krit, akkor a nullhipotézist elutasítják
-
ANOVA az SPSS használatával
Először töltse le az SPSS szoftvert az ANOVA végrehajtásához. Itt megtudhatja, hogyan lehet egyirányú ANOVA-t végrehajtani az SPSS segítségével
Az SPSS mindig azt feltételezi, hogy a független változó numerikusan van ábrázolva. A minta adatkészletben a MAJOR egy karakterlánc. Tehát először konvertálja a karakterláncváltozót numerikus változóvá. Amint befejeződött a konverzió, készen állsz az ANOVA elvégzésére
- Nyissa meg az SPSS szoftvert
- Kattintson az Elemzés à Eszközök összehasonlítása à Egyirányú ANOVA elemre
- Az ANOVA párbeszédpanel egyirányú megjelenik a képernyőn
- A párbeszédpanel bal oldalán megjelenik az Ön által mért függő változók listája. Helyezze a jobb oldali Függő listába a felső nyíl gombbal
- Ugyanígy mozgassa a független változót a bal oldali listában a Faktor mezőbe a jobb oldalon.
- Kattintson a Post Hoc gombra a többszörös összehasonlítás típusának kiválasztásához.
- Válassza ki a kutatásnak megfelelő Post hoc tesztet a teszt melletti jelölőnégyzetre kattintva
- Kattintson a Folytatás gombra, és eljuttatja az Egyirányú ANOVA párbeszédpanelhez
- Válassza ki a statisztikákat, és kattintson a jelölőnégyzetekre a lehetőség bal oldalán a kiválasztáshoz
- Kattintson a Means plot elemre, hogy megkapja a feltétel átlagának grafikonját
- Kattintson a Folytatás és az OK gombra
Megjelenik az SPSS kimeneti ablak hat fő résztel
- Leíró rész
- A variációk homogenitásának vizsgálata
- ANOVA
- Több összehasonlítás
- Tanulmányi átlag
- Grafikon
Az ANOVA futtatásakor figyelembe veendő dolgok
Az adatszint és a feltételezések döntő szerepet játszanak az ANOVA-ban.
A kutatónak meg kell tudnia, hogy az adatok keresztezett vagy beágyazott-e. Az adatok átlépésével minden csoport megkapja az összes szempontot.
Ha az adatok beágyazva vannak, akkor minden csoport eltérő ANOVA módszert fog kapni.
Fontosabb az anova effektus méretének kiszámítása. A hatás mérete megmondja, hogy a nullhipotézis milyen mértékben hamis. A közepes hatású méret mindig előnyösebb
Remélem, ez a cikk rövid áttekintést adott az ANOVA-ról és az eredmények értelmezéséről.
Kapcsolódó tanfolyamok: -
- ANOVA a Minitab használatával
- R Studio Anova Technika tanfolyam