A kétirányú ANOVA áttekintése
Kétirányú ANOVA (varianciaanalízis) segít megérteni az egy folyamatosan függő változó és a két kategorikus független változó kapcsolatát. Ebben a témakörben megismerjük R kétirányú ANOVA-t.
Az alábbiakban felsoroljuk a kétirányú ANOVA érdeklődésének hipotézisét
- H₀: Hívja azt a főhatást, amely az első tényező, amely a folyamatos változótól függ
- H₀: A fő hatás a második változóra gyakorolt hatás függvénye is a függő folyamatos változón.
- H₀: Az interakció mind az első, mind a második tényező együttes hatása a függő változóra
Az alábbiakban felsoroljuk azokat a normákat, amelyeknek a kétirányú ANOVA-nak meg kell felelnie.
- A megfigyeléseknek függetleneknek kell lenniük
- A megfigyeléseket általában szét kell osztani.
- A megfigyeléseknek azonos varianciának kell lennie
- Nincsenek kívülálló tervek
- A hibáknak függetleneknek kell lenniük.
jegyzet
Adatainkat át kell alakítanunk, ha a normálitás és az egyenlő variancia sérül.
Példa kétirányú ANOVA-ra R-ben
Végezzünk egyirányú ANOVA tesztet a rák szintjére vonatkozó adatkészletben, amely 48 sort és 3 adatváltozót tartalmaz:
Töltött idő: Egy állat túlélési ideje
A rák különböző szintjei 1 - 3
Kezelés: Az 1-3
A tesztelés előtt a következő adatokra van szükségünk.
- Az adatok importálása
- Távolítsa el a felesleges változót
- Konvertálja a változókat (a rák szintjei) rendezett szintre.
Az alábbiakban található az adatkészlet.
Észrevételek: 48
Változók: 3
túlélési idő: 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
1., 1., 1., 1., 2., 2., 2., 3., 3., 3., 3., 1., 1., 1., 2., 2., 2. rák szintje…
A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, B kezelés, …
célok
- H₀: nem változik az átlagos túlélési idő a csoportok között
- H₀: a túlélési idő legalább egy csoportnál eltérő.
Lépések
- Ellenőrizze a rák szintjét. Három karakterértéket láthatunk, mivel azokat mutációval rendelkező igével faktorokra konvertáljuk.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Számítsa ki az átlagot és a szórást is
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Kimenet:
Tibble: 3 x 4
rákszintek száma_cancerlevels középidő sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 277650 0, 06227627
- A harmadik lépésben grafikusan ellenőrizheti, hogy van-e különbség az eloszlások között. Ne feledje, hogy tartalmazza a megsértett pontot.
- Futtassa a tesztet az AOV paranccsal.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Szintaxis:
y ~ X1 + X2 +… + Xn (X1 + X2 +… a független változókra vonatkozik)
y ~. Az összes fennmaradó változót független változóként használja
Ne felejtse el menteni a modellt, és nyomtassa ki az összefoglalót.
Kód
- aov (idő ~ rákszintek, adatok = df): Futtassa az ANOVA tesztet a következő képlettel
- Összegzés (anova_one_way): A teszt összegzésének kinyomtatása
Df Összeg Sq átlagos Sq F érték Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Maradványok 45 1.972 0.0438
-
Signif. kódok: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
A p-érték alacsonyabb, mint a 0, 05 küszöbérték. A statisztikai különbséget '*' jelzi a fenti esetben.
Egyirányú teszt kétutas anovához R
Lássuk, hogyan lehet az egyirányú tesztet kiterjeszteni a kétirányú ANOVA-ra. A teszt hasonló az egyirányú ANOVA-hoz, de a képlet különbözik és hozzáad egy másik csoportváltozót a képlethez.
y = x1 + x2
- H0 : Az átlagok mindkét változó esetében azonosak (tényezőváltozók)
- H3 : Az átlag mindkét változó esetében különbözik
A kezelési változókat hozzáadja modellünkhöz. Ez a változó jelzi a beteg kezelését. Érdekel, hogy van-e statisztikai függőség a rák szintje és a betegnek adott kezelés között.
A kódot úgy állítjuk be, hogy kezeljük a másik független változóval.
Df Összeg Sq átlagos Sq F érték Pr (> F)
2. rákszint 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Kezelje 3 0, 9212 0, 3071 12, 27 6.7e-06 ***
Maradványok 42 1.0509 0.0250
Mind a rák szintje, mind a kezelés statisztikailag különbözik a 0-tól. Ezzel elutasíthatjuk a NULL hipotézist. Azt is erősítse meg, hogy a kezelés vagy a rák típusának megváltoztatása befolyásolja a túlélési időt.
Teszt
Egyirányú ANOVA: H3- Az átlag legalább egy csoportnál különbözik
Kétirányú ANOVA: H3- Az átlag mindkét csoportban különbözik.
Különbség az egy- és a kétirányú ANOVA között
Különbségek az egyirányú ANOVA és a kétirányú ANOVA között
Egyirányú ANOVA | Kétirányú ANOVA |
Úgy tervezték, hogy lehetővé tegye az egyenlőség tesztelését három vagy több eszköz között | Úgy tervezték, hogy két független változó kölcsönös kapcsolatát értékelje egy függő változón. |
Bevon egy független változót | Két független változót von be |
3 vagy több kategorikus csoportban elemezve. | Két tényező több csoportját összehasonlítja |
Két elvnek kell megfelelnie - replikáció és randomizálás | Meg kell felelnie három alapelvnek, amelyek a replikáció, a randomizálás és a helyi kontroll. |
A kétirányú ANOVA előnyei
- A fenti példában az életkor és a nem a példánkban - segít csökkenteni a hibaváltozatokat, hatékonyabbá téve a tervezést.
- A kétirányú ANOVA lehetővé teszi, hogy egyidejűleg két tényező hatását teszteljük.
Az ANOVA alkalmazásai
- A különböző járművek, az üzemanyag és az út típusa futóteljesítményének összehasonlítása.
- Ismerkedés a hőmérséklet, a nyomás vagy a kémiai koncentráció hatására valamilyen kémiai reakcióra (erőreaktorok, vegyi üzemek stb.)
- Különböző katalizátorok hatása a kémiai reakciósebességre
- A reklámok hatásainak megértése és az ügyfelek eltérő száma.
- A teljesítmény, a minőség és a sebesség előállításának hatása a biológiában (az elvégzett sejtek számán alapuló folyamat)
Ajánlott cikkek
Ez egy útmutató a kétutas ANOVA-hoz R.-ban. Itt tárgyaljuk a példákat, célokat, lépéseket és az egyirányú és a kétirányú ANOVA közötti különbségeket. Lehet, hogy megnézi a következő cikkeket is, ha többet szeretne megtudni -
- ANOVA R-ben
- Az eredmények értelmezése az ANOVA teszt segítségével
- Regresszió vs ANOVA
- GLM R-ben