Funkce Excel CORREL - Výpočet statistické korelace

Stáhněte si ukázkový sešit

Stáhněte si ukázkový sešit

Tento výukový program ukazuje, jak používat Funkce Excel CORREL v Excelu pro výpočet korelace.

Přehled funkcí CORREL

Funkce CORREL Vypočítává korelaci dvou řad čísel.

Chcete -li použít funkci listu CORREL Excel, vyberte buňku a zadejte:

(Všimněte si, jak se zobrazují vstupy vzorců)

Funkce CORREL Syntaxe a vstupy:

1 = CORREL (pole1, pole2)

pole 1 - Pole čísel.

Co je funkce CORREL?

Funkce Excel CORREL vrací korelační koeficient (Pearsonův r) dvou datových rozsahů.

Co je korelační koeficient?

Korelační koeficient, obvykle označovaný jako Pearsonův r (pojmenovaná po Karlovi Pearsonovi, osobě, která ji vyvinula), je statistika, která vám řekne, jak silně dvě proměnné spolu souvisí.

Pearsonova r je číslo mezi -1 a 1, což může vést ke třem možným interpretacím: pozitivní korelace, negativní korelace a žádná korelace.

Pozitivní korelace

Pozitivní korelace (r > 0) znamená, že když jsou dvě proměnné v tandemu - když pozorujete vysoké skóre v jedné proměnné, máte tendenci také pozorovat vysoké skóre v druhé. Podobně, když je jedna proměnná nízká, druhá bývá také nízká.

Například výška a hmotnost mají pozitivní korelaci. Viz tabulka níže, která vykresluje výšku a hmotnost malého vzorku hráčů baseballu:

The r tohoto malého vzorku je 0,73 - velmi silná pozitivní korelace. Logicky to dává smysl - vyšší lidé bývají v průměru těžší, protože tuto extra výšku tvoří kosti a svaly a další tkáň, které všechny něco váží.

Korelace ale není dokonalá (v dokonalé korelaci s r z 1, všechna skóre by klesla na trendovou čáru). Někteří nižší lidé mohou být těžší - možná si vezmou trochu tuku navíc nebo si zacvičí v posilovně. Stejně tak někteří vysokí lidé mohou být velmi hubení a ve skutečnosti váží méně než mnoho nižších lidí.

Korelace je zde pravděpodobně tak vysoká, protože máme co do činění se sportovci, byla by v celkové populaci nižší. Při používání CORREL - the r dostanete, není definitivní - při interpretaci musíte přemýšlet o tom, jaká jsou vaše data a jak jste je získali.

Negativní korelace

Negativní korelace (r <0) znamená, že když pozorujete vysoké skóre v jedné proměnné, máte tendenci pozorovat nízké skóre v druhé proměnné a naopak.

Negativně korelují například výsledky testů studentů a počet absencí, které měli ve škole. To znamená, že čím více dní zameškají, tím nižší skóre mají. Čím méně dní zmeškají, tím vyšší skóre obvykle bývá:

Korelace opět není dokonalá (jako téměř nikdy nejsou). Máme zde jednoho studenta, který zmeškal 5 dní, ale přesto dokázal získat 85%. Máme také jednoho, který zaznamenal 52%, přestože chyběly jen dva dny.

Stále máme jasný negativní trend. Ale stále existuje mnoho variací ve výsledcích testů, které nelze vysvětlit samotnou absencí. To může být způsobeno jinými proměnnými, jako je schopnost, motivace, zdraví a mnoho dalších potenciálních faktorů.

Když tedy používáte CORREL, mějte na paměti, že existuje větší obrázek, který vaše data nemusí plně vysvětlovat.

Žádná korelace

Žádná korelace (r = 0 nebo se blíží 0) znamená, že nemůžete předvídat skóre jedné proměnné na základě jiné. Pokud vykreslíte data, neuvidíte žádný rozpoznatelný trend a trendová čára bude plochá nebo téměř plochá.

Zde jsou některé údaje o délce prsteníku a IQ:

Jak vidíte, v této ukázce mezi těmito dvěma proměnnými není žádné spojení, takže můžeme předpokládat, že spolu nesouvisejí.

V praxi je nepravděpodobné, že byste získali r přesně 0. Pamatujte, že při sběru dat často dochází k určitým odchylkám v důsledku chyby, třeba v měření nebo ve vykazování. Takže jen proto, že vaše r není přesně 0, neznamená to, že jste něco našli.

Korelace není příčinná souvislost

Je důležité mít na paměti, že CORREL vám nemůže říci, která proměnná ovlivňuje druhou - nebo dokonce, pokud mezi proměnnými existuje nějaký příčinný vztah. Byla například nalezena korelace mezi následujícími proměnnými:

  • Množství prodané zmrzliny a množství násilných trestných činů
  • Jak jste šťastní a jak úspěšní jste ve své kariéře
  • Počet lidí, kteří se utopili v bazénu, a počet filmů, ve kterých se Nicolas Cage objevil za rok

Prvním příkladem je třetí proměnný problém. Zmrzlina samozřejmě nedělá lidi násilnými a ani násilí nespouští touhu po mraženém mléce a cukru. Třetí proměnnou je počasí. V horkém počasí lidé prostě více chodí ven - je mezi nimi větší kontakt, a tak se zvyšuje pravděpodobnost konfliktu. V horkém počasí si lidé také kupují více zmrzliny. Prodej zmrzliny a násilná kriminalita tedy korelují pouze proto, že jsou obě propojeny se třetí proměnnou.

Druhý by mohl být příkladem dvojí příčinná souvislost. Úspěch v práci může být prospěšný pro vaše štěstí - vyděláte více peněz a obecně budete mít větší kontrolu nad tím, jakou práci děláte a s kým ji děláte. Ale štěstí může být prospěšné i pro úspěch, možná jsou šťastnější lidé snáze srozumitelní a rozvíjejí pevnější pracovní vztahy, nebo možná jsou psychicky odolnější vůči nezdarům. V tomto případě se obě proměnné navzájem ovlivňují.

Třetí je prostě a falešná korelace. Jen proto, že dvě proměnné ve vašich datech korelují, neznamená to, že v reálném životě stejně interagují.

Sečteno a podtrženo, korelace vám nemůže říci, zda jsou dvě proměnné kauzálně propojeny.

Jak se přípravek CORREL používá

Použijte funkci Excel CORREL takto:

1 = CORREL (B3: B15, C3: C15)

S CORREL definujete dva argumenty - dva rozsahy dat, které chcete korelovat.

Zde je několik klíčových bodů, které je třeba mít na paměti s CORREL:

  • Text, logická hodnota (PRAVDA/NEPRAVDA) a prázdné buňky jsou ignorovány.
  • Oba rozsahy dat musí mít stejný počet datových bodů, jinak se zobrazí chyba #N/A
  • Pokud je jeden z rozsahů dat prázdný, nebo pokud v datech nejsou vůbec žádné odchylky (tj. Pokud jsou všechny datové body stejné číslo), získáte #DIV/0! Chyba

Funkce CORREL v Tabulkách Google

Funkce CORREL funguje v Tabulkách Google úplně stejně jako v Excelu:

Další poznámky

CORREL Příklady ve VBA

Ve VBA můžete také použít funkci CORREL. Typ:
application.worksheetfunction.correl (pole1, pole2)
Argumenty funkce (pole1 atd.) Můžete buď zadat přímo do funkce, nebo definovat proměnné, které se místo toho použijí.

Zpět na seznam všech funkcí v Excelu

wave wave wave wave wave