Как да направите T тест в Excel

Съдържание:

Как да направите T тест в Excel
Как да направите T тест в Excel
Anonim

Т-тестът е начин да се реши дали има статистически значими разлики между наборите от данни, като се използва t-разпределението на Стюдънт. T-тестът в Excel е T-тест с две проби, сравняващ средните стойности на две проби. Тази статия обяснява какво означава статистическа значимост и показва как да направите T-тест в Excel.

Инструкциите в тази статия се отнасят за Excel 2019, 2016, 2013, 2010, 2007; Excel за Microsoft 365 и Excel Online.

Image
Image

Какво е статистическа значимост?

Представете си, че искате да знаете кой от двата зара ще даде по-добър резултат. Хвърляте първия зар и получавате 2; хвърляте втория зар и получавате 6. Това говори ли ви, че вторият зар обикновено дава по-високи резултати? Ако сте отговорили „Разбира се, че не“, значи вече имате известна представа за статистическата значимост. Разбирате, че разликата се дължи на произволната промяна в резултата, всеки път, когато се хвърля зар. Тъй като пробата беше много малка (само една ролка), тя не показа нищо значимо.

Сега си представете, че хвърляте всеки зар 6 пъти:

  • Първият зар хвърля 3, 6, 6, 4, 3, 3; Средно=4,17
  • Вторият зар хвърля 5, 6, 2, 5, 2, 4; Средно=4,00

Сега това доказва ли, че първият зар дава по-високи резултати от втория? Вероятно не. Малка извадка с относително малка разлика между средните стойности прави вероятно разликата все още да се дължи на случайни вариации. Тъй като увеличаваме броя на хвърлянията на зарове, става трудно да се даде здрав разумен отговор на въпроса - дали разликата между резултатите е резултат от случайна вариация или наистина е по-вероятно единият да даде по-високи резултати от другия?

Значимостта е вероятността наблюдаваната разлика между извадките да се дължи на случайни вариации. Значимостта често се нарича алфа ниво или просто „α“. Нивото на достоверност, или просто 'c,' е вероятността разликата между извадките да не се дължи на случайна вариация; с други думи, че има разлика между основните популации. Следователно: c=1 – α

Можем да зададем „α“на каквото ниво пожелаем, за да се чувстваме уверени, че сме доказали значимостта. Много често се използва α=5% (95% увереност), но ако искаме да сме наистина сигурни, че разликите не са причинени от случайна вариация, можем да приложим по-високо ниво на сигурност, като използваме α=1% или дори α=0,1 %.

Използват се различни статистически тестове за изчисляване на значимостта в различни ситуации. T-тестовете се използват, за да се определи дали средните стойности на две популации са различни, а F-тестовете се използват, за да се определи дали дисперсиите са различни.

Защо да тестваме за статистическа значимост?

Когато сравняваме различни неща, трябва да използваме тест за значимост, за да определим дали едното е по-добро от другото. Това се отнася за много полета, например:

  • В бизнеса хората трябва да сравняват различни продукти и маркетингови методи.
  • В спорта хората трябва да сравняват различно оборудване, техники и състезатели.
  • В инженерството хората трябва да сравняват различни дизайни и настройки на параметри.

Ако искате да тествате дали нещо се представя по-добре от нещо друго в която и да е област, трябва да тествате за статистическа значимост.

Какво е T-разпределение на студент?

t-разпределението на Стюдънт е подобно на нормално (или гаусово) разпределение. И двете са разпределения с форма на камбана, като повечето резултати са близки до средната стойност, но някои редки събития са доста далеч от средната стойност и в двете посоки, наричани опашки на разпределението.

Точната форма на t-разпределението на Student зависи от размера на извадката. За проби от повече от 30 е много подобно на нормалното разпределение. Тъй като размерът на извадката намалява, опашките стават по-големи, представлявайки увеличената несигурност, която идва от правенето на изводи въз основа на малка извадка.

Как да направите T-тест в Excel

Преди да можете да приложите T-тест, за да определите дали има статистически значима разлика между средните стойности на две проби, първо трябва да извършите F-тест. Това е така, защото се извършват различни изчисления за T-теста в зависимост от това дали има значителна разлика между дисперсиите.

Ще ви е необходима добавката за пакета с инструменти за анализ, активирана за извършване на този анализ.

Проверка и зареждане на добавката Analysis Toolpak

За да проверите и активирате Analysis Toolpak, следвайте тези стъпки:

  1. Изберете ФАЙЛ раздел >изберете Опции.
  2. В диалоговия прозорец Опции изберете Add-Ins от разделите отляво.
  3. В долната част на прозореца изберете падащото меню Управление, след което изберете Добавки на Excel. Изберете Go.

    Image
    Image
  4. Уверете се, че квадратчето за отметка до Analysis Toolpak е отметнато, след което изберете OK.

  5. Пакетът с инструменти за анализ вече е активен и сте готови да приложите F-тестове и T-тестове.

Извършване на F-тест и T-тест в Excel

  1. Въведете два набора от данни в електронна таблица. В този случай разглеждаме продажбите на два продукта за една седмица. Средната дневна стойност на продажбите за всеки продукт също се изчислява, заедно със стандартното му отклонение.

    Image
    Image
  2. Изберете Данни раздел > Анализ на данни

    Image
    Image
  3. Изберете F-Test Two-Sample for Variances от списъка, след което изберете OK.

    Image
    Image

    F-тестът е силно чувствителен към ненормалност. Следователно може да е по-безопасно да използвате тест на Welch, но това е по-трудно в Excel.

  4. Изберете диапазона на променлива 1 и диапазона на променлива 2; задайте алфа (0,05 дава 95% увереност); изберете клетка за горния ляв ъгъл на изхода, като се има предвид, че това ще запълни 3 колони и 10 реда. Изберете OK.

    Image
    Image

    За диапазона за променлива 1 трябва да бъде избрана извадката с най-голямото стандартно отклонение (или дисперсия).

  5. Вижте резултатите от F-теста, за да определите дали има значителна разлика между отклоненията. Резултатите дават три важни стойности:

    • F: Съотношението между дисперсиите.
    • P(F<=f) one-tail: Вероятността променлива 1 всъщност да няма по-голяма дисперсия от променлива 2. Ако това е по-голямо от алфа, което обикновено е 0,05, тогава няма значителна разлика между дисперсиите.
    • F Критична една опашка: Стойността на F, която би била необходима, за да даде P(F<=f)=α. Ако тази стойност е по-голяма от F, това също показва, че няма значителна разлика между вариациите.

    P(F<=f) може също да се изчисли с помощта на функцията FDIST с F и степените на свобода за всяка проба като нейни входове. Степените на свобода са просто броят наблюдения в извадка минус едно.

  6. Сега, след като знаете дали има разлика между отклоненията, можете да изберете подходящия T-тест. Изберете Данни раздел > Анализ на данни, след което изберете t-тест: две извадки при равни отклонения или t-тест: две извадки с допускане на неравни вариации

    Image
    Image
  7. Независимо коя опция сте избрали в предишната стъпка, ще бъдете представени със същия диалогов прозорец за въвеждане на подробностите за анализа. За да започнете, изберете диапазоните, съдържащи образците за Диапазон на променлива 1 и Диапазон на променлива 2.

    Image
    Image
  8. Ако приемем, че искате да тествате за липса на разлика между средните стойности, задайте Хипотезирана средна разлика на нула.
  9. Задайте нивото на значимост алфа (0,05 дава 95% увереност) и изберете клетка за горния ляв ъгъл на изхода, като имате предвид, че това ще запълни 3 колони и 14 реда. Изберете OK.
  10. Прегледайте резултатите, за да решите дали има значителна разлика между средните стойности.

    Точно както при F-теста, ако p-стойността, в този случай P(T<=t), е по-голяма от алфа, тогава няма значителна разлика. В този случай обаче са дадени две p-стойности, едната за тест с една опашка, а другата за тест с две опашки. В този случай използвайте стойността с две опашки, тъй като всяка променлива с по-голяма средна стойност би била значителна разлика.

Препоръчано: