Критерии и методи за проверка на статистически хипотези, примери

Съдържание:

Критерии и методи за проверка на статистически хипотези, примери
Критерии и методи за проверка на статистически хипотези, примери
Anonim

Тестването на хипотези е необходима процедура в статистиката. Тестът на хипотезата оценява две взаимно изключващи се твърдения, за да определи кое твърдение е най-добре подкрепено от извадковите данни. Когато се каже, че констатацията е статистически значима, това се дължи на тест на хипотеза.

Методи за проверка

Методите за тестване на статистически хипотези са методи за статистически анализ. Обикновено се сравняват два набора от статистически данни или набор от извадкови данни се сравнява със синтетичен набор от данни от идеализиран модел. Данните трябва да се тълкуват по такъв начин, че да добавят нови значения. Можете да ги интерпретирате, като приемете определена структура на крайния резултат и използвате статистически методи, за да потвърдите или отхвърлите предположението. Предположението се нарича хипотеза, а статистическите тестове, използвани за тази цел, се наричат статистически хипотези.

H0 и H1 хипотези

Има две основниконцепциите за статистическа проверка на хипотези - т. нар. "главна, или нулева хипотеза" и "алтернативна хипотеза". Те се наричат още хипотези на Нейман-Пиърсън. Предположението за статистически тест се нарича нулева хипотеза, основна хипотеза или накратко H0. Често се нарича предположение по подразбиране или предположението, че нищо не се е променило. Нарушението на предположението от теста често се нарича първа хипотеза, алтернативна хипотеза или H1. H1 е съкращение за някаква друга хипотеза, защото всичко, което знаем за нея, е, че данните H0 могат да бъдат изхвърлени.

тест за нулева хипотеза
тест за нулева хипотеза

Преди да отхвърлите или не отхвърлите нулевата хипотеза, резултатът от теста трябва да бъде интерпретиран. Сравнението се счита за статистически значимо, ако връзката между наборите от данни е малко вероятно да бъде реализация на нулевата хипотеза според праговата вероятност – нивото на значимост. Съществуват и критерии за добро съответствие за проверка на статистическите хипотези. Това е името на критерия за проверка на хипотезата, който се свързва с предполагаемия закон за неизвестното разпределение. Това е числена мярка за несъответствието между емпиричните и теоретичните разпределения.

Процедура и критерии за тестване на статистически хипотези

Най-често срещаните методи за избор на хипотези се основават или на информационния критерий на Акаике, или на коефициента на Байесов. Тестването на статистически хипотези е ключова техника както в извода, така и в байесовия извод, въпреки че двата вида имат забележими разлики. Тестове за статистически хипотезидефинирайте процедура, която контролира вероятността от погрешно вземане на решение за неправилна хипотеза по подразбиране или нулева хипотеза. Процедурата се основава на това колко вероятно е да работи. Тази вероятност за вземане на грешно решение е невероятността нулевата хипотеза да е вярна и да не съществува конкретна алтернативна хипотеза. Тестът не може да покаже дали е вярно или невярно.

Методи за проверка на статистически хипотези
Методи за проверка на статистически хипотези

Алтернативни методи за теория на решенията

Съществуват алтернативни методи на теорията на решенията, при които нулевата и първата хипотези се разглеждат на по-равностойно ниво. Други подходи за вземане на решения, като байесовата теория, се опитват да балансират последствията от лошите решения във всички възможности, вместо да се фокусират върху една-единствена нулева хипотеза. Редица други подходи за решаване коя от хипотезите е вярна се основават на данните, кои от тях имат желаните свойства. Но тестването на хипотези е доминиращият подход към анализа на данни в много области на науката.

Тестване на статистическата хипотеза

Когато един набор от резултати се различава от друг набор, човек трябва да разчита на тестване на статистически хипотези или тестове на статистически хипотези. Тяхната интерпретация изисква правилно разбиране на p-стойностите и критичните стойности. Също така е важно да се разбере, че независимо от нивото на значимост, тестовете все още могат да съдържат грешки. Следователно заключението може да не е правилно.

Процесът на тестване се състои отняколко стъпки:

  1. Създава се първоначална хипотеза за изследване.
  2. Посочени са подходящи нулеви и алтернативни хипотези.
  3. Обяснява статистическите предположения за извадката в теста.
  4. Определяне кой тест е подходящ.
  5. Изберете нивото на значимост и прага на вероятността, под който нулевата хипотеза ще бъде отхвърлена.
  6. Разпределението на статистиката на теста за нулева хипотеза показва възможните стойности, при които нулевата хипотеза се отхвърля.
  7. Изчисляването е в ход.
  8. Взема се решение за отхвърляне или приемане на нулевата хипотеза в полза на алтернатива.

Има алтернатива, която използва p-стойност.

Примери за проверка на статистически хипотези
Примери за проверка на статистически хипотези

Тестове за значимост

Чистите данни нямат практическа полза без интерпретация. В статистиката, когато става въпрос за задаване на въпроси относно данни и интерпретиране на резултатите, се използват статистически методи, за да се гарантира точността или вероятността на отговорите. Когато се тестват статистически хипотези, този клас методи се наричат статистически тестове или тестове за значимост. Терминът „хипотеза” напомня научните методи, при които се изследват хипотези и теории. В статистиката тестът на хипотезата води до количество, дадено на дадено предположение. Позволява ви да интерпретирате дали едно предположение е вярно или е извършено нарушение.

Статистическа интерпретация на тестове

Тестове за хипотезисе използват, за да се определи кои резултати от изследването ще доведат до отхвърляне на нулевата хипотеза за предварително определено ниво на значимост. Резултатите от теста за статистически хипотези трябва да бъдат интерпретирани, за да може да продължи работата по него. Има две общи форми на критерии за проверка на статистически хипотези. Това са p-стойност и критични стойности. В зависимост от избрания критерий, получените резултати трябва да се тълкуват различно.

Какво е p-стойност

Изходът се описва като статистически значим при интерпретиране на p-стойността. Всъщност този индикатор означава вероятността от грешка, ако нулевата хипотеза бъде отхвърлена. С други думи, може да се използва за именуване на стойност, която може да се използва за интерпретиране или количествено определяне на резултат от теста и за определяне на вероятността от грешка при отхвърляне на нулевата хипотеза. Например, можете да извършите тест за нормалност върху извадка от данни и да откриете, че има малък шанс за отклонение. Въпреки това, нулевата хипотеза не трябва да бъде отхвърлена. Тестът за статистически хипотези може да върне p-стойност. Това се прави чрез сравняване на стойността на p с предварително определена прагова стойност, наречена ниво на значимост.

Статистическо тестване на нулеви хипотези
Статистическо тестване на нулеви хипотези

Ниво на значимост

Нивото на значимост често се изписва с гръцката малка буква "алфа". Общата стойност, използвана за алфа е 5% или 0,05 По-малка алфа стойност предполага по-надеждна интерпретация на нулевата хипотеза. Р-стойността се сравнява спредварително избрана алфа стойност. Резултатът е статистически значим, ако р-стойността е по-малка от алфа. Нивото на значимост може да се обърне, като се извади от едно. Това се прави, за да се определи нивото на достоверност на хипотезата, като се имат предвид наблюдаваните извадкови данни. Когато се използва този метод за тестване на статистически хипотези, P-стойността е вероятностна. Това означава, че в процеса на интерпретиране на резултата от статистически тест човек не знае кое е вярно или невярно.

Теория за проверка на статистически хипотези

Отхвърлянето на нулевата хипотеза означава, че има достатъчно статистически доказателства, че изглежда вероятно. В противен случай това означава, че няма достатъчно статистически данни, за да го отхвърлите. Може да се мисли за статистически тестове от гледна точка на дихотомията на отхвърляне и приемане на нулевата хипотеза. Опасността от статистическото тестване на нулевата хипотеза е, че ако бъде приета, тя може да изглежда вярна. Вместо това би било по-правилно да се каже, че нулевата хипотеза не се отхвърля, защото няма достатъчно статистически доказателства, които да я отхвърлят.

Статистическа хипотеза, проверяваща добротата на критериите за годност
Статистическа хипотеза, проверяваща добротата на критериите за годност

Този момент често обърква начинаещите екстри. В такъв случай е важно да си напомните, че резултатът е вероятностен и че дори приемането на нулевата хипотеза все още има малък шанс за грешка.

Вярна или невярна нулева хипотеза

Интерпретацията на стойността на p не означава, че е нулахипотезата е вярна или невярна. Това означава, че е направен избор да се отхвърли или не нулевата хипотеза при определено ниво на статистическа значимост въз основа на емпиричните данни и избрания статистически тест. Следователно р-стойността може да се разглежда като вероятността на данните, дадени при предварително определено предположение, вградено в статистическите тестове. P-стойността е мярка за това колко вероятно ще бъде наблюдавана извадката от данни, ако нулевата хипотеза е вярна.

Интерпретация на критични стойности

Някои тестове не връщат p. Вместо това те могат да върнат списък с критични стойности. Резултатите от такова изследване се тълкуват по подобен начин. Вместо да се сравнява единична p-стойност с предварително определено ниво на значимост, тестовата статистика се сравнява с критична стойност. Ако се окаже по-малко, това означава, че не е било възможно да се отхвърли нулевата хипотеза. Ако е по-голямо или равно, нулевата хипотеза трябва да бъде отхвърлена. Значението на алгоритъма за проверка на статистическите хипотези и интерпретацията на неговия резултат е подобно на p-стойността. Избраното ниво на значимост е вероятностно решение за отхвърляне или не отхвърляне на предположението за базовия тест предвид данните.

Грешки в статистическите тестове

Интерпретацията на тест за статистически хипотези е вероятностна. Задачата на тестването на статистическите хипотези не е да се намери вярно или невярно твърдение. Доказателството от теста може да е погрешно. Например, ако алфата е 5%, това означава, че в по-голямата си част 1 от 20нулевата хипотеза ще бъде отхвърлена по погрешка. Или няма да стане поради статистическия шум в извадката от данни. Като се има предвид тази точка, малка p стойност, при която да се отхвърли нулевата хипотеза, може да означава, че тя е невярна или че е допусната грешка. Ако се направи такъв тип грешка, резултатът се нарича фалшиво положителен. И такава грешка е грешка от първи вид при тестване на статистически хипотези. От друга страна, ако p-стойността е достатъчно голяма, за да означава отхвърляне на нулевата хипотеза, това може да означава, че е вярно. Или не е правилно и е настъпило някакво малко вероятно събитие, поради което е допусната грешката. Този тип грешка се нарича фалшиво отрицателно.

Статистическо тестване на нулеви хипотези
Статистическо тестване на нулеви хипотези

Вероятност за грешки

При тестване на статистически хипотези все още има шанс да направите някоя от тези видове грешки. Вероятни са фалшиви данни или фалшиви заключения. В идеалния случай трябва да се избере ниво на значимост, което да сведе до минимум вероятността от една от тези грешки. Например, статистическото тестване на нулеви хипотези може да има много ниско ниво на значимост. Въпреки че нивата на значимост като 0,05 и 0,01 са често срещани в много области на науката, най-често използваното ниво на значимост е 310^-7 или 0,0000003. Често се нарича „5-сигма“. Това означава, че заключението е било произволно с вероятност 1 на 3,5 милиона независими повторения на експериментите. Примерите за тестване на статистически хипотези често носят такива грешки. Това е и причината, поради която е важно да имаме независими резултати.проверка.

Примери за използване на статистическа проверка

Има няколко често срещани примера за тестване на хипотези на практика. Един от най-популярните е известен като „Дегустация на чай“. Д-р Мюриел Бристол, колега на основателя на биометрия Робърт Фишър, твърди, че може да каже със сигурност дали е добавен първо към чаша чай или мляко. Фишър предложи да й даде осем чаши (по четири от всеки сорт) на случаен принцип. Тестовата статистика беше проста: преброяване на броя на успехите при избора на чаша. Критичният регион беше единственият успех от 4, вероятно въз основа на обичайния критерий за вероятност (< 5%; 1 на 70 ≈ 1,4%). Фишър твърди, че не е необходима алтернативна хипотеза. Дамата правилно идентифицира всяка чаша, което се счита за статистически значим резултат. Този опит доведе до книгата на Фишър „Статистически методи за изследователи“.

Пример на ответника

Статистическата съдебна процедура е сравнима с наказателен съд, при който обвиняемият се счита за невинен, докато не бъде доказано виновен. Прокурорът се опитва да докаже вината на подсъдимия. Само когато има достатъчно доказателства за обвинение, подсъдимият може да бъде признат за виновен. В началото на процедурата има две хипотези: „Подсъдимият не е виновен” и „Подсъдимият е виновен”. Хипотезата за невинност може да бъде отхвърлена само когато грешката е много малко вероятна, защото човек не желае да осъди невинен обвиняем. Такава грешка се нарича грешка от тип I и нейното възникванерядко се контролира. Вследствие на това асиметрично поведение, грешка от тип II, т.е. оправдаване на извършителя, е по-честа.

Примери за статистическа валидация
Примери за статистическа валидация

Статистиката е полезна при анализиране на големи количества данни. Това важи в еднаква степен и за тестването на хипотези, които могат да обосноват заключенията, дори ако не съществува научна теория. В примера за дегустация на чай беше „очевидно“, че няма разлика между наливането на мляко в чая или наливането на чай в мляко.

Истинското практическо приложение на тестването на хипотези включва:

  • проверка дали мъжете сънуват повече кошмари от жените;
  • документ приписване;
  • Оценка на влиянието на пълнолунието върху поведението;
  • определяне на диапазона, в който прилепът може да открие насекомо с помощта на ехо;
  • избор на най-доброто средство за отказване от тютюнопушенето;
  • Проверка дали стикерите на бронята отразяват поведението на собственика на автомобила.

Проверката на статистическите хипотези играе важна роля в статистиката като цяло и в статистическите изводи. Тестването на стойност се използва като заместител на традиционното сравнение на прогнозната стойност и експерименталния резултат в основата на научния метод. Когато една теория е в състояние само да предскаже знака на връзка, тестовете за насочени хипотези могат да бъдат конфигурирани по такъв начин, че само статистически значим резултат подкрепя теорията. Тази форма на теория за оценка е най-строгатакритика към използването на тестване на хипотези.

Препоръчано: