Често срещан въпрос при сравняване на два набора от измервания е дали да се използва параметрична или непараметрична процедура за тестване. Най-често няколко параметрични и непараметрични теста се сравняват с помощта на симулация, като t-тест, нормален тест (параметрични тестове), нива на Wilcoxon, резултати на Ван дер Валдън и т.н. (непараметрични).
Параметричните тестове предполагат основни статистически разпределения в данните. Следователно трябва да бъдат изпълнени няколко условия на реалността, за да е надежден техният резултат. Непараметричните тестове не зависят от никакво разпределение. По този начин те могат да се прилагат, дори ако условията на параметричната реалност не са изпълнени. В тази статия ще разгледаме параметричния метод, а именно коефициента на корелация на Студент.
Параметрично сравнение на проби (t-Student)
Методите се класифицират въз основа на това, което знаем за темите, които анализираме. Основната идея е, че има набор от фиксирани параметри, които определят вероятностен модел. Всички видове коефициенти на Студент са параметрични методи.
Това често са онези методи, когато се анализират, виждаме, че обектът е приблизително нормален, така че преди да използвате критерия, трябва да проверите за нормалност. Това означава, че разположението на характеристиките в таблицата за разпределение на Студент (и в двете извадки) не трябва да се различава значително от нормалното и трябва да съответства или приблизително да съответства на посочения параметър. За нормално разпределение има две мерки: средната стойност и стандартното отклонение.
T-тестът на студента се прилага при тестване на хипотези. Позволява ви да тествате предположението, приложимо за субектите. Най-честата употреба на този тест е да се провери дали средните стойности на две проби са равни, но може да се приложи и към една извадка.
Трябва да се добави, че предимството на използването на параметричен тест вместо непараметричен е, че първият ще има по-голяма статистическа мощност от втория. С други думи, един параметричен тест е по-вероятно да доведе до отхвърляне на нулевата хипотеза.
Единична извадка t-Студентски тестове
Коефициентът на студент от единична извадка е статистическа процедура, използвана за определяне дали извадка от наблюдения може да бъде генерирана чрез процес със специална средна стойност. Да предположим, че средната стойност на разглежданата характеристика Mх е различно от известна известна стойност на A. Това означава, че можем да предположим H0 и H1. С помощта на t-емпиричната формула за една извадка можем да проверим коя от тези хипотези сме приели, че е правилна.
Формулата за емпиричната стойност на t-теста на Студент:
Ученически t-тестове за независими проби
Независимият коефициент на Студент е използването му, когато се получават два отделни набора от независими и еднакво разпределени проби, по една от всяко от двете сравнения, които се сравняват. С независимо предположение се приема, че членовете на двете извадки няма да образуват двойка корелирани стойности на характеристиките. Например, да предположим, че оценяваме ефекта от медицинско лечение и включваме 100 пациенти в нашето проучване, след което разпределяме на случаен принцип 50 пациенти в групата за лечение и 50 в контролната група. В този случай имаме две независими извадки, съответно можем да формулираме статистическите хипотези H0 и H1и да ги тестваме с помощта на дадените формули за нас.
Формули за емпиричната стойност на t-теста на Студент:
Формула 1 може да се използва за приблизителни изчисления, за близки по брой проби и формула 2 за точни изчисления, когато пробите се различават значително по брой.
T-Студент тест за зависими проби
Сдвоените t-тестове обикновено се състоят от съвпадащи двойки от едни и същи единици илиедна група единици, която е била двойно тествана (t-тест за „повторно измерване“). Когато имаме зависими извадки или две серии от данни, които са положително корелирани помежду си, можем съответно да формулираме статистическите хипотези H0 и H1и ги проверете с помощта на формулата, дадена ни за емпиричната стойност на t-теста на Студент.
Например, субектите се тестват преди лечение за високо кръвно налягане и се тестват отново след лечение с лекарство за понижаване на кръвното налягане. Чрез сравняване на едни и същи резултати на пациентите преди и след лечението, ние ефективно използваме всеки от тях като собствен контрол.
По този начин, правилното отхвърляне на нулевата хипотеза може да стане много по-вероятно, като статистическата мощност се увеличава просто защото случайните вариации между пациентите вече са елиминирани. Имайте предвид обаче, че увеличаването на статистическата мощност идва чрез оценка: необходими са повече тестове, всеки субект трябва да бъде проверен двойно.
Заключение
Форма на тестване на хипотези, коефициентът на ученика е само една от многото опции, използвани за тази цел. Статистиците трябва допълнително да използват методи, различни от t-теста, за да изследват повече променливи с по-голям размер на извадката.