Разпределение на Пиърсън: определение, приложение

Съдържание:

Разпределение на Пиърсън: определение, приложение
Разпределение на Пиърсън: определение, приложение
Anonim

Какъв е законът за разпространение на Pearson? Отговорът на този широк въпрос не може да бъде прост и кратък. Системата Pearson първоначално е проектирана да моделира видими изкривени наблюдения. По това време беше добре известно как да се настрои теоретичния модел, за да съответства на първите два кумуланта или моменти от наблюдаваните данни: всяко разпределение на вероятностите може да бъде директно разширено, за да образува група от скали за местоположение.

Хипотезата на Пиърсън за нормалното разпределение на критериите

Освен в патологични случаи, скалата на местоположението може да бъде направена така, че да съответства на наблюдаваната средна стойност (първия кумулант) и дисперсията (втората кумуланта) по произволен начин. Въпреки това, не беше известно как да се конструират разпределения на вероятностите, при които асиметрия (стандартизиран трети кумулант) и ексцес (стандартизиран четвърти кумулант) могат да бъдат контролирани еднакво свободно. Тази необходимост стана очевидна, когато се опитахме да съберем известни теоретични модели към наблюдаваните данни,който показа асиметрия.

Във видеото по-долу можете да видите анализа на чи-разпределението на Pearson.

Image
Image

История

В оригиналната си работа Пиърсън идентифицира четири типа разпределения (номерирани от I до IV) в допълнение към нормалното разпределение (което първоначално е било известно като тип V). Класификацията зависи от това дали разпределенията се поддържат в ограничен интервал, по полуос или върху цялата реална линия и дали са били потенциално изкривени или непременно симетрични.

Във втория документ бяха коригирани два пропуска: той предефинира разпределението тип V (първоначално беше само нормалното разпределение, но сега с обратна гама) и въведе разпределението тип VI. Заедно първите две статии обхващат петте основни типа на системата на Пиърсън (I, III, IV, V и VI). В третата статия Пиърсън (1916) въвежда допълнителни подтипове.

Функции за разпределение на Пиърсън
Функции за разпределение на Пиърсън

Подобрете концепцията

Ринд изобретява прост начин да визуализира пространството от параметри на системата на Пиърсън (или разпределението на критериите), който по-късно приема. Днес много математици и статистици използват този метод. Типовете разпределения на Пиърсън се характеризират с две величини, обикновено наричани β1 и β2. Първият е квадратът на асиметрия. Вторият е традиционният ексцес, или четвъртият стандартизиран момент: β2=γ2 + 3.

Съвременните математически методи дефинират ексцеса γ2 като кумуланти вместо моменти, така че за нормалноразпределение имаме γ2=0 и β2=3. Тук си струва да следваме историческия прецедент и да използваме β2. Диаграмата вдясно показва кой тип е конкретно разпределение на Пиърсън (означено с точка (β1, β2).

Статистика на Пиърсън
Статистика на Пиърсън

Много от изкривените и/или немезокуртични дистрибуции, които познаваме днес, все още не са били известни в началото на 1890-те. Това, което сега е известно като бета разпределение, е използвано от Томас Байс като заден параметър на разпределението на Бернули в неговата статия от 1763 г. за обратната вероятност.

Бета разпределението стана известно поради присъствието си в системата на Pearson и беше известно до 40-те години на миналия век като разпространение на Pearson тип I. Разпределението тип II е специален случай на тип I, но обикновено вече не се отделя.

Разпределението на гамата произлиза от неговата собствена работа и е известно като нормалното разпределение на Пиърсън тип III, преди да придобие съвременното си име през 30-те и 40-те години на миналия век. Доклад от 1895 г. на учен представя разпределението тип IV, което съдържа t-разпределението на Студент, като специален случай, предшестващ последващото използване на Уилям Сили Госет с няколко години. Неговият документ от 1901 г. представя разпределение с обратна гама (тип V) и бета прости числа (тип VI).

Друго мнение

Според Орд, Пиърсън разработи основната форма на уравнение (1) въз основа на формулата за производната на логаритъма на функцията на плътността на нормалното разпределение (която дава линейно деление на квадратнаструктура). Много специалисти все още се занимават с тестване на хипотезата за разпределението на критериите на Пиърсън. И доказва своята ефективност.

Алтернативно разпределение на Пиърсън
Алтернативно разпределение на Пиърсън

Кой беше Карл Пиърсън

Карл Пиърсън е английски математик и биостатистик. На него се приписва създаването на дисциплината математическа статистика. През 1911 г. той основава първия в света отдел по статистика в University College London и прави значителен принос в областта на биометриката и метеорологията. Пиърсън също беше привърженик на социалния дарвинизъм и евгеника. Той беше протеже и биограф на сър Франсис Галтън.

Биометрия

Карл Пиърсън играе важна роля в създаването на училището по биометрия, което е конкурираща се теория за описване на еволюцията и наследяването на популациите в началото на 20-ти век. Неговата поредица от осемнадесет статии "Математически принос към теорията на еволюцията" го утвърждава като основател на биометричното училище за наследяване. Всъщност Пиърсън посвещава голяма част от времето си през 1893-1904 г разработване на статистически методи за биометрия. Тези методи, които са широко използвани днес за статистически анализ, включват теста хи-квадрат, стандартното отклонение, корелацията и регресионните коефициенти.

Коефициент на корелация на Пиърсън
Коефициент на корелация на Пиърсън

Въпросът за наследствеността

Законът за наследственост на Пиърсън гласи, че зародишната плазма се състои от елементи, наследени от родителите, както и от по-далечни предци, чийто дял варира според различните характеристики. Карл Пиърсън беше последовател на Галтън и въпреки това техенпроизведенията се различаваха в някои отношения, Пиърсън използва значителна част от статистическите концепции на своя учител при формулирането на биометрично училище за наследяване, като например закона за регресията.

Разпределение на Пиърсън
Разпределение на Пиърсън

Училищни функции

Биометричното училище, за разлика от Менделианците, не е било фокусирано върху предоставянето на механизъм за наследяване, а върху предоставянето на математическо описание, което не е причинно-следствено по природа. Докато Галтън предлага прекъсната теория на еволюцията, при която видовете ще се променят с големи скокове, а не с малки промени, които се натрупват с течение на времето, Пиърсън посочи недостатъци в този аргумент и всъщност използва идеите си за разработване на непрекъсната теория на еволюцията. Менделианците предпочитат прекъснатата теория на еволюцията.

Докато Галтън се фокусира главно върху прилагането на статистически методи за изследване на наследствеността, Пиърсън и неговият колега Уелдън разшириха своите разсъждения в тази област, вариациите, корелациите на естествения и сексуалния подбор.

Типично разпределение
Типично разпределение

Поглед към еволюцията

За Пиърсън теорията на еволюцията не е имала за цел да идентифицира биологичния механизъм, който обяснява моделите на унаследяване, докато менделският подход обявява гена за механизъм на наследяване.

Пърсън критикува Бейтсън и други биолози, че не са възприели биометрични методи в своето изследване на еволюцията. Той осъди учените, които не се фокусираха върхустатистическа валидност на техните теории, като се посочва:

"Преди да приемем [всякаква причина за прогресивна промяна] като фактор, ние трябва не само да покажем неговата правдоподобност, но, ако е възможно, да демонстрираме неговата количествена способност."

Биолозите се поддадоха на "почти метафизични спекулации относно причините за наследствеността", които замениха процеса на събиране на експериментални данни, което всъщност може да позволи на учените да стеснят потенциалните теории.

статистически мост
статистически мост

Закони на природата

За Пиърсън законите на природата бяха полезни за правене на точни прогнози и за обобщаване на тенденциите в наблюдаваните данни. Причината беше преживяването, „че се е случила определена последователност и се е повторила в миналото“.

По този начин идентифицирането на конкретен механизъм на генетиката не е било достойно усилие за биолозите, които вместо това трябва да се съсредоточат върху математическите описания на емпиричните данни. Това отчасти доведе до остър спор между биометристи и менделианци, включително Бейтсън.

След като последният отхвърли един от ръкописите на Пиърсън, описващ нова теория за вариация или хомотип на потомството, Пиърсън и Уелдън основават компанията Biometrika през 1902 г. Въпреки че биометричният подход към наследяването в крайна сметка загуби своята менделска перспектива, методите, които са разработили по това време, са жизненоважни за изучаването на биологията и еволюцията днес.

Препоръчано: