Байесови мрежи: определение, примери и как работят

2026 Автор: Angel Austin | [email protected]. Последно модифициран: 2025-01-23 12:20:35

Убеждение, мрежа за вземане на решения, байесов (ian) модел или вероятностно управляван ацикличен графичен модел е вариантна схема (вид статистически модел), която представлява набор от променливи и техните условни зависимости чрез насочена ациклична графика (DAG).

Например, байесова мрежа може да представлява вероятностни връзки между болести и симптоми. Като се има предвид последното, мрежата може да се използва за изчисляване на възможността за различни заболявания. Във видеото по-долу можете да видите пример за байесова мрежа от вярвания с изчисления.

Ефективност

Ефективните алгоритми могат да извършват изводи и учене в байесовите мрежи. Мрежите, които моделират променливи (като речеви сигнали или протеинови последователности), се наричат динамични мрежи. Обобщения на байесовите мрежи, които могат да представят и решават проблеми при несигурност, се наричат диаграми на влияние.

Есенция

ОфициалноБайесовите мрежи са DAG, чиито възли представляват променливи в байесовия смисъл: те могат да бъдат наблюдавани стойности, скрити променливи, неизвестни параметри или хипотези. Защото е много интересно.

Байесова мрежа пример

Две събития могат да доведат до намокряне на тревата: активна пръскачка или дъжд. Дъждът има пряк ефект върху използването на пръскачката (а именно, че когато вали, пръскачката обикновено е неактивна). Тази ситуация може да се моделира с помощта на байесова мрежа.

Симулация

Тъй като байесовата мрежа е пълен модел за своите променливи и техните връзки, тя може да се използва за отговор на вероятностни запитвания за тях. Например, може да се използва за актуализиране на знанията за състоянието на подмножество от променливи, когато се наблюдават други данни (доказателствени променливи). Този интересен процес се нарича вероятностен извод.

A posteriori дава универсално достатъчна статистика за приложения за откриване при избор на стойности за подмножество от променливи. По този начин този алгоритъм може да се счита за механизъм за автоматично прилагане на теоремата на Байес към сложни проблеми. На снимките в статията можете да видите примери за байесови мрежи от вярвания.

Изходни методи

Най-често срещаните методи за точен извод са: елиминиране на променлива, което елиминира (чрез интегриране или сумиране) ненаблюдаемотопараметри без заявка един по един чрез разпределяне на сумата към продукта.

Щракнете върху разпространението на "дърво", което кешира изчисления, така че много променливи могат да бъдат запитвани наведнъж и новите доказателства могат да се разпространяват бързо; и рекурсивно съпоставяне и/или търсене, които позволяват компромиси между пространство и време и съответстват на ефективността на елиминирането на променлива, когато се използва достатъчно място.

Всички тези методи имат специална сложност, която зависи експоненциално от дължината на мрежата. Най-често срещаните приблизителни алгоритми за извод са елиминиране на мини-сегмент, циклично разпространение на убежденията, обобщено разпространение на убежденията и вариационни методи.

Мрежа

За да посочите напълно байесовата мрежа и по този начин напълно да представите общото разпределение на вероятностите, е необходимо да посочите за всеки възел X вероятностното разпределение за X, дължащо се на родителите на X.

Разпределението на X условно от неговите родители може да има всякаква форма. Обичайно е да се работи с дискретни или гаусови разпределения, тъй като това опростява изчисленията. Понякога са известни само ограниченията за разпространение. След това можете да използвате ентропията, за да определите единичното разпределение, което има най-висока ентропия предвид ограниченията.

По същия начин, в специфичния контекст на динамична байесова мрежа, условното разпределение за времевата еволюция на латентнатасъстоянието обикновено се настройва така, че да максимизира скоростта на ентропията на подразбиращия се произволен процес.

Прякото максимизиране на вероятността (или апостериорната вероятност) често е трудно предвид наличието на ненаблюдавани променливи. Това е особено вярно за байесова мрежа за вземане на решения.

Класически подход

Класическият подход към този проблем е алгоритъмът за максимизиране на очакванията, който редува изчисляването на очакваните стойности на ненаблюдаваните променливи в зависимост от наблюдаваните данни с максимизиране на общата вероятност (или постериорна стойност), като се приема, че предварително изчислената очаквана стойностите са правилни. При условия на умерена редовност, този процес се сближава в максималните (или максималните a posteriori) стойности на параметрите.

По-пълен байесов подход към параметрите е да ги третираме като допълнителни ненаблюдавани променливи и да изчислим пълното задно разпределение върху всички възли, като се имат предвид наблюдаваните данни, и след това да се интегрират параметрите. Този подход може да бъде скъп и да доведе до големи модели, което прави класическите подходи за настройка на параметрите по-достъпни.

В най-простия случай байесова мрежа се дефинира от експерт и след това се използва за извършване на извод. В други приложения задачата за определяне е твърде трудна за човек. В този случай структурата на байесовата невронна мрежа и параметрите на локалните разпределения трябва да бъдат научени сред данните.

Алтернативен метод

Алтернативен метод за структурирано обучение използва оптимизационно търсене. Това изисква прилагането на функция за оценка и стратегия за търсене. Често срещан алгоритъм за оценяване е постериорната вероятност на структура, дадени данни за обучение, като BIC или BDeu.

Времето, необходимо за изчерпателно търсене, връщащо структура, която максимизира резултата, е суперекспоненциално в броя на променливите. Стратегията за локално търсене прави постепенни промени, за да подобри оценката на структурата. Фридман и неговите колеги обмисляха използването на взаимна информация между променливите, за да намерят желаната структура. Те ограничават набора от родителски кандидати до k възли и ги търсят задълбочено.

Особено бърз метод за точно изучаване на BN е да си представим проблема като оптимизационен проблем и да го решим с помощта на целочислено програмиране. Ограниченията за ацикличност се добавят към целочислената програма (IP) по време на решението под формата на режещи равнини. Такъв метод може да се справи с проблеми до 100 променливи.

Решаване на проблеми

За решаване на проблеми с хиляди променливи е необходим различен подход. Единият е първо да изберете един ред и след това да намерите оптималната структура на BN по отношение на този ред. Това предполага работа в пространството за търсене на възможно подреждане, което е удобно, тъй като е по-малко от пространството на мрежовите структури. След това се избират и оценяват няколко поръчки. Този метод се оказанай-доброто налично в литературата, когато броят на променливите е огромен.

Друг метод е да се съсредоточи върху подклас от разложими модели, за които MLEs са затворени. След това можете да намерите последователна структура за стотици променливи.

Изучаването на байесови мрежи с ограничена ширина от три линии е необходимо, за да се осигури точен, интерпретируем извод, тъй като най-лошият случай на сложността на последния е експоненциален в дължината на дървото k (съгласно хипотезата за експоненциално време). Въпреки това, като глобално свойство на графиката, тя значително увеличава сложността на процеса на обучение. В този контекст K-дървото може да се използва за ефективно обучение.

Разработка

Разработването на Bayesian Web of Trust често започва със създаването на DAG G, така че X да удовлетворява локално свойство на Марков по отношение на G. Понякога това е каузална DAG. Оценяват се условните вероятностни разпределения на всяка променлива спрямо нейните родители в G. В много случаи, особено когато променливите са дискретни, ако съвместното разпределение на X е продукт на тези условни разпределения, тогава X става байесова мрежа по отношение на G.

„Одеялото на възел“на Марков е набор от възли. Марковият юрган прави възела независим от останалата част от заготовката на възела със същото име и е достатъчно знания за изчисляване на неговото разпределение. X е байесова мрежа по отношение на G, ако всеки възел е условно независим от всички други възли, като се има предвид неговия марковскиодеяло.