Предельные теоремы теории вероятностей

4.Проверка статистических гипотез. На основании некоторых соображений можно считать, что функция распределения случайной величины о есть F (x) и необходимо определить совместимы ли наблюденные значения с гипотезой, что о на самом деле имеет распределение F (x).

Таким образом, если вид функции распределения не вызывает сомнений и в проверке нуждаются только значения некоторых параметров, характеризующих это распределение, то в задаче необходимо узнать, не опровергают ли результаты наблюдений ту гипотезу, что параметры распределения имеют предположенные значения. Это — задача проверки простой гипотезы. Если проверяемая гипотеза состоит в том, что параметры принимают не точно определенные значения, а какие-то из некоторых определенных множеств, то гипотеза называется сложной.

Задачу также можно сформулировать так: Имеются две последовательности независимых наблюдений над случайной величиной о с функцией распределения и над случайной величиной с функцией распределения. Функции распределения и неизвестны; требуется оценить правдоподобность гипотезы .

5.Оценка зависимости. Производится последовательность наблюдений сразу двух случайных величин о и з. Результаты наблюдений даны следующими парами значений: Необходимо выяснить наличие функциональной или корреляционной связи между о и з.

6. Управление процессами. Пусть имеется случайный процесс от дискретного или непрерывного времени. Процесс под влиянием тех или иных причин может нарушить свое нормальное протекание и привести к иным, например. Это нарушение нормального течения может привести к нежелательным последствиям и нам нужно своевременно заметить момент «разладки» и оказать управляющее воздействие с целью восстановления нормального хода процесса.

Однако перечисленными задачами далеко не исчерпываются основные проблемы статистики.

1.2.2 Проверка статистических гипотез: основные понятия Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Такие утверждения можно делать на основании теоретических соображений или статистических исследований других наблюдений.

Если для исследуемого явления сформулирована та или иная гипотеза (обычно её называют основной или нулевой гипотезой и обозначают символом), то задача состоит в том, чтобы сформулировать такое правило, которое позволяло бы по результатам соответствующих наблюдений (по имеющимся статистическим данным) принять или отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза принимается или отвергается, называется статистическим критерием проверки гипотезы. Разработка таких правил и их обоснование с точки зрения требований оптимальности и составляют предмет теории проверки статистических гипотез.

22 стр., 10930 слов

Статистические методы в управлении качеством

... различными требованиями к качеству уровень качества — относительная характеристика, являющаяся результатом сравнения совокупности значений показателей качества продукции с соответствующей совокупностью базовых значений этих показателей (при количественной статистической оценке) мера качества — при выполнении точных ...

Иногда могут возникнуть ситуации, когда проверяемая гипотеза состоит в том, что некоторый параметр семейства распределений соответствующей совокупности, например среднее значение, дисперсия, имеет наперед заданное значение или множество значений. Такие гипотезы называются параметрическими.

Простой называют гипотезу, содержащую только одно предположение. Например, гипотеза о том, что математическое ожидание нормального распределения равно 3(известно) — простая. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, гипотеза о том, что математическое ожидание нормального распределения равно 3(неизвестно) — сложная.

В итоге проверки статистической гипотезы в двух случаях может быть принято неправильное решение, то есть могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута основная (правильная) гипотеза. Ошибка второго рода состоит в том, что будет принята конкурирующая (неправильная) гипотеза.

Общий метод проверки гипотез заключается в следующем. Сначала формулируется только одна гипотеза и требуется проверить, согласуются ли имеющиеся статистические данные с этой гипотезой или же они её опровергают. Соответствующие критерии называются критериями согласия.

Рассмотрим общий метод построения критериев. Пусть о распределении случайной величины X=(, описывающий результат изучаемого эксперимента, сформулирована некоторая гипотеза .

Необходимо найти такую статистику T=T (x), характеризующую отклонение эмпирических данных от соответствующих гипотетических значений, распределение которой в случае справедливости можно было бы определить. Пусть — множество всех возможных значений статистики Т; определим подмножество так, чтобы вероятность P (T (x).

Тогда правило проверки гипотезы пусть х — наблюдавшаяся реализация случайной величины Х и t=T (x) — соответствующее значение статистики. Если t, то гипотеза должна быть отвергнута как противоречащая статистическим данным.

Статистику Т называют статистикой критерия, а подмножество её значений — критической областью для гипотезы. То есть критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Различают одностороннюю и двустороннюю критические области. Критическими точками называют точки, отделяющие критическую область от области принятия гипотезы. Тогда правосторонняя критическая область определяется неравенством К<, где положительное число. А левосторонняя область определяется неравенством К>, где отрицательное число. При выполнении обоих неравенств область называют двусторонней. В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенством |K|>.

19 стр., 9357 слов

Международная стандартизация в области управления документацией

... и информационной деятельности. Задачи курсовой работы: 1. Определение понятия международной стандартизации. 2. Характеристика деятельности, структуры, порядка разработки стандартов Международной организации по стандартизации (ИСО). 3. Изучение международной стандартизации в области электронного документооборота. 4. Изучение международной стандартизации метаданных ...

Число б называют уровнем значимости критерия, и его можно считать вероятностью ложного отвержения гипотезы, когда она верна. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Любое распределение наблюдаемой случайной величины Х, которое может оказаться истинным, но отличающееся от гипотетического, называют альтернативой. Совокупность всех альтернатив называют альтернативной гипотезой и обозначают .

Таким образом, критерий определяется заданием соответствующей критической области в множестве значений статистики Т. По своему смыслу критическая область должна включать все маловероятные при гипотезе значения статистики критерия. Обычно используют области вида {t} (для неотрицательных статистик Т) или вида, хотя в конкретных задачах возможны и другие варианты выбора критической области. Вид критической области во многом определяется целью, для которой строится критерий.

Каждый критерий строится для того, чтобы определять, имеют ли место те или иные отклонения от основной гипотезы. Характер таких отклонений может быть разным, поэтому надо иметь критерии как универсального типа («улавливающие» любые отклонения от основной гипотезы), так и предназначенные для выявления отклонений только определенного типа.

Так, часто большие и малые статистики T (X) указывают на разный характер отклонения от нулевой гипотезы, поэтому может оказаться, что в одних случаях лучше использовать критерий, основанный на критической области {t}, а в других — на критической области {t}.

Для проверки одной и той же гипотезы можно строить различные критерии, основываясь на разных статистиках T (X), и чтобы выбрать в конкретной ситуации тот или иной критерий, надо иметь принципы сравнения различных критериев. Идея построения таких принципов состоит в исследовании поведения критериев при тех или иных отклонениях от основной гипотезы.

Величину W (F)=W (, представляющую собой вероятность попадания значения статистики критерия в критическую область, когда истинным распределением наблюдений является распределение F, называют функцией мощности критерия.

Условие P (T (x) перепишем в виде W (F).

Если, то значение W (F) называют мощностью критерия при альтернативе. Значение W (F) при характеризует вероятность принятия правильного решения в ситуации, когда нулевая гипотеза ложна.

Таким образом, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования должно обеспечить минимальную ошибку второго рода. Следует отметить, что единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объёма выборок.

Желательным свойством критерия является свойство несмещённости, которое означает, что выполняется: W (F).

Или это означает, что вероятность отвергнуть нулевую гипотезу, когда она истинна, не превышает заданного уровня значимости б, и в то же время если гипотеза ложна, то она отвергается с вероятностью, большей б. Для вычисления статистики критерия необходимо знать распределение статистики критерия не только при нулевой гипотезе, но и при альтернативах. Поэтому функцию W (F) удаётся найти не во всех случаях.

4 стр., 1882 слов

Сроки службы материалов, конструкций и изделий. Понятие и критерии ...

... повреждений или отказов. Отказы несущих и ограждающих конструкций Отказ конструкций - событие, заключающееся в нарушении работоспособности, прекращение выполнения конструкциями заданных функций, определяемых с соответствующими допусками. При назначении нормативной надежности как несущих, так и ограждающих конструкций под отказом конструкций понимают техническое ...

Следует отметить, что важным показателем каждого критерия является трудоемкость практической реализации соответствующего алгоритма. На практике, когда требуется быстро получить ответ, предпочтение нередко отдается просто реализуемому критерию, даже если он не является оптимальным в теоретическом смысле.

1.2.3 Критерий однородности Смирнова Пусть о1, о2,…, оnвзаимно независимые и одинаково непрерывно распределенные случайные величины, и пусть з1? з 2??? зn.

Эмпирическими называют распределение дискретной случайной величины о*, которая принимает значения з1, з 2,…, зn с одинаковыми вероятностями, равными 1/n:

P з1, з 2,…, зn=1/n, (i=1,2,…, n)

Функция эмпирического распределения выражается равенством:

  • Fn (x|з1,…, зn)=Pо*< зi=

И при каждом действительном х является случайной величиной (функцией от з1, з 2,…, зn).

В дальнейшем функцию эмпирического распределения мы будем обозначать Fn (x), не указывая явно зависимости от величин зi. Так как MFn (x)F (x), DFn (x)[1-F (x)0 (n), где F (x) — функция распределения исходных величин оi (функция теоретического распределения), Fn (x) — несмещенная и состоятельная оценка для F (x).

Если функция теоретического распределения достоверно известна и лишь высказывается гипотеза, согласно которой этой функцией является некоторая заданная функция непрерывного распределения F (x), не содержащая неизвестных параметров, то обозначаем такую гипотезу символом H0:

H0: Fn (x)F (x).

Точно также выражаются гипотезы, конкурирующие с H0:

  • H1+{Ш[F (x)]}:sup|x|<�Ш[F (x)](MFn (x)-F (x))>0,

H1-{Ш[F (x)]}:inf|x|<�Ш[F (x)](MFn (x)-F (x))>0,

где Ш (F) — заданная неотрицательная функция (ее часто называют весовой функцией).

Рассмотрим критерий Смирнова, предназначенного для проверки гипотезы Н0 при конкурирующей гипотезе Н1. Статистики критерия задаются формулами:

  • Dn-=sup|x|<| Fn (x)-F (x)|,

Dn+sup|x|<(Fn (x)-F (x)),

где в левых частях знаки + и — указывают соответствующую конкурирующую гипотезу Н1+ и Н1- .

Для практических вычислений этих статистик полезны другие формулы, эквивалентны предыдущим:

Dn+=,

Dn-=.

Если гипотеза Н0 верна, то статистики Dn+ и Dnраспределены одинаково, поэтому в дальнейшем мы будем рассматривать лишь критерий, обоснованный на статистике Dn+:

P{Dn+ ?x}=, (0

Из предельных теорем и асимптотических формул следует, что если n и 0<�е?x = O (n1/3), то

P.

Иными словами при больших значениях n статистика (6nDn++1)2/(9n) приближенно распределена как ч2с двумя степенями свободы.

С ростом n погрешности убывают как 1/n.

Пусть Q — заданный уровень значимости, выраженный в процентах (0

P{Dn+? Dn+(Q)}=0,01Q.

Если в результате эксперимента окажется, что Dn+? Dn+(Q), то согласно критерию Смирнова с уровнем значимости Q гипотеза Н0 должна быть отвергнута.

Значение удобнее вычислять следующим способом. Пусть

Где

Тогда

5 стр., 2068 слов

Что такое случайная величина

... Пуассона, является последовательность радиоактивного распада частиц. 2.2 Законы распределения непрерывной случайной величины случайный величина теория вероятность Рассмотренные выше правила распределения случайной величины являются ... случайной величины звучит следующим образом: Пусть (Ω, F, P) - вероятностное пространство, тогда случайной величиной называют функцию X: Ω → R [2]. Случайную величину ...

2. Практическая часть

2.1 Решения задач о типах сходимости

1.Доказать что из сходимости почти наверное следует сходимость по вероятности. Привести контрпример, показывающий, что обратное не верно.

Решение. Пусть последовательность случайных величин ,…,… сходится к случайной величине почти наверное. Значит, для любого 0

=0

Так как, то

P ()P ()

и из сходимости к почти наверное вытекает, что сходится к по вероятности так как в этом случае

=0

Но обратное утверждение неверно. Пусть,…,… — последовательность независимых случайных величин, имеющих одну и ту же функцию распределения F (x), равную нулю при x0 и равную 1 при x0. Рассмотрим последовательность

= ,= ,…,= …

Эта последовательность сходится к нулю по вероятности, так как

P () = 1P () = 1F () =

стремится к нулю при любом фиксированном и n. Однако сходимость к нулю почти наверное иметь место не будет. Действительно,

P = 1P () = 1P () =

= 1 = 1 = 1

Стремится к единице с вероятностью 1при любых и n в последовательности ,…,… найдутся реализации, превосходящие .

Отметим, что при наличии некоторых дополнительных условий, накладываемых на величины, сходимость по вероятности влечет сходимость почти наверное.

2.Пусть монотонная последовательность. Доказать, что в этом случае сходимостьк по вероятности влечет за собой сходимость к с вероятностью 1.

Решение. Пусть монотонно убывающая последовательность, то есть …. Для упрощения наших рассуждений будем считать, что 0, 0 при всех n. Пусть сходится к по вероятности, однако сходимость почти наверное не имеет место. Тогда существует 0, такое, что при всех n

0.

Но = и сказанное означает, что при всех

0.

Что противоречит сходимости к по вероятности. Таким образом, для монотонной последовательности, сходящейся кпо вероятности, имеет место и сходимость с вероятностью 1 (почти наверное).

3. Пусть последовательность n сходится к по вероятности. Доказать, что из этой последовательности можно выделить последовательность, сходящуюся к с вероятностью 1 при .

Решение. Пусть — некоторая последовательность положительных чисел, причем, и — такие положительные числа, что ряд. Построим последовательность индексов n1

Так как ряд сходится, то при любом е остаток ряда стремится к нулю. Но тогда стремится к нулю и

то есть .

4. Доказать, что из сходимости в среднем какого либо положительного порядка следует сходимость по вероятности. Приведите пример, показывающий, что обратное утверждение неверно.

Решение. Пусть последовательность n сходится к величине в среднем порядка р> 0, то есть

Воспользуемся обобщенным неравенством Чебышева: для произвольных е и р> 0

Устремив и учитывая, что, получим, что

то есть n сходится к по вероятности.

Однако сходимость по вероятности не влечет за собой сходимость в среднем порядка р> 0. Это показывает следующий пример. Рассмотрим вероятностное пространство, , где = [0, 1] — борелевскаяалгебра, — мера Лебега.

9 стр., 4118 слов

Физические величины и единицы их измерения

... которые отождествлялись с названиями частей человеческого тела. ФИЗИЧЕСКИЕ ВЕЛИЧИНЫ И ЕДИНИЦЫ ИХ ИЗМЕРЕНИЯ. Физические величины Технологическая деятельность человека связана с измерением различных физических величин. Физическая величина, Значение физической величины –, Измерением физической величины В основном в теории измерений принято пять типов шкал: названия, порядок, ...

Определим последовательность случайных величин следующим образом:

Последовательность n сходится к 0 по вероятности, так как

но при любом р> 0

то есть сходимость в среднем иметь не будет.

5. Пусть, при чем для всех n. Доказать, что в этом случае n сходится к в среднеквадратическом.

Решение. Заметим,, то и. Получим оценку для. Рассмотрим случайную величину. Пусть е — произвольное положительное число. Тогда при и при .

Значит,

Если, то и. Следовательно,. А поскольку е сколь угодно мало и, то при, то есть в среднеквадратическом.

6. Доказать, что если n сходится к по вероятности, то имеет место слабая сходимость. Приведите контрольный пример, показывающий, что обратное утверждение неверно.

Решение. Докажем, что если, то в каждой точке х, являющейся точкой непрерывности (это необходимое и достаточное условие слабой сходимости), — функция распределения величины n, а — величины .

Пусть х — точка непрерывности функции F. Если, то справедливо по крайней мере одно из неравенств или. Тогда

Аналогично, присправедливо хотя бы одно из неравенств или и

Или

Откуда

Если, то для сколь угодно малого е существует такое N, что при всех п> N

Тогда С другой стороны, если хточка непрерывности то можно найти такое е, что для сколь угодно малого

И

Значит, для сколь угодно малых е и существует такое N, что при п>N

Или

или, что-то же самое,

Это означает, что во всех точках непрерывности имеет место сходимость и. Следовательно, из сходимости по вероятности вытекает слабая сходимость.

Обратное утверждение, вообще говоря, не имеет места. Чтобы убедиться в этом, возьмем последовательность случайных величин, не равных с вероятностью 1 постоянным и имеющих одну и ту же функцию распределения F (x).

Считаем, что при всех п величины и независимы. Очевидно, слабая сходимость имеет место, так как у всех членов последовательности одна и та же функция распределения. Рассмотрим :

|Из независимости и одинаковой распределенности величин, следует, что

то есть

Выберем среди всех функций распределений невырожденных случайных величин такую F (x), что будет отлично от нуля при всех достаточно малых е. Тогда не стремится к нулю при неограниченном росте пи сходимость по вероятности иметь место не будет.

7. Пусть имеет место слабая сходимость, где с вероятностью 1 есть постоянная. Доказать, что в этом случае будет сходиться к по вероятности.

Решение. Пусть с вероятностью 1 равно а. Тогда слабая сходимость означает сходимость при любых .Так как, то при и при. То есть при и при. Отсюда следует, что для любого е вероятности

и

стремятся к нулю при. Это значит, что

стремится к нулю при, то есть сходиться к по вероятности.

2.2 Решение задач на центральную предельную для независимых одинаково распределенных случайных величин

8. В результате технической проверки 900 электроприборов установлено, что в среднем срок безотказной работы приборов увеличился на 1,2 года по сравнению со средним сроком безотказной работы приборов, полученных по итогам предыдущих проверок. Можно ли объяснить случайностью подобное отклонение, если считать среднеквадратичное отклонение срока безотказной работы электроприборов равным 8 годам?

15 стр., 7341 слов

Построение математических моделей при решении задач оптимизации

... средствами элементарной математики. Следует различать также два вида задач на оптимизацию. В задачах первого вида улучшение достигается за счет коренных качественных изменений: выбор новых конструктивных решений, переход ... вызвано тем, что исследования проводятся в условиях, определенных не полностью, зависящих от случайных причин. В тех случаях, когда в центре внимания находятся вопросы динамики ...

Решение Обозначим через срок безотказной работыго электроприбора, и будем рассматривать последовательность случайных величин, для которых, , .

Введем обозначение .

Так как , — независимые одинаково распределенные случайные величины, то к ним применима центральная предельная теорема для независимых одинаково распределенных случайных величин, которая устанавливает равномерную относительно () сходимость

где — функция стандартного нормального распределения.

При больших () имеет место приближенное равенство

Вычислим вероятность того, что срок безотказной работы приборов увеличится более чем на 1,2 года по сравнению со сроком работы приборов:

Ответ: полученная вероятность очень мала, и мы можем сделать вывод, что нельзя объяснить случайностью данное отклонение.

9. Интеграл вычислен методом Монте-Карло. Сколько опытов нужно произвести, чтобы с вероятностью большей 0,99, можно было считать абсолютную погрешность вычисления значения интеграла не превосходящей 0,1% от?

Решение Значение интеграла можно рассматривать как математическое ожидание функции от случайной величины, где — случайная величина, равномерно распределенная на с плотностью .

Пусть — независимые равномерные на случайные числа. Тогда можно рассматривать как приближенное значение интеграла значение случайной величины

Вычислим

;

Так как — независимые и одинаково распределенные случайные величины, имеющие конечные дисперсии:

то к этим случайным величинам применима ЦПТ:

Введем. При больших ()

Из условия задачи, вероятность такой погрешности больше 0,99:

;

Ответ: необходимо произвести не менее опытов.

10. Интеграл вычислен методом Монте-Карло на основании 1000 независимых опытов. Найти вероятность того, что абсолютная погрешность в определении величины не превосходит 0,01.

Решение Значение интеграла можно рассматривать как математическое ожидание функции случайной величины, где — случайная величина, равномерно распределенная на. Пусть — независимые равномерные на случайные числа. Тогда можно рассматривать как приближенное значение интеграла значение случайной величины

Вычислим

Так как — независимые и одинаково распределенные случайные величины, имеющие конечные дисперсии, то к этим случайным величинам применима ЦПТ:

Введем. При больших ()

Из условия задачи:, , следовательно

Ответ: искомая вероятность равна 0,712.

Заключение

В данной работе мы рассмотрели определения таких понятий, как сходимость последовательностей случайных величин, сходимость вероятностных распределений, характеристическая функция, центральная предельная теорема, статистическая гипотеза, критическая область, критерий согласия. В практической части были решены задачи о типах сходимости, центральной предельной теореме для независимых одинаково распределенных случайных величины. Так же была проведена проверка гипотез критерием «критерий однородности Смирнова»

12 стр., 5859 слов

Единицы физической величины

Цель реферата – рассмотреть эталоны единиц физических величин. Важной задачей метрологии является создание эталонов физических величин, привязанных к физическим константам и имеющих диапазоны, необходимые для ... материалов, процессов выражались различными числовыми значениями. Международный комитет по мерам и весам выделил из своего состава комиссию по разработке единой Международной системы единиц. ...

Использованная литература

[Электронный ресурс]//URL: https://drprom.ru/referat/predelnyie-teoremyi-teorii-veroyatnostey/

В. Б. Горяинов

Б. В. Курс

В. В. Семенця, В. А. Колемаева, В. Е. Теориявероятностей, А. Н. Вероятность