geladen (geladen) wrote,
geladen
geladen

Categories:

разбросало кучу #6, внеочередной выпуск (интервал доверия)

В СВЫПУНАЛЬ будет часто использоваться выражение "доверительный интервал", вокруг которого часто возникает путаница (вплоть до лабов по физике на третьем курсе, припоминаю, разные преподаватели подразумевали под ДИ немного разные вещи).

В нашем альманахе тоже, у ДИ будет два определения, одно из которых, строго говоря -- неправильное (но очень удобное).

Правильное, каноническое определение, в применении к нашему случаю, означает примерно следующее:

Предположим, некий гражданин Г. отстрелялся по мишени, с целью выяснить кучность винтовки. Замерил гражданин Г., в зависимости от метода подсчёта, всякие свои кучи, координаты отдельных пробоин, 50% разброс по вертикали-горизонтали, ну или мало ли что ещё люди придумали для САМЕВИК. Из замеров вывел значение для разброса -- оценил сигму, R50 чи R95, т. е. некий реальный инженерно-значимый параметр своей винтовки и прикинул по некоей формуле, соответствующей методу отстрела, доверительный интервал.

К примеру, из расчётов получилось, что R50 на этой дистанции = одна угловая минута, а по расчётам доверительного интервала с 95% уровнем доверия, ДИ равен ±20%, т. е. 0.8 - 1.2 МОА. Что это значит?

Это значит, что если гражданин Г. отстреляется ещё много раз ровно по тому же протоколу, и для каждого замера вычислит интервал доверия, в 95% случаев реальное значение измеряемой величины будет попадать в ДИ (а, соответственно, в 5% случаев -- выходить за ДИ). Не больше, не меньше.

* Это НЕ значит, что для данного конкретного замера с 95% вероятностью R50 находится в ДИ. (R50 -- величина не случайная, она там либо находится, либо нет.)
* Это НЕ значит, что 95% значений, составляющих данный конкретный замер, лежат в ДИ.
* Это НЕ значит, что для последующих замеров вычисленный результат с 95% вероятностью будет попадать в ДИ, полученный для этого замера.
* etc. (за примеры спасибо уикипэдии)

При всём вышесказанном, интуитивное понимание ДИ -- правильное. ДИ -- действительно можно воспринимать как интервал вокруг экспериментально полученного значения, в котором с большой вероятностью лежит настоящее значение, которое мы пытаемся определить опытным путём.

Про ДИ нужно отметить несколько важных моментов:
* ДИ вычисляется из данных конкретного эксперимента. При повторении эксперимента ДИ может быть другой.
* ДИ вычисляется для конкретного уровня доверия. Как правило, в инженерных применениях используется 95% (своего рода, уровень доверия "по умолчанию"). Если снизить уровень доверия, интервал ДИ сужается; понятно почему -- если, например, при уровне доверия в 95% искомое значение "вылетает" за интервал только в одним из 20 случаев, то с УД в 90% -- уже в одном из 10.
* Не сто́ит путать уровень доверия с характеристиками разброса или иными параметрами изучаемого феномена. УД в определении ДИ характеризует только требование к точности эксперимента. Значение УД -- например 95% -- задаёт сам Учоный, совершенно от балды, в меру своих представлений об "уверенности".
* ДИ не обязательно является симметричным вокруг экспериментально полученного значения, как, например, плюс-минус 20%. Может вполне быть, скажем, плюс 15%, минус 25%.
* ДИ для заданного УД -- не единственный. Может быть несколько разных интервалов доверия вокруг экспериментально полученного значения, каждый из которых будет удовлетворять определению.

А теперь -- неправильное, но тоже полезное определение:

Предположим имеется некий метод вычисления кучности из экспериментальных пробоин в мишени (напр., среднее из максимального разброса 2 серий по 5 выстрелов). Истинное значение (в данном случае -- ~3.06σ) можно получить путём усреднения результатов от бесконечного количества экспериментов; экспериментальные данные попадают к нему более или менее близко.

Если задать некий "уровень доверия", напр. в 95%, неправильное, но тоже полезное, определение доверительного интервала звучит так: промежуток, в который при данном методе вычислений попадёт УД% экспериментальных результатов.

ДИ, в таком случае, характеризует метод вычислений, а не конкретный эксперимент, что очень полезно именно для сравнения методов и выбора наилучшего.

В конкретном эксперименте, подобный "неправильный" ИД говорит нам только то, что следует из определения, и тут он ВНЕЗАПНО приближается к "правильному" (в случае ~ симметричных распределений). Если мы, к примеру, знаем (см. СВЫПУНАЛЬ), что 95% экспериментов по "методу ганзы" лежат в ±37.3% от истины, путём смелого логического хода, мы можем заключить, что в 95% отстрелов 2х5, истина находится где-то в ±37.3% от результата. (75% колебаний результата, бонжур реальность).

Какое определение ДИ используется, будет совершенно понятно из контекста.

Остерегайся СВЫПУНАЛЬ, дорогой читатель, там в засаде сидят срыв покровов и разгром наголову.
Tags: вероятность, возликуй зануда, ликбез, разбросало кучу
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments