Функция распределения вероятностей. Плотность вероятностей. Плотность распределения вероятностей случайной величины Что такое плотность вероятности

Пусть $X$ -- непрерывная случайная величина с функцией распределения вероятностей $F(x)$. Напомним определение функции распределения:

Определение 1

Функцией распределения называется функция $F(x)$ удовлетворяющая условию $F\left(x\right)=P(X

Так как случайная величина является непрерывной, то, как нам уже известно, функция распределения вероятностей $F(x)$ будет непрерывной функцией. Пусть $F\left(x\right)$ также дифференцируема на всей области определения.

Рассмотрим интервал $(x,x+\triangle x)$ (где $\triangle x$ - приращение величины $x$). На нем

Теперь устремляя значения приращения $\triangle x$ к нулю, получим:

Рисунок 1.

Таким образом, получаем:

Плотность распределения, как и функция распределения, - это одна из форм закона распределения случайной величины. Однако закон распределения может быть записан через плотность распределения только для непрерывных случайных величин.

Определение 3

Кривая распределения -- это график функции $\varphi \left(x\right)$ плотность распределения случайной величины (рис.1).

Рисунок 2. График плотности распределения.

Геометрический смысл 1: Вероятность попадания непрерывной случайной величины в интервал $(\alpha ,\beta)$ равна площади криволинейной трапеции, ограниченной графиком функции распределения $\varphi \left(x\right)$ и прямыми $x=\alpha ,$ $x=\beta $ и $y=0$ (рис. 2).

Рисунок 3. Геометрическое изображение вероятности попадания непрерывной случайной величины в интервал $(\alpha ,\beta)$.

Геометрический смысл 2: Площадь бесконечной криволинейной трапеции, ограниченной графиком функции распределения $\varphi \left(x\right)$, прямой $y=0$ и переменной прямой $x$ есть ни что иное как функция распределения $F(x)$(рис. 3).

Рисунок 4. Геометрическое изображение функции вероятности $F(x)$ через плотность распределения $\varphi \left(x\right)$.

Пример 1

Пусть функция распределения $F(x)$ случайной величины $X$ имеет следующий вид.

1.Плотность распределения вероятностей непрерывной случайной величины

Функция распределения непрерывной случайной величины является ее исчерпывающей вероятностной характеристикой. Но она имеет недостаток, заключающийся в том, что по ней трудно судить о характере распределения случайной величины в небольшой окрестности той или другой точки числовой оси. Более наглядное представление о характере распределения непрерывной случайной вели­чины в окрестностях различных точек дается функцией, которая называется плотностью распределения вероятности или дифференциальным законом распределения случайной величины. В этом вопросе мы рассмотрим плотность распределения вероятности и её свойства.

Пусть имеется непрерывная случайная величина Х с функцией распределения . Вычислим вероятность попадания этой случайной величины на элементарный участок
:

Составим отношение этой вероятности к длине участка
:

Полученное отношение называется средней вероятностью, которая приходится на единицу длины этого участка.

Считая функцию распределения F (х) дифференцируемой, перейдем в равенстве (1) к пределу при
; тогда получим:

Предел отношения вероятности попадания непрерыв­ной случайной величины на элементарный участок от х до х+∆х к длине этого участка ∆х , когда ∆х стремится к нулю, называется плотностью распределения случайной величины в точке х и обозначается f (x ).

В силу равенства (2) плотность распределения f (х) равна производной от функции распределения F (х), т. е.

.

Смысл плотности распределения f (х) состоит в том, что она указывает на то, как часто появляется случай­ная величина Х в некоторой окрестности точки х при повторении опытов.

Кривая, изображающая плотность распределения f (х) случайной величины, называется кривой распределения. Примерный вид кривой распределения представлен на рис.1.

Заметим, что если возможные значения случайной величины заполняют некоторый конечный промежуток, то плотность распределения f (x ) = 0 вне этого про­межутка.

Выделим на оси абсцисс элементарный участок ∆х , примыкающий к точке х (рис. 2), и найдем вероятность попадания случайной величины X на этот участок. С одной стороны, эта вероятность равна приращению
функции распределения F (х), соответствующему приращению x = dx аргумента х. С другой стороны, вероятность попадания случайной величины X на эле­ментарный участок dx с точностью до бесконечно малых высшего порядка, чем ∆х равна f (x ) dx (так как F (x )≈ dF (х) = f (x ) dx ). Геометрически это есть площадь эле­ментарного прямоугольника с высотой f (x ) и основанием dx (рис. 2). Величина f (x ) dx называется элементом вероятности..

Следует обратить внимание на то, что не все случайные величины, возможные значения которых непрерывно заполняют некоторый интервал, являются непрерывными случайными величинами. Встречаются такие случайные величины, возможные значения которых непрерывно заполняют некоторый промежуток, но для которых функция распределения не везде является непрерывной, а в отдельных точках терпит разрывы. Такие случайные величины называются смешанными. Так, например, в задаче обнаружения сигнала в шумах амплитуда полез­ного сигнала является смешанной случайной величиной X , которая может принимать любое значение, как положительное, так и отрицательное.

Дадим теперь более строго определение непрерывной случайной величины.

Случайная величина X называется непрерывной, если ее функция распределения F (х\ непрерывна на всей оси Ох, а плотность распределения f (x ) существует везде, за исключением, быть может, конечного числа точек.

Рассмотрим свойства плотности распределения.

Свойство 1. Плотность распределения неотрицательна, т. е.

Это свойство непосредственно вытекает из того, что плотность распределения
есть производная от неубывающей функции распределения F (x ).

Свойство 2 . Функция распределения случайной величины равна интегралу от плотности в интервале от – ∞ до х, т. е.

. (3)

Свойство 3. Вероятность попадания непрерывной случайной величины X на участок
равна интегралу от плотности распределения, взятому по этому участку, т. е.

. (4)

Свойство 4. Интеграл в бесконечных пределах от плотности распределения равен единице:

.

Если интервал возможных значений случайной величины имеет конечные пределы а и b , то плотность распределения f (х) = 0 вне промежутка
и свойство 4 тогда можно записать так:

.

Пример . Случайная величина X подчинена закону распределения с плотностью

.

Требуется:

1) Найти коэффициент а.

2) Найти вероятность попадания случайной величины на участок от 0 до .

Решение . 1) Для определения коэффициента а вос­пользуемся свойством 4 плотности распределения:

,

откуда .

2) По формуле (4) имеем:

.

Модой
непрерывной случайной величины Х
называется то её значение, при котором плотность распределения максимальна.

Медианой непрерывной случайной величины Х называется такое её значение, для которого равновероятно, окажется ли случайная величина меньше или больше , то есть:

Геометрически мода является абсциссой той точки кривой распределения, ордината которой максимальна (для дискретной случайной величины модой является абсцисса точки полигона с максимальной ординатой).

Геометрически медиана – это абсцисса точки, в которой площадь ограниченная кривой распределения, делится пополам.

Заметим, что если распределение является одномодальным и симметрическим, то математическое ожидание, мода и медиана совпадают.

Отметим также, что третий центральный момент или асимметрия служит характеристикой «скошенности» распределения. Если распределение симметрично относительно математического ожидания, то для кривой распределения (гистограммы)
. Четвертый центральный момент служит для характеристик островершинности или плосковершинности распределения. Эти свойства распределения описываются с помощью так называемого эксцесса. Формулы для нахождения асимметрии и эксцесса были нами рассмотрены на предыдущей лекции.

2.Нормальное распределение

Среди распределений непрерывных случайных величин центральное место занимает нормальный закон или закон распределения Гаусса, плотность вероятности которого имеет вид:

, (5)

где
– параметры нормального распределения.

Так как нормальное распределение зависит от двух параметров и
, то его называют ещё двухпараметрическим распределением.

Нормальный закон распределения применяется в тех случаях, когда случайная величина Х является результатом действия большого числа различных факторов. Каждый фактор в отдельности на величину Х влияет незначительно и нельзя указать, какой именно в большей степени, чем остальные. Примерами случайных величин, имеющих нормальное распределение, могут служить: отклонение действительных размеров деталей, обработанных на станке, от номинальных размеров, ошибки при измерении, отклонения при стрельбе и другие.

Докажем, что в формуле (5) параметр а является математическим ожиданием, а параметр
– среднеквадратическим отклонением:

.

Первый из интегралов равен нулю, так как подынтегральная функция является нечетной. Второй интеграл известен как интеграл Пуассона:

.

Вычислим дисперсию:

.

График плотности вероятности нормального распределения называют нормальной кривой Гаусса (рис.3).

Отметим некоторые свойства кривой:

1.Функция плотности распределения вероятностей определена на всей числовой оси, то есть
.

2.Область значений функции
, то есть кривая Гаусса располагается выше оси абсцисс и не пересекает её.

3. Ветви кривой Гаусса асимптотически стремятся к оси
, то есть

4.Кривая симметрична относительно прямой
. Таким образом для нормального распределения математическое ожидание совпадает с модой и медианой распределения.

5.Функция имеет один максимум в точке с абсциссой
, равный
. С возрастанием
кривая Гаусса становится более пологой, а при убывании
– более «островершинной».

6. Кривая Гаусса имеет две точки перегиба с координатами
и
.

7.Если при неизменном
изменять математическое ожидание, то кривая Гаусса будет сдвигаться вдоль оси
: вправо – при возрастании а , и влево – при убывании.

8.Асимметрия и эксцесс для нормального распределения равны нулю.

Найдем вероятность попадания случайной величины, распределенной по нормальному закону на участок
. Известно, что

.

.

Пользуясь заменой переменной

,

. (6)

Интеграл
не выражается через элементарные функции, поэтому для вычисления интеграла (6) пользуются таблицами значений специальной функции, которая называется функцией Лапласа , и имеет вид:

.

После несложных преобразований получим формулу для вероятности попадания случайной величины на заданный промежуток
:

. (7)

Функция Лапласа обладает следующими свойствами:

1.
.

2.
является нечетной функцией.

3.
.

График функции распределения приведен на рис.4.

Пусть требуется вычислить вероятность того, что отклонение нормально распределенной случайной величины Х по абсолютной величине не превосходит заданного положительного числа , то есть вероятность осуществления неравенства
.

Воспользуемся формулой (7) и свойством нечетности функции Лапласа:

.

Положим
и выберем
. Тогда получим:

.

Это означает, что для нормально распределенной случайной величины с параметрами а и
выполнение неравенства
является практически достоверным событием. В этом заключается так называемое правило «трех сигм».

Определение . Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка.

Для непрерывной случайной величины вводится понятие функции распределения.

Определение. Функцией распределения вероятностей случайной величины Х называют функцию F(х), определяющую для каждого значения x вероятность того, что случайная величина Х примет значение меньшее x, то есть:

F(х) = P(X < x)

Часто вместо термина «функция распределения» используют термин «интегральная функция распределения».

Свойства функции распределения:

1. Значения функции распределения принадлежат отрезку:

0 ≤ F(х) ≤ 1.

2. Функция распределения есть неубывающая функция, то есть:

если x > x ,

то F(x ) ≥ F(x ).

3. Вероятность того, что случайная величина примет значение, заключенное в интервале . Вероятность такого события

P (х X х + Δх ) = F (х + Δх ) – F (х ),

т.е. равна приращению функции распределения F (х ) на этом участке. Тогда вероятность, приходящаяся на единицу длины, т.е. средняя плотность вероятности на участке от х до х + Δх , равна

Переходя к пределу Δх → 0, получим плотность вероятности в точке х :

представляющую производную функции распределения F (х ). Напомним, что для непрерывной случайной величины F (х ) – дифференцируемая функция.

Определение. Плотностью вероятности (плотностью распределения ) f (x ) непрерывной случайной величины Х называется производная ее функции распределения

f (x ) = F ′(x ). (4.8)

Про случайную величину Х говорят, что она имеет распределение с плотностью f (x ) на определенном участке оси абсцисс.

Плотность вероятности f (x ), как и функция распределения F (x ) является одной из форм закона распределения. Но в отличие от функции распределения она существует только для непрерывных случайных величин.

Плотность вероятности иногда называют дифференциальной функцией или дифференциальным законом распределения . График плотности вероятности называется кривой распределения .

Пример 4.4. По данным примера 4.3 найти плотность вероятности случайной величины Х .

Решение. Будем находить плотность вероятности случайной величины как производную от ее функции распределения f (x ) = F "(x ).

Отметим свойства плотности вероятности непрерывной случайной величины.

1. Плотность вероятности – неотрицательная функция , т.е.

Геометрически вероятность попадания в интервал [α , β ,] равна площади фигуры, ограниченной сверху кривой распределения и опирающейся на отрезок [α , β ,] (рис.4.4).

Рис. 4.4 Рис. 4.5

3. Функция распределения непрерывной случайной величины может быть выражен через плотность вероятности по формуле :

Геометрически свойства 1 и 4 плотности вероятности означают, что ее график – кривая распределения – лежит не ниже оси абсцисс, а полная площадь фигуры, ограниченной кривой распределения и осью абсцисс, равна единице.

Пример 4.5. Функция f (x ) задана в виде:

Найти: а) значение А ; б) выражение функции распределения F (х ); в) вероятность того, что случайная величина Х примет значение на отрезке .

Решение. а) Для того, чтобы f (x ) была плотностью вероятности некоторой случайной величины Х , она должна быть неотрицательна, следовательно, неотрицательным должно быть и значение А . С учетом свойства 4 находим:

, откуда А = .

б) Функцию распределения находим, используя свойство 3 :

Если x ≤ 0, то f (x ) = 0 и, следовательно, F (x ) = 0.

Если 0 < x ≤ 2, то f (x ) = х /2 и, следовательно,

Если х > 2, то f (x ) = 0 и, следовательно

в) Вероятность того, что случайная величина Х примет значение на отрезке находим, используя свойство 2 .

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X

F(x) = P(X

Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график Функции распределения для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения (Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале , т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона плотность вероятности равна 1/(0,5-0)=2. А для с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

    Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ).

    Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

    Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

    Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП() ).

    Вычисление плотности вероятности с использованием функций MS EXCEL

    Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

    Найдем плотность вероятности для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

    Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

    Вычисление вероятностей с использованием функций MS EXCEL

    1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

    НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5.
    Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

    2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

    В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

    3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА) .

    Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье функции распределения найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5.

    В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5) =0.

    Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

    Обратная функция распределения вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

    В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

    Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье .



Читайте также: