1 / 205

Лекция 1.

Лекция 1. Предмет математической статистики. Статистика – наука, изучающая совокупность массовых явлений с целью выявления скрытых закономерностей и изучения их с помощью некоторых обобщенных показателей.

wayne-neal
Télécharger la présentation

Лекция 1.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Лекция 1. Предмет математической статистики

  2. Статистика – наука, изучающая совокупность массовых явлений с целью выявления скрытых закономерностей и изучения их с помощью некоторых обобщенных показателей

  3. Все методы математической статистики можно отнести к двум основным ее разделам: теории статистического оценивания параметров и теории проверки статистических гипотез.

  4. Выборочный метод в статистике. • Пример 1. Рассматривается урна, содержащая N шаров, каждый из которых может быть либо белым, либо черным. Неизвестноенам количество белых шаров обозначим M, тогда черных шаров будет N-M.

  5. Пусть нам разрешили извлекать из урны шары и фиксировать их цвет. Если извлеченный шар белый – пишем 1, иначе 0. После фиксации цвета шар возвращается в урну. Пусть мы извлекли таким образом n шаров и получили упорядоченный набор из n нулей и единиц- выборку.

  6. Можем ли мы на основе этой выборки сформулировать некоторое утверждение о количестве белых шаров ( или о доле p белых шаров) в урне ? Очевидно, что да.

  7. Формализуем задачу: пусть мы рассматриваем случайную величину X, имеющую распределение Бернулли, т.е. принимающую только два значения 0 и 1 с вероятностями, соответственно, p, 1-p. Выборку теперь мы можем интерпретировать как последовательность n независимых наблюдений сл.в. X. Задача состоит в оценке параметра p данного распределения.

  8. В общем случае выборочный метод состоит в следующем: рассматриваются n независимых наблюдений изучаемой сл.в. X – выборка, и опираясь на эту информацию мы должны сделать некоторое высказывание о распределении изучаемой сл.в. ( или о его параметрах).

  9. В математической статистике выборку удобно рассматривать иначе: как единственную реализацию n-мерной случайной величины X, относительно компонент которой предполагается, что они независимы и имеют такое же распределение, как и исходная случайная величина X.

  10. Идею выборочного метода можно изложить на содержательном языке. Вводится понятие генеральной совокупности, т.е. множества всех мыслимых значений изучаемой величины и выборки- некоторого наблюдаемого подмножества генеральной совокупности.

  11. Выборочный метод на таком языке: • по выборке, т.е. по части множества мы должны сформулировать некоторое высказывание о всей генеральной совокупности. При таком подходе выделяют два основных требования, предъявляемых к выборке • репрезентативность • однородность.

  12. Выборка считается репрезентативной, если у каждого элемента генеральной совокупности равные шансы попасть в выборку. • Выборку называют однородной, если в ней представлены значения одной сл.в., а не нескольких, имеющих существенно различные распределения.

  13. Пример 2 • На одних из президентских выборов в США у Ф.Рузвельта был малоизвестный сейчас конкурент Ландон. Одна из компаний перед выборами провела большого объема телефонный опрос избирателей из различных штатов «За кого собираетесь голосовать?» На основании результатов опроса была предсказана победа Ландону. В чем заключалась ошибка при составлении выборки?

  14. Пример 3 • Пусть на лекции присутствует достаточно много студентов. Мы записали рост каждого из присутствующих, в надежде получить оценку среднего роста человека студенческого возраста. Что можно сказать об однородности данной выборки и почему?

  15. Следует быть очень внимательным к нарушениям требований, предъявляемых к выборке. Если выборка «плохая», то никакая изощренная математика и никакие совершенные программные средства Вас не спасут!

  16. Первичная обработка статистических данных. • Здесь мы рассмотрим, как сделать данные более обозримыми и наглядными, что позволит нам далее сделать некоторые первичные предположения об изучаемой сл.в.

  17. 1) Группировка данных • Группировка данных делает данные обозримыми, что весьма полезно (особенно при «ручном» счете). • Если изучаемая сл.в. дискретная, то группировка данных очевидна: выписываются в в порядке возрастания различные элементы, наблюдавшиеся в выборке (варианты) и соответствующие им частоты (либо- относительные частоты ).

  18. Если же сл.в. дискретная, то выборка «накрывается» набором непересекающихся промежутков, для каждого из которых находится количество попавших в него элементов • Для числа интервалов r в этом случае рекомендуется формула :

  19. 2) Графическое представление данных. • Любые графики делают данные наглядными. Самыми полезными графиками на этом этапе являются гистограмма и полигон. Для построения этих графиков данные должны быть сгруппированы, после чего строятся кусочно-постоянная (гистограмма) либо кусочно-линейная (полигон) зависимость частот от вариант.

  20. Если частоты пронормированы, то такие графики можно интерпретировать как некие статистические аналоги графиков, задающих распределение сл.в X (например плотности распределения, если X непрерывна).

  21. Глядя на такой график часто удается обнаружить неоднородность выборки, или – выдвинуть первичное предположение о виде распределения.

  22. Полигон

  23. Точечные оценки параметров распределения. • В курсе теория вероятностей и математическая статистика давались формальные определения основных требований, предъявляемых к точечным оценкам: • состоятельности, • несмещенности и • эффективности оценки.

  24. Оценка будет состоятельной, если с увеличением объема выборки существенное отклонение оценки от оцениваемого параметра становится маловероятным. • Оценка будет несмещенной, если она не дает систематической ошибки.

  25. Оценка будет максимально эффективной, если рассеивание ее значений относительно оцениваемого параметра, полученных для серии выборок, будет минимально. (Это оценка, дающая максимальную «кучность»).

  26. Сравнительно редко удается построить оценки, удовлетворяющие всем трем условиям. Обычно используются состоятельные, но лишь асимптотически эффективные или несмещенные оценки.

  27. Вспомним некоторые (основные) оценки, известные нам из курса теории вероятностей и математической статистики.

  28. Средние значения :выборочное среднее, медиана, мода. • Выборочное среднее- это среднее арифметическое значение для элементов данной выборки ‑ (принятые обозначения: Mean или ), т.е. средним арифметическим значением признака называется величина • где - значение i-го элемента выборки, n - число элементов в выборке

  29. мода – наиболее часто встречающееся значение переменной (M, Mo) • медиана – среднее по порядку значение (принятые обозначения: Median, Me). Медиана - это "серединное" значение признака в том смысле, что у половины объектов совокупности значения этого признака меньше, а у другой половины - больше медианы.

  30. Приближенно вычислить медиану можно, упорядочив все значения признака по возрастанию (убыванию) и найдя число в этом вариационном ряду, которое либо имеет номер (n+1)/2 - в случае нечетного n, либо находится посередине между числами с номерами n/2 и (n+1)/2 - в случае четногоn.

  31. Напомним, что выборочные мода и медиана более устойчивы к «засоренности» выборки, чем выборочное среднее.

  32. Показатели вариации, разбросазначений: дисперсия, среднее квадратическое (стандартное) отклонение, коэффициент вариации.

  33. Несмещенная (исправленная) выборочная дисперсия

  34. (исправленное) среднее квадратическое или стандартное отклонение ‑ мера разброса значений признака около среднего арифметического значения (принятые обозначения: Std.Dev. (standard deviation),  или s). Величина этого отклонения вычисляется по формуле

  35. коэффициент вариации ‑ отношение стандартного отклонения к среднему арифметическому, выраженное в процентах (обозначается в статистике буквой V). Коэффициент вычисляется по формуле: . • Коэффициент вариации используется для сравнения вариаций «размерных» величин.

  36. Все вышеуказанные оценки среднего и вариации, а также многие другие оценки Вы научитесь находить средствами STATGRAPHICS в лабораторных работах 1-2

  37. Можно добавить другие характеристики

  38. Лекция 2. Основные виды распределений, используемых в статистике. Статистические таблицы.

  39. 1) Нормальное распределение . • Обозначение: • Плотность распределения: • m=MX,

  40. График плотности

  41. 2)РаспределениеПирсона. • Обозначение • где распределены по закону и независимы. Плотность распределения: для x>0.

  42. Разное количество степеней свободы

  43. 3)Распределение t Стьюдента. • Обозначение • Где и независимы. • Плотность распределения:

More Related