Предмет статистики — это количественная сторона массовых социально-экономических явлений в неразрывной связи с их качественной стороной. Она изучает закономерности, которые проявляются только в большой массе. Отличия от других наук: статистика дает другим наукам (экономике, социологии) цифровой материал и методы для анализа, используя свой специфический подход к изучению именно массовых процессов.
Статистика — это социальная наука, изучающая количественную сторону массовых явлений и процессов. Само слово происходит от латинского "status" — состояние или положение дел. Изначально она использовалась для описания состояния государства (учет населения, земель, армии). Этапы развития прошли от простой описательной "государствоведения" до сложного аналитического инструмента с математической базой.
Объект изучения — это исследуемое явление (например, предприятия города). Статистическая совокупность — это множество его элементов (все предприятия). Единица изучения (или единица совокупности) — отдельный элемент (одно предприятие). Статистическая закономерность — это повторяющаяся тенденция, которая видна только в массе (например, рост средней зарплаты). Статистические показатели — это обобщающие числовые характеристики совокупности (объем выпуска, средняя зарплата).
Метод статистики включает три этапа: 1) Статистическое наблюдение (сбор данных). 2) Сводка и группировка (обобщение данных в таблицы). 3) Анализ: расчёт абсолютных и относительных величин, средних величин, показателей вариации (разброс данных), индексов (динамика), а также корреляционный и регрессионный анализ (изучение связей).
В рыночной экономике статистика — это основа управления. На уровне макроэкономики она дает данные о ВВП, инфляции, безработице для государства. На уровне микроэкономики она помогает фирмам анализировать рынок, конкурентов, цены. Главное требование — достоверность и полнота данных, иначе управленческие решения будут ошибочными.
Официальная статистика в Узбекистане централизована. Главный орган — Национальный комитет Республики Узбекистан по статистике (Госкомстат, сейчас Агентство статистики). Ему подчиняются областные управления статистики, а тем, в свою очередь, — городские и районные отделы статистики. Эта система обеспечивает сбор и обработку данных по единой методологии.
По способу сбора: непосредственное (сами видим/считаем) и документальное (из отчетов). По времени: непрерывное (текущее) (постоянно, ЗАГС), периодическое (через равные промежутки, учеба) и единовременное (один раз, перепись). По охвату: сплошное (все единицы) и выборочное (только часть единиц).
Сущность — это первый этап стат. исследования, сбор первичных данных. Значение — от качества наблюдения зависит итог всего анализа. Формы наблюдения: статистическая отчетность (предприятия сдают отчеты) и специально организованные обследования (переписи, опросы, мониторинги). Виды классифицируют по времени и охвату.
Это план наблюдения. Сначала определяют цель и задачи. Затем — объект наблюдения (что изучаем) и единицу наблюдения (у кого собираем данные). Важнейшая часть — программа наблюдения, это список вопросов (формуляр, анкета), на которые нужно получить ответы. Также решаются вопросы организации (кто, где, когда).
Это практическая подготовка. Определяют организующие организации (кто проводит). Уточняют объект и единицу наблюдения. Устанавливают период наблюдения (время сбора данных) и критический момент (или дата) — точный момент времени, на который данные должны быть актуальны (например, "на 00:00 1 января").
Сущность — это планомерный, научно организованный сбор данных о явлениях. Значение — это основа, фундамент всего исследования. Формы: статистическая отчетность (обязательная) и специально организованные обследования (переписи, опросы). Виды — по времени (текущее, периодическое) и охвату (сплошное, выборочное). Методы — документальный, опрос, непосредственное наблюдение.
По времени: регулярное (постоянно или через периоды, = текущее + периодическое), разовое (единовременное, например, перепись) и эпизодическое (нерегулярно, по мере надобности). По охвату единиц: сплошное наблюдение (изучаем все единицы совокупности) и выборочное наблюдение (изучаем только часть, но делаем выводы обо всех).
Ошибки — это расхождения данных с реальностью. Бывают случайные (описки) и систематические (постоянно завышают или занижают). Преднамеренные ошибки (приписки) — это вид систематических. Ошибки записи — это описки. Методы выявления: арифметическая проверка (контроль итогов, сумм) и логическая проверка (сопоставление связанных ответов, например, "возраст 5 лет" и "имеет высшее образование" — это логическая ошибка).
Статистическая отчетность — это основная форма наблюдения. Особенность — она обязательна, ведется регулярно, имеет установленную программу (формы отчетов) и строгие порядок и сроки представления. Чаще всего это сплошное наблюдение (отчитываются все предприятия), но для малого бизнеса может быть выборочное наблюдение.
Чтобы устранить ошибки, нужен контроль. В статистической отчетности и специально организованных обследованиях используют арифметический (счет) и логический (смысл) контроль. Главный метод — это профилактика: точное определение объекта и единицы наблюдения, четкие инструкции для регистраторов, понятная программа наблюдения (анкета).
Это полный план. Программно-методические: цель и задачи, объект и единица наблюдения, программа наблюдения (анкета). Организационные: организующие организации (кто проводит), период сбора данных, дата или критический момент (на какой момент времени фиксируем данные).
Это обследования, которые проводятся регулярно (текущие), но не являются сплошной отчетностью. Примеры: Обследование бюджета домохозяйств (выборочно изучают доходы и расходы семей). Статистика потребительских цен (регистрация цен для расчета инфляции). Статистика неорганизованной торговли (учет торговли на рынках). Статистика дехканских хозяйств.
Сводка — это второй этап, обработка данных после наблюдения. Группировка — это разделение совокупности на однородные группы. Цель группировки и ее задачи — упорядочить данные, выделить социально-экономические явления (типы). Виды: типологическая (разделение на типы, напр., предприятия по форме собственности), структурная (изучение состава, напр., население по возрасту), аналитическая (изучение связи, напр., группировка рабочих по стажу и выработке).
Сущность — это разделение единиц совокупности на однородные группы по существенным признакам. Значение — это основа для анализа, позволяет увидеть структуру и связи. Цель и задачи — выделить типы, изучить структуру, выявить связи (например, в социальных сферах). Основные виды: типологическая (выделение типов), структурная (изучение состава) и аналитическая (изучение связей).
Сущность — разделение данных на группы. Цель и задачи — выделить социальные группы, типы, изучить структуру и связи. Виды по задачам: типологическая, структурная, аналитическая. По числу признаков: простая (по 1 признаку) и сложная (по 2 и более, =комбинационная). По методу: первичная (на основе исходных данных) и вторичная (перегруппировка уже сгруппированных данных).
Сначала — определение признака группировки (например, возраст). Затем определяем число групп. Если интервалы равные, делаем расчет длины интервала (h = (Xmax - Xmin) / k, где k - число групп). Затем устанавливаем нижние и верхние границы групп (например, 20-25, 25-30). Главное, чтобы каждая единица попала только в одну группу.
Типологическая решает задачу выделения соц-эконом. типов (напр., разделить фирмы на малые, средние, крупные). Структурная — задачу изучения состава (напр., какова доля малых фирм?). Аналитическая — задачу выявления связи (напр., как размер фирмы влияет на прибыль?). Первичная группировка решает эти задачи на сырых данных, вторичная — на уже готовых.
Это повторение 20-го. Классификация по задачам (цель, задачи): типологическая (выделить типы, социальные группы), структурная (показать состав), аналитическая (найти связь). По сложности: простая (1 признак), сложная (2+ признака). По этапу: первичная (из сырых данных), вторичная (перегруппировка).
Значение — это основной метод обобщения данных, он превращает хаос цифр в упорядоченную систему. Цель и задачи — сделать данные обозримыми. Группировка по социально-экономическим признакам (напр., по доходу) позволяет: 1) выделить типы (типологическая), 2) изучить состав (структурная), 3) выявить взаимосвязи (аналитическая).
Признаки бывают атрибутивные (текст, напр., пол) и количественные (число, напр., возраст). Виды по задачам: типологическая, структурная, аналитическая. По числу признаков: простая, сложная. По этапу: первичная, вторичная. Правила: групп не должно быть слишком много или мало (часто 5-8), интервалы должны быть четкими, каждая единица — только в 1 группе.
1. Выбрать признак группировки (по чему делим). 2. Определить число групп. 3. Определить размер интервала (если признак количественный). 4. Установить нижнюю и верхнюю границу каждой группы. 5. Разнести единицы по группам (составить рабочую таблицу или макет). 6. Подсчитать итоги и оформить итоговую таблицу.
По срокам: текущий отчет (месячный, квартальный) и годовой отчет. По способу передачи (устаревшие): телеграфный отчет, отчет по электронной почте (сейчас основной). По охвату: первичный отчет (отдельное предприятие) и сводный отчет (обобщение по району, отрасли, региону).
Это повторение 17-го. Это выборочные обследования, которые проводятся регулярно. Исследование бюджета домашних хозяйств — изучают доходы/расходы семей. Статистика потребительских цен — мониторинг цен для инфляции. Статистика неорганизованной торговли (рынки) и статистика дехканских хозяйств — оценка объемов в этих секторах.
Таблица — это способ наглядного представления данных. Структура: макет таблицы — это ее "скелет" (шапка и боковик). У таблицы должен быть порядковый номер и общее название таблицы (отражает суть). Подлежащее таблицы — это то, о чем идет речь (объект, строки). Сказуемое таблицы — это показатели, которые характеризуют подлежащее (столбцы). Обязательно указываются единицы измерения, периоды или даты.
Простые таблицы — в подлежащем просто перечень объектов (напр., список заводов). Групповые таблицы — в подлежащем дана группировка по одному признаку (напр., заводы, сгруппированные по числу рабочих). Комбинационные таблицы — в подлежащем дана группировка по двум и более признакам (напр., заводы, сгруппированные по числу рабочих И по форме собственности).
1. Заголовок таблицы (название) должен быть четким. 2. Таблица должна быть компактной, без лишних линий. 3. Обязательны единицы измерения. 4. Итоги должны быть видны. 5. Использовать условные обозначения в таблице: "..." (явл. нет), "-" (данных нет), "0.0" (величина малая). 6. Все ячейки должны быть заполнены (числом или знаком).
Экономический показатель (стат. показатель) — это обобщающая характеристика, мера. Он отражает связь качества и количества. Содержание: имеет пространственные границы (где?), временные (когда?) и методологию. Выражается через число и единицы измерения (шт., тонны, %). Норма — это эталон, с которым сравнивают показатель. Элементы объекта — это то, что он измеряет.
Это комбинация 29, 30 и 31. Макет таблицы состоит из подлежащего (строки, объект) и сказуемого (столбцы, показатели). Типы по подлежащему: простые (перечень), групповые (1 признак), комбинационные (2+ признака). Правила: четкое название, единицы измерения, заполненные ячейки (цифры или знаки "-", "..."), компактность.
Для любой таблицы нужен порядковый номер и название таблицы. В простой таблице подлежащее — это просто список (напр., стран), а сказуемое — показатели (напр., ВВП, население). В комбинационной подлежащее сложнее, оно делится на группы по 2+ признакам (напр., страны по континентам И уровню дохода). И там, и там в сказуемом указываем единицы измерения, а в заголовках — периоды или даты.
Таблицы и графики — это методы наглядного представления данных. Таблицы (простые, групповые, комбинационные) имеют макет (подлежащее, сказуемое), название, номер, единицы измерения, периоды/даты. Графики визуализируют данные. Виды графиков: диаграммы (сравнительные-столбики, структурные-секторные, динамические-линейные) и статистические карты (картограммы-раскраска, картодиаграммы-диаграммы на карте).
График — это условное изображение числовых данных с помощью геометрических фигур. Роль и значение: наглядность, быстрое восприятие, выявление тенденций, анализ структуры. Основные элементы: поле графика, геометрические образы (точки, линии), масштаб, экспликация (пояснения), название. Виды: диаграммы, карты. Создание требует выбора вида, масштаба. Анализ — это чтение графика, выводы о тенденциях.
Создание графика — это перевод чисел в геометрические символы (линии, столбики). График строится в области графика, часто в системе координат. Важнейший элемент — шкала, на ней откладываются значения. Масштаб — это длина отрезка шкалы, соответствующая единице показателя. Шкалы бывают прямые (равномерные) и изогнутые (напр., логарифмические). Числовая сетка (координатная) помогает точнее строить и считывать данные.
Основные виды: Диаграммы (самые частые) и статистические карты. Диаграммы бывают: сравнительные (столбиковые, ленточные — для сравнения), структурные (секторные, = круговые — для показа доли), динамические (линейные, спиральные — для показа изменений во времени). Картограммы — штриховка или раскраска регионов на карте. Картодиаграммы — размещение диаграмм (столбиков, кругов) на карте.
Линейные диаграммы строятся в области координат, используя ось абсцисс (Х, обычно время) и ось ординат (Y, показатель). Данные изображаются точками, которые соединяются линиями. Эти точки — вершины ординат. Плоские диаграммы — это столбиковые, секторные, квадратные (где важна площадь). Числовая сетка помогает в построении.
Круговые (секторные) диаграммы используются для показа структуры. Весь круг (360°) принимается за 100% (вся совокупность). Части совокупности изображаются как сектора круга, размер (угол) которых пропорционален доле (1% = 3.6°). Диаграммы в форме квадрата (или "квадратные круги") — это тоже способ показать структуру, где 100% — это площадь квадрата.
Образные (фигурные) диаграммы — это способ изображения данных с помощью изображения объектов (картинок, силуэтов). Например, производство тракторов — картинками тракторов. Размер картинки или их число должно быть пропорционально величине. Устанавливается единица измерения (напр., 1 силуэт = 1000 чел). Удобны для показа динамики явления в популярной форме.
Показатель — это обобщающая характеристика. Количественные показатели — числа (возраст, цена). Атрибутивные — текст (пол, профессия). Экономические показатели — это показатели, характеризующие экономику (ВВП, прибыль). Они делятся на макроэкономические (уровень страны: ВВП, инфляция) и микроэкономические (уровень фирмы: себестоимость, рентабельность).
Сравнение — основа анализа. Виды: Сравнение в динамике (с прошлым периодом). Сравнение в пространстве (сравнение регионов, стран, объектов). Сравнение с планом и договором (план/факт анализ). Также есть сравнение с нормативом или стандартом.
Абсолютные величины показывают размер, объем. Они всегда именованные (тонны, штуки). Виды: Индивидуальные величины (характеризуют 1 единицу, напр., выработка 1 рабочего). Групповые и простые (общие) — характеризуют группу или всю совокупность (напр., фонд з/п по цеху, общая численность). Сложные величины — получаются как произведение (напр., чел.-дни).
Сущность — это первичные показатели, показывают объем и число явлений. Значение — основа для всех расчетов (относительных, средних). Методы определения: прямое суммирование данных наблюдения. Бывают индивидуальные (1 объект) и общие (вся совокупность). Обязательно имеют единицы измерения (натуральные, денежные, трудовые).
Относительная величина — это результат деления одного показателя (текущий) на другой (база). Формы выражения зависят от базы: База=1: коэффициенты (напр., 1.15). База=100: проценты (%, напр., 115%). База=1000: промилле (‰, напр., 1150‰, рождаемость). База=10000: продецимилле (‱, редко).
1. ОВ динамики (текущий / прошлый, темп роста). 2. ОВ структуры (часть / целое). 3. ОВ сравнения (или сопоставления) (объект А / объект Б). 4. ОВ интенсивности (одно явление / другая, связанная с ним среда, напр., рождаемость на 1000 чел.). 5. ОВ выполнения плана (факт / план).
Существуют взаимосвязи. Например, ОВ динамики целого (общего итога) зависит от ОВ динамики его частей и изменения ОВ структуры. Индекс переменного состава = индекс постоянного состава * индекс структуры. ОВ интенсивности можно сравнивать (ОВ сравнения) во времени (ОВ динамики).
Порядок: делим текущий показатель на базу. Формы: коэффициенты, проценты, промилле, продецимилле. Виды: ОВ динамики (рост/снижение), ОВ структуры (доля), ОВ сравнения/сопоставления (во сколько раз больше/меньше), ОВ интенсивности (насыщенность).
Абсолютные (в тоннах, шт.) показывают размер. Виды: индивидуальные, простые (общие), групповые, сложные. Относительные (в %, разы) показывают соотношение. Виды: ОВ динамики, ОВ структуры, ОВ сравнения/сопоставления, ОВ интенсивности. Абсолютные — первичны, относительные — производны.
Это почти повтор 44-го. Абсолютные показатели показывают размер явления. Они всегда имеют единицы измерения (натуральные, трудовые, денежные). Виды: индивидуальные (1 ед.), простые (общие) или групповые (итог по группе/совокупности), сложные (произведение двух величин, напр., тонно-километры).
Сущность: средняя — это обобщающая характеристика, которая гасит случайные колебания и показывает типичный уровень признака в совокупности. Значение — позволяет сравнивать разные совокупности. Виды: Средняя арифметическая (самая частая), средняя гармоническая (когда неизвестны веса, но известно их произведение), средняя геометрическая (для темпов роста), средняя квадратическая (для расчета вариации).
Применяется для анализа средних и массовых социально-экономических явлений (средняя з/п, средний возраст). Простая средняя арифметическая: (сумма значений) / (число значений). Используется, когда данные не сгруппированы. Взвешенная средняя арифметическая: (сумма произведений 'значение * вес') / (сумма весов). Используется, когда данные сгруппированы, и каждое значение встречается разное число раз (вес).
1. Среднюю можно считать только для однородной совокупности (бессмысленно считать среднюю температуру по больнице). 2. Если все значения (X) умножить/разделить на А, средняя (Xср) тоже умножится/разделится на А. 3. Если к X прибавить/вычесть А, Xср тоже изменится на А. 4. Сумма отклонений от средней = 0. 5. Метод «моментов» основан на этих свойствах для упрощения расчета. Закон больших чисел — основа, т.к. только в массе средняя показывает типичный уровень.
Это повторение 52-го. Основные виды степенных средних: Средняя арифметическая (для суммируемых величин), средняя гармоническая (обратна арифметической, для средних скоростей, цен), средняя геометрическая (для средних темпов роста), средняя квадратическая (для расчета среднего отклонения).
Это повторение 54-го. Использование: для обобщения массовых соц-эконом. явлений. Свойства: 1. Средняя постоянной величины = самой постоянной. 2. Сумма отклонений от средней = 0. 3. Уменьшение всех вариантов на число А уменьшит среднюю на А (основа метода "моментов"). 4. Средняя должна считаться для однородной совокупности. Закон больших чисел обеспечивает устойчивость средней.
Метод "Моментов" упрощает расчет средней для интервальных рядов с равными интервалами. Он основан на математических свойствах средней. 1. Выбираем "условный ноль" (А) — середину интервала с макс. частотой. 2. Находим отклонения (m) от А в единицах интервала (h): m = (Xi - A) / h. 3. Считаем "момент 1-го порядка" (M1) = (сумма m*f) / (сумма f). 4. Находим среднюю: Xср = M1 * h + A.
Применяется, когда нам неизвестны веса (f), но известно их произведение (X*f). Простая гармоническая: Xгарм = n / (сумма 1/X). Взвешенная гармоническая: Xгарм = (сумма W) / (сумма W/X), где W = X*f (общий объем). Пример: расчет средней скорости, если мы знаем время (W/X) и расстояние (W) на каждом участке.
Это повторение 53-го. Сущность: обобщающий показатель для анализа массовых соц-эконом. явлений. Виды: Простая средняя арифметическая (для несгруппированных данных, (сумма X) / n) и Взвешенная средняя арифметическая (для сгруппированных данных, (сумма X*f) / (сумма f)).
Это нестепенные средние, они характеризуют структуру ряда. Мода (Mo) — это значение, которое встречается чаще всего. Медиана (Me) — это значение, которое находится в середине упорядоченного ряда (делит ряд пополам: 50% меньше, 50% больше). Сходство: обе — характеристики центра. Различия: на медиану не влияют крайние (очень большие или малые) значения, а мода может быть не одна.
Вариация — это разброс данных. 1. Вариационный размах (R) = Xmax - Xmin (самый простой). 2. Дисперсия (σ²) — это средний квадрат отклонений от средней. 3. Среднее квадратическое отклонение (σ) — корень из дисперсии (показывает, на сколько в среднем значения отклоняются от средней). 4. Коэффициент вариации (V) = (σ / Xср) * 100% (относительный разброс, для сравнения).
1. Для каждого интервала (ряда) определяем его середину: Xi = (Нижняя граница + Верхняя граница) / 2. 2. Используем формулу взвешенной средней арифметической: Xср = (сумма Xi * fi) / (сумма fi), где fi — частота (число единиц в ряду). 3. Для открытых интервалов (напр., "до 20") длина интервала берется как у соседнего.
Сущность: средний квадрат отклонений от средней. Математические свойства: 1. Дисперсия постоянной = 0. 2. Если X умножить на А, дисперсия (σ²) умножится на А². 3. Если к X прибавить А, σ² не изменится. Виды: общая, внутригрупповые (внутри групп) и межгрупповая (между группами). Правило сложения дисперсий: Общая = (средняя из внутригрупповых) + (межгрупповая).
Вариация — это изменчивость, разброс значений. Средняя величина показывает только центр, но не показывает, насколько данные кучные. Изучать вариацию нужно, чтобы оценить однородность совокупности и надежность средней. Показатели: Абсолютное линейное отклонение (средний модуль отклонений) и среднее квадратическое отклонение (корень из дисперсии, самый частый).
Это повтор 61/64. Средняя величина не дает полного представления, важна изменчивость. Изучение вариации позволяет судить об однородности совокупности. Если разброс (вариация) большой, средняя — нетипична. Показатели: Вариационный размах (R), Дисперсия (σ²), Среднее квадр. отклонение (σ) и Коэффициент вариации (V).
Мода (Mo) и Медиана (Me) — это структурные средние. Экономическая сущность: Mo — самый частый (популярный) вариант, Me — значение, делящее совокупность пополам. Расчет в интервальном ряду: Mo = Xo + h * (f_mo - f_mo-1) / ((f_mo - f_mo-1) + (f_mo - f_mo+1)). Me = Xo + h * ( (сумма f)/2 - S_me-1 ) / f_me. Сходство: показатели центра. Различия: Me нечувствительна к "выбросам".
Используется, когда совокупность разделена на группы (группировка). Общая дисперсия (разброс всех данных) = внутригрупповая дисперсия (средняя из дисперсий внутри групп) + межгрупповая дисперсия (разброс групповых средних вокруг общей средней). Это правило сложения дисперсий. Оно показывает, какая часть общего разброса (общей дисперсии) вызвана разницей МЕЖДУ группами, а какая — разбросом ВНУТРИ групп.
Виды дисперсий: 1. Общая (вся совокупность). 2. Дисперсии внутри групп (показывают разброс в каждой группе). 3. Средняя из внутригрупповых. 4. Дисперсия между группами (межгрупповая, показывает разброс средних). Правило сложения дисперсий связывает их: Общая = Средняя_внутригрупповых + Межгрупповая.
Метод "Моментов" использует математические свойства среднего и дисперсии (сдвиг на А не меняет дисперсию, деление на h меняет ее в h² раз). Применение на практике (для равных интервалов): 1. Находим "момент 2-го порядка" M2 = (сумма m² * f) / (сумма f). 2. Находим M1 (как для средней). 3. Дисперсия σ² = (M2 - (M1)²) * h². 4. Среднее квадратичное отклонение (σ) = корень из σ².
Суть: изучаем не всю генеральную совокупность, а только ее часть (выборку), но выводы делаем обо всей. Причины: 1. Экономия времени и средств (дешевле и быстрее). 2. Более глубокое изучение совокупности (можно задать больше вопросов). 3. Невозможность сплошного (напр., контроль качества, уменьшение количества единиц с возможным ухудшением качества — т.е. разрушение при проверке).
Выборка применяется почти везде. Социальные сферы: опросы общественного мнения, обследования домохозяйств (бюджеты, рабочая сила). Промышленность: контроль качества продукции. Сельское хозяйство: определение урожайности. Таможня: выборочный контроль грузов. Торговля: обследование цен.
Чтобы обеспечить репрезентативность (представительность), нужно рассчитать количество (объем) выборочной совокупности (n). Формула n зависит от: 1. Допустимой ошибки выборки (Δ, чем меньше хотим ошибку, тем больше n). 2. Коэффициента доверия (t). 3. Дисперсии (σ² для количественных признаков) или (p*q для альтернативных признаков).
Репрезентативная ошибка — это разница между показателями выборочной совокупности и генеральной совокупности. Средняя ошибка (m) — это корень из дисперсии, деленной на n (m = σ / √n). Она показывает, насколько в среднем выборка отклоняется от генеральной. Предельная ошибка (Δ) = m * t, где t — коэффициент доверия (зависит от вероятности).
Ошибки бывают регистрации (случайные, постоянные) и репрезентативные (только в выборке). Репрезентативная ошибка (ошибка представительности) — это главная, ее можно рассчитать. Она бывает средняя (m) и предельная (Δ). Формула средней ошибки (m) зависит от дисперсии, объема выборки и способа отбора (повторный или бесповторный).
Это повтор 70-го. Суть: по части (выборке) судим о целом (генеральной совокупности). Преимущества (причины): 1. Экономия времени и средств (дешевле и быстрее). 2. Более глубокое изучение совокупности (т.к. опрашиваем меньше людей, но подробнее). 3. Невозможность сплошной проверки (разрушающий контроль).
Случайный отбор (жребий, лотерея). Механический отбор (каждый k-й, напр., каждый 10-й). Типичный отбор (стратифицированный) (сначала делим на группы, потом случайно отбираем из каждой). Серийный (последовательный) отбор (отбираем не единицы, а "гнезда", серии, и в них изучаем всех). Комбинированный отбор (сочетание методов).
Временной ряд — это данные за периоды времени. По типу показателей: абсолютные (тонны), относительные (%), ряды из среднего значения (средняя з/п). По характеру времени: Периодические (интервальные) ряды (показатель за период, напр., ВВП за год; можно суммировать). Моментные ряды (показатель на дату, напр., численность на 1 января; нельзя суммировать).
Абсолютный прирост (Y(i) - Y(i-1)). Темп роста (Y(i) / Y(i-1)). Темп прироста (Темп роста - 100%). Абсолютное значение 1% прироста. Средние уровни (средняя за период). Коэффициент ускорения (сравнение цепных абсолютных приростов). Бывают цепные (к прошлому) и базисные (к 1-му периоду).
Для интервальных (периодических) рядов с равными периодами — среднее арифметическое (простое). Для моментных рядов с равными промежутками — среднее хронологическое ((Y1/2 + Y2 + ... + Yn/2) / (n-1)). Для расчета среднего темпа роста — среднее геометрическое (корень n-1 степени из произведения цепных темпов роста).
Тенденция — это основное направление развития. Перед анализом ряды надо привести к сопоставимому виду (одинаковые периоды, цены). Методы выявления: Сглаживание рядов (укрупнение интервалов, метод скольжения — скользящая средняя). Аналитическое выравнивание (подбор математической функции, тренда, напр., y=a+bt, методом наименьших квадратов).
Суть: ряд временных показателей (уровней). Классификация: периодические (за период) и моментные (на дату). Правила построения: 1. Приведение рядов к сопоставимому виду (по территории, ценам, методике). 2. Равные интервалы. Интерполяция — нахождение значения внутри ряда. Экстраполяция — прогноз, продление тенденции в будущее.
Для периодических (интервальных) — средняя арифметическая простая. Для моментальных (моментных) с равными интервалами — средняя хронологическая. Для моментальных с НЕравными интервалами — средняя арифметическая взвешенная (веса — длительность). Средний темп изменений (роста) — средняя геометрическая. Средний темп прироста = (Средний темп роста - 1).
Это методы сглаживания. Укрупнение временных рядов (вместо месяцев берем кварталы или годы). Скользящий средний уровень (метод скольжения) — для каждого уровня ряда рассчитывается средняя из него и k-соседних. Бывает нецентрированное (простое скольжение) и центрированное (важно для четного числа членов).
Индекс — это относительная величина, которая показывает, во сколько раз изменился сложный экономический показатель (состоящий из несоизмеримых элементов, напр., цены на разные товары). Значимость — сравнение во времени, пространстве. Классификация по признакам: по базе (цепные/базисные), по охвату (индивидуальные/общие), по составу (агрегатные/средние).
Индивидуальный индекс (i) — характеризует 1 элемент. Индекс физического объема (iq) = q1 / q0 (штуки). Индекс цены (ip) = p1 / p0 (сумы). Индекс себестоимости (iz) = z1 / z0. Индекс производительности труда (it) = t1 / t0.
Общий индекс (I) — характеризует всю совокупность. Строятся в агрегатной форме (суммирование). Индекс стоимости (товарооборота) I(pq) = (сумма p1*q1) / (сумма p0*q0). Индекс физического объема I(q) = (сумма p0*q1) / (сумма p0*q0) (веса — цены баз. периода). Индекс цен I(p) = (сумма p1*q1) / (сумма p0*q1) (веса — объемы отч. периода). Аналогично для себестоимости и производительности труда.
По охвату: индивидуальные (1 товар) и общие (группа). По форме: агрегатные (I) и средние (из индивидуальных). Для анализа средних величин: Индекс переменной структуры (показывает общее изменение средней). Индекс постоянной структуры (показывает изменение средней только за счет изменения самого признака). Индекс структурных сдвигов (показывает изменение средней только за счет изменения структуры).
Это формы общих индексов, если нет полных данных. Средний арифметический индекс (напр., индекс общего физического объема) = (сумма iq * p0*q0) / (сумма p0*q0). Средний гармонический индекс (напр., индекс общей цены) = (сумма p1*q1) / (сумма (p1*q1) / ip). Они математически равны агрегатным. Индекс структуры тоже можно рассчитать как средний.
Используется для анализа динамики СРЕДНЕГО показателя (напр., средней цены). Индекс переменной структуры (отношение двух фактических средних) = Индекс постоянной структуры (показывает, как изменилась средняя только за счет цен) * Индекс структурных сдвигов (показывает, как изменилась средняя только за счет структуры продаж).
Это повтор 88-го. Это способ расчета общего индекса, если нет данных для агрегатного. Средний арифметический индекс (напр., Iq) = (сумма iq * W) / (сумма W), где W — веса базисного периода. Средний гармонический индекс (напр., Ip) = (сумма W) / (сумма W / ip), где W — веса отчетного периода.
Это индексы динамики. Цепные индексы — база сравнения постоянно меняется (каждый год к прошлому). Базовые индексы — база сравнения постоянна (все годы к одному, напр., к 2010). Связь: произведение цепных индексов = базовому индексу последнего периода. Это верно и для индивидуальных, и для общих индексов (если веса постоянны).
Взаимосвязь: Индекс = Показатель / Показатель. Если Показатель = А * В, то Индекс(Показателя) = Индекс(А) * Индекс(В). Пример: Индекс общего товарооборота (I_pq) = Индекс общего физического объема (I_q) * Индекс цен (I_p). Индекс производственных затрат (I_zq) = Индекс себестоимости (I_z) * Индекс физ. объема (I_q).
Это индексы для сравнения показателей по разным территориям (в пространстве), напр., сравнение цен в Ташкенте и Самарканде. Сложность — разные количества (структура) в регионах. Чтобы сравнить цены, нужно взять одинаковое (стандартное) количество товаров, либо использовать "идеальный" индекс Фишера.
Это агрегированные индексы. Индекс Ласпейреса (I_L) — веса базисного периода (напр., индекс цен I(p) = (сумма p1*q0) / (сумма p0*q0)). Индекс Пааше (I_P) — веса отчетного периода (напр., I(p) = (сумма p1*q1) / (сумма p0*q1)). Индекс Фишера ("идеальный") — корень квадратный из I_L * I_P. Преимущества/недостатки: Ласпейрес удобнее (веса не меняются), Пааше точнее отражает текущую структуру.
Индекс-дефлятор — это индекс цен, используемый для пересчета номинального ВВП (в текущих ценах) в реальный ВВП (в сопоставимых ценах). Порядок расчета: Дефлятор ВВП (это индекс Пааше) = (Номинальный ВВП) / (Реальный ВВП). Отсюда, Реальный ВВП = Номинальный ВВП / Индекс-дефлятор.
Изучение причинно-следственных связей — главная задача анализа. Связи бывают: Функциональная связь (жесткая, одному Х соответствует один Y, y=f(x)). Корреляционная связь (нежесткая, одному Х соответствует несколько Y, но в среднем Y меняется при изменении Х, напр., стаж и зарплата). Метод баланса — это тоже метод изучения связей (напр., Баланс доходов и расходов).
По числу факторов: парная корреляция (y и x) и многомерная (y и несколько x). По направлению: прямая связь (Х растет, Y растет) и обратная связь (Х растет, Y падает). По форме: прямая линейная связь (описывается прямой, y=a+bx) и криволинейная связь (парабола, гиперобола).
1. Постановка задачи и предварительный анализ (какие факторы). 2. Сбор и изучение данных (нужна однородность). 3. Определение формы связи (напр., по полю корреляции — линейная или нет). 4. Определение уравнения регрессии (расчет параметров 'a' и 'b' методом наименьших квадратов). 5. Оценка уравнения регрессии (проверка его значимости, F-критерий) и тесноты связи (коэф. корреляции).
Плотность (теснота) связи: Коэффициент корреляции (r, для линейной связи, от -1 до +1). Коэффициент детерминации (R², = r², показывает, какой % вариации Y объяснен фактором X). Корреляционное соотношение (η, для криволинейной). Для качественных/ранговых: Коэффициент Спирмена (ранговый), Коэффициент Кендалла, Коэффициент Фехнера, коэффициент ассоциации.
Это метод изучения связи. Корреляционный анализ — измеряет тесноту связи (коэф. r). Регрессионный анализ — определяет форму связи (уравнение y=f(x)). Бывает парная корреляция/регрессия (1 фактор) и многомерная (2+ фактора). Связь может быть прямая (r > 0) или обратная (r < 0), прямая линейная (прямая) или криволинейная (парабола и т.д.).
Суть гипотезы — это предположение. Нулевая гипотеза (H₀) — это гипотеза "статус-кво", об отсутствии разницы или связи (напр., "средние равны", "связи нет"). Альтернативная гипотеза (H₁) — это то, что мы хотим доказать (напр., "средние не равны", "связь есть"). Исследовательская гипотеза — это, по сути, и есть H₁, то предположение, ради которого мы проводим тест.
Решение принимается так: 1. Задаем уровень значимости (α) (напр., 5%). 2. По (α) и числу степеней свободы находим критическое значение (из таблицы). 3. Это значение отделяет критическую область (область отклонения H₀). 4. Считаем фактическое значение (статистика проверки гипотезы, напр., t-факт). 5. Если t-факт > t-крит (попал в крит. область), то H₀ отклоняем в пользу H₁.
Ошибка I типа (α) — это отклонить нулевую гипотезу (H₀), когда она на самом деле верна (найти разницу, которой нет). Ошибка II типа (β) — это принять нулевую гипотезу (H₀), когда верна альтернативная (H₁) (не найти разницу, которая есть). Мощность теста (1–β) — это способность теста найти разницу, если она есть. Мы контролируем α (уровень значимости).
Сходства: z-распределение (стандартное нормальное) и t-распределение Стьюдента оба симметричные, колоколообразные, с центром в 0. Отличия: z-распределение используется, когда известно генеральное стандартное отклонение (σ) или объём выборки (n) очень большой (n > 30-50). t-распределение используется, когда σ неизвестно (используем s) и n мало; оно "шире" z, его форма зависит от степеней свободы (df = n-1).