Для установления зависимости между урожайностью и сортом винограда
Обновлено: 18.09.2024
Метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений. По своей роли в процессе исследования метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношение различных факторов и определить силу их влияния на результативные показатели.
Содержание
2. Показатели симметрии, асимметрии и эксцесса……………………. 8
Задачи…………. 12
Список использованной литературы….………..…………
Работа состоит из 1 файл
Кр по статистике вар5.doc
Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):
Применение этого показателя дает возможность не только определить степень асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений и рассчитывается по формуле:
Если отношение , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:
где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту и другую сторону от средней арифметической.
Наиболее точным является показатель, основанный на использовании центрального момента четвертого порядка:
Эксцесс представляет сбой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение
В целях изучения проблем молодых семей в городе намечено провести выборочное наблюдение. Определить перечень вопросов, которые, по Вашему мнению, можно было бы включить в анкету обследования.
В анкету обследования могут быть включены следующие вопросы:
1. Возраст семьи (длительность совместного проживания).
2. Количество детей в семье.
3. Уровень дохода на одного члена семьи.
4. Жилищно-бытовые условия (наличие собственной квартиры).
5. Особенности распределения домашних обязанностей.
6. Уровень образования супругов.
7. Сфера деятельности супругов.
Кожевенно-обувное предприятие в целях оптимизации плана выпуска женской обуви провело обследование 50 женщин, отобранных случайным образом. В результате получены следующие данные о размере обуви обследованных женщин:
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Эмпирическое корреляционное среднее варьирует от 0 до 1.
- когда по двум рядам данным X и Y необходимо произвести аналитическую группировку
- группировка уже произведена, необходимо проверить правило сложения дисперсий
- по двум рядам данным X и Y необходимо найти уравнение нелинейной регрессии и оценить его значимость.
В данном примере:
х – оборачиваемость в днях (фактор);
у – прибыль (результат).
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Сопоставим изменения средних значений результата с изменениями фактора. Чтобы эти изменения были сравнимыми, надо делать группировку с равными интервалами или рассчитывать изменения результата на единицу изменения фактора.
В примере средняя прибыль изменяется от группы к группе, следовательно, связь между оборачиваемостью и прибылью есть. Причем обратная: чем медленнее оборачиваются средства, тем меньше прибыль.
Рассчитаем, на сколько снижается прибыль при замедлении оборачиваемости:
1) млн. руб./день;
2) млн. руб./день.
Полученные значения показывают величину снижения прибыли при замедлении оборачиваемости на 1 день. Здесь: b xy ≠const следовательно, связь нелинейная.
bxy – показатели силы связи.
По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основан на правиле разложения дисперсии: общая дисперсия S y равна сумме внутригрупповой и межгрупповой дисперсий.
Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной
yij – значение признака для i-ой единицы в j -ой группе;
y j – среднее значение признака в j-ой группе;
nj – число единиц в j-ой группе;
m – число групп.
Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:
Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:
– коэффициент детерминации;
– эмпирическое корреляционное отношение.
Рассмотрим пример.
7. Определим коэффициент детерминации – η²:
или 26%.
Таким образом, только на 26% вариация урожайности обусловлена различиями между сортами, а на 74% – другими факторами (характером почвы, удобренностью участков, поливом и т.п.).
8. Определяем эмпирическое корреляционное отношение:
.
Следовательно, можно утверждать, что связь умеренная.
Случай №1.
Используя вторичные источники данных, проведем выборочное наблюдение 30 предлагаемых на продажу автомобилей Kia Sorento за последние три месяца.
Исследуемые признаки: Y – цена автомобиля, тыс. руб.; Х1 – время эксплуатации, лет;
Решение:
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Тогда ширина интервала составит:
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
470 | 470 - 563 | 1 |
470 | 470 - 563 | 2 |
470 | 470 - 563 | 3 |
480 | 470 - 563 | 4 |
480 | 470 - 563 | 5 |
485 | 470 - 563 | 6 |
485 | 470 - 563 | 7 |
500 | 470 - 563 | 8 |
525 | 470 - 563 | 9 |
530 | 470 - 563 | 10 |
530 | 470 - 563 | 11 |
550 | 470 - 563 | 12 |
560 | 470 - 563 | 13 |
590 | 563 - 656 | 1 |
599 | 563 - 656 | 2 |
600 | 563 - 656 | 3 |
600 | 563 - 656 | 4 |
600 | 563 - 656 | 5 |
640 | 563 - 656 | 6 |
640 | 563 - 656 | 7 |
640 | 563 - 656 | 8 |
655 | 563 - 656 | 9 |
680 | 656 - 749 | 1 |
695 | 656 - 749 | 2 |
700 | 656 - 749 | 3 |
700 | 656 - 749 | 4 |
705 | 656 - 749 | 5 |
710 | 656 - 749 | 6 |
729 | 656 - 749 | 7 |
749 | 656 - 749 | 8 |
Аналитическая группировка.
Группы | № | Кол-во, f | ∑X | X = ∑X / f | ∑Y | Y = ∑Y / f |
470 - 563 | 1,2,3,4,5,6,7,8,9,10,11,12,13 | 13 | 6535 | 502.69 | 121 | 9.31 |
563 - 656 | 14,15,16,17,18,19,20,21,22 | 9 | 5564 | 618.22 | 67 | 7.44 |
656 - 749 | 23,24,25,26,27,28,29,30 | 8 | 5668 | 708.5 | 43 | 5.38 |
Итого | 30 | 17767 | 231 |
1. Находим средние значения каждой группы.
Общее средние значение для всей совокупности:
2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:
Расчет для группы: 470 - 563(1,2,3,4,5,6,7,8,9,10,11,12,13)
yj | (yj- yср) 2 | Результат |
11 | (11 - 9.31) 2 | 2.86 |
11 | (11 - 9.31) 2 | 2.86 |
11 | (11 - 9.31) 2 | 2.86 |
10 | (10 - 9.31) 2 | 0.48 |
11 | (11 - 9.31) 2 | 2.86 |
9 | (9 - 9.31) 2 | 0.0947 |
6 | (6 - 9.31) 2 | 10.94 |
9 | (9 - 9.31) 2 | 0.0947 |
11 | (11 - 9.31) 2 | 2.86 |
6 | (6 - 9.31) 2 | 10.94 |
8 | (8 - 9.31) 2 | 1.71 |
8 | (8 - 9.31) 2 | 1.71 |
10 | (10 - 9.31) 2 | 0.48 |
Итого | 40.77 |
Расчет для группы: 563 - 656(14,15,16,17,18,19,20,21,22)
yj | (yj- yср) 2 | Результат |
9 | (9 - 7.44) 2 | 2.42 |
7 | (7 - 7.44) 2 | 0.2 |
7 | (7 - 7.44) 2 | 0.2 |
8 | (8 - 7.44) 2 | 0.31 |
9 | (9 - 7.44) 2 | 2.42 |
6 | (6 - 7.44) 2 | 2.09 |
5 | (5 - 7.44) 2 | 5.98 |
8 | (8 - 7.44) 2 | 0.31 |
8 | (8 - 7.44) 2 | 0.31 |
Итого | 14.22 |
Расчет для группы: 656 - 749(23,24,25,26,27,28,29,30)
yj | (yj- yср) 2 | Результат |
6 | (6 - 5.38) 2 | 0.39 |
5 | (5 - 5.38) 2 | 0.14 |
6 | (6 - 5.38) 2 | 0.39 |
5 | (5 - 5.38) 2 | 0.14 |
5 | (5 - 5.38) 2 | 0.14 |
6 | (6 - 5.38) 2 | 0.39 |
5 | (5 - 5.38) 2 | 0.14 |
5 | (5 - 5.38) 2 | 0.14 |
Итого | 1.88 |
3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:
Средняя из частных дисперсий:
4. Межгрупповая дисперсияотносится на счет изучаемого фактора, она называется факторной
Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:
σ²= σ²i +δ²
σ 2 = 1.9 + 2.58 = 4.48
Проверим этот вывод путем расчета общей дисперсии обычным способом:
yi | (yi- yср) 2 | Результат |
11 | (11 - 7.7) 2 | 10.89 |
11 | (11 - 7.7) 2 | 10.89 |
11 | (11 - 7.7) 2 | 10.89 |
10 | (10 - 7.7) 2 | 5.29 |
11 | (11 - 7.7) 2 | 10.89 |
9 | (9 - 7.7) 2 | 1.69 |
6 | (6 - 7.7) 2 | 2.89 |
9 | (9 - 7.7) 2 | 1.69 |
11 | (11 - 7.7) 2 | 10.89 |
6 | (6 - 7.7) 2 | 2.89 |
8 | (8 - 7.7) 2 | 0.09 |
8 | (8 - 7.7) 2 | 0.09 |
10 | (10 - 7.7) 2 | 5.29 |
9 | (9 - 7.7) 2 | 1.69 |
7 | (7 - 7.7) 2 | 0.49 |
7 | (7 - 7.7) 2 | 0.49 |
8 | (8 - 7.7) 2 | 0.09 |
9 | (9 - 7.7) 2 | 1.69 |
6 | (6 - 7.7) 2 | 2.89 |
5 | (5 - 7.7) 2 | 7.29 |
8 | (8 - 7.7) 2 | 0.09 |
8 | (8 - 7.7) 2 | 0.09 |
6 | (6 - 7.7) 2 | 2.89 |
5 | (5 - 7.7) 2 | 7.29 |
6 | (6 - 7.7) 2 | 2.89 |
5 | (5 - 7.7) 2 | 7.29 |
5 | (5 - 7.7) 2 | 7.29 |
6 | (6 - 7.7) 2 | 2.89 |
5 | (5 - 7.7) 2 | 7.29 |
5 | (5 - 7.7) 2 | 7.29 |
Итого | 134.3 |
Определяем эмпирическое корреляционное отношение:
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x 2 = ∑y•x
Для наших данных система уравнений имеет вид
30a + 231 b = 17767
231 a + 1913 b = 132293
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = -33.6031, a = 850.9774
Уравнение регрессии (эмпирическое уравнение регрессии):
y = -33.6031 x + 850.9774
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x | y | x 2 | y 2 | x·y |
11 | 470 | 121 | 220900 | 5170 |
11 | 470 | 121 | 220900 | 5170 |
11 | 470 | 121 | 220900 | 5170 |
10 | 480 | 100 | 230400 | 4800 |
11 | 480 | 121 | 230400 | 5280 |
9 | 485 | 81 | 235225 | 4365 |
6 | 485 | 36 | 235225 | 2910 |
9 | 500 | 81 | 250000 | 4500 |
11 | 525 | 121 | 275625 | 5775 |
6 | 530 | 36 | 280900 | 3180 |
8 | 530 | 64 | 280900 | 4240 |
8 | 550 | 64 | 302500 | 4400 |
10 | 560 | 100 | 313600 | 5600 |
9 | 590 | 81 | 348100 | 5310 |
7 | 599 | 49 | 358801 | 4193 |
7 | 600 | 49 | 360000 | 4200 |
8 | 600 | 64 | 360000 | 4800 |
9 | 600 | 81 | 360000 | 5400 |
6 | 640 | 36 | 409600 | 3840 |
5 | 640 | 25 | 409600 | 3200 |
8 | 640 | 64 | 409600 | 5120 |
8 | 655 | 64 | 429025 | 5240 |
6 | 680 | 36 | 462400 | 4080 |
5 | 695 | 25 | 483025 | 3475 |
6 | 700 | 36 | 490000 | 4200 |
5 | 700 | 25 | 490000 | 3500 |
5 | 705 | 25 | 497025 | 3525 |
6 | 710 | 36 | 504100 | 4260 |
5 | 729 | 25 | 531441 | 3645 |
5 | 749 | 25 | 561001 | 3745 |
231 | 17767 | 1913 | 10761193 | 132293 |
1. Параметры уравнения регрессии.
Выборочные средние.
1.1. Коэффициент корреляции
Ковариация.
cov(x,y)= x·y - x · y = 4409.77-7.7·592.23 = -150.43
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Готовое решение: Заказ №9684
Тип работы: Задача
Статус: Выполнен (Зачтена преподавателем ВУЗа)
Предмет: Экономика
Дата выполнения: 23.10.2020
Цена: 219 руб.
Чтобы получить решение , напишите мне в WhatsApp , оплатите, и я Вам вышлю файлы.
Кстати, если эта работа не по вашей теме или не по вашим данным , не расстраивайтесь, напишите мне в WhatsApp и закажите у меня новую работу , я смогу выполнить её в срок 1-3 дня!
Описание и исходные данные задания, 50% решения + фотография:
Задача 24
Для установления зависимости между урожайностью и сортом винограда в одном из хозяйств на основе выборки определили урожай на 8 кустах винограда.
Средние затраты на 1 руб. произведенной продукции в целом по ЗАО. Структуры численности рабочих. Зависимость между урожайностью и сортом винограда в одном из хозяйств. Общий индекс затрат на производство. Уровень ряда динамики для интервального ряда.
Рубрика | Экономика и экономическая теория |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 26.07.2010 |
Размер файла | 128,3 K |
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Задача 1. По данным о производственной деятельности ЗАО определить средние затраты на 1 руб. произведенной продукции в целом по ЗАО.
Таблица 1 - Исходные данные
Общие затраты на производство, млн. руб.
Затраты на 1 руб. произведенной
Решение:
Для определения средних затрат на 1 рубль произведенной продукции необходимо воспользоваться средней гармонической, так как у нас известен числитель и неизвестен знаменатель. Для определения средней строим вспомогательную таблицу.
Таблица 2 - Вспомогательная
Общие затраты на производство, млн. руб., (Wi)
Затраты на 1 руб.
продукции, руб. (Xi)
продукции, млн руб.
Так средние затраты на 1 рубль продукции рассчитываются по формуле
где х - признак (варианта) - индивидуальные значения усредняемого признака; показатель, представляющий собой реально существующий экономический показатель равный х• f:
Данные берутся из таблицы.
Ответ: Средние затраты на 1 рубль произведенной продукции равны 72 коп.
Задача 2. По данным 10% -го выборочного обследования рабочих по стажу работы, результаты которого приведены ниже, определить:
1) относительную величину структуры численности рабочих;
2) моду и медиану стажа рабочих;
3) средний стаж рабочих цеха;
4) размах вариации;
5) среднее линейное отклонение;
7) среднее квадратическое отклонение;
8) коэффициент вариации;
9) с вероятностью 0,997 пределы, в которых изменяется средний стаж рабочих в целом по предприятию;
10) с вероятностью 0,997 пределы, в которых изменяется доля рабочих, имеющих стаж работы более 10 лет в целом по предприятию. Сделать выводы.
Таблица 3 - Исходные данные
Группы рабочих по стажу, лет
1) Находим относительную величину структуры численности рабочих, для этого строим следующую таблицу.
Таблица 4 - Относительная структура численности рабочих
Группы рабочих по стажу, лет
2) Находим моду и медиану стажа рабочих. Для этого строим вспомогательную таблицу.
Таблица 5 - Вспомогательная.
Группы рабочих по стажу, лет
Число рабочих (fi)
Середина интервала, (xi)
Мода - это наиболее часто встречающееся значение ряда:
где - мода; - нижняя граница модального интервала. Интервал с максимальной частотой является модальным; - шаг модального интервала, который определяется разницей его границ; fmo - частота модального интервала; fmo-1 - частота интервала, предшествующего модальному; fmo+1 - частота интервала, последующего за модальным.
Медианой является значение признака х, которое больше или равно и одновременно меньше или равно половине остальных элементов ряда распределения. Медиана делит ряд на две равные части:
где xme - нижняя граница медианного интервала. Интервал, в котором находится порядковый номер медианы, является медианным. Для его определения необходимо подсчитать величину . Интервал с накопленной частотой равной величинеявляется медианным; i - шаг медианного интервала, который определяется разницей его границ; - сумма частот вариационного ряда; Sme-1- сумма накопленных частот в домедианном интервале; fme - частота медианного интервала.
3) Находим средний стаж рабочих цеха:
где х - признак (варианта) - индивидуальные значения усредняемого признака, в качестве которого берется середина интервала, определяемая как полусумма его границ;
f - частота, т.е. числа, показывающие, сколько раз повторяется та или иная варианта.
Сравниваем полученные значения, в нашем случае получаем:
что говорит о левосторонней асимметрии.
По этим данным можно сделать вывод о том, что средний стаж рабочих составляет 7,05 лет; наиболее часто встречаются рабочие со стажем 7,263 года. Кроме того, половина рабочих имеет стаж более 7,166 лет, а другая - менее 7,166 лет.
4) Находим размах вариации.
где хmax - максимальное значение признака; х min - минимальное значение признака.
Так, разница между максимальным значением признака и минимальным составляет 12.
5) Находим среднее линейное отклонение:
где - индивидуальные значения признака, - средняя величина; f - частота.
Читайте также: