Для установления зависимости между урожайностью и сортом винограда

Обновлено: 18.09.2024

Метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений. По своей роли в процессе исследования метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношение различных факторов и определить силу их влияния на результативные показатели.

Содержание

2. Показатели симметрии, асимметрии и эксцесса……………………. 8

Задачи…………. 12
Список использованной литературы….………..…………

Работа состоит из 1 файл

Кр по статистике вар5.doc

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

Применение этого показателя дает возможность не только определить степень асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений и рассчитывается по формуле:

Если отношение , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту и другую сторону от средней арифметической.

Наиболее точным является показатель, основанный на использовании центрального момента четвертого порядка:

Эксцесс представляет сбой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение

В целях изучения проблем молодых семей в городе намечено провести выборочное наблюдение. Определить перечень вопросов, которые, по Вашему мнению, можно было бы включить в анкету обследования.

В анкету обследования могут быть включены следующие вопросы:

1. Возраст семьи (длительность совместного проживания).

2. Количество детей в семье.

3. Уровень дохода на одного члена семьи.

4. Жилищно-бытовые условия (наличие собственной квартиры).

5. Особенности распределения домашних обязанностей.

6. Уровень образования супругов.

7. Сфера деятельности супругов.

Кожевенно-обувное предприятие в целях оптимизации плана выпуска женской обуви провело обследование 50 женщин, отобранных случайным образом. В результате получены следующие данные о размере обуви обследованных женщин:

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Эмпирическое корреляционное среднее варьирует от 0 до 1.

когда по двум рядам данным X и Y необходимо произвести аналитическую группировку
группировка уже произведена, необходимо проверить правило сложения дисперсий
по двум рядам данным X и Y необходимо найти уравнение нелинейной регрессии и оценить его значимость.

В данном примере:
х – оборачиваемость в днях (фактор);
у – прибыль (результат).
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Сопоставим изменения средних значений результата с изменениями фактора. Чтобы эти изменения были сравнимыми, надо делать группировку с равными интервалами или рассчитывать изменения результата на единицу изменения фактора.
В примере средняя прибыль изменяется от группы к группе, следовательно, связь между оборачиваемостью и прибылью есть. Причем обратная: чем медленнее оборачиваются средства, тем меньше прибыль.
Рассчитаем, на сколько снижается прибыль при замедлении оборачиваемости:
1) млн. руб./день;
2) млн. руб./день.
Полученные значения показывают величину снижения прибыли при замедлении оборачиваемости на 1 день. Здесь: b xy ≠const следовательно, связь нелинейная.
b_xy – показатели силы связи.
По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основан на правиле разложения дисперсии: общая дисперсия S _y равна сумме внутригрупповой и межгрупповой дисперсий.
Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной

y_ij – значение признака для i-ой единицы в j -ой группе;
y _j – среднее значение признака в j-ой группе;
n_j – число единиц в j-ой группе;
m – число групп.
Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:

Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:
– коэффициент детерминации;
– эмпирическое корреляционное отношение.
Рассмотрим пример.

7. Определим коэффициент детерминации – η²:
или 26%.
Таким образом, только на 26% вариация урожайности обусловлена различиями между сортами, а на 74% – другими факторами (характером почвы, удобренностью участков, поливом и т.п.).
8. Определяем эмпирическое корреляционное отношение:
.
Следовательно, можно утверждать, что связь умеренная.

Случай №1.
Используя вторичные источники данных, проведем выборочное наблюдение 30 предлагаемых на продажу автомобилей Kia Sorento за последние три месяца.
Исследуемые признаки: Y – цена автомобиля, тыс. руб.; Х1 – время эксплуатации, лет;
Решение:
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Тогда ширина интервала составит:

Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

470	470 - 563	1
470	470 - 563	2
470	470 - 563	3
480	470 - 563	4
480	470 - 563	5
485	470 - 563	6
485	470 - 563	7
500	470 - 563	8
525	470 - 563	9
530	470 - 563	10
530	470 - 563	11
550	470 - 563	12
560	470 - 563	13
590	563 - 656	1
599	563 - 656	2
600	563 - 656	3
600	563 - 656	4
600	563 - 656	5
640	563 - 656	6
640	563 - 656	7
640	563 - 656	8
655	563 - 656	9
680	656 - 749	1
695	656 - 749	2
700	656 - 749	3
700	656 - 749	4
705	656 - 749	5
710	656 - 749	6
729	656 - 749	7
749	656 - 749	8

Аналитическая группировка.

Группы	№	Кол-во, f	∑X	X = ∑X / f	∑Y	Y = ∑Y / f
470 - 563	1,2,3,4,5,6,7,8,9,10,11,12,13	13	6535	502.69	121	9.31
563 - 656	14,15,16,17,18,19,20,21,22	9	5564	618.22	67	7.44
656 - 749	23,24,25,26,27,28,29,30	8	5668	708.5	43	5.38
Итого	30	17767	231

1. Находим средние значения каждой группы.

Общее средние значение для всей совокупности:

2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:

Расчет для группы: 470 - 563(1,2,3,4,5,6,7,8,9,10,11,12,13)

y_j	(y_j- y_ср) 2	Результат
11	(11 - 9.31) 2	2.86
11	(11 - 9.31) 2	2.86
11	(11 - 9.31) 2	2.86
10	(10 - 9.31) 2	0.48
11	(11 - 9.31) 2	2.86
9	(9 - 9.31) 2	0.0947
6	(6 - 9.31) 2	10.94
9	(9 - 9.31) 2	0.0947
11	(11 - 9.31) 2	2.86
6	(6 - 9.31) 2	10.94
8	(8 - 9.31) 2	1.71
8	(8 - 9.31) 2	1.71
10	(10 - 9.31) 2	0.48
Итого	40.77

Определим групповую (частную) дисперсию для 1-ой группы:

Расчет для группы: 563 - 656(14,15,16,17,18,19,20,21,22)

y_j	(y_j- y_ср) 2	Результат
9	(9 - 7.44) 2	2.42
7	(7 - 7.44) 2	0.2
7	(7 - 7.44) 2	0.2
8	(8 - 7.44) 2	0.31
9	(9 - 7.44) 2	2.42
6	(6 - 7.44) 2	2.09
5	(5 - 7.44) 2	5.98
8	(8 - 7.44) 2	0.31
8	(8 - 7.44) 2	0.31
Итого	14.22

Определим групповую (частную) дисперсию для 2-ой группы:

Расчет для группы: 656 - 749(23,24,25,26,27,28,29,30)

y_j	(y_j- y_ср) 2	Результат
6	(6 - 5.38) 2	0.39
5	(5 - 5.38) 2	0.14
6	(6 - 5.38) 2	0.39
5	(5 - 5.38) 2	0.14
5	(5 - 5.38) 2	0.14
6	(6 - 5.38) 2	0.39
5	(5 - 5.38) 2	0.14
5	(5 - 5.38) 2	0.14
Итого	1.88

Определим групповую (частную) дисперсию для 3-ой группы:

3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:

Средняя из частных дисперсий:

4. Межгрупповая дисперсияотносится на счет изучаемого фактора, она называется факторной

Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:
σ²= σ²_i +δ²
σ 2 = 1.9 + 2.58 = 4.48
Проверим этот вывод путем расчета общей дисперсии обычным способом:

y_i	(y_i- y_ср) 2	Результат
11	(11 - 7.7) 2	10.89
11	(11 - 7.7) 2	10.89
11	(11 - 7.7) 2	10.89
10	(10 - 7.7) 2	5.29
11	(11 - 7.7) 2	10.89
9	(9 - 7.7) 2	1.69
6	(6 - 7.7) 2	2.89
9	(9 - 7.7) 2	1.69
11	(11 - 7.7) 2	10.89
6	(6 - 7.7) 2	2.89
8	(8 - 7.7) 2	0.09
8	(8 - 7.7) 2	0.09
10	(10 - 7.7) 2	5.29
9	(9 - 7.7) 2	1.69
7	(7 - 7.7) 2	0.49
7	(7 - 7.7) 2	0.49
8	(8 - 7.7) 2	0.09
9	(9 - 7.7) 2	1.69
6	(6 - 7.7) 2	2.89
5	(5 - 7.7) 2	7.29
8	(8 - 7.7) 2	0.09
8	(8 - 7.7) 2	0.09
6	(6 - 7.7) 2	2.89
5	(5 - 7.7) 2	7.29
6	(6 - 7.7) 2	2.89
5	(5 - 7.7) 2	7.29
5	(5 - 7.7) 2	7.29
6	(6 - 7.7) 2	2.89
5	(5 - 7.7) 2	7.29
5	(5 - 7.7) 2	7.29
Итого	134.3

Определяем эмпирическое корреляционное отношение:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x 2 = ∑y•x
Для наших данных система уравнений имеет вид
30a + 231 b = 17767
231 a + 1913 b = 132293
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = -33.6031, a = 850.9774
Уравнение регрессии (эмпирическое уравнение регрессии):
y = -33.6031 x + 850.9774
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

x	y	x 2	y 2	x·y
11	470	121	220900	5170
11	470	121	220900	5170
11	470	121	220900	5170
10	480	100	230400	4800
11	480	121	230400	5280
9	485	81	235225	4365
6	485	36	235225	2910
9	500	81	250000	4500
11	525	121	275625	5775
6	530	36	280900	3180
8	530	64	280900	4240
8	550	64	302500	4400
10	560	100	313600	5600
9	590	81	348100	5310
7	599	49	358801	4193
7	600	49	360000	4200
8	600	64	360000	4800
9	600	81	360000	5400
6	640	36	409600	3840
5	640	25	409600	3200
8	640	64	409600	5120
8	655	64	429025	5240
6	680	36	462400	4080
5	695	25	483025	3475
6	700	36	490000	4200
5	700	25	490000	3500
5	705	25	497025	3525
6	710	36	504100	4260
5	729	25	531441	3645
5	749	25	561001	3745
231	17767	1913	10761193	132293

1. Параметры уравнения регрессии.
Выборочные средние.

1.1. Коэффициент корреляции
Ковариация.
cov(x,y)= x·y - x · y = 4409.77-7.7·592.23 = -150.43
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Готовое решение: Заказ №9684

Тип работы: Задача

Статус: Выполнен (Зачтена преподавателем ВУЗа)

Предмет: Экономика

Дата выполнения: 23.10.2020

Цена: 219 руб.

Чтобы получить решение , напишите мне в WhatsApp , оплатите, и я Вам вышлю файлы.

Кстати, если эта работа не по вашей теме или не по вашим данным , не расстраивайтесь, напишите мне в WhatsApp и закажите у меня новую работу , я смогу выполнить её в срок 1-3 дня!

Описание и исходные данные задания, 50% решения + фотография:

Задача 24

Для установления зависимости между урожайностью и сортом винограда в одном из хозяйств на основе выборки определили урожай на 8 кустах винограда.

Средние затраты на 1 руб. произведенной продукции в целом по ЗАО. Структуры численности рабочих. Зависимость между урожайностью и сортом винограда в одном из хозяйств. Общий индекс затрат на производство. Уровень ряда динамики для интервального ряда.

Рубрика	Экономика и экономическая теория
Вид	контрольная работа
Язык	русский
Дата добавления	26.07.2010
Размер файла	128,3 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Задача 1. По данным о производственной деятельности ЗАО определить средние затраты на 1 руб. произведенной продукции в целом по ЗАО.

Таблица 1 - Исходные данные

Общие затраты на производство, млн. руб.

Затраты на 1 руб. произведенной

Решение:

Для определения средних затрат на 1 рубль произведенной продукции необходимо воспользоваться средней гармонической, так как у нас известен числитель и неизвестен знаменатель. Для определения средней строим вспомогательную таблицу.

Таблица 2 - Вспомогательная

Общие затраты на производство, млн. руб., (Wi)

Затраты на 1 руб.

продукции, руб. (Xi)

продукции, млн руб.

Так средние затраты на 1 рубль продукции рассчитываются по формуле

где х - признак (варианта) - индивидуальные значения усредняемого признака; показатель, представляющий собой реально существующий экономический показатель равный х• f:

Данные берутся из таблицы.

Ответ: Средние затраты на 1 рубль произведенной продукции равны 72 коп.

Задача 2. По данным 10% -го выборочного обследования рабочих по стажу работы, результаты которого приведены ниже, определить:

1) относительную величину структуры численности рабочих;

2) моду и медиану стажа рабочих;

3) средний стаж рабочих цеха;

4) размах вариации;

5) среднее линейное отклонение;

7) среднее квадратическое отклонение;

8) коэффициент вариации;

9) с вероятностью 0,997 пределы, в которых изменяется средний стаж рабочих в целом по предприятию;

10) с вероятностью 0,997 пределы, в которых изменяется доля рабочих, имеющих стаж работы более 10 лет в целом по предприятию. Сделать выводы.

Таблица 3 - Исходные данные

Группы рабочих по стажу, лет

1) Находим относительную величину структуры численности рабочих, для этого строим следующую таблицу.

Таблица 4 - Относительная структура численности рабочих

Группы рабочих по стажу, лет

2) Находим моду и медиану стажа рабочих. Для этого строим вспомогательную таблицу.

Таблица 5 - Вспомогательная.

Группы рабочих по стажу, лет

Число рабочих (fi)

Середина интервала, (xi)

Мода - это наиболее часто встречающееся значение ряда:

где - мода; - нижняя граница модального интервала. Интервал с максимальной частотой является модальным; - шаг модального интервала, который определяется разницей его границ; f_mo - частота модального интервала; f_mo_-1 - частота интервала, предшествующего модальному; f_mo₊₁ - частота интервала, последующего за модальным.

Медианой является значение признака х, которое больше или равно и одновременно меньше или равно половине остальных элементов ряда распределения. Медиана делит ряд на две равные части:

где x_me - нижняя граница медианного интервала. Интервал, в котором находится порядковый номер медианы, является медианным. Для его определения необходимо подсчитать величину . Интервал с накопленной частотой равной величинеявляется медианным; i - шаг медианного интервала, который определяется разницей его границ; - сумма частот вариационного ряда; S_me_-1- сумма накопленных частот в домедианном интервале; f_me - частота медианного интервала.

3) Находим средний стаж рабочих цеха:

где х - признак (варианта) - индивидуальные значения усредняемого признака, в качестве которого берется середина интервала, определяемая как полусумма его границ;

f - частота, т.е. числа, показывающие, сколько раз повторяется та или иная варианта.

Сравниваем полученные значения, в нашем случае получаем:

что говорит о левосторонней асимметрии.

По этим данным можно сделать вывод о том, что средний стаж рабочих составляет 7,05 лет; наиболее часто встречаются рабочие со стажем 7,263 года. Кроме того, половина рабочих имеет стаж более 7,166 лет, а другая - менее 7,166 лет.

4) Находим размах вариации.

где х_max - максимальное значение признака; х _min - минимальное значение признака.

Так, разница между максимальным значением признака и минимальным составляет 12.

5) Находим среднее линейное отклонение:

где - индивидуальные значения признака, - средняя величина; f - частота.

Читайте также: