Как можно использовать корреляционный и регрессионный анализы в целях прогнозирования урожая

Обновлено: 04.10.2024

3.5. Корреляционно-регрессионный анализ для определения степени влияния метеоусловий на урожайность.

При анализе урожайности, являющейся функцией очень многих факторов, часто возникает потребность количественно определить роль, степень влияния различных факторов. Одним из статистических методов, соответствующих поставленной задаче, является метод корреляционного анализа.

Для нахождения параметров а0 и а1 при линейной зависимости воспользуемся формулами из пункта 3.4.

Для нашего примера:

а1 = (6*43064 – 3488*74,5)/(6*2072762 – 3488 2 ) = 0,005

а0 = 12,4 + 0,005*581,3 = 15,3.

Отсюда уравнение регрессии будет иметь вид:

т.е. при изменении количества осадков на единицу, показатель урожайности изменится на 0,005.

Найдем коэффициент корреляции (r), который рассчитывается по формуле:

ai – коэффициент регрессии в уравнении связи,

x – среднее квадратическое отклонение факторного признака,

y – среднее квадратическое отклонение результативного признака.

Значения x и y рассчитаем по формулам, приведенным в предыдущем пункте, для чего воспользуемся суммами, рассчитанными для исчисления параметров связи. Перепишем эти суммы:

х=3488; у=74,5; х 2 =2072762; у 2 =932,13; n=6.

r = 0,005*(87/1,28)= 0,34,

т.е. теснота связи между количеством выпавших осадков и изменением урожайности небольшая. Что подтверждает расчеты, сделанные ранее в пункте 3.3.

Расчетная таблица за 6 лет.

3.6. Исчисление показателей колеблемости (устойчивости) урожайности во времени.

Ценные выводы об имеющихся резервах дальнейшего повышения урожайности дает сравнение урожайности хозяйств во времени, т.е. исчисление показателей колеблемости (устойчивости) урожайности.

Для этого необходимо определить средние уровни и показатели общей вариации урожайности зерновых (необходимые суммы и суммы квадратов определим по исходным данным таблицы 10).

Выравненные уровни по прямой линии yt

Отклонение от выравненного уровня y - yt

Средняя урожайность, ц с 1 га Y=Y/n

Дисперсия урожайности  2 = ( 2 / n) -  2 / n 2

Среднее квадратическое отклонение урожайности, ц с 1 га

Коэффициент вариации урожайности, % V0=(*100)/yср

По вышеприведенным формулам производим расчет показателей:

Средняя урожайность, ц с 1 га Yср=11,8

Дисперсия урожайности  2 =(2523,99/17) – (40200,25/289)=148,5 – 139=9,5

Среднее квадратическое отклонение урожайности, ц с 1 га =3,1

Коэффициент вариации урожайности, % V0=(3,1*100)/11,8=26,3.

Судя по коэффициентам вариации колеблемость урожайности зерновых в хозяйствах Тверской области довольно высока. Однако сделать вывод об устойчивости урожайности по этим данным нельзя, поскольку колеблемость определяется двумя группами причин: 1) тенденцией роста урожайности в динамике; 2) случайной колеблемостью урожайности около тенденции, определяющей саму урожайность.

Определим колеблемость урожайности зерновых по указанным двум источникам. Для этого проведем выравнивание урожайности по прямой линии и определим отклонения от выравненных уровней.

Динамика урожайности зерновых в Тверской области за 1985 – 2001 годы, ц с 1 га

Проведем выравнивание уровня урожайности зерновых в динамике по уравнению прямой линии Y=a+bt, где Y – урожайность, a – начальный сглаженный уровень, b – среднегодовой абсолютный прирост урожайности, t – номер года.

Для определения неизвестных параметров управления a и b составим систему из двух нормальных уравнений:

где n – число лет динамического ряда, равное 17 годам.

Необходимые для решения уравнения величины , t, yt и t 2 возьмем из таблицы 11. Подставим исходные данные в систему уравнений и решим ее:

Приведем к единице коэффициенты при а, разделив каждое уравнение соответственно на 17 и 153:

вычтем из второго уравнения первое и определим коэффициент b:

Рассчитаем коэффициент а, подставив значение b= - 0,5 в первое уравнение системы:

Следовательно, уравнение выравненного уровня урожайности в динамическом ряду составит Yt=16,3 – 1,5t, т.е. урожайность ежегодно уменьшается в среднем на 0,5 ц, начиная с уровня 16,3 ц, достигнутого к началу периода.

Исходя из полученных данных, продолжим анализ устойчивости урожайности во времени. Для этого вычислим следующие переменные:

Остаточная дисперсия урожайности  2 ост=((y - yt) 2 )/n

Остаточное среднее квадратическое отклонение, ц с 1 га

Остаточный коэффициент вариации, % Vост=ост*100/yср

Коэффициент устойчивости урожайности, % Ky=100 - Vост

Используя данные таблиц 10 и 11, находим вышеперечисленные показатели.

Остаточная дисперсия урожайности  2 ост=136,97/17=8,06

Остаточное среднее квадратическое отклонение, ц с 1 га ост=2,84

Остаточный коэффициент корреляции, % Vост=24,07

Коэффициент устойчивости урожайности, %

Как видно по уровню остаточного коэффициента вариации, случайная колеблемость, а следовательно, и неустойчивость урожайности зерновых довольно высока, что соответствует сделанному ранее выводу в пункте 3.1. В первую очередь, это связано с изменением метеорологических условий, которые оказывают большое влияние на урожайность зерновых.

Для наиболее точной характеристики устойчивости (колеблемости) урожайности найдем также факторную дисперсию, коэффициент случайной дисперсии, индекс корреляции по следующим формулам:

Факторная дисперсия  2 ф= 2 -  2 ост

Коэффициент случайной дисперсии К= 2 ост/ 2

Индекс корреляции R=1-К

Подставив значения, получим следующий результат:

Получив все необходимые данные, можно сделать вывод, что метеорологические условия оказывают наибольшее влияние на урожайность. Это показывает остаточная дисперсия (=8,06), которая характеризует вариацию урожайности, обусловленную причинами, не зависящими от человека, а также коэффициент случайной дисперсии (К=0,85), характеризующий степень зависимости урожайности от случайных факторов, т.е. независящих от человека причин.

Раздел: Статистика
Количество знаков с пробелами: 73603
Количество таблиц: 18
Количество изображений: 3

Прогнозирование урожайности сельскохозяйственного предприятия с использованием методов корреляционно-регрессионного анализа

Овощеводство одна из важнейших отраслей сельского хозяйства, которая играет большую роль в обеспечении населения продукцией.

Урожай и урожайность овощей – важнейшие результативные показатели овощеводства и сельскохозяйственного производства в целом. Уровень урожайности отражает воздействие экономических и природных условий, в которых осуществляется сельскохозяйственное производство, и качество организационно-хозяйственной деятельности каждого предприятия.

Урожай характеризует общий объем производства продукции данной культуры, а урожайность – продуктивность этой культуры в конкретных условиях ее возделывания.

Так как целью любого предприятия является получение прибыли, а урожайность оказывает непосредственное влияние на прибыль, так как определяет валовый объем производства продукции. Таким образом, показатель урожайности характеризует эффективность овощеводства в целом. Очевидно, математические методы анализа показателей урожайности могут оказаться крайне полезными.

Одним из математических методов, который применим к выявлению силы и формы зависимости урожайности от ряда факторов, является модель множественной регрессии.

Общее назначение множественной регрессии состоит в анализе связи между несколькими независимыми переменными и зависимой переменной.

Основная цель применения модели множественной регрессии - построить модели с несколькими факторами и определить влияние каждого фактора в отдельности, а также их совместное воздействие на изучаемый показатель (зависимую переменную).

Были определены следующие переменные модели:
* показатель урожайности в качестве зависимой переменной;
* среднемесячный расход минеральных удобрений, среднемесячная подкормка углекислым газом, среднемесячная температура в качестве независимых переменных.

Так как урожайность имеет довольно тесную связь с выбранными факторами и при этом эти факторы не коррелируют между собой, то при правильно построенной модели и верно выбранной форме зависимости урожайности от этих факторов, эта модель позволяет делать удовлетворительный прогноз показателя урожайности на перспективу.


Прогнозирование урожайности сельскохозяйственного предприятия с использованием методов корреляционно-регрессионного анализа


Как работаем и отдыхаем в 2022 году ?

В системе статистической обработки данных и аналитики часто используется сочетание методик корреляции и регрессии. Создателем корреляционно-регрессионного анализа считается Фрэнсис Гальтон, который разработал теоретическую основу методологии в 1795 году. В конце 19 века многие европейские ученые в области теории статистики углубили познания в вопросе использования количественных измерителей для отражения связей между явлениями.

Что такое корреляционно-регрессионный анализ (КРА) предприятия?

Корреляционно-регрессионный анализ (КРА) на предприятиях используется для выявления связей между несколькими факторами хозяйственной деятельности и оценки степени взаимозависимости выбранных для анализа критериев. Методика использует два алгоритма действий:

  1. Корреляция, которая направлена на построение моделей связей.
  2. Регрессия, используемая для прогнозирования событий на основе наиболее подходящей для ситуации модели связей.

Анализ проводится в несколько шагов:

  • постановка задач проведения исследования;
  • массовый сбор информации: систематизация статистических данных по конкретным показателям деятельности предприятия в динамике за несколько периодов;
  • этап создания модели связей;
  • анализ функционирования модели, оценка ее эффективности.

Для проведения КРА необходимо использовать показатели в едином измерителе, все они должны иметь числовое значение.

ОБРАТИТЕ ВНИМАНИЕ! Для достоверности данных и работоспособности модели сведения должны быть собраны за длительный отрезок времени.

Для полноты анализа надо устранить количественные ограничения на показатели модели, должно соблюдаться условие постоянной временной и территориальной структуры рассматриваемой совокупности элементов.

Где используется корреляционно-регрессионный анализ?

ВАЖНО! Пример проведения корреляционно-регрессионного анализа от КонсультантПлюс доступен по ссылке

Основные ситуации применения КРА:

  1. Тестирование отношения между несколькими величинами: выявляется, что именно этот показатель является влияющим, а второй – зависимым.
  2. Определение связи между двумя переменными факторами без уточнения причинно-следственного блока сведений.
  3. Расчет показателя по изменению значения другого фактора.

Корреляционно-регрессионная методика анализа может применяться для подготовки данных о разных сторонах деятельности компании. В бизнесе построение моделей зависимости одного показателя от других факторов и дальнейшая эксплуатация выведенной математической формулы позволяют отслеживать оперативное изменение текущей ситуации в выбранном сегменте хозяйствования и быстро принимать управленческие решения.

Например, благодаря КРА можно постоянно отслеживать уровень рыночной стоимости предприятия. Для этого на начальных этапах проводится сбор информации о динамике изменения рыночной стоимости и статистических показателей всех возможных факторов влияния:

  • уровень выручки;
  • рентабельность;
  • размер активов;
  • сумма непогашенной дебиторской или кредиторской задолженности;
  • резерв сомнительных долгов и др.

Для каждого критерия строится модель, которая выявляет, насколько сильно фактор может влиять на рыночную стоимость бизнес-проекта. Когда все модели построены, оценивается их работоспособность и адекватность. Из комплекса данных выбирается тот тип взаимосвязей, который отвечает требованиям объективности и достоверности. На основе полученной схемы связей создается уравнение, которое позволит получать прогнозные данные об изменении рыночной стоимости при условии изменения значения конкретного фактора.

Методику можно применять при формировании ценовой политики, составлении бизнес-планов, проработке вопроса о расширении ассортиментного ряда и в других сегментах предпринимательства.

Задачи, виды и показатели корреляционно-регрессионного анализа

Задачи КРА заключаются в:

  • идентификации наиболее значимых факторов влияния на конкретный показатель деятельности предприятия;
  • количественном измерении тесноты выявленных связей между показателями;
  • определении неизвестных причин возникновения связей;
  • всесторонней оценке факторов, которые признаны наиболее важными для рассматриваемого показателя;
  • выведении формулы уравнения регрессии;
  • составлении прогноза возможного результата деятельности при изменении ключевых связанных факторов с учетом возможного влияния других факторных признаков.

КРА подразумевает использование нескольких видов корреляционных и регрессионных методов. Зависимости выявляются при помощи корреляций таких типов:

  • парная, если связь устанавливается с участием двух признаков;
  • частная – взаимосвязь оценивается между искомым показателем и одним из ключевых факторов, при этом условием задается постоянное значение комплекса других факторов (то есть числовое выражение всех остальных факторов в любых ситуациях будет приниматься за определенную неизменную величину);
  • множественная – основу исследования составляет влияние на показатель деятельности не одного фактора, а сразу нескольких критериев (двух и более).

СПРАВОЧНО! Выявленные показатели степени тесноты связей отражаются коэффициентом корреляции.

На выбор коэффициента влияет шкала измерения признаков:

  1. Шкала номинальная, которая предназначена для приведения описательных характеристик объектов.
  2. Шкала ординальная нужна для вычисления степени упорядоченности объектов в привязке к одному и более признакам.
  3. Шкала количественная используется для отражения количественных значений показателей.

Регрессионный анализ пользуется методом наименьших квадратов. Регрессия может быть линейной и множественной. Линейный тип предполагает модель из связей между двумя параметрами. Например, при наличии таких двух критериев, как урожайность клубники и полив, понятно, что именно объем поступающей влаги будет влиять на объем выращенной и собранной клубники. Если полив будет чрезмерным, то урожай пропадет. Урожайность же клубники никак не может воздействовать на систему полива.

Множественная регрессия учитывает более двух факторов одновременно. В случае с клубникой при оценке ее урожайности могут использоваться факторы полива, плодородности почвы, температурного режима, отсутствия слизняков, сортовые особенности, своевременность внесения удобрений. Все перечисленные показатели в совокупности оказывают комплексное воздействие на искомое значение – урожайность ягод.

Система показателей анализа формируется критериями классификации. Например, при экстенсивном типе развития бизнеса в качестве показателей могут выступать такие факторы:

  • количество сотрудников;
  • число заключенных договоров за отчетный период;
  • посевные площади;
  • прирост поголовья скота;
  • расширение дилерской сети;
  • объем основных фондов.

При интенсивном типе развития могут применяться следующие показатели:

  • производительность труда;
  • рентабельность;
  • урожайность;
  • фондоотдача;
  • ликвидность;
  • средний объем поставок в отчетном периоде по одному договору.

Оценка

Для оценки достоверности и эффективности модели связей необходимо построить матрицу коэффициентов. Коэффициент в случае парной корреляции вычисляется по формуле:


Диапазон значений коэффициента ограничивается показателями от -1 до +1. Если итоговое значение было получено со знаком плюс, то между рассматриваемыми переменными имеется прямая связь. Если в результате расчетов значение оказалось отрицательным, то связь будет обратной, то есть при увеличении одного из показателей другой связанный с ним фактор будет уменьшаться. Пример прямой связи – увеличение посевных площадей будет способствовать росту объема собираемой с полей продукции. Пример обратной связи – увеличение посевных площадей сопровождается снижением урожайности.

Качественный аспект тесноты связи между рассматриваемыми в аналитических расчетах показателями можно оценивать, основываясь на шкале Чеддока.

В соответствии с ее нормами связь будет расцениваться как сильная при значении коэффициента корреляции по абсолютным данным величины выше 0,7. Положительный или отрицательный знак сопровождает числовое значение – неважно, ориентироваться необходимо только на число. Если коэффициент после вычислений оказался ниже 0,3, то связь можно считать слабой.

Для дальнейших этапов анализа выбираются факторы с высокой степенью связанности. Все остальные критерии, для которых установлена слабая связь, отбрасываются. На основании полученных сведений определяется вид математического уравнения регрессии. Рассчитывается численное значение оценки параметров регрессии, определяются качества полученной модели регрессии.

Содержание

Введение 3
1 Экономическая характеристика предприятия 5
2 Статистика земельного фонда и посевных площадей
2.1 Анализ состава земельного фонда, земель сельскохозяйственного назначения и структуры посевных площадей 13
2.2 Расчёт и оценка показателей динамики размера посевных площадей 17
3 Статистика урожая и урожайности
3.1 Расчёт и анализ показателей урожайности сельскохозяйственных структур 22
3.2 Выявление основной тенденции развития показателя урожайности методом аналитического выравнивания 24
3.3 Индексный анализ валового сбора по группе однородных культур 28
3.4 Прогнозирование урожайности методом экстраполяции 30
4 Корреляционно-регрессионный анализ влияния факторов на показатель урожайности сельскохозяйственных культур 34
Выводы 41
Список использованной литературы 43

В агрономических исследованиях редко приходится иметь дело с точными и определенными функциональными связями, когда каждому значению независимого признака (Х) соответствует строго определенное значение результативного признака (зависимого) (У). Чаще между изучаемыми явлениями, объектами, условиями среды, ростом, продуктивностью растений и другими показателями существуют корреляционные или вероятностные взаимосвязи, когда определенному значению независимой переменной X соответствует не одно, а множество возможных значений признака Y.

Корреляции подразделяют по направлению, форме и числу связей. По направлению корреляция может быть прямой или обратной, по форме прямолинейной и криволинейной, а по числу связей – простой и множественной.

На основании корреляционного анализа устанавливают форму, направление и тесноту связи, то есть дается качественная оценка зависимости.

Для количественной оценки связи между изучаемыми признаками проводится регрессионный анализ, на основании которого определяют уравнение регрессии. Уравнение регрессии в агрономии используют:

для прогнозирования значения урожайности в зависимости от метеоусловий, вредителей, болезней, сорняков и рекомендуемых агроприемов;

для прогнозирования распространения вредителей и болезней от внешних условий;

для прогнозирования качества продуктов переработки и их хранения по качеству сырья и т.д.

Читайте также: