Из урожая картофеля собранного на одной из опытных делянок случайным

Обновлено: 18.09.2024

Зафиксированные в документах учета сведения об изучаемом объекте (или объектах) представляют тот первичный фактический материал, который нуждается в соответствующей обработке. Обработка начинается с упорядочения или систематизации собранных данных. Процесс систематизации результатов массовых наблюдений, объединения их в относительно однородные группы по некоторому признаку называется группировкой.

Группировка - это не просто технический прием, позволяющий представить первичные данные в комплексном виде, но и глубоко осмысленное действие, направленное на выявление связей между явлениями. Ведь от того, как группируется исходный материал, во многих случаях зависят выводы о природе изучаемого явления. Один и тот же материал дает диаметрально противоположные выводы при разных приемах группировки. Нельзя группировать в одну и ту же совокупность неоднородные по составу данные, необдуманно выбирать способ группировки. Группировка должна отвечать требованию поставленной задачи и соответствовать содержанию изучаемого явления.

Наиболее распространенной формой группировки являются статистические таблицы.

Особую форму группировки представляют так называемые статистические ряды. Статистическим называется ряд числовых значений признака, расположенных в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики и регрессии, а также ряды ранжированных значений признаков и ряды накопленных частот, являющихся производными вариационных рядов.

Вариационным рядом или рядом распределенияназывают двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности. Например, из урожая картофеля, собранной на одной из опытных делянок, случайным способом, т.е. наугад, отобрано 25 клубней, в которых подсчитывали число глазков. Результаты подсчета оказались следующие: 6,9,5,7,10,8,9,10,8,11,9,12,9,8,10,11,9,10,8,10,7,9,11,9,10.

Чтобы разобраться в этих данных, расположим их в ряд (а порядке регистрации результатов наблюдений) с учетом повторяемости вариант в этой совокупности:

Варианты х. 6 9 5 7 10 8 11 12

Число вариант f……1 7126431

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной латинской буквой f. Общая сумма ( ∑)частот вариационного ряда равна объему данной совокупности, т.е.:

K

∑ f i = n

I

K

F i

I

обозначает действие суммирования, в данном
случае суммирование частот вариационного ряда от первого (i=1)
до k - класса, а п - общее число наблюдений, или объем
совокупности.

Частоты (веса) выражают не только абсолютными, но и относительными числами - в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частостей равна единице, т.е.

∑ f i / n = 1; ∑ ( f i / n) 100 = 100%

Если частоты выражены в процентах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необходимой в тех случаях, когда приходится сопоставлять друг с другом вариационные ряды, сильно отличающиеся по их объемам.

Распределение исходных данных вариационный ряд преследует определенные цели. Одна из них - ускорение работы при вычислении по вариационному ряду обобщающих числовых характеристик - средней величины и показателей вариации. Другая сводится к выявлению закономерности варьирования учитываемого признака. Приведенный ряд удовлетворяет первой, но не удовлетворяет достижению второй цели. Чтобы ряд распределения полностью удовлетворял предъявляемым к нему требованиям, его нужно строить по ранжированным значениям признака.

Под ранжированием (от франц. Ranger -выстраивать в ряд по ранжиру, т.е. по росту) понимают расположение членов ряда в возрастающем (или убывающем) порядке.

В зависимости от того, как варьирует признак - дискретно или непрерывно, в широком или узком диапазоне, - статистическая совокупность распределяется в безынтервальный или интервальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариационного ряда, во втором - подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам, на которые разбивается общая вариация признака в пределах от минимальной до максимальной варианты данной совокупности. Эти промежутки, или классовые интервалы, могут быть равными и не равными по ширине. Отсюда различают равно - и неравноинтервальные вариационные ряды.

В неравноинтервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. Поэтому в качестве числовых характеристик таких рядов используют особые показатели.

Неравноинтервальную группировку применяют сравнительно редко. Как правило, биометрические данные распределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисление сводных числовых характеристик вариационного ряда, сопоставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка искажает точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака на такое число групп или классов, которое удовлетворяло бы обоим требованиям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построении вариационного ряда:

Где L - величина классового интервала; Х тах X min- максимальная и минимальная варианты совокупности; К число классов, на которые следует разбить вариацию признака.

Более точно величину К можно определить по формуле Стерджеса:

К = 1+3,32 lg n

При наличии в совокупности большого числа членов (n > 100) можно использовать формулу К = 5 lg n


Таблицы. Наиболее распространенной формой группировки являются статистические таблицы; они бывают простыми и сложными. К простым относятся, например, четырехпольные таблицы, применяемые при альтернативной группировке, когда одна группа вариант противопоставляется другой; например, здоровые — больным, высокие — низким и т. д. В качестве примера такой группировки могут служить результаты обследования 265 учащихся младших классов на состояние нёбных миндалин (табл. 1).

Из табл. 1 видно, что заболевание нёбных миндалин, по-видимому, чаще встречается среди учащихся третьих и четвертых классов.

К сложным относятся многопольные таблицы, применяемые при изучении корреляционной зависимости и при выяснении причинно-следственных отношений между варьирующими признаками. Примером корреляционной таблицы служат классические данные Гальтона, показывающие наличие положительной зависимости между ростом родителей и ростом их детей (табл. 2).




Среди группировок видное место занимают вариационные ряды. На их описании следует остановиться более подробно. Ряды регрессии, динамики и другие будут рассмотрены в последующих главах.

Вариационным, рядом или рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности. Например, из урожая картофеля, собранного на одной из опытных делянок, случайным способом, т. е. наугад, отобрано 25 клубней, в которых подсчитывали число глазков. Результаты подсчета оказались следующие: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 11, 9, 10. Чтобы разобраться в этих данных, расположим их в ряд (в порядке регистрации результатов наблюдений) с учетом повторяемости вариант в этой совокупности:


Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f. Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.

(греческая буква сигма прописная) обозначает действие суммирования, в данном случае суммирование частот вариационного ряда от первогокласса, а п — общее число наблюдений, или объем совокупности.

Частоты (веса) выражают не только абсолютными, но и относительными числами — в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частостей равна единице, т. е.


, если частоты выражены в процентах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необходимой в тех случаях, когда приходится сопоставлять друг с другом вариационные ряды, сильно отличающиеся по их объемам.

Распределение исходных данных в вариационный ряд преследует определенные цели. Одна из них — ускорение работы при вычислении по вариационному ряду обобщающих числовых характеристик— средней величины и показателей вариации. Другая сводится к выявлению закономерности варьирования учитываемого признака. Приведенный ряд удовлетворяет первой, но не удовлетворяет достижению второй цели. Чтобы ряд распределения полностью удовлетворял предъявляемым к нему требованиям, его нужно строить по ранжированным значениям признака.


Под ранжированием (от франц.—выстраивать в ряд по ранжиру, т. е. по росту) понимают расположение членов ряда в возрастающем (или убывающем) порядке. Так, в данном случае результаты наблюдений следует распределить так:


Этот упорядоченный ряд распределения в равной мере удовлетворяет достижению и первой, и второй целей. Он хорошо обозрим и наилучшим образом иллюстрирует закономерность варьирования признака.

В зависимости от того, как варьирует признак — дискретно или непрерывно, в широком или узком диапазоне, — статистическая совокупность распределяется в безынтервальный или интервальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариационного ряда, во втором — подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от — до), на которые разбивается общая вариация признака в пределах от минимальной до максимальной варианты данной совокупности. Эти промежутки, или классовые интервалы, могут быть равными и не равными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. Примером неравноинтервального ряда распределения могут служить данные А. Ф. Ковшарь (1966), показывающие зависимость между числом стай сизых голубей и количеством особей в стае в гнездовой (с 15 марта по 15 августа) и послегнездовой (с 15 августа по 15 марта) периоды их жизни (табл. 4).

В неравноинтервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. Поэтому в качестве числовых характеристик таких рядов используют особые показатели.

Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные распределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисление сводных числовых характеристик вариационного ряда, сопоставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые


интервалы) искажает типичные черты варьирования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требованиям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построении вариационного ряда:


(1)


где— величина классового интервала;— максимальная и минимальная варианты совокупности; К — число классов, на которые следует разбить вариацию признака.

Число классов (К) можно приблизительно наметить, пользуясь табл. 5.

Более точно величинуК можно определить по формуле Стерджеса:При наличии в совокупности большого числа членовможно использовать формулуК.

Вопрос о том, распределять ли собранные данные в интервальный или безынтервальный ряд, решают в зависимости от характера и размаха варьирования признака.

Если признак варьирует дискретно и слабо, т. е. в узких границах (величинаК оказывается равной единице или может быть приравнена к единице), данные распределяются в безынтервальный вариационный ряд. Если же признак варьирует в широких границах, то независимо от того, как он варьирует — дискретно или непрерывно, по данным строят интервальный вариационный ряд.

Новогородковская ОШ

Подготовила учитель математики

Рыбка Елена Николаевна

Статистика
(слайд 1)

числовых характеристик данных измерений; повторение основных

определений, изученных в данной теме;

2) формирование информационной культуры учащихся;

3) развитие абстрактного, логического, структурного мышления,

зрительной памяти, речи учащихся
Тип урока: обобщение и закрепление знаний
Ход урока

І. Организационный момент

ІІ. Немного размышлений

В век бесконечного потока информации крылатое выражение Ф. Бекона приобретает особый смысл. Мало владеть какой-то информацией, её нужно правильно использовать. Но часто информация трудна для восприятия: она не наглядна, занимает много места, никак не упорядочена и т.д. А значит, она не может принести пользу. Единственный разумный выход – преобразовать первоначальную информацию. Значительную часть подобного преобразования берёт на себя статистика.

Статистика — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.()
IIІ. Проверка домашнего задания и постановка цели урока.
(слайд 5) составить схему обработки данных
(слайд 6) разгадать кроссворд (проверка определений)


  • По вертикали

  • 1. Число данного ряда, которое окажется посередине, если этот ряд упорядочить

  • 2. Числа, которые показывают сколько раз, повторялось каждое значение варианта.

  • 4. Среднее … ряда чисел – это частное от деления суммы этих чисел на число слагаемых

  • 6. Разность между наибольшим и наименьшим из чисел

(слайд 8) отчет о творческой работе (проверка домашнего задания)

Творческое задание: На сегодня у вас было творческое домашнее задание опросить определенное количество людей и собранную информацию сгруппировать, анализировать и сделать соответствующие расчеты.
ІV. Повторение и систематизация знаний учащихся
Задача 1(слайд 9)

14, 14, 13, 14, 14, 15, 14, 13, 13, 14, 14, 14, 15, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15


  1. Ранжировать ряд

  2. Составить статистическую таблицу

  3. Найти среднее арифметическое, размах, моду и медиану

13,13,13,14,14,14,14,14,14,14,14,15,15 – ранжированный ряд


Возраст

13 лет

14 лет

15 лет

Частота

3

8

2


  1. Составить статистическую таблицу

  2. Найти моду, медиану и построить полигон

Задача 2 (слайд 12)

В таблице указано количество книг, прочитанных каждым из учеников за летние каникулы:

Найдите среднее арифметическое, медиану и моду этого набора чисел.


Аня

Витя

Игорь

Оля

Петя

Катя

Лена

Саша

8

10

6

1

0

8

5

3


  • Среднее арифметическое

  • 8 + 10 + 6 + 1 + 0 + 8 + 5 + 3= 5,125

  • Чтобы найти медиану, числа нужно упорядочить:

  • 0, 1, 3, 5, 6, 8, 8, 10. Количество чисел четно, поэтому нужно взять среднее арифметическое двух чисел, стоящих в центре: медиана (5+6)/2 = 5,5

  • Мода – это число, которое повторяется чаще остальных, то есть 8.

  • Ответ: 5,125; 5,5; 8.

Задача 3 (слайд 14)

Составьте статистическую таблицу и постройте полигон частот и гистограмму, по результатам письменного

экзамена по математике: 6,7,7,8,9,2,10,6,5,6,7,3,7,9,9,2,3,2,6,6,

Решение: (слайд 15)

Дана выборка объема 40. Ее ряд данных – 2,3,5,6,7,8,9,10.

Оценка в 2 балла встретилась 5 раз, т.е. частота варианты 2 равна 5.

Сделав то же для других оценок, найдем их частоты: 5,3,2,11,9,4,5,1

(можно проверить: 5+3+2+11+9+4+5+1 = 40).

Вычислив остальные частоты, составим таблицу и строим графики.


Варианта

2

3

5

6

7

8

9

10

Всего 8

Частота варианты

5

3

2

11

9

4

5

1

Сумма 40

(слайд 16)

Полигон частот

1 2 3 4 5 6 7 8 9 10 варианта

Из урожая картофеля, собранного на одной из опытных делянок, случайным образом было отобрано 25 клубней, в которых подсчитывалось число глазков. Результат оказался следующий:

6, 9, 5, 10, 7, 9, 8, 10, 9, 10, 8, 11, 9, 12, 9, 10, 8, 10, 11, 9, 10, 9, 8, 7, 11.

Требуется построить вариационный ряд, столбчатую диаграмму (вариант; частота).

Решение: (слайд 20)

Чтобы разобраться в этих данных, расположим из в порядке возрастания числовых значений признака, т.е. ранжируем таким образом, чтобы посчитать, сколько раз каждая варианта (хi) встречается в данной совокупности. Получим ряд: 5, 6, 7, 7, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9,10, 10, 10, 10, 10, 10, 11, 11, 11, 12. Так как признак варьирует в пределах от 5 до 12 единиц, то вариационный ряд представим следующим образом:


  1. Подготовиться к контрольной работе.

  2. І и ІІ уровень № 607, № 610

  3. ІІІ и ІV уровни № 615, №617

Итог урока:

Подводя итоги, хотелось бы сказать, что статистическое наблюдение - интересная и занимательная область математики. Статистические наблюдения используются практически везде, где только можно обусловить их применение. Вместе с тем, несмотря на обширную область применения, статистические наблюдения являються довольно-таки сложным предметом и ошибки нередки. Однако в целом наблюдения как предмет для рассмотрения представляют собой большой интерес.

И в завершении хочу сказать:

«Не нужно нам владеть клинком,

Не ищем славы громкой ,

Тот побеждает, кто знаком

Приложение 1



  • По вертикали

  • 1. Число данного ряда, которое окажется посередине, если этот ряд упорядочить

  • 2. Числа, которые показывают сколько раз, повторялось каждое значение варианта.

  • 4. Среднее … ряда чисел – это частное от деления суммы этих чисел на число слагаемых

  • 6. Разность между наибольшим и наименьшим из чисел

Приложение 2 (карточки с задачами)
Задача 1
Возраст девятиклассников:

14, 14, 13, 14, 14, 15, 14, 13, 13, 14, 14, 14, 15, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15


  1. Ранжировать ряд

  2. Составить статистическую таблицу

  3. Найти среднее арифметическое, размах, моду и медиану.

В таблице указано количество книг, прочитанных каждым из учеников за летние каникулы:

Найдите среднее арифметическое, медиану и моду этого набора чисел.


Аня

Витя

Игорь

Оля

Петя

Катя

Лена

Саша

8

10

6

1

0

8

5

3

Задача 4
Составьте статистическую таблицу и постройте полигон частот и гистограмму, по

результатам письменного экзамена по математике: 6,7,7,8,9,2,10,6,5,6,7,3,7,9,9,2,3,2,6,6,

6,7,8,8,2,6,7,9,7,5,9,8,2,6,6,3,7,7,6,6
Задача 5
Ученик засекал в течение недели время, которое он тратит на дорогу в школу и из школы.

На сколько минут в среднем дорога из школы дольше дороги в школу?


День

Пн

Вт

Ср

Чт.

Пт.

В школу (мин)

19

20

21

17

22

Из школы (мин)

28

22

20

25

24

Задача 6
Из урожая картофеля, собранного на одной из опытных делянок, случайным образом было отобрано 25 клубней, в которых подсчитывалось число глазков. Результат оказался следующий:

6, 9, 5, 10, 7, 9, 8, 10, 9, 10, 8, 11, 9, 12, 9, 10, 8, 10, 11, 9, 10, 9, 8, 7, 11.

Требуется построить вариационный ряд, столбчатую диаграмму (вариант; частота).

Мой мальчик, ты должен верить в Бога несмотря на все то, что тебе говорят священники. Марго Асквит
ещё >>

Презентация на тему: " Элементы математической статистики Тема: Предмет и задачи математической статистики. Представление данных." — Транскрипт:

2 Элементы математической статистики Тема: Предмет и задачи математической статистики. Представление данных.

3 Определение Современную математическую статистику определяют как науку о принятии решений в условиях неопределённости.

4 Задача математической статистики Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов. Математическая статистика Математическая статистика возникла в XVII веке и развивалась параллельно с теорией вероятностей. Дальнейшее развитие (вторая половина XIX века – начало XX века) обязано, в первую очередь, П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову, а так же К. Гауссу, А. Кетле, Ф. Гальтону, К. Пирсону и другие. XX век – советские учёные : В. И. Романовский, Е. Е. Слуцкий, А. Н. Колмогоров. Английские: Стьюдент, Фишер, Смирнов. Американские:С. Нейман, Вальд.

5 Генеральная и выборочная совокупность Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты.

6 Def: Выборочной совокупностью или выборкой называют совокупность случайно отобранных объектов. Def: Генеральной совокупностью называют совокупность объектов из которых производится выборка. Def: Объемом совокупности называют число объектов этой совокупности. Определения выборочной и генеральной совокупности

7 Репрезентативность выборки Репрезентативность выборки. Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулирует так: выборка должна быть репрезентативной (представительной).

8 В силу закона больших чисел можно утверждать, больших что выборка будет репрезентативной, если её осуществлять случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.

10 Признаки делятся на качественные и количественные. Качественные: окраска цветов, особи разного пола и масти (серые, вороные, гнедые, пёстрые и другие), цвет глаз и волос. Альтернативные признаки ( женщина и мужчина, высокий и низкий). Количественные признаки поддаются непосредственному измерению или счёту. Их делят на мерные или метрические, и счётные или меристические. Мерные признаки: длина колосьев урожайность, мясная и молочная, продуктивность животных. Счётные признаки: число зёрен или колосков в колосьях, яйце- носкость и другие. Порядковые признаки – объекту приписывают числа или баллы.

11 Определение: Характерным свойством биологических признаков является варьирование величины признаков в определённых пределах при переходе от одной единицы наблюдений к другой. Эти колебания величины одного и того же признака, наблюдаемые в массе однородных членов статистической совокупности, называют вариациями ( от латинского variatio – изменение, колебания), а отдельные числовые значения варьирующего признака принято называть вариантами (от латинского variants, variantis - различимый, изменяющийся)

12 Def: Вариационным рядом или рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности. Определение

13 Определение Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности называются частотами и обозначается строчной буквой латинского алфавита n i Общая сумма частот вариационного ряда равна объёму данной совокупности, т.е. n-общее число наблюдений.

14 Определение Частоты выражают не только абсолютными, но и относительными числами в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях частоты называют относительными.

15 Статистическое распределение можно задать так же в виде последовательности интервалов и соответствующих им частот ( в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал). И НТЕРВАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

16 Пример: Из урожая картофеля, собранного на одном из опытных делянок, случайным способом, т.е. наугад, отобрано 20 клубней, в которых подсчитывали число глазков. Результаты подсчёта оказались следующими:

17 Проранжируем ряд Под ранжированием (от французского ranger – выстраивать в ряд по ранжиру т.е. по росту) понимают расположение членов ряда в возрастающем ( или убывающем) порядке Распределение абсолютных частот Растянутое, некомпактное представление: строится интервальное распределение. Число интервалов (классов) К определяется по правилу. XiXi nini nini nini

Читайте также: