Конспект урока "Корреляционные зависимости" 10 класс

Тема: Корреляционные зависимости
Класс: 10
Тип урока: комбинированный
Цели:
получение представлений о корреляционной зависимости величин;
Освоение способа вычисления коэффициента корреляции с помощью функции
КОРЕЛЛ
Используемые технические и программные средства: компьютеры,
мультимедиапроектор, табличный процессор MS Excel.
План
1. Организационный момент.
2. Проверка домашнего задания.
Д/з сбор данных (за 2-3 недели): число часов, затрачиваемых на выполнение
домашних заданий и средняя оценка.
3. Изучение нового материала.
Величины, характеризующие различные свойства объектов, могут быть
независимыми или взаимосвязанными. Различают два вида зависимостей между
величинами (факторами): функциональную и статистическую.
При функциональной зависимости двух величин значению одной из них
обязательно соответствует одно или несколько точно определенных значений другой
величины. Функциональная связь двух факторов возможна лишь при условии, что вторая
величина зависит только от первой и не зависит ни от каких других величин.
Функциональная связь одной величины с множеством других возможна, если эта
величина зависит только от этого множества факторов. В реальных ситуациях существует
бесконечно большое количество свойств самого объекта и внешней среды, влияющих
друг на друга, поэтому такого рода связи не существуют, иначе говоря, функциональные
связи являются математическими абстракциями. Их применение допустимо тогда, когда
соответствующая величина в основном зависит от соответствующих факторов.
Воздействие общих факторов, наличие объективных закономерностей в поведении
объектов приводят к проявлению статистической зависимости.
Статистической называют зависимость, при которой изменение одной из величин
влечет изменение распределения других (другой), и эти другие величины принимают
некоторые значения с определенными вероятностями. Функциональную зависимость в
таком случае следует считать частным случаем статистической: значению одного фактора
соответствуют значения других факторов с вероятностью, равной единице. Однако на
практике такое рассмотрение функциональной связи применения не нашло.
Более важным частным случаем статистической зависимости является
корреляционная зависимость, характеризующая взаимосвязь значений одних случайных
величин со средним значением других, хотя в каждом отдельном случае любая
взаимосвязанная величина может принимать различные значения.
Рассмотрим некую сложную систему. Пусть важной характеристикой этой сложной
системы является фактор А, на него могут оказывать влияние одновременно многие
другие факторы: В, С, D. и т.д. Рассмотрим два типа задач:
1. Определение наличия какого-либо заметного влияния на фактор А со стороны
фактора В
2. Ответ на вопрос: Какие из факторов В, С, D и т.д. оказывают наибольшее влияние
на фактор А?
Если в качестве сложной системы рассмотреть школу, то фактором А может быть
средняя успеваемость учащихся школы, В финансовые расходы школы на
хозяйственные нужды, С уровень квалификации учителей, D контингент учащихся, Е -
уровень ТСО и другие.
Для выявления зависимости от какого-либо определенного фактора, необходимо
максимально исключить влияние других факторов. Например, собирая информацию о
разных школах, нужно выбирать такие, в которых приблизительно одинаковый
контингент учеников, квалификация учителей, обеспеченность учебникам и пр., однако
при этом хозяйственные расходы школ разные (наличие/отсутствие спонсоров, и другие
причины).
Задача. Найти наличие/отсутствие взаимосвязи между финансовыми затратами
школы на одного ученика и средней успеваемостью.
Решение:
Хозяйственные расходы школы выразим количеством рублей, отнесенных к числу
учеников в школе (руб./чел.), потраченных за определенный период времени (последние
3-5 лет). Успеваемость - средний балл учеников по результатам окончания последнего
учебного года. В статистических расчетах обычно используются относительные и
усредненные величины. Итоги сбора информации представим в табличной форме.
Номер школы
Фактор
А
В
С
Успеваемость
(ср.балл)
Затраты
(руб/чел.)
Уровень
квалификации
(ср. катег.)
..
Построим точечные диаграммы по данным: затраты-успеваемость; успеваемость-
категорийность.
Значения величин: финансовых затрат и успеваемости имеют значительный
разброс и, на первый взгляд взаимосвязи между ними не видно. Однако она вполне может
существовать.
Зависимости между величинами, каждая из которых подвергается не
контролируемому полностью разбросу, называются корреляционными зависимостями.
Раздел математической статистики, который исследует такие зависимости,
называется корреляционным анализом. Корреляционный анализ изучает усредненный
закон поведения каждой из величин в зависимости от значений другой величины, а также
меру такой зависимости.
Корреляционная зависимость определяется различными параметрами, среди
которых наибольшее распространение получили показатели, характеризующие
взаимосвязь двух случайных величин (парные показатели): корреляционный момент,
коэффициент корреляции.
Оценку корреляции величин начинают с высказывания гипотезы о возможном
характере зависимости между значениями. Чаще всего допускают наличие линейной
зависимости. В таком случае мерой корреляционной зависимости является величина,
которая называется коэффициентом корреляции.
Коэффициент корреляции:
обычно обозначается греческой буквой ρ;
находится в диапазоне-1<ρ<+1;
если значение ρ по модулю близко к 1, то имеет место сильная корреляция, если к
0, то слабая;
близость ρ к +1 означает, что возрастанию одного набора значений соответствует
возрастание другого набора, близость к -1 означает обратное;
значение ρ легко найти с помощью MS Excel, т.к. данная функция является
встроенной.
В MS Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и
входит в группу статистических функций.
Алгоритм использования функции КОРРЕЛ:
установить курсор в любую свободную ячейку на листе, где находится таблица, и
запустите функцию КОРРЕЛ;
укажите необходимые диапазоны значений
после ввода диапазонов получите значение ρ.
4. Практическая работа «Расчет корреляционных зависимостей в MS Excel»
a. Внести в таблицу данные, полученные в ходе выполнения домашнего
задания
Число часов
Средняя оценка
b. Построить с помощью Мастера диаграмм точечную диаграмму, визуально
отображающую табличную зависимость.
c. Ответить на вопрос, можно ли на основании этой точечной диаграммы
выдвинуть гипотезу о наличии линейной корреляции между величинами.
d. Используя функцию КОРРЕЛ найти коэффициент корреляции и
подтвердить или опровергнуть указанную гипотезу.
5. Физкульминутка
Закрыть глаза, сильно напрягая глазные мышцы, на счет 1-4, затем раскрыть
глаза, расслабив мышцы глаз, посмотреть вдаль на счет 1-6. Повторить 4-5 раз.
Посмотреть на переносицу и задержать взор на счет 1-4. До усталости глаза не
доводить. Затем открыть глаза, и посмотреть вдаль на счет 1-6. Повторить 4-5
раз.
Не поворачивая головы, посмотреть направо и зафиксировать взгляд на счет 1-
4, затем посмотреть вдаль прямо на счет 1-6. Аналогичным образом
проводятся упражнения. Но с фиксацией взгляда влево, вверх и вниз.
Повторить 3-4 раза.
Перенести взгляд быстро по диагонали: направо вверх - налево вниз, потом
прямо вдаль на счет 1-6; затем налево вверх направо вниз и посмотреть вдаль
на счет 1-6. Повторить 4-5 раз.
6. Домашнее задание на выбор:
1) Придумайте таблицу парных измерений значений некоторых величин, между
которыми существует гипотетическая корреляционная зависимость.
2) По данным Территориального органа Федеральной службы государственной
статистики по Амурской области (www.stat.amur.ru) составьте таблицу парных
измерений количества и пола безработных за последний доступный период.
3) По данным Федеральной службы государственной статистики (http://www.gks.ru/)
составьте таблицу парных измерений количества и пола безработных за последний
доступный период.
Использованные источники
1. Семакин И.Г. Информатика 11-й класс/ И.Г. Семакин, Е.К. Хеннер М.: БИНОМ.
Лаборатория знаний, 2002
2. СанПиН 2.2.2.542-96. Приложение 16 (http://spinet.ru/kendh/sanpin/pr16.php)
3. http://dvo.sut.ru/libr/opds/i130hod2/7.htm
4. www.stat.amur.ru
5. http://www.gks.ru/