Конспект урока "Построение регрессионных моделей с помощью табличного процессора" 10 класс

Тема: Построение регрессионных моделей с помощью табличного процессора
Класс: 10
Тип урока: комбинированный
Цели: знакомство с понятием регрессионной модели, освоение способов построения по
экспериментальным данным регрессионной модели и тренда средствами MS Excel.
Используемые технические и программные средства: компьютеры,
мультимедиапроектор, табличный процессор Ms Excel.
План урока
1.Организационный момент
2.Устный опрос
Какие вам известны формы представления зависимостей между величинами?
Что такое математическая модель?
Может ли математическая модель включать в себя только константы?
Приведите пример известной вам функциональной зависимости между
характеристиками некоторой системы?
3.Изучение нового материала
Современный подход к управлению, управленческим кадрам предполагает наличие
умений решать целый ряд задач. Например, анализ связи между несколькими
независимыми переменными и зависимой переменной.
Примеры:
a) Агент по продаже недвижимости мог бы вносить в каждый элемент реестра размер
дома квадратных метрах), число спален, средний доход населения в этом районе в
соответствии с данными переписи и субъективную оценку привлекательности дома.
Как только эта информация собрана для различных домов, было бы интересно
посмотреть, связаны ли и каким образом эти характеристики дома с ценой, по которой
он был продан. Например, могло бы оказаться, что число спальных комнат является
лучшим предсказывающим фактором для цены продажи дома в некотором
специфическом районе, чем "привлекательность" дома (субъективная оценка). Могли
бы также обнаружиться и "выбросы", т.е. дома, которые могли бы быть проданы
дороже, учитывая их расположение и характеристики.
b) Специалисты по кадрам обычно решают задачи определения вознаграждения
адекватного выполненной работе. Можно определить некоторое количество факторов
или параметров, таких, как "размер ответственности" или "число подчиненных",
которые, как ожидается, оказывают влияние на стоимость работы. Кадровый аналитик
затем проводит исследование размеров окладов среди сравнимых компаний на рынке,
записывая размер жалования и соответствующие характеристики (т.е. значения
параметров) по различным позициям.
Ясно, что для решения данных задач необходимо построить математические
модели, т.е. получить формулы зависимости, например, уровня заработной платы от
"размера ответственности" или "числа подчиненных"; цены дома от количества спален,
района и т.д.
Вид функции ни в одном, ни в другом случае неизвестен, их следует искать
методом подбора по экспериментальным данным. Понятно также, что график искомых
функций должен проходить близко к точкам диаграмм экспериментальных данных. Если
строить графики точно через все полученные точки, то модели математические виды
функций могут оказаться очень сложными. Кроме того, экспериментальные значения
являются приближенными (так оценка дома с точки зрения привлекательности
субъективна).
Отсюда следуют основные требования к искомым функциям:
Они должны быть достаточно простыми для использования в дальнейших
вычислениях;
Графики функций должны проходить вблизи экспериментальных точек так, чтобы
отклонения этих точек от графика были минимальны и равномерны.
Решать данные задачи можно, даже не зная глубоко математику, стоящую за
применяемым аппаратом. Главное представлять суть решаемой проблемы, уметь собирать
информацию и вводить в компьютер исходные данные, интерпретировать полученные
результаты. Самым простым и доступным средством решения задачи в данном случае
будет Ms Excel. - универсальная система обработки данных, которая может
использоваться для анализа и представления данных в наглядной форме.
Разрешим, например, вопрос о связи между занятостью и полом на Амурском
рынке труда.
a) Для этого заполним таблицу:
2000
2001
2002
2003
2004
2005
2006
Женщины
36415
24015
23847
22776
28149
20219
17991
Мужчины
29705
30452
24558
24152
20171
23618
18312
b) Построим точечную диаграмму.
c) Построим модель, показывающую связь между полом и занятость на Амурском
рынке труда в период с 2000 – 2006 гг.
В данном случае модель имеет полиномиальный вид (полином 4 степени).
d) Проанализируем полученные модели. Можно предположить, что с
периодичностью 2-3 года происходит перераспределение количества безработных
мужчин и женщин, т.е. если увеличивается количество безработных женщин,
уменьшается количество безработных мужчин и наоборот. Построенные графики
позволяют сделать предположение о том, что, данные функции имеют тенденцию
рисунок 1.
монотонного убывания, т.е. численность безработных мужчин и женщин постепенно
выравнивается.
Полученные функции, графики которых приведены на рисунке 1, принято называть в
статистике регрессионными моделями. Регрессионная модель это функция,
описывающая зависимость между количественными характеристиками сложных систем.
График регрессионной модели называется трендом. Получение регрессионной модели
происходит в два этапа:
подбор вида функции;
вычисление параметров функции.
Чаще всего выбор производится среди следующих функций:
у = ax+b линейная функция;
y = ax
2
+bx+c квадратичная функция (полином второй степени);
y = aln(x)+b логарифмическая функция;
y = ae
bx
- экспоненциальная функция;
y = ax
b
- степенная функция.
Если Вы выбрали (сознательно или наугад) одну из предлагаемых функций, то
следующим шагом нужно подобрать параметры (a,b,c и пр.) так, чтобы функция
располагалась как можно ближе к экспериментальным точкам.
На графике присутствует еще одна величина, полученная в результате построения
тренда. Она обозначена как R
2
. В статистике эта величина называется коэффициентом
детерминированности. Именно она определяет, насколько удачной является полученная
регрессионная модель.
R
2
всегда заключен в диапазоне от 0 до 1.
Если R
2
1, то функция точно проходит через табличные значения, если R
2
= 0, то
выбранный вид модели предельно неудачен. Чем ближе R
2
к 1, тем удачнее
регрессионная модель.
4. Практическая работа «Построение регрессионных моделей с помощью табличного
процессора».
Задание для практической работы с описанием алгоритма построения моделей раздается
каждому ученику.
Задание
Алгоритм получения регрессионной модели по МНК с построением тренда с помощью Ms
Excel:
1. Ввести табличные данные:
Концентрация примесей в
воздухе
С, мг/куб.м
Уровень
заболеваемости
Р, бол./тыс.
2
19
2,5
20
2,9
32
3,2
34
3,6
51
3,9
55
4,2
90
4,6
108
5
171
2. Построить точечную диаграмму (график) по столбцу 2;
3. Выделить диаграмму (щелкнуть мышью по полю диаграммы);
4. Выполнить команду: Диаграмма Добавить линию тренда;
5. В открывшемся окне на закладке «Тип» выбрать «Линейный тренд»;
6. Перейти к закладке «Параметры»; установить галочки на флажках «показывать
уравнения на диаграмме» и «поместить на диаграмму величину
достоверности аппроксимации R
2
», щелкнуть по кнопке ОК.
Аналогично построить графики и другие типы трендов, не удаляя предыдущие
результаты. Квадратичный тренд получается путем выбора полиномиального типа
функции с указанием степени 2. На рабочем листе должно получиться 6 графиков.
Выберите тот график с трендом, который (на Ваш взгляд) наиболее приближается к
экспериментальным данным и выполните для этого графика следующие действия.
7. По данным из следующей таблицы постройте с помощью Ms Excel линейную,
экспоненциальную и т.д. регрессионные модели. Выберите лучшую модель.
Х
2
4
6
8
10
12
14
16
18
20
22
24
26
28
У
44
32
35
40
30
27
21
25
20
23
18
19
20
16
8. Лучшую модель разместите на отдельном листе диаграмм.
5.Физкультминутка
o Закрыть глаза, не напрягая глазные мышцы, на счет 1-4, широко раскрыть глаза и
посмотреть вдаль на счет 1-6. Повторить 4-5 раз.
o Посмотреть на кончик носа на счет 1-4, а потом перевести взгляд вдаль на счет 1-6.
Повторить 4-5 раз.
o Не поворачивая головы (голова прямо), делать медленно круговые движения глазами
вверх вправо вниз влево и в обратную сторону: вверх влево вниз вправо.
Затем посмотреть вдаль на счет 1-6. Повторить 4-5 раз.
o При неподвижной голове перевести взор с фиксацией его на счет 1-4 вверх, на счет
1-6 прямо; после чего аналогичным образом вниз прямо, вправо прямо, влево
прямо. Проделать движение по диагонали в одну и другую стороны с переводом глаз
прямо на счет 1-6. Повторить 3-4 раза.
6. Домашнее задание
1.Конспект.
2.По данным Территориального органа Федеральной службы государственной
статистики по Амурской области (www.stat.amur.ru) (Федеральной службы
государственной статистики http://www.gks.ru/) постройте регрессионную модель
зависимости занятости от возраста за последний доступный период.
Использованные источники
1. Семакин И.Г. Информатика 11-й класс/ И.Г. Семакин, Е.К. Хеннер М.: БИНОМ.
Лаборатория знаний, 2002
2. http://festival.1september.ru/articles/312516/
3. СанПиН 2.2.2.542-96. Приложение 16 (http://spinet.ru/kendh/sanpin/pr16.php)
4. http://dvo.sut.ru/libr/opds/i130hod2/7.htm
5. www.stat.amur.ru
6. http://www.gks.ru/)