Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save anonymous/ea268287bbafc7b9ec400642f5809c63 to your computer and use it in GitHub Desktop.
Save anonymous/ea268287bbafc7b9ec400642f5809c63 to your computer and use it in GitHub Desktop.
Стандартное отклонение результатов тестирования

Стандартное отклонение результатов тестирования - Шкалирование результатов тестирования


Стандартное отклонение результатов тестирования



Расчет среднего значения и стандартного отклонения тестовой оценки
Обработка результатов тестирования и определение качества теста. Олейник
Расчет среднего арифметического результатов тестирования
Расчет среднего арифметического результатов тестирования
Обработка результатов тестирования и определение качества теста. Олейник
Расчет среднего арифметического результатов тестирования













Для характеристик степени рассеяния отдельных значений вокруг среднего используются различные меры: Размах измеряет на шкале расстояние, в пределах которого изменяются все значения показателя в распределении. Например, распределения индивидуальных баллов табл. Вариационный размах легко вычисляется, но используется крайне редко при характеристике распределения баллов по тесту. И для этого есть веские основания. Во-первых, размах является весьма приближенным показателем, так как не зависит от степени изменчивости промежуточных значений, расположенных между крайними значениями в распределении баллов по тесту. Во-вторых, крайние значения индивидуальных баллов, как правило, ненадежны, поскольку содержат в себе значительную ошибку измерения. В этой связи более удачной мерой считается дисперсия. Подсчет дисперсии основан на вычислении отклонений каждого значения показателя от среднего арифметического в распределении. Для индивидуальных баллов значения отклонений несут информацию о вариации совокупности значений баллов N учеников, т. Совокупность с большей неоднородностью будет иметь большие по модулю отклонения, наоборот, для однородных распределений отклонения должны быть близки к нулю. Знак отклонения указывает место результата ученика по отношению к среднему арифметическому по тесту. Для ученика с индивидуальным баллом выше среднего значение разности будет положительно, а для тех, у кого результат ниже , отклонение меньше нуля. Например, в распределении баллов со средним значением из табл. Если просуммировать все отклонения, взятые со своим знаком, то для симметричных распределений сумма будет равна нулю. В рассматриваемом примере сумма отклонений. Для преодоления этого эффекта каждое отклонение возводят в квадрат и находят сумму квадратов отклонений: Величина суммы зависит также от размера выборки учеников, выполнявших тест. Зависимость здесь вполне очевидна: Поэтому при сравнении мер изменчивости распределений, отличающихся по объему, возникает препятствие, которое снимается путем деления каждой суммы на N - 1, где N — число учеников, выполнявших тест. Определяемая таким образом мера изменчивости называется дисперсией. Она обычно обозначается символом и вычисляется по формуле. В примере вычислялась просто в силу того, что среднее арифметическое было целым числом. На практике, как правило, приходится иметь дело с дробными значениями , что делает использование формулы 2 крайне утомительным. Кроме дисперсии, для характеристики меры изменчивости распределения удобно использовать еще один показатель вариации, который называется стандартным отклонением. Стандартное отклонение равно корню квадратному из дисперсии:. Стандартное отклонение не следует путать со средним отклонением, последнее находится по формуле. Дисперсия играет важную роль в оценке качества нормативно-ориентированных тестов. Слабая вариация результатов испытуемых указывает на низкое качество теста. Основания для подобного вывода вполне прозрачны. Низкая дисперсия индивидуальных баллов говорит о слабой дифференциации испытуемых по уровню подготовки в тестируемой группе, то есть о той ситуации, которая диаметрально противоположна основной цели создания нормативно-ориентированного теста. Излишне высокая дисперсия, характерная для случая, когда все учащиеся отличаются по числу выполненных заданий, также грозит неприятными последствиями и требует переработки теста. Превышение разумных пределов величины дисперсии приводит к искажению вида распределения, которое начинает существенно отличаться от планируемой теоретической нормальной кривой. При переработке теста следует руководствоваться простым правилом: Конечно, использовать какой-либо из существующих критериев для проверки нормальности распределения в практике довольно неудобно. Поэтому зачастую непрофессионалы в оценке характера распределения руководствуются простым соотношением. Для этого величину X сравнивают с утроенным стандартным отклонением. Если это равенство выполняется, то есть если. Наличие асимметрии легко установить визуально, анализируя полигон частот или гистограмму. Более тщательный анализ можно провести с помощью обобщенных статистических характеристик, предназначенных для оценки асимметрии в распределении. Отрицательная, нулевая, положительная асимметрия. Наиболее удачная формула для подсчета асимметрии имеет вид. После подстановки данных из рассматриваемого выше примера табл. При интерпретации полученного значения асимметрии 0,2 необходимо обратить внимание на то, что вклад положительных значений кубов разностей будет больше кубов отрицательных значений, но ненамного, поэтому величинa асимметрии получилась положительной и небольшой. Таким образом, асимметрия распределения положительна, если основная часть значений индивидуальных баллов лежит справа от среднего значения, что обычно характерно для излишне легких тестов. Асимметрия распределения баллов отрицательна, если большинство учеников получили оценки ниже среднего балла. Эффект отрицательной асимметрии встречается в излишне трудных тестах, не сбалансированных правильно по трудности при отборе заданий в тест. В хорошо сбалансированном по трудности тесте, как уже отмечалось ранее, распределение баллов имеет вид нормальной кривой. Для нормального распределения характерна нулевая асимметрия, что вполне естественно, так как при полной симметрии каждое значение балла, меньшее , уравновешивается другим симметричным, большим, чем. С помощью эксцесса можно получить представление о том, являются ли полигон частот или гистограмма островершинными или плоский. Островершинная, средневершинная и плоская кривые. Первая кривая А — островершинная, имеет явно выраженный положительный эксцесс, вторая кривая В — средневершинная, имеет нулевой эксцесс, характерный для нормальной кривой, третья кривая С — плосковершинная, кривые такого типа имени эксцесс меньше нуля. Обычно эксцесс вычисляется по формуле. Для рассматриваемого примера см. Более того, интерпретация результата, указывающего на крутизну кривой распределения, возможна в сравнительно небольшой окрестности моды и теряет свой смысл по мере удаления вдоль кривой. В том случае, когда распределение данных бимодально имеет две моды , необходимо говорить об эксцессе в окрестности каждой моды. Бимодальная конфигурация указывает на то, что по результатам выполнения теста выборка учеников разделилась на две группы. Одна группа справилась с большинством легких, а другая с большинством трудных заданий теста. Один из наиболее важных выводов в случае бимодального распределения нацелен на коррекцию трудности заданий теста. По-видимому, в тесте недостаточно представлены задания средней трудности, позволяющие выровнять распределение баллов, приблизив его к нормальной кривой. В заключение необходимо провести проверку значимости найденных значений асимметрии и эксцесса. Для этого необходимо добавить информацию о принимаемом уровне риска допустить ошибку в статистическом выводе. Девятый шаг предназначен для вычисления показателей связи между результатами учеников по отдельным заданиям теста. При оценке качества заданий важно понять, существует ли тенденция, когда одни и те же ученики добиваются успеха в какой-либо паре заданий теста. Либо, наоборот, такой тенденции, указывающей на связь результатов, нет, и состав учеников, добивающихся успеха, полностью меняется при переходе от одного задания к другому в тесте. Очевидно, для ответа на поставленные вопросы необходимо провести анализ данных, собрав их в таблицу. Однако такой визуальный анализ данных — дело достаточно утомительное, а для больших выборок и просто невозможное. Поэтому обычно ответ на вопрос о существовании связи между двумя наборами данных получают с помощью корреляции. Корреляция в широком смысле слова означает связь между явлениями и процессами, Однако для исследования связи установить ее наличие недостаточно, необходимо также правильно выбрать ее вид и форму показателя, предназначенного для оценки меры связи между явлениями. Связь между двумя наборами данных?? Диаграмма рассеяния, показывающая связь результатов тестирования группы школьников по математике X с результатами тестирования по физике Y. Диаграмма указывает на наличие слабой положительной связи, однако не позволяет ввести обобщенную ее меру. Примеры различного вида диаграмм, позволяющих графически интерпретировать характер связи между наборами данных X и Y , приведены на рис. Графическая интерпретация видов связи. Для повышения сопоставимости оценок показателей связи по выборкам с различной дисперсией ковариацию делят на стандартные отклонения. Таким образом, необходимо разделить на и , где и — стандартные отклонения по множествам X и Y соответственно. В результате получается величина, которая называется коэффициентом корреляции Пирсона:. Анализ значений коэффициента корреляции в табл. По данным таблицы, задание 3 отрицательно коррелирует с заданиями 7, 8, 9 и 10 теста. В них просматривается только один минус на месте, соответствующем заданию теста 3, которое в свою очередь отрицательно коррелирует с четырьмя заданиями теста. Аналогичная ситуация наблюдается в столбце, соответствующем заданию 8 теста. Отрицательные значения коэффициента корреляции указывают на определенный просчет разработчиков в содержании заданий 3 и 8 теста. Наиболее распространенная причина — отсутствие предметной чистоты содержания — нередко встречается при разработке самых разных тестов. Понятно, что предметная чистота — скорее идеализируемое, чем реальное требование к содержанию любого теста. Например, в тесте по физике всегда встречаются задания с большим количеством математических преобразований, в тесте по биологии — задания, требующие серьезных знаний по химии, в тесте по истории — задания рассчитанные на выявление культурологических знании, и т п. Поэтому говорить об отсутствии пересечения содержания заданий одной учебной дисциплины с содержанием другой в чистом виде не приходится. Можно лишь стремиться к тому, чтобы при выполнении каждого задания доминировали знания по проверяемому предмету. По-видимому, противоположная ситуация наблюдалась в заданиях 3 и 8, отрицательные значения корреляции по которым указывают на отсутствие связи их содержания с содержанием других заданий теста. Таким образом, задания 3 и 8 для повышения гомогенности содержания необходимо удалить из теста. Конечно, окончательное решение остается за автором, поскольку оно бессмысленно без тщательного анализа содержания заданий теста. Правда, подобное решение об удалении заданий может быть принято в том случае, когда эмпирические результаты собраны по репрезентативной выборке учеников. Если представительность выборки не достигнута, то появление минусов может не отражать ни в коей мере реальную ситуацию с содержанием заданий теста. Для тематических тестов высокая корреляция между задания ми неизбежна, так как задания отражают слабо варьирующее, исходное содержание, что вполне оправдано назначением теста. Однако для итоговых тестов высокой корреляции между заданиями по возможности стараются избегать тестов, оценивающих одинаковые содержательные элементы, поскольку вряд ли имеет смысл включать в итоговый тест несколько заданий. Поэтому в итоговых тестах обычно стремятся к невысокой положительной корреляции, когда значения коэффициента варьируют в интервале 0; 0,3 и каждое задание привносит свой специфический вклад в общее содержание теста. На десятом шаге с помощью подсчета значений коэффициента бисериальной корреляции оценивается валидность отдельных заданий теста. Коэффициент бисериальной корреляции используется в том случае, когда один набор значений распределения задается в дихотомической шкале, а другой — в интервальной. Тогда в качестве показателя связи между распределениями выбирают бисериальный коэффициент. Под эту ситуацию подпадает подсчет корреляции между результатами выполнения каждого задания дихотомическая шкала и суммой баллов испытуемых интервальная или квазиинтервальная шкала по заданиям теста. Формула для подсчета, полученная по результатам вывода, имеет вид. Вычисление по формуле 9 требует использования специальных таблиц для нахождения ординат стандартной нормальной кривой и определенной математической подготовки. Анализ значений коэффициента бисериальной корреляции в табл. Полученный вывод дает ценную информацию о низкой валидности заданий 3 и 8 теста. Эти задания следует признать неудачными и для улучшения теста их необходимо удалить. В целом задание можно считать валидным, когда значение Под этот критерий подпадают все, кроме двух заданий третьего и восьмого рассматриваемого примера матрицы теста. Оценка валидности задания позволяет судить о том, насколько задание пригодно для работы в соответствии с общей целью создания теста. Если эта цель — дифференциация учеников по уровню подготовки, то валидные задания должны четко отделять хорошо подготовленных от слабо подготовленных учеников тестируемой группы. Решающую роль в оценке валидности задания играет разность. Чем выше значение этой разности, тем лучше работает задание на общую цель дифференциации испытуемых, выполняющих тест. Главная Опубликовать работу О сайте. Контрольно-измерительные материалы КИМы и интерпретация результатов тестирования. Сохрани ссылку на реферат в одной из сетей: В рассматриваемом примере сумма отклонений что, конечно, не позволяет оценить меру неоднородности распределения, поскольку отрицательные и положительные слагаемые уничтожают друг друга. Тогда сумма вида будет большой, если результаты тестирования отличаются существенной неоднородностью, и малой — в случае близких результатов испытуемых по тесту. Для рассматриваемого примера Величина суммы зависит также от размера выборки учеников, выполнявших тест. Она обычно обозначается символом и вычисляется по формуле 2 Для рассматриваемого примера В примере вычислялась просто в силу того, что среднее арифметическое было целым числом. Стандартное отклонение равно корню квадратному из дисперсии: Если это равенство выполняется, то есть если?? Наиболее удачная формула для подсчета асимметрии имеет вид Асимметрия 5 где — индивидуальный балл i -го ученика; — среднее значение баллов по тестируемой группе; — куб стандартного отклонения; N — число учеников. Обычно эксцесс вычисляется по формуле Эксцесс , 6 где все обозначения остались прежними. В результате получается величина, которая называется коэффициентом корреляции Пирсона:


Сколько стоит куб горячей воды в ярославле
Кино без прав
Мощный стабилизатор на полевых транзисторах схема
Таблица квадратов числа 2
Развитие понятия парадигма
Математические стихи 5 класс
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment