Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save anonymous/3894a44bebca92921335879894705b2b to your computer and use it in GitHub Desktop.
Save anonymous/3894a44bebca92921335879894705b2b to your computer and use it in GitHub Desktop.
Метод многомерной классификации

Метод многомерной классификации



Назначеные и классификация многомерных методов.
Многомерные статистические методы и их применение в экономике
Методы многомерной классификации Кучерявский С.В. svk@asu.ru. - презентация

Многомерность свойственна психологическим данным по природе, поскольку они чаще всего состоят по крайней мере из нескольких наблюдений за поведением одного человека или группы лиц. Многомерные методы и были созданы для совместной обработки таких данных, например для их исследований с целью обнаружения присущих им базисных характеристик либо, в случае дедуктивного подхода, для проверки или оценки априорных гипотез в отношении этих данных. В своих лучших образцах многомерный анализ представляет собой обобщение одномерного анализа, так что в тех случаях, когда данные состоят из значений только одной переменной, многомерный метод будет давать тот же результат, что и соответствующий одномерный метод. Так, есть статистики, базирующиеся на многомерном распределении случайных величин, которые можно свести к таким хорошо известным одномерным статистикам, как F-квадрат или t-критерий. Многомерный анализ включает широкий спектр математических статистических методов и, вообще говоря, не существует общепринятого определения границ этой области. По общей договоренности, однако, такие специализированные предметы, как теория надежности или теория латентных черт, не считаются разделами многомерного анализа в силу их обособленных традиций в сфере психол. Методы анализа множественных дихотомических переменных часто рассматриваются и изучаются под своими названиями, например логлинейные модели. Также анализ повторных наблюдений, проведенных на одном человеке или на каком-то др. Список многомерных методов, которые будут упомянуты ниже, не претендует на полноту и состоит из методов, наиболее часто применяемых в психологии. Эти методы можно классифицировать по трем основаниям: Классификация методов по исходным предположениям о структуре данных:. Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами. При этом исследователь ограничен и в направлении поиска: Применение многомерных методов требует соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы STATIST1CA, SPSS, STATGRAPH, STADIA, содержащие практически весь спектр статистических методов — от простейших до самых современных. Стоит обратить внимание на пакет STADIA, поскольку он — отечественный, а потому сравнительно дешевый. Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки. Факторный анализ позволяет решить две важные проблемы исследователя: С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными. Таким образом, можно выделить 2 цели Факторного анализа -определение взаимосвязей между переменными, классификация переменных , т. При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонентов внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей. Например, анализируя оценки, полученные по нескольким шкалам, исследователь замечает, что они сходны между собой и имеют высокий коэффициент корреляции, он может предположить, что существует некоторая латентная переменная, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором. Данный фактор влияет на многочисленные показатели других переменных, что приводит нас к возможности и необходимости выделить его как наиболее общий, более высокого порядка. Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов МГК. Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство МГК также в том, что он — единственный математически обоснованный метод факторного анализа. В обязательные условия факторного анализа входят:. Для решения первой задачи строится пространство канонических дискриминантных функций, которые позволяют с максимальной эффективностью "разделить" классы. Для того чтобы разделить k классов, требуется не более k - 1 канонических дискриминантных функций например, для разделения двух классов достаточно одной функции, для разделения трех классов - двух функций и т. Канонические дискриминантные функции можно рассматривать как аналог регрессии, построенной для целей классификации; дискриминантные исходные переменные являются в них переменными независимыми см. Для измерения абсолютного и относительного вклада дискриминантных переменных в разделение классов используются нестандартизированные и стандартизированные коэффициенты канонических функций. В пространстве канонических дискриминантных функций можно также решать задачу классификации объектов, не принадлежавших к первоначальной выборке. Для этого вычисляются расстояния от каждого "нового" объекта до геометрического "центра" каждого класса. Могут учитываться априорные вероятности принадлежности к классам, а также цена ошибок классификации. Альтернативным подходом к классификации объектов является вычисление классифицирующих функций Фишера - по одной для каждого класса. Эти функции также можно рассматривать как аналог регрессионных уравнений с "независимыми" дискриминантными переменными. Объект относится к тому классу, для которого вычисленное значение классифицирующей функции является максимальным. По ней же оценивается эффективность решающих процедур. Для этого строится специальная классификационная матрица, которая показывает, к какому классу объект принадлежал априорно и в какой класс был классифицирован с помощью канонических дискриминантных или классифицирующих функций. В модели должно быть не менее двух классов, в каждом классе - не менее двух объектов из обучающей выборки, число дискриминантных переменных не должно превосходить объем обучающей выборки за вычетом двух объектов. Дискриминантные переменные должны быть количественными и линейно независимыми не должны коррелировать друг с другом. Выполнение этих требований проконтролировать достаточно легко. Для каждого класса требуется также приблизительное равенство матриц ковариации и многомерная нормальность распределения. Нарушение последнего требования может привести к ошибкам классификации в "пограничных" зонах, где вероятности принадлежности объекта к двум или нескольким классам приблизительно равны. Многомерное шкалирование начало свое интенсивное развитие в х годах в работах американских ученых Торгерсона Torgerson [9], Шепарда Shepard [8], Краскэла Kruskal [6]. Круг советских специалистов, занимающихся этой проблемой, достаточно узок, и основные их усилия направлены на разработку формализованных методов и вычислительных процедур, реализующих известные модели на ЭВМ. К настоящему времени методы многомерного шкалирования, к сожалению, не получили широкого применения в психометрических исследованиях в нашей стране. Видимо, причинами тому являются малочисленность группы специалистов и отсутствие хороших пакетов программ. Задача многомерного шкалирования в самом общем виде состоит в том, чтобы выявить структуру исследуемого множества стимулов. Под выявлением структуры понимается выделение набора основных факторов, по которым различаются стимулы, и описание каждого из стимулов в терминах этих факторов. Процедура построения структуры опирается на анализ объективной или субъективной информации о близостях между стимулами либо информации о предпочтениях на множестве стимулов. В случае анализа субъективных данных решаются одновременно две задачи. С одной стороны, выявляется объективная структура субъективных данных, с другой — определяются факторы, влияющие на процесс принятия решения. Методы многомерного шкалирования могут использовать разные типы данных: Как правило, с каждым типом данных принято соотносить определенную группу методов их обработки. Однако такое соотнесение не должно быть слишком жестким, поскольку часто не представляет особого труда перейти от одного типа данных к другому. Так, например, данные о профилях можно легко преобразовать в данные о близостях, для этого необходимо только воспользоваться подходящей метрикой. Данные о предпочтениях содержат в себе информацию о доминировании. С другой стороны, подсчитав корреляции между столбцами матрицы предпочтений, получим матрицу близостей между стимулами, а корреляции между строками той же матрицы дадут нам матрицу близостей между субъектами. В настоящей работе будет обсуждаться только анализ близостей. В основе многомерного шкалирования лежит идея геометрического представления стимульного множества. Предположим, что нам задано координатное пространство, каждая ось которого соответствует одному из искомых факторов. Каждый стимул представляется точкой в этом пространстве, величины проекций этих точек на оси соответствуют значениям или степеням факторов, характеризующих данный стимул. Чем больше величина проекций, тем большим значением фактора обладает стимул. Мера сходства между двумя стимулами обратна расстоянию между соответствующими им точками. Чем ближе стимулы друг к другу, тем выше мера сходства между ними и ниже мера различия , далеким точкам соответствует низкая мера сходства. Чтобы точным образом измерить близости, необходимо ввести метрику в искомом координатном пространстве; выбор этой метрики оказывает большое влияние на результат решения. Наиболее распространенными ее случаями являются: Использование равномерных метрик предполагает, что при оценке сходств различий субъект в одинаковой мере учитывает все факторы. Когда же имеется основание утверждать, что факторы неравноценны для индивида и он учитывает их в разной степени, прибегают к взвешенной метрике, где каждому фактору приписывается определенный вес. Разные индивиды могут принимать во внимание разные факторы. Тогда каждый индивид характеризуется своим собственным набором весов Wti. Взвешенная метрика Минковского имеет вид:. Геометрически она интерпретируется следующим образом. Схема многомерного шкалирования включает ряд последовательных этапов. На первом этапе необходимо получить экспериментальным способом субъективные оценки различий. Процедура опроса и вид оценок должны выбираться исследователем в зависимости от конкретной ситуации. В результате такого опроса должна быть сконструирована субъективная матрица попарных различий между стимулами, которая будет служить входной информацией для следующего этапа. На втором этапе решается задача построения координатного пространства и размещения в нем точек-стимулов таким образом, чтобы расстояния между ними, определяемые по введенной метрике, наилучшим образом соответствовали исходным различиям между стимулами. Для решения этой формальной задачи не требуется никаких сведений о самих стимулах, достаточно располагать только матрицей попарных различий между ними. Для построения искомого координатного пространства используется достаточно разработанный аппарат линейной или нелинейной оптимизации. Значения координат этих точек и являются решением задачи. Используя эти координаты, мы строим геометрическое представление стимулов в пространстве невысокого числа измерений. Оно должно быть в достаточной степени адекватно исходным данным. Стимулы, которым в исходной матрице соответствуют большие меры различий, должны находиться далеко друг от друга, а стимулы, которым соответствуют малые меры различий, — близко. Формальным критерием адекватности может служить коэффициент корреляции, он должен быть достаточно высоким. Средство повышения точности формального решения состоит в увеличении числа измерений, т. Чем выше размерность пространства, тем больше возможностей получить более точное решение. На третьем этапе решается содержательная задача интерпретации формального результата, полученного на предыдущей стадии. Координатные оси построенного стимульного пространства должны получить смысловое содержание, они должны быть проинтерпретированы как факторы, определяющие расхождения между стимулами. Эта работа является достаточно сложной и может быть выполнена только специалистом, хорошо знакомым с исследуемым материалом. Если на предыдущем этапе достаточно было только информации о попарных различиях между стимулами, то для содержательной интерпретации необходимо тщательное изучение их характеристик. Последнее изменение этой страницы: Все права принадлежать их авторам. Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления. Назначеные и классификация многомерных методов.


Капитан моторс липецк каталог товаров
Кто где воевал в великой отечественной
Как увеличить fps в samp
Можно ли со сбербанка перевести на карту
Автостанция аэропорт симферополь расписание автобусов
Агентский договор подряда
Норма бензина приказ минтранса
Посадить базилик семенами
План развития учреждения здравоохранения
Как извлечь корень в excel
Лямблии у беременных лечение
Политика новости сегодняшнего дня
Как почистить кишечник активированным углем
Скачать елена ваенга гравитация
Услуга везде как дома
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment