Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save anonymous/47331f74ed572bc47198abe45c792a13 to your computer and use it in GitHub Desktop.
Save anonymous/47331f74ed572bc47198abe45c792a13 to your computer and use it in GitHub Desktop.
Многомерные классификации методов

Многомерные классификации методов


Многомерные классификации методов



3. Методы многомерной классификации
Тема: Многомерные статистические методы и их применение в экономике
Методы обучения. Многомерная классификация методов. Проблема выбора методов в начальной школе


























Роль математико-статистических методов в психологическом исследовании не однозначна. Эта функция является исходной, а потому более значимой. В результате мы получаем описательные математические модели, применяемые для представления исходных эмпирических данных в доступном для интерпретации виде, или эмпирические математические модели ЭММ. Или даже просто ранжирование членов группы, которое предполагает, что порядковый номер испытуемого отражает выраженность изучаемого свойства. По сути дела, ЭММ идентичны мыслительным операциям. Когда много и объектов и признаков, простейшие ЭММ уже мало пригодны. Далеко не каждая исследовательская лаборатория могла себе это позволить. Список многомерных методов, которые будут рассмотренных ниже, не претендует на полноту и состоит из методов, наиболее часто применяемых в психологии. Эти методы можно классифицировать по трем основаниям: Классификация методов по исходным предположениям о структуре данных:. Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами. При этом исследователь ограничен и в направлении поиска: Применение многомерных методов требует соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы STATIST1CA, SPSS, STATGRAPH, STADIA, содержащие практически весь спектр статистических методов — от простейших до самых современных. Стоит обратить внимание на пакет STADIA, поскольку он — отечественный, а потому сравнительно дешевый. Измерение в терминах производимых исследователем операций — это приписывание объекту числа по определенному правилу. Это правило устанавливает соответствие между измеряемым свойством объекта и результатом измерения — признаком. В обыденном сознании, как правило, нет необходимости разделять свойства вещей и их признаки: Если нет необходимости в измерении, мы ограничиваемся сравнительными суждениями: В научном исследовании нам исключительно важно отдавать себе отчет в том, что точность, с которой признак отражает измеряемое свойство, зависит от процедуры операции измерения. Мы можем разделить всех наших испытуемых на две группы по сообразительности: И далее приписать каждому испытуемому символ например, 1 и 0 в зависимости от его принадлежности к той или другой группе. А можем упорядочить всех испытуемых по степени выраженности сообразительности, приписывая каждому его ранг, от самого сообразительного 1 ранг , самого сообразительного из оставшихся 2 ранг и т. В каком из этих двух случаев измеренный признак будет точнее отражать различия между испытуемыми по измеряемому свойству, догадаться нетрудно. В зависимости от того, какая операция лежит в основе измерения признака, выделяют измерительные шкалы. Эти шкалы устанавливают определенные соотношения между свойствами чисел и измеряемым свойством объектов. Шкалы разделяют на метрические если есть или может быть установлена единица измерения и неметрические если единицы измерения не могут быть установлены. Номинативная шкала неметрическая , или шкала наименований номинальное измерение. В ее основе лежит процедура, обычно не ассоциируемая с измерением. Пользуясь определенным правилом, объекты группируются по различным классам так, чтобы внутри класса они были идентичны по измеряемому свойству. Каждому классу дается наименование и обозначение, обычно числовое. Затем каждому объекту присваивается соответствующее обозначение. В последнем случае если одному испытуемому присвоена 1, а другому 2, то это обозначает только то, что у них разные предпочтения: Заметим, что в этом случае мы учитываем только одно свойство чисел — то, что это разные символы. Остальные свойства чисел не учитываются. Привычные операции с числами — упорядочивание, сложение-вычитание, деление — при измерении в номинативной шкале теряют смысл. При сравнении объектов мы можем делать вывод только о том, принадлежат они к одному или разным классам, тождественны или нет по измеренному свойству. Несмотря на такие ограничения, номинативные шкалы широко используются в психологии, и к ним применимы специальные процедуры обработки и анализа данных. Ранговая, или порядковая шкала неметрическая как результат ранжирования. Как следует из названия, измерение в этой шкале предполагает приписывание объектам чисел в зависимости от степени выраженности измеряемого свойства. Мы можем ранжировать всех испытуемых по интересующему нас свойству на основе экспертной оценки или по результатам выполнения некоторого задания и приписать каждому испытуемому его ранг. Или предложить испытуемым самим определить выраженность изучаемого свойства, пользуясь предложенной шкалой 5-, 7- или балльной. Существует множество способов получения измерения в порядковой шкале. Но суть остается общей: При измерении в ранговой шкале, таким образом, из всех свойств чисел учитывается то, что они разные, и то, что одно число больше, чем другое. Основываясь только на этих данных, мы можем судить о том, кто раньше прибежал, а кто позже. Но мы не можем судить, насколько каждый из них пробежал быстрее или медленнее другого. Необходимо установить для себя и запомнить порядок ранжирования. Строгих правил выбора здесь нет, но важно помнить, в каком направлении производилось ранжирование. Необходимо соблюдаь правило ранжирования для связанных рангов, когда двое или более испытуемых имеют одинаковую выраженность измеряемого свойства. В этом случае таким испытуемым присваивается один и тот же, средний ранг. Следующему за этой парой испытуемому присваивается ранг 3, и т. Это правило основано на соглашении соблюдения одинаковой суммы рангов для связанных и несвязанных рангов. Это такое измерение, при котором числа отражают не только различия между объектами в уровне выраженности свойства характеристика порядковой шкалы , но и то, насколько больше или меньше выражено свойство. Равным разностям между числами в этой шкале соответствуют равные разности в уровне выраженности измеренного свойства. Иначе говоря, измерение в этой шкале предполагает возможность применения единицы измерения метрики. Объекту присваивается число единиц измерения, пропорциональное выраженности измеряемого свойства. Важная особенность интервальной шкалы — произвольность выбора нулевой точки: Произвольность выбора нулевой точки отсчета обозначает, что измерение в этой шкале не соответствует абсолютному количеству измеряемого свойства. Следовательно, применяя эту шкалу, мы можем судить, насколько больше или насколько меньше выражено свойство при сравнении объектов, но не можем судить о том, во сколько раз больше или меньше выражено свойство. Интервальные измерения широко используются в психологии. Примером могут являться тестовые шкалы, которые специально вводятся при обосновании равноинтервальности метричности тестовой шкалы IQ Векслера, стены, Т -шкала и т. Абсолютная шкала, или шкала отношений метрическая. Измерение в этой шкале отличается от интервального только тем, что в ней устанавливается нулевая точка, соответствующая полному отсутствию выраженности измеряемого свойства. В отличие от температуры по Цельсию, температура по Кельвину представляет собой измерение в абсолютной шкале. Более привычные примеры измерения в этой шкале — это измерения роста, веса, времени выполнения задачи и т. Общим в этих примерах является применение единиц измерения и то, что нулевой точке соответствует полное отсутствие измеряемого свойства. В силу абсолютности нулевой точки, при сравнении объектов мы можем сказать не только о том, насколько больше или меньше выражено свойство, но и о том, во сколько раз на сколько процентов и т. Измерив время решения задачи парой испытуемых, мы можем сказать не только о том, кто и на сколько секунд минут решил задачу быстрее, но и о том, во сколько раз на сколько процентов быстрее. Следует отметить, что, несмотря на привычность и обыденность абсолютной шкалы, в психологии она используется не часто. Из редких примеров можно привести измерение времени реакции обычно в миллисекундах и измерение абсолютных порогов чувствительности в физических единицах свойств стимула. Перечисленные шкалы полезно характеризовать еще и по признаку их дифференцирующей способности мощности. В этом отношении шкалы по мере возрастания мощности располагаются следующим образом: Таким образом, неметрические шкалы заведомо менее мощные — они отражают меньше информации о различии объектов испытуемых по измеренному свойству, и, напротив, метрические шкалы более мощные, они лучше дифференцируют испытуемых. Поэтому, если у исследователя есть возможность выбора, следует применить более мощную шкалу. Другое дело, что чаще такого выбора нет, и приходится использовать доступную измерительную шкалу. Более того, часто исследователю даже трудно определить, какую шкалу он применяет. Классификация установок, по Узнадзе. Классификация по скорости развития TNM клиническая классификация Автомобильные перевозки. Конвенция КДТП , накладная CMR. Ассоциация международных автомобильных перевозок АСМАП. Классификация и механизм действия. Показания к применению в психиатрии и соматической медицине. Базы данных и их классификация Береговой рельеф. Последнее изменение этой страницы: Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии.


Назначеные и классификация многомерных методов.


Многомерность свойственна психологическим данным по природе, поскольку они чаще всего состоят по крайней мере из нескольких наблюдений за поведением одного человека или группы лиц. Многомерные методы и были созданы для совместной обработки таких данных, например для их исследований с целью обнаружения присущих им базисных характеристик либо, в случае дедуктивного подхода, для проверки или оценки априорных гипотез в отношении этих данных. В своих лучших образцах многомерный анализ представляет собой обобщение одномерного анализа, так что в тех случаях, когда данные состоят из значений только одной переменной, многомерный метод будет давать тот же результат, что и соответствующий одномерный метод. Так, есть статистики, базирующиеся на многомерном распределении случайных величин, которые можно свести к таким хорошо известным одномерным статистикам, как F-квадрат или t-критерий. Многомерный анализ включает широкий спектр математических статистических методов и, вообще говоря, не существует общепринятого определения границ этой области. По общей договоренности, однако, такие специализированные предметы, как теория надежности или теория латентных черт, не считаются разделами многомерного анализа в силу их обособленных традиций в сфере психол. Методы анализа множественных дихотомических переменных часто рассматриваются и изучаются под своими названиями, например логлинейные модели. Также анализ повторных наблюдений, проведенных на одном человеке или на каком-то др. Список многомерных методов, которые будут упомянуты ниже, не претендует на полноту и состоит из методов, наиболее часто применяемых в психологии. Эти методы можно классифицировать по трем основаниям: Классификация методов по исходным предположениям о структуре данных:. Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами. При этом исследователь ограничен и в направлении поиска: Применение многомерных методов требует соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы STATIST1CA, SPSS, STATGRAPH, STADIA, содержащие практически весь спектр статистических методов — от простейших до самых современных. Стоит обратить внимание на пакет STADIA, поскольку он — отечественный, а потому сравнительно дешевый. Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки. Факторный анализ позволяет решить две важные проблемы исследователя: С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными. Таким образом, можно выделить 2 цели Факторного анализа -определение взаимосвязей между переменными, классификация переменных , т. При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонентов внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей. Например, анализируя оценки, полученные по нескольким шкалам, исследователь замечает, что они сходны между собой и имеют высокий коэффициент корреляции, он может предположить, что существует некоторая латентная переменная, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором. Данный фактор влияет на многочисленные показатели других переменных, что приводит нас к возможности и необходимости выделить его как наиболее общий, более высокого порядка. Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов МГК. Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство МГК также в том, что он — единственный математически обоснованный метод факторного анализа. В обязательные условия факторного анализа входят:. Для решения первой задачи строится пространство канонических дискриминантных функций, которые позволяют с максимальной эффективностью "разделить" классы. Для того чтобы разделить k классов, требуется не более k - 1 канонических дискриминантных функций например, для разделения двух классов достаточно одной функции, для разделения трех классов - двух функций и т. Канонические дискриминантные функции можно рассматривать как аналог регрессии, построенной для целей классификации; дискриминантные исходные переменные являются в них переменными независимыми см. Для измерения абсолютного и относительного вклада дискриминантных переменных в разделение классов используются нестандартизированные и стандартизированные коэффициенты канонических функций. В пространстве канонических дискриминантных функций можно также решать задачу классификации объектов, не принадлежавших к первоначальной выборке. Для этого вычисляются расстояния от каждого "нового" объекта до геометрического "центра" каждого класса. Могут учитываться априорные вероятности принадлежности к классам, а также цена ошибок классификации. Альтернативным подходом к классификации объектов является вычисление классифицирующих функций Фишера - по одной для каждого класса. Эти функции также можно рассматривать как аналог регрессионных уравнений с "независимыми" дискриминантными переменными. Объект относится к тому классу, для которого вычисленное значение классифицирующей функции является максимальным. По ней же оценивается эффективность решающих процедур. Для этого строится специальная классификационная матрица, которая показывает, к какому классу объект принадлежал априорно и в какой класс был классифицирован с помощью канонических дискриминантных или классифицирующих функций. В модели должно быть не менее двух классов, в каждом классе - не менее двух объектов из обучающей выборки, число дискриминантных переменных не должно превосходить объем обучающей выборки за вычетом двух объектов. Дискриминантные переменные должны быть количественными и линейно независимыми не должны коррелировать друг с другом. Выполнение этих требований проконтролировать достаточно легко. Для каждого класса требуется также приблизительное равенство матриц ковариации и многомерная нормальность распределения. Нарушение последнего требования может привести к ошибкам классификации в "пограничных" зонах, где вероятности принадлежности объекта к двум или нескольким классам приблизительно равны. Многомерное шкалирование начало свое интенсивное развитие в х годах в работах американских ученых Торгерсона Torgerson [9], Шепарда Shepard [8], Краскэла Kruskal [6]. Круг советских специалистов, занимающихся этой проблемой, достаточно узок, и основные их усилия направлены на разработку формализованных методов и вычислительных процедур, реализующих известные модели на ЭВМ. К настоящему времени методы многомерного шкалирования, к сожалению, не получили широкого применения в психометрических исследованиях в нашей стране. Видимо, причинами тому являются малочисленность группы специалистов и отсутствие хороших пакетов программ. Задача многомерного шкалирования в самом общем виде состоит в том, чтобы выявить структуру исследуемого множества стимулов. Под выявлением структуры понимается выделение набора основных факторов, по которым различаются стимулы, и описание каждого из стимулов в терминах этих факторов. Процедура построения структуры опирается на анализ объективной или субъективной информации о близостях между стимулами либо информации о предпочтениях на множестве стимулов. В случае анализа субъективных данных решаются одновременно две задачи. С одной стороны, выявляется объективная структура субъективных данных, с другой — определяются факторы, влияющие на процесс принятия решения. Методы многомерного шкалирования могут использовать разные типы данных: Как правило, с каждым типом данных принято соотносить определенную группу методов их обработки. Однако такое соотнесение не должно быть слишком жестким, поскольку часто не представляет особого труда перейти от одного типа данных к другому. Так, например, данные о профилях можно легко преобразовать в данные о близостях, для этого необходимо только воспользоваться подходящей метрикой. Данные о предпочтениях содержат в себе информацию о доминировании. С другой стороны, подсчитав корреляции между столбцами матрицы предпочтений, получим матрицу близостей между стимулами, а корреляции между строками той же матрицы дадут нам матрицу близостей между субъектами. В настоящей работе будет обсуждаться только анализ близостей. В основе многомерного шкалирования лежит идея геометрического представления стимульного множества. Предположим, что нам задано координатное пространство, каждая ось которого соответствует одному из искомых факторов. Каждый стимул представляется точкой в этом пространстве, величины проекций этих точек на оси соответствуют значениям или степеням факторов, характеризующих данный стимул. Чем больше величина проекций, тем большим значением фактора обладает стимул. Мера сходства между двумя стимулами обратна расстоянию между соответствующими им точками. Чем ближе стимулы друг к другу, тем выше мера сходства между ними и ниже мера различия , далеким точкам соответствует низкая мера сходства. Чтобы точным образом измерить близости, необходимо ввести метрику в искомом координатном пространстве; выбор этой метрики оказывает большое влияние на результат решения. Наиболее распространенными ее случаями являются: Использование равномерных метрик предполагает, что при оценке сходств различий субъект в одинаковой мере учитывает все факторы. Когда же имеется основание утверждать, что факторы неравноценны для индивида и он учитывает их в разной степени, прибегают к взвешенной метрике, где каждому фактору приписывается определенный вес. Разные индивиды могут принимать во внимание разные факторы. Тогда каждый индивид характеризуется своим собственным набором весов Wti. Взвешенная метрика Минковского имеет вид:. Геометрически она интерпретируется следующим образом. Схема многомерного шкалирования включает ряд последовательных этапов. На первом этапе необходимо получить экспериментальным способом субъективные оценки различий. Процедура опроса и вид оценок должны выбираться исследователем в зависимости от конкретной ситуации. В результате такого опроса должна быть сконструирована субъективная матрица попарных различий между стимулами, которая будет служить входной информацией для следующего этапа. На втором этапе решается задача построения координатного пространства и размещения в нем точек-стимулов таким образом, чтобы расстояния между ними, определяемые по введенной метрике, наилучшим образом соответствовали исходным различиям между стимулами. Для решения этой формальной задачи не требуется никаких сведений о самих стимулах, достаточно располагать только матрицей попарных различий между ними. Для построения искомого координатного пространства используется достаточно разработанный аппарат линейной или нелинейной оптимизации. Значения координат этих точек и являются решением задачи. Используя эти координаты, мы строим геометрическое представление стимулов в пространстве невысокого числа измерений. Оно должно быть в достаточной степени адекватно исходным данным. Стимулы, которым в исходной матрице соответствуют большие меры различий, должны находиться далеко друг от друга, а стимулы, которым соответствуют малые меры различий, — близко. Формальным критерием адекватности может служить коэффициент корреляции, он должен быть достаточно высоким. Средство повышения точности формального решения состоит в увеличении числа измерений, т. Чем выше размерность пространства, тем больше возможностей получить более точное решение. На третьем этапе решается содержательная задача интерпретации формального результата, полученного на предыдущей стадии. Координатные оси построенного стимульного пространства должны получить смысловое содержание, они должны быть проинтерпретированы как факторы, определяющие расхождения между стимулами. Эта работа является достаточно сложной и может быть выполнена только специалистом, хорошо знакомым с исследуемым материалом. Если на предыдущем этапе достаточно было только информации о попарных различиях между стимулами, то для содержательной интерпретации необходимо тщательное изучение их характеристик. Последнее изменение этой страницы: Все права принадлежать их авторам. Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления. Назначеные и классификация многомерных методов.


444 приказ министра обороны
Как установить и пользоваться скайпом
Где находится разъем для диагностики газель бизнес
Приказ организации безопасного производства работ
Маша лепить пельмени
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment