Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save anonymous/949105c811aed9382b0055dfa64e59ee to your computer and use it in GitHub Desktop.
Save anonymous/949105c811aed9382b0055dfa64e59ee to your computer and use it in GitHub Desktop.
Метод группового учета аргументов

Метод группового учета аргументов



Под сложностью модели в МГУА понимается число параметров. Для порождения используется [базовая модель], подмножество элементов которой должно входить в искомую модель. Для выбора моделей используются внешние критерии , специальные функционалы качества моделей, вычисленные на тестовой выборке. МГУА рекомендуется к использованию в том случае, когда выборка содержит несколько элементов. Тогда при построении регрессионных моделей использовать статистические гипотезы о плотности распределения, плотности распределения например, гипотезу о Гауссовском распределении , невозможно. Поэтому используется индуктивный подход, согласно которому последовательно порождаются модели возрастающей сложности до тех пор, пока не будет найден минимум некоторого критерия качества модели. Этот критерий качества называется внешний критерий , так как при настройке моделей и при оценке качества моделей используются разные данные. Достижение глобального минимума внешнего критерия при порождении моделей означает, что модель, доставляющая такой минимум, является искомой. Один из авторов этого метода А. В результате находится модель оптимальной структуры в виде одного уравнения или системы уравнений. Индуктивный алгоритм отыскания модели оптимальной структуры в состоит из следующих основных шагов. Пусть задана выборка ,. Выборка разбивается на обучающую и тестовую. Эти множества удовлетворяют условиям разбиения. Разбиение выборки представляется в виде. Например, используется функциональный ряд Вольтерра, называемый также полиномом Колмогорова-Габора:. Например, задано конечное множество нелинейных функций. Ниже описаны несколько часто используемых внешних критериев. При этом вводится ограничение на длину полинома базовой модели. Например, степень полинома базовой модели на не должно превышать заданное число. Аргументы этой функции переобозначаются следующим образом:. Для линейно входящих коэффициентов задается одноиндексная нумерация. Тогда модель может быть представлена в виде линейной комбинации. При усложнении модели внутренний критерий не дает минимума для моделей оптимальной сложности, поэтому для выбора модели он не пригоден. Для выбора моделей вычисляется качество порожденных моделей. При этом используется контрольная выборка и назначенный внешний критерий. Если значение внешнего критерия не достигает своего минимума при увеличении сложности модели или значение функции качества неудовлетворительно, то выбирается лучшая модель из моделей заданной сложности. Под сложностью модели подразумевается число настраиваемых параметров модели. Существуют следующие причины, по которым глобальный минимум может не существовать:. Авторами метода рассмотрены весьма большое число различных критериев выбора моделей. Значительная часть этих критериев опубликована на сайте http: Критерий выбора модели может быть назван внешним, если он получен с помощью дополнительной информации, не содержащейся в данных которые использовались при вычислении параметров моделей. Например, такая информация содержится в дополнительной, тестовой выборке. Алгоритм МГУА использует и внутренний критерий и внешний. Внутренний критерий используется для настройки параметров модели, внешний критерий используется для выбора модели оптимальной структуры. Возможен выбор моделей по нескольким внешним критериям. Иначе критерий непротиворечивости модели: Критерий не включает ошибку модели в явной форме. Утверждается, что с помощью этого критерия, из сильно зашумленных данных возможно найти скрытые физические закономерности. Является модификацией критерия регулярности. В этом случае выборка делится не на две, а на три части:. Этот критерий позволяет использовать при выборе моделей линейную комбинацию нескольких критериев. В данном случае оптимальная модель может быть найдена только после завершения настройки параметров всех моделей. Такой критерий обеспечивает выбор наиболее несмещенных, устойчивых и точных моделей. Выбирается множество внешних критериев, условиям оптимальности которых должна удовлетворять модель. Каждой модели ставится в соответствие вектор в пространстве выбранных критериев. Отыскиваются векторы, принадлежащие Парето-оптимальному фронту множества всех векторов, соответствующих порожденным моделям. При создании комбинированного критерия рассматриваются модели, критерии которых принадлежат полученному Парето-оптимальному фронту. Целю МГУА является получение модели в результате перебора моделей из индуктивно-порождаемого множества. Параметры каждой модели настраиваются так, чтобы доставить минимум выбранному внешнему критерию. Все алгоритмы МГУА воспроизводят схему массовой селекции: Из моделей-претендентов выбираются лучшие в соответствии с выбранным критерием. Многорядные алгоритмы могут вычислять остатки регрессионных моделей после каждого ряда селекции или не вычислять; при этом используются исходные данные. Комбинаторный однорядный алгоритм использует только один ряд выбора. При этом порождаются все возможные линейные комбинации ограниченной сложности. Пусть, как и ранее. Алгоритм выполняет следующие шаги. Для всех комбинаций входных аргументов строятся модели-претенденты неубывающей сложности. Параметры каждой модели настраиваются методом наименьших квадратов по обучающей выборке. Наилучшая модель выбирается исходя из минимума значения внешнего критерия. Тогда модель имеет вид. Так как при порождении моделей необходимо выбирать из моделей, что может повлечь недопустимо большое время вычислений, предложены несколько эвристических алгоритмов, позволяющих сократить время вычислений, без уменьшения максимальной сложности моделей. Порождаются модели как линейные комбинации всевозможных пар переменных. Каждая модель, порождаемая на ряде задается парой индексов. После порождения моделей их параметры настраиваются с использованием внутреннего критерия. Эти модели используются в следующем ряде. Множество выбранных моделей задано множеством пар индексов. Например, для второго ряда множество моделей. Порожденные модели снова настраиваются, выбираются наилучшие. При этом индексация элементов моделей остается сквозной,. Остановка порождения моделей на последующих рядах происходит в том случае, когда с увеличением номера слоя, то есть, с усложнением моделей, происходит увеличение внешнего критерия лучшей модели. Регрессионный анализ Энциклопедия анализа данных Популярные и обзорные статьи. Метод группового учёта аргументов Материал из MachineLearning. Просмотры Статья Обсуждение Просмотр История. Личные инструменты Представиться системе. Навигация Заглавная страница Сообщество Новости Последние правки Случайная статья Справка Инструктаж Вопросы и ответы ToDo. Энциклопедия анализа данных Популярные и обзорные статьи Публикации Полезные ссылки. Инструменты Ссылки сюда Связанные правки Загрузить файл Спецстраницы Версия для печати Постоянная ссылка. Содержание 1 Описание алгоритма МГУА 2 Внешние критерии МГУА 2.


Липолитики для похудения сколько
Лечение после удаления кисты яичника
Поздравление с днем семьи в прозе
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment