Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save anonymous/9154ea210a35c829f82170602586b96f to your computer and use it in GitHub Desktop.
Save anonymous/9154ea210a35c829f82170602586b96f to your computer and use it in GitHub Desktop.
Зависимостей структура свойство

Зависимостей структура свойство



Вы точно человек?
Исследование зависимостей «состав-структура-свойства» для полимерных материалов
ПОИСК ЗАВИСИМОСТИ «СТРУКТУРА-СВОЙСТВО» ДЛЯ РАЗНОРОДНОЙ ВЫБОРКИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ

Тверь, Садовый переулок, Центральной проблемой теоретической химии является нахождение зависимостей между структурой органических соединений и проявляемыми ими свойствами. В попыпеах ее решения широко используется вычислительная техника, оснащенная программным обеспечением, позволяющим находить количественные корреляции "структура-свойство" ККСС. Для построения в ЭВМ ККСС- моделей используют различные методы описания молекул. Эти методы В1слючают в себя вычисление топологических индексов, теоретико-информационных индексов, наборов структурных фрагментов различных типов V! Важны , аспектом создаваемых ККСС-моделей является задача выбора оптимального набора признаков дескрипторов молекул для расчета данного свойства, а также задача содержательной интерпретации параметров получаемых ККСС-моделей. В настоящее время при описании структур молекул принято использовать наборы заранее заданных дескрипторов, индексов, структурных фрагментов, формакофоров, дескрипторных центров и т. Наборы признаков могут дополняться, если в ходе решения ККСС-задачи выясняется, что реализованный в программе набор признаков неадекватно описывает исследуемое свойство. Выбор 1ризнаков, адекватных данному свойству, является одной из вая-1ых проблем, возникающих при решении ККСС-задач. Провести исследование различных вариантов автомати-еского и исчерпывающего формирования. Разработать алгоритмы и программы, реализующие предложенную методику и обеспечивающие автоматический отбор параметров, адекватных для расчета данного свойства. Провести практическую проверку разработанных программ для построения ККСС-эависимостей различных свойств веществ: Предложена и программно реализована новая методика автоматического описания структур молекул на основе исчерпывающего перечисления всех неэквивалентных фрагментов заданного типа С их помощью учитываются топологические, химические и иные особенности строения молекул. Показано, что с целью получения адекватного описания молекул следует вводить маркеры атомов для учета их специфических особенностей например, 8аряда, электрофильности, нук-леофильности, относительного пространственного положения и т. Предложен и программно реализован метод отбора значимых признаков из большого числа всевозможных структурных фрагментов для расчета данного физико-химического свойства. Проведено исследование влияния различных маркеров атомов и различных длин цепочек маркированных атомов на качество линейных ККСС-моделей. Построены линейные модели "структура-свойство" для различных физико-химических свойств органических соединений. Показана их пригодность для прогноза свойств новых соединений. Разработаны оригинальные алгоритмы и программы, предназначенные для перечисления и кодирования всех структурных фрагментов молекул - цепочек маркированных атомов заданной длины. Программы составляют ядро системы "БИБИГОН" и служат для построения и верификации линейных ККСС- моделей. Система проходит опытную эксплуатацию в ряде организаций, включая ИОХ РАН, ИФАВ РАН,, Химфак МГУ. Результаты работы содержатся в 13 публикациях. Результаты докладывались на Межвузовской конференции "Молекулярные графы в химических исследованиях" Калинин, , на Первой бсесоюзной конференции по теоретической органической химии ВАТОХ,- Волгоград, , на Всесоюзной школе-семинаре "Статистический и дискретный анализ данных и экспертные оценки" Одесса, , на 9-ой Всесоюзной конференции "Химичекая информатика", Черноголовка, ВО введении обосновывается актуальность задачи нахождения ёНачимых признаков молекул при установлении ККСС-зависимостей, Ьпределяются цели и задачи исследования. В первой главе дается обзор современных методов представления химических структур органических соединений в ЭВМ на основе инвариантов молекулярных графов. Описан молекулярный химический граф МХ-граф как математический объект, используемый для представления в ЭВМ структур органических соединений. Сформулирована общая постановка эадачи установления количественных корреляций структура-свойство ККСС как специальный случай задачи распознавания образов. Проведена классификация существующих способов описания МХ-графов на основе топологических и теоретико-информационных индексов, а так же с использованием подструктур молекулярного графа. К численным инвариантам относятся топологические индексы,. Рассмотрены различные способы формирования структурных инвариантов МХ-графов. Отмечено, что структурные инварианты являются основой для построения многих индексов МХ-графов: Описан подструктурный подход формирования признаков молекул. В ФКСП используется список заранее определенных фрагментов "фзрмако-форов", дескрипторных центров для нахождения и кодирования лодструктурных фрагментов в молекулах. Описаны особенности использования подструктурного подхода в аддитивных схемах расчета физико-химических свойств органических соединений, предложенных К М. Татевским и развиваемых им и его сотрудниками. Описан индекс Смоленского для аппроксимации свойств углеводородов на цепочках атомов углерода. Существующее многообразие подходов к описанию молекулярных структур и появление все новых инвариантов МХ-графов делает актуальной разработку единообразного подхода для представления особенностей химических структур для решения ККСС-задач. Вторая глава посвящена изложению метода описания структур в виде исчерпывающего перечисления всех неизоморфных цепочбк маркированных атомов и последующего формирования и отбора признаков, значимых для данного свойства. Будем рассматривать молекулярные графы "со стертым водородом". Для систематического перечисления подструктур молекул обычно используют фрагменты ближайшего окружения атома различных уровней: На рисунке 1 изображены фрагменты первого уровня для атома, имеющего 2, 3 и 4 соседних атома. Показано, что "цепочечное" представление произвольных подструктур рис.! Это сводит аадачу перечисления подструктур молекул к задаче перечисления всех неэквивалентных цепочек атомов. VI различных атомов, что каждая последовательная пара атомов соединена ребром. Будем различать неизоморфные цепочки путем сравнения их символьных канонических кодов. Пусть каждому атому МХ-графа присвоена некоторая символьная метка Ы1, тогда кодом К С цепочки С У1,У, назовем соответствующую последовательность меток атомов: Для зличения особенностей атомов в Ж-графе будем использовать. Если атом имеет кольцевые свя-ви, будем называть его "кольцевым атомом". Среди "1ссльцевых" атомов будем различать "чисто кольцевые" атомы, то есть атомы, у которых все ребра кольцевые, и "кольцевые с заместителем" атомы, у которых имеется ациклическое ребро. Определим r-маркер следующим образом:. Определим символьную метку атома как "NNpbr" 5 символов или. Методика конструирования новых маркеров: Разделим область определения h v на три непересекающихся интервала: Н - "Ь", если h v принадлежит интервалу Н2; "с", если h v принадлежит интервалу НЗ; где h v - значение характеристики на v- атоме MX-графа. Разбиение области определения функции h v на интервалы HI, Н2, должно задаваться: Если новый Н-маркер будет включен в формирование меток атомов, то при перечислении неизоморфных фрагментов будет сформирован новый набор первичных признаков. Адекватность этого набора для оценки исследуемого свойства молекул следует проверять с помощью системы "БИБИ-ГОН". Для перечисления в MX-графе цепочек заданной длины используется "волновой" алгоритм. Пусть вначале все вершины графа имеют целочисленную А-метку, равную нулю. Зададим стартовый s-атом, его А-метка равна 1. Таким образом, в А-метках фиксируется момент времени прохождения волны через атом. Пусть s - стартовый атом и проведена волновая разметка графа. Тогда А-метки, расставляемые волновым алгоритмом A j. Для всех з-атомов с ненулевой А-меткой су чествует цепь, соединяющая з-атом с атомом, то есть все эт атомы принадлежат одному связному графу. Пусть А-метка з-атома равна к: При этом последовательность атомов з,31,32, Зч, э образует цепочку минимальной длины С з,э. На основе этих утверждений разработаны следующие алгорит мы: Схема формирования матрицы описания ] изображена на рисунке 3. При перечислении и кодировании всех неэквивалентных цепочек маркированных атомов возникает проблема "информационного взрыва": В связ] с этим необходим отбор признаков, значимых для данной свойства. Такой набор признаков назовем "базовым списком дескрипторов" БСД. Он формируется как из исходных первичных-, признаков, так и из сложных составных или вторичных признаков. При этом только переменные базового списка будут участвовать в построении ККСС-моделей. Размер базового списка фиксируется пользователем заранее. Формирование БСД основано на использовании метода группового учета аргументов МГУА: Упорядочим вектора оценок 7 в порядке убывания множественного коэффициента корреляции 1? Каждый вектор У проверяется на вва-имную коррелированность с векторами, уже попавшими в список. Если коэффициент корреляции хотя бы для одного базового вектора, превышает заданный порог ГК. Преобразование переменных для базового списка. МГУ А-метод формирования базового списка позволяет вводить новые составные признаки. Пусть определено некоторое множество функций одной переменной:. Таким образом, происходит автоматический отбор лучших возможно,нелинейных переменных В системе "БИБКГОН" реализованы следующие функции г-Г Х: В третьей главе описана система БИБИГОН, созданная в ИОХ РАН для диалогового построения линейных ККСС-моделей на основе цепочек маркированных атомов. В системе используются три базовых маркера: Разработанные программы пречисления и кодирования неэквивалентных цепочек, формирования матрицы описания и отбора переменных являются составной частью системы "БИБИГОН". Система "БИБИГОН" позволяет проводить:. В четвертой главе приведены практические примеры, иллюстрирующие эффективность предложенной методики автоматического выбора адекватного описания структур для ККСС-задач. Все приводимые модели проверены на прогностичность методом "скользящего контроля": Когда значение J пробегает все структуры, формируется "скользящий" вектор ошибки PSS Predict Sum of Squares. По вектору PSS вычисляются соответствующие значения S, F квадрат множественного коэффициента регресии,. Проведен расчет следующих свойств: Выборка содержала соединения. N - , К - 18, К";. Переменная N обозначает число структур в обучающей выборке, К- число признаков, вошедших в модель. Проверка прогностичности модели проводилась методом "Скользящий контроль": Ревультатн расчета, получен 1Ш0 методом наименьших квадратов: М- , К , 1Г2 - 0. Выборка, содержащая 84 соединения введена в ЭВМ на основе данных ВНИИ Новых Антибиотиков РАМН. Результаты расчета, полученные методом наименьших квадратов: Обучающая выборка годежала содинений. Результаты объединены ь Таблице Для проверки применимости описываемого в работе подхода к построению ККСА-моде-лей для "биологической" активности, а не только для физико-химических свойств, была исследована обучающая выборка, содержащая 54 соединения. Обучающая выборка содежала содинения. Лучшая модель была построена на атомах с 7-ой маркиров1. Обучающая выборка содежала содинения, из них 45 алканов, 35 циклоалканов и 74 алкенов. Заклинепиэ содержит основные выводы работы, в нем сформулированы возможные пути развития метода символьной маркировки атомов. В приложении 1 приведены полные таблицы "свойство -расчет - отклонение" для описанных в 4-ой главе ККСС-моделей. В приложении 2 подробно описана система "БИБИГОН". Разработана методика автоматического описания структур молекул для ККСС-задач на основе исчерпывающего перечисления неэквивалентных цепочек маркированных атомов: Цепочки маркированных атомов являются новым типом структурных дескрипторов молекул и имеют. Показана возможность использования метода группового учета аргументов Я"УА для отбора на всевозможных струотур-1шх Фрагментов значимых признаков при оценке заданного с ьо йот на. Метод позволяет формировать составные вторичные признаки на основе функциональных в том числе и нелинейных преобразований исходных признаков молекул. Разработаны алгоритмы и получены программы, реализующие предложенную методику описания молекул и МГУА-метод автоматического отбора признаков. Программы пошли как составная часть в систему "БКБИГОН", которая служит для диалогового построения и верификации линейных ККСС-моделей. Показана прогностическая устойчивость найденных ККСС-зависимостей методом "скользящего контроля". Параметры для расчетов полибензоидных. Выбор ал фавита структурных. I Всесоюз ной конференции по теоретической органической химии - ВАТОХ Волгоград, , с. Формирова ние моделей ККСА на основе большого числа структурных дескрип торов. Всесоюзной конференции по теоретической органической химии ВАТОХ, Волгоград, , с. К , Зефиров а С. Ж, , в печати. Библиотека диссертаций Химические науки Физическая химия Метод и математическая модель автоматического формирования структурных дескрипторов для выявления зависимостей "структура-свойство" в ряду органических соединений тема автореферата и диссертации по химии, Работа выполнена в Институте органической химии имени Е Д. Зелинского Российской Академии Наук Научные руководители: Институт Химической Физики РАН. В соответствии с целью были поставлены следующие ЗАДАЧИ: Предложен и программно реализован метод отбора значимых признаков из большого числа всевозможных структурных фрагментов для расчета данного физико-химического свойства 4. Работа состоит из введения, четырех глав, заключения, списка литературы и двух приложений. Цепочки атомов С1 и С2 одинаковой длины будем зьгаать эквивалентными, если совпадают их канонические коду, е. Таким образом, эквивалентность цепочек атомов равной шш. Фрагменты первого уровня V-атома КК-графа. Введем Ь-маркер химической связи атома: Определим r-маркер следующим образом: Тогда А-метки, расставляемые волновым алгоритмом A j - А-метка. Варианты маркирования атома азота Утверждение 4. АО - к; АП1 - к-1; А 32 - к-2; Пусть определено некоторое множество функций одной переменной: Система "БИБИГОН" позволяет проводить: По вектору PSS вычисляются соответствующие значения S, F квадрат множественного коэффициента регресии, стандартное отклонение и критерий Фишера. Результаты объединены ь Таблице 2: Лучшая модель была построена на атомах с 7-ой маркиров1 Результаты расчета, полученные методом наименьших квадратов: Цепочки маркированных атомов являются новым типом структурных дескрипторов молекул и имеют - 15 - ясную химическую интерпретацию. Основные результаты работы калодеши в слодукцих публикациях: Ж, , в печати Похожие работы Метод поверхностных молекулярных потенциалов в расчетах связи "Структура-активность" органических соединений Разработка нового метода посика корреляций "структура-свойства" и прогнозирование параметров энергетических соединений Количественные модели "структура-свойство" органических соединений Роль систем межмолекулярных взаимодействий в формировании некоторых физических свойств органических соединений Методология построения количественных моделей связи "структура-свойство" для разнородных выборок органических соединений. Физика Математика Химия физико-математические науки Математика Теория вероятностей и математическая статистика. Математическая логика, алгебра и теория чисел. Дискретная математика и математическая кибернетика. Математическое обеспечение вычислительных машин и систем. Системный анализ и автоматическое управление. Механика деформируемого твердого тела. Механика жидкости, газа и плазмы. Динамика, прочность машин, приборов и аппаратуры. Динамика сыпучих тел, грунтов и горных пород. Астрометрия и небесная механика. Приборы и методы экспериментальной физики. Теплофизика и теоретическая теплотехника. Физика атомного ядра и элементарных частиц. Химическая физика, в том числе физика горения и взрыва. Физика пучков заряженных частиц и ускорительная техника. Коллоидная химия и физико-химическая механика. Химия и технология композиционных материалов. Математическая и квантовая химия. Химия, физика и технология поверхности. Библиотека физико-математических и химических наук. Пономарева, Людмила Алексеевна АВТОР.


Характеристика мицубиси шариот
Сигнализации starline инструкция
Турнирная таблица италии по футболу 2017
Какие классы условий труда существуют
Crazy никита текст
Футбол чемпионат мира 2016 турнирная таблица
Приказ ффомс 271
Правило большого пальца в экономике
Сколько надо кирпичей на столб
Торт со сливочным сыром
Мозолистая экзема фото
Сколько пробудут мощи николая чудотворца
Год открытия периодического закона
Похудей за 13 дней
Можно ли установить кондиционер на ваз 2110
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment