Том 37, № 2

Оценка неопределенности в задаче регрессии при байесовской регуляризации решения

Антон Сергеевич НУЖНЫЙ, Елена Александровна САВЕЛЬЕВА

PDF (Rus)

7-18

Рассматривается проблема оценки неопределенности в задаче регрессии. Решение задачи регрессии в данной работе ищется в виде ряда из базисных функций. Коэффициенты при базисных функциях подбираются путем минимизации суммы среднеквадратичной ошибки аппроксимации искомой функцией данных обучающего множества и регуляризационного слагаемого, смысл которого в наложении ограничений на множество решений. Добавление регуляризационного слагаемого – один из способов борьбы с математической некорректностью задачи. Регуляризационное слагаемое состоит из штрафного функционала и регуляризационного множителя, который является дополнительным параметром регрессионной модели. Байесовский подход к оценке оптимального значения регуляризационного множителя дает возможность получить его непосредственно из данных, как наиболее правдоподобное. Выбор регрессионной модели в виде ряда базисных функций из заданного набора позволяет сократить высокую вычислительную стоимость байесовского подхода за счет замены итерационной процедуры, используемой для модели общего вида, аналитическими выражениями. В процессе поиска регуляризационного множителя байесовский подход вычисляет оценку неопределенности получаемого решения. Корректность данной оценки является предметом текущего исследования. Предложенный подход к оценке неопределенности тестируется на модельных данных, зашумленных искусственным шумом. Показывается, что полученная предлагаемым методом оценка величины шума, дает хорошее совпадение со значением, заданным при генерации данных. Точность предлагаемого метода превзошла на модельных примерах точность используемого для оценки неопределенности набора данных Гамма-теста.

Применения программного обеспечения с открытым исходным кодом для схемотехнического моделирования при разработке аналоговых интегральных микросхем

Вадим Вадимович КУЗНЕЦОВ, Дмитрий Владимирович АНДРЕЕВ, Григорий Константинович ГРИШИН

PDF (Eng)

19-32

Аннотация

Моделирование схем является неотъемлемой частью процесса проектирования микроэлектронных устройств. В статье представлен процесс проектирования с использованием инструмента для моделирования Qucs-S с Ngspice или QucsatorRF в качестве движка моделирование. Данное ПО может быть использовано как в академических, так и в промышленных целях. Qucs-S сочетает в себе современный графический интерфейс и движки для моделирования, такие как Ngspice, QucsatorRF и XYCE. В статье представлен обзор программной архитектуры Qucs-S и ее применения для проектирования интегральных схем. Предлагаемый рабочий процесс проиллюстрирован на примере извлечения параметров полупроводниковых резисторов и углового моделирования с использованием упомянутых инструментов с открытым исходным кодом.

Методы схемотехнического и топологического синтеза аналоговых интегральных схем по спецификации с использованием методов машинного обучения и дифференцируемого программирования

Денис Сергеевич ЩЕПЕТОВ, Александр Геннадиевич ТИМОШЕНКО, Владимир Анатольевич ГАРАНЖА, Игорь Евгеньевич КАПОРИН, Дмитрий Николаевич КАРГИН

PDF (Rus)

33-48

Аннотация

Задача разработки принципиальной электрической схемы, возникающая при создании аналоговых интегральных схем, сформулирована как задача оптимизации дифференцируемой гладкой функции с помощью комбинации методов дифференцируемого программирования и методов машинного обучения. Показано, что такой подход позволяет достичь требований спецификации и предложить оптимальную комбинацию схемотехнических шаблонов, составляющих аналоговую интегральную схему, без привлечения методов комбинаторной оптимизации и обучения с подкреплением. Показано, что такой подход дает значительные преимущества по скорости по сравнению с традиционными методами, основанными на обучении с подкреплением. Исследована возможность полностью автоматического синтеза аналоговой ИС от спецификации до топологии без участия эксперта с помощью программных средств с открытым исходным кодом. Показаны преимущества и недостатки такого подхода.

Предсказание характеристик СБИС по логической схеме с помощью методов машинного обучения

Михаил Сергеевич ЛЕБЕДЕВ, Дарья Алексеевна ДЫСКИНА, Анастасия Юрьевна ЕРЕМЕНКО, Фёдор Александрович КАБАНОВ, Илья Александрович КОЗМИН, Даниил Михайлович ПЕТРЕНКО, Никита Басуевич ПОУДИАЛ, Андрей Алексеевич СЕРГЕЕВ, Рена Афраил кызы ШИРИНОВА

PDF (Rus)

49-60

Аннотация

Разработка цифровой аппаратуры – длительный процесс, одними из основных этапов которого являются логический и физический синтез. Несмотря на автоматизацию синтеза в современных САПР, он может занимать часы или даже дни. Применение методов машинного обучения может помочь прогнозировать результаты синтеза и за счет этого ускорить весь процесс разработки. В данной статье описан опыт создания и оценки восьми моделей машинного обучения для прогнозирования площади и задержки СБИС по ее схеме на этапе логического синтеза. Полученные результаты показывают перспективность данного подхода и указывают направления для дальнейших исследований.

Проектирование и развитие механизма мандатного контроля целостности в операционной системе Astra Linux

Петр Николаевич ДЕВЯНИН, Алексей Александрович СТАРОСТИН, Денис Сергеевич ПАНОВ, Семен Владимирович УСАЧЕВ

PDF (Rus)

61-78

Аннотация

Механизм мандатного контроля целостности (МКЦ) – фундамент безопасности сертифицированной по высшим классам защиты и уровням доверия операционной системы (ОС) Astra Linux, обеспечивающий наряду с другими механизмами, включая замкнутую программную среду (ЗПС), защиту привилегированных процессов ОС, целостность исполняемых и конфигурационных системных файлов и каталогов ОС, а также пользовательских данных. Использование МКЦ направлено на защиту от вирусов (например, «шифровальщиков»), от эксплуатации многих типовых уязвимостей программного обеспечения (ПО) ОС семейства Linux, в том числе приводящих к атакам нарушителя с правами суперпользователя root. Научной основой реализации МКЦ в ОС Astra Linux является соответствующая критериям ГОСТ Р 59453.1-2021 мандатная сущностно-ролевая ДП-модель управления доступом и информационными потоками в ОС семейства Linux (МРОСЛ ДП-модель). При этом внедрение механизма МКЦ поверх штатного для ОС семейства Linux дискреционного управления доступом представляет существенные трудности, часто требует разработки технологий и сценариев согласованного с ним применения системного и прикладного ПО. Авторами проводятся исследования по проектированию, развитию и эффективному использованию МКЦ. Во-первых, это доработки МРОСЛ ДП-модели для теоретического описания механизма МКЦ с учетом вносимых в него изменений. Во-вторых, адаптированная к МКЦ технология контейнерной виртуализации, когда потенциально «опасное» ПО запускается в изолированных на промежуточных уровнях целостности (в сессиях администратора системы, работающего на максимальном уровне целостности) или отрицательных уровнях целостности (в сессиях непривилегированного пользователя, работающего на нулевом уровне целостности) контейнерах-«песочницах» (например, docker). В-третьих, технологии и сценарии непосредственного запуска прикладного ПО на промежуточных или отрицательных уровнях целостности с настройкой меню рабочего стола администратора системы или непривилегированного пользователя, соответственно.
В-четвертых, утилита настройки МКЦ, выставляющая файлам и каталогам уровни целостности или специальные флаги на основе правил профилей LSM-модуля AppArmor.

TSAR: инструмент для оценки статических анализаторов

Кирилл Алексеевич ЧИБИСОВ, Рубен Артурович БУЧАЦКИЙ, Андрей Дмитриевич ТИМОНИН, Владислав Игоревич ЛАЗАРЬ, Дмитрий Михайлович ЖУРИХИН, Андрей Андреевич БЕЛЕВАНЦЕВ

PDF (Rus)

79-96

Аннотация

В статье представляется новый инструмент TSAR, предназначенный для оценки эффективности статических анализаторов. TSAR включает в себя три основных компонента: систему анализа статических анализаторов, генератор тестов, базирующийся на Common Weakness Enumeration (CWE), и механизмы трансформации кода (мутатора) для усложнения работы анализаторов. Система анализа позволяет выявлять слабые места в инструментах статического анализа, в то время как генератор тестов создает специфические случаи на основе известных уязвимостей. Трансформации кода позволяют создавать сложные структуры, затрудняющие анализ и призванные проверить устойчивость анализаторов к обнаружению реальных уязвимостей. Данный инструмент предоставляет исследователям и разработчикам возможность для более глубокой оценки качества статических анализаторов программного обеспечения для их дальнейшего улучшения.

Алгоритм выбора семантических мутаций в фаззинге по принципу серого ящика

Григорий Романович РАЙКИН, Максим Сергеевич ПЕЛЕВИН, Владимир Михайлович ИЦЫКСОН

PDF (Rus)

97-114

Аннотация

С развитием современных информационных систем динамический анализ становится неотъемлемой частью процесса разработки программного обеспечения. Одной из самых эффективных и распространённых техник в этой области является фаззинг-тестирование (фаззинг). Суть этого метода состоит в передаче исследуемой программе большого количества случайных и неожиданных входных данных. Инструменты мутационного фаззинга генерируют тестовые данные, применяя модификации (мутации) к удачным из уже использованных вариантов, повышая таким образом число обнаруженных поведений и покрытие кода. Сами мутации при этом чаще всего выбираются случайным образом.
В данной работе предложен метод повышения эффективности мутационного фаззинга с помощью адаптивной стратегии выбора мутации. Предложенный метод апробирован на широко используемых Java-пакетах и продемонстрировал статистически значимый прирост количества найденных ошибок и числа различных поведений (трасс исполнения) тестируемых программ.

Усовершенствованный поиск архитектур в автоматическом решении задач графового машинного обучения: расширение и динамическая приоритизация пространства поиска для повышения эффективности

Фёдор Михайлович БАЛАБАНОВ, Кирилл Сергеевич ЛУКЬЯНОВ

PDF (Rus)

115-128

Аннотация

В данной работе исследуются методы улучшения процесса автоматизированного поиска архитектур для графовых нейронных сетей (ГНС). Мы предлагаем новый подход, основанный на адаптивном изменении пространства поиска посредством выделения приоритетных направлений, что позволяет повысить эффективность поиска архитектур. Еще один предлагаемый подход расширяет пространство поиска, разрешая комбинировать различные типы графовых сверточных слоев. Основное внимание уделяется максимизации точности архитектур в расширенном пространстве поиска при фиксированном бюджете поиска по количеству моделей. Наши эксперименты проводятся на наборах данных цитирования, химических молекул и графов покупок. Результаты экспериментов показывают, что предложенный подход позволяет находить более эффективные модели без увеличения вычислительных ресурсов и демонстрирует высокую перспективность для автоматизации решений реальных задачах анализа графовых данных.

Построение гидравлической модели теплообменного аппарата

Елена Сергеевна БАЙМЕТОВА, Мария Равилевна КОРОЛЕВА

PDF (Rus)

129-140

Аннотация

В работе приведено построение гидравлической модели теплообменного аппарата (ТА). Исследуемый в работе многосекционный ТА включает в себя теплообменную матрицу из 11 секций, каждая из которых содержит 6 каналов малого диаметра. Построение гидравлической математической модели (ГММ) основано на результатах экспериментальных исследований и результатах математического моделирования. Численное моделирование проводилось в пакете OpenFOAM с использованием решателя simpleFoam. На основе математического моделирования проведены полноразмерные расчеты ТА в рабочем диапазоне чисел Рейнольдса, а также дополнительные расчёты течения в малоразмерных каналах с учетом внутреннего оребрения и наличия интенсификаторов теплообмена. В результате анализа распределения гидравлических потерь в многосекционном ТА построена гидравлическая математическая модель работы устройства. На основе сопоставления расчетных данных и результатов экспериментальных исследований проведена идентификация параметров ГММ теплообменного аппарата. Построенная модель в дальнейшем будет обобщена на широкий размерный ряд ТА данного вида.

Параметрическое исследование эффективности исполнения единичной секции маслоохладителя

Алена Алексеевна ЧЕРНОВА, Айгуль Расимовна ШИГАПОВА

PDF (Rus)

141-152

Аннотация

В работе приведены результаты численного исследования влияния конструктивного параметра – зазора между охлаждающими пластинами конвективного теплообменного аппарата на его эффективность. Рассматривается единичная охлаждающая секция маслоохладителя, состоящая из разведённых на определенное расстояние охлаждающих пластин. Оценка эффективности устройства строится на основе анализа изменения коэффициентов теплоотдачи на границах рабочих сред от увеличения расстояния между пластинами. Рассматривается задача сопряженного теплообмена между нагретым гидравлическим маслом, пластинами маслоохладителя и холодным турбулентным потоком нагнетаемого вентилятором воздуха. Численное решение полученной системы уравнений строится методом контрольных объемов с использованием решателя chtMultiRegionFoam свободно распространяемого программного обеспечения OpenFOAM. Численное моделирование рабочих процессов, протекающих в единичной секции маслоохладителя, производилось методом установления. В результате численного моделирования получены поля физических величин, структура потока воздуха и масла в соответствующих каналах устройства. Выявлено и показано влияние величины зазора между пластинами на внутреннюю и внешнюю аэродинамику единичной секции маслоохладителя. Выявлен, описан и обоснован неравномерный нагрев корпуса охлаждающей секции с локализацией температурного максимума в области внутренних центральных каналов. Анализ полученных теплофизических характеристик позволил выявить оптимальное расстояние между пластинами маслоохладителя в 22 мм.

Численное исследование турбулентного диффузионного пламени на поверхности полиметилметакрилата на основе открытого пакета FDS

Габриела МОРАР, Александр Иванович КАРПОВ, Артем Андреевич ШАКЛЕИН

PDF (Rus)

153-162

Аннотация

Проведено численное исследование турбулентного диффузионного пламени на поверхности полиметилметакрилата (ПММА). Для проведения расчетов использовалась программа с открытым кодом Fire Dynamics Simulator (FDS), в которой использовался метод LES для моделирования турбулентного пламени. Для визуализации результатов использовалась программа SmokeView, которая является модулем пакета FDS. По результатам исследования определены размеры области вблизи поверхности горения, в которой наблюдается ламинарный режим течения. Предлагается алгоритм для решения сопряженной задачи распространения турбулентного пламени по поверхности горючего материала. Алгоритм сопряженной задачи состоит в совместном расчете ламинарного пламени вблизи поверхности горения и турбулентного режима в остальной области.

Математическое моделирование турбулентного потока жидкости с помощью квазигидродинамических уравнений и модели турбулентности k-omega

Ксения Сергеевна КОРОЛЁВА, Игорь Иванович ПОТАПОВ

PDF (Rus)

163-180

Аннотация

В настоящей работе предложена математическая модель для решения задачи о течении развитого турбулентного потока в канале. В качестве уравнений, описывающих течение жидкости, используются уравнения Рейнольдса и уравнения модели турбулентности k-omega, приведенные к квазигидродинамическому виду. Для численного решения уравнений математической постановки использовался комбинированный подход, сочетающий метод контрольных объемов и метод конечных элементов на треугольных адаптивных сетках. Для верификации предложенной математической модели была решена задача о течении турбулентного потока в канале прямоугольной формы. Полученные результаты показали, хорошее согласование результатов по предложенной модели с результатами прямого численного моделирования в области турбулентного подслоя. Для дальнейшей верификации модели был выполнен расчет ряда задач об обтекании турбулентным потоком фиксированных песчаных дюн с различным углом подветренного склона. Выполнен сравнительный анализ расчетных характеристик потока с экспериментальными данными, который показал их качественное и количественное согласование, за исключением значений кинетической энергии турбулентности в случае обтекания пологих дюн. Хорошее согласование значений осредненного над одной дюной сдвигового напряжения Рейнольдса и общего касательного напряжения, полученных по предложенной модели, с экспериментальными данными позволяет использовать предложенную модель для расчета характеристик гидродинамического потока, проходящего над изменяющимися во времени донными формами.

О размыве дна, вызванном взвешенной турбулентной струей

Александр Георгиевич ПЕТРОВ, Игорь Иванович ПОТАПОВ

PDF (Rus)

181-194

Аннотация

В работе рассмотрена задача о воздействии турбулентной струи, на размываемое дно. Предложена математическая модель задачи, включающая уравнения Рейнольдса, уравнения переноса кинетической энергии, диссипации турбулентности, концентрации взвешенных частиц и уравнение русловых деформаций. Для описания изменений донной поверхности используется оригинальное уравнение донных деформаций, построенное на основе аналитической модели движения влекомых наносов. Предложен алгоритм решения задачи с помощью метода контрольных объемов. Численное моделирование задачи показало, что при размыве дна под воздействием турбулентной струи возникает характерная донная волна, параметры которой в области размыва, согласуются с известными экспериментальными данными.

Характеристики взаимодействия встречных недорасширенных струй из микросопел

Михаил Александрович КОРЕПАНОВ, Мария Равилевна КОРОЛЕВА, Екатерина Александровна МИТРЮКОВА

PDF (Rus)

195-206

Аннотация

В работе представлены результаты параметрических исследований особенностей столкновения сверхзвуковых недорасширенных струй аргона, вытекающих из соосных микросопел, расположенных навстречу друг другу. Для численного моделирования газодинамики сверхзвуковых струй использовалась математическая модель вязкого сжимаемого газа, основанная на классических уравнениях Навье-Стокса, дополненных уравнениями состояния совершенного газа. Задача решалась в двумерной осесимметричной постановке в рамках гипотезы симметричного взаимодействия потоков. Задача решалась методом контрольных объёмов. Для дискретизации конвективных членов использовался метод Годунова, а для дискретизации диссипативных членов использовалась линейная интерполяция значений на границах контрольных ячеек. Интегрирование по времени выполнялось методом Рунге-Кутты третьего порядка. Параметрический анализ был направлен на оценку влияния расстояния между соплами на размеры области взаимодействия струй, а также уровня плотности в этой зоне. Полученные распределения основных газодинамических величин позволили описать структуру течения и оценить форму и размеры локальных зон течения, а также уровень плотности в области контакта двух сверхзвуковых микроструй. Анализ показал, что более плотную зону можно получить сближением сопел, однако в этом случае происходит уменьшение продольного размера этой зоны, что необходимо учитывать при планировании экспериментальных исследований.

Исследование распространения примеси в среде в одной прикладной осесимметричной задаче

Евгений Александрович МИХАЙЛОВ, Игорь Олегович ТЕПЛЯКОВ, Дмитрий Андреевич ВИНОГРАДОВ

PDF (Rus)

207-216

Аннотация

С точки зрения приложений представляет интерес распространение примеси в цилиндрическом объеме, заполненном воздухом низкой плотности. Она связана с испарением вещества из небольшого «стакана», в котором имеют место конвективные течения, связанные с нагревом его дна. Рассмотрено распространение примеси с учетом как диффузии, так и конвективного переноса за счет тепловых процессов внутри «стакана». Распределение скоростей в основном объеме ищется с помощью решения уравнения Навье – Стокса, для примеси решается уравнение переноса с диффузионным слагаемым. Использована конечно-разностная численная схема, реализованная с помощью собственного программного кода. Получены решения в случаях, соответствующих разной высоте стенок «стакана», различным соотношениям между коэффициентами, описывающими процессы конвективного переноса и диффузии. Показано, что высокие стенки существенно препятствуют процессу распространения примеси в основной объем, и вещество в основном концентрируются внутри «стакана», не переходя за его пределы. Данные результаты имеют сходство с данными о переносе одной из компонент векторного потенциала в задаче об усилении вмороженного магнитного поля за счет конвекции в задаче, решавшейся ранее. Обсуждается вопрос о применении данных результатов на практике и их экспериментальной проверке в лабораторных условиях. Отмечено, что в целом распространение примеси соответствует данным, полученным в ходе экспериментальных исследований, проведенных ранее.

Поиск именованных сущностей в инструкциях по медицинскому применению лекарственных средств с использованием глубокого обучения и методов обработки естественного языка

Юрий Павлович ТИТОВ, Никита Владимирович КИЛЬМИШКИН, Дмитрий Дмитриевич КУБРАКОВ, Полина Михайловна ИВАНОВА

PDF (Rus)

217-236

Аннотация

В рамках работы создан специализированный словарь для поиска ключевых терминов в текстах медицинских инструкций, с использованием данных из глобальной базы данных VigiAccess, классификации МКБ-10 и ресурса rlsnet.ru. Текстовый корпус был предварительно очищен и приведён к единому формату для улучшения качества обучения модели. В дальнейшем планируется использовать источник grls.rosminzdrav.ru, как более авторитетный и полный, для получения информации о зарегистрированных лекарственных средствах. Для автоматизации аннотации данных разработан алгоритм, который выполняет поиск и разметку терминов из словаря в формате BIO (Begin, Inside, Outside), обеспечивая структурированную разметку для обучения моделей. Модель на основе глубоких нейронных сетей продемонстрировала высокую эффективность в распознавании именованных сущностей благодаря учёту контекстных зависимостей. Построение семантического графа лекарственных средств осуществлялось с помощью алгоритмов нахождения связей между именованными сущностями. Однако автоматическое выявление более глубоких связей между узлами графа затруднено и требует ручной доразметки данных для учёта сложных грамматических структур, что позволит улучшить анализ взаимодействий в текстах медицинских инструкций.

Какой статус васюганского варианта хантыйcкого языка подтверждают вычисления на платформе ЛингвоДок с точки зрения его системных морфологических характеристик?

Виктория Владимировна ВОРОБЬЕВА, Ирина Владимировна НОВИЦКАЯ

PDF (Eng)

237-246

Аннотация

В данном исследовании объектом анализа выступает васюганский вариант хантыйского языка. Его статус вызывает противоречивые мнения в исследованиях хантологов. Для уточнения статуса васюганского идиома как отдельного диалекта или как говора вах-васюганского диалекта мы использовали современные методы анализа языковых данных. На платформе LingvoDoc были использованы корпусные данные двух вариантов хантыйского языка, а именно, ваховского хантыйского и васюганского хантыйского, для расчета их морфологической близости с помощью онлайн-инструмента виртуальной лаборатории. Результаты анализа указывают на то, что морфологические системы ваховского и васюганского вариантов хантыйского языка совпадают на 98%, что подтверждает их морфологическое единство и принадлежность к одному и тому же диалектному континууму. Машинный анализ морфологических словарей, родственных групп и транскрипций выявил только три автономных аффикса в каждом идиоме. В связи с тем, что объёмы корпусных данных двух диалектных разновидностей несбалансированы, уникальные автономные морфологические аффиксы в каждом идиоме можно рассматривать как аргумент, подлежащий дальнейшей корректировке.

Названия украшений в тюркских и финно-угорских языках Урало-Поволжья

Римма Талгатовна МУРАТОВА

PDF (Rus)

247-254

Аннотация

В статье рассматриваются названия украшений в тюркских и финно-угорских языках Урало-Поволжья, выявляются общие и специфические особенности в их номинации. Исследования проводились с учетом данных лингвистических, этнографических, археологических трудов. Были построены ареалы распространения названий и предпринималась попытка датировать появление лексем. Поиск этимологий и картографирование проводились на лингвистической платформе Лингводок. Выявлены следующие особенности названий украшений в тюркских и финно-угорских языках Урало-Поволжья: 1) лексемы для обозначения кольца, серег и бус в тюркских языках являются более древними и восходят к праформам; в финно-угорских они являются либо заимствованиями, либо производными от других слов. Данный вывод полностью совпадает с результатами исследований археологов, которые относят украшения тюрков к гунно-сарматской эпохе; 2) названия подтверждают этнографические данные, например, арабское заимствование для обозначения бус из кораллов встречается в тех языках, в которых этот тип бус встречается; 3) названия налобной повязки соответствуют типам и функциям повязок. Таким образом, на основе лингвистических сведений нам удалось подтвердить данные археологических и этнографических исследований, в некотором смысле даже датировать происхождение названий.

Место коми-язьвинского в классификации языков коми на основании фонетических, лексических и морфологических особенностей с помощью программ платформы ЛингвоДок

Ольга Николаевна БАЖЕНОВА

PDF (Eng)

255-262

Аннотация

Cтатья посвящена определению места коми-язьвинского идиома в коми диалектном континууме. Для этой цели на лингвистической платформе LingvoDoc было обработано 8 коми словарей (аудиословари коми-язьвинского, верхнекамского, верхнесысольского, мысовского и кудымкарского диалектов, а также морфологические словари коми-язьвинского, коми-зырянского и коми-пермяцкого идиомов). Благодаря применению инструментов «поиск когнатов языков/диалектов», «анализ когнатов языков/диалектов», «глоттохронология языков/диалектов», «степень морфологической близости между диалектами/языками», «суммарный коэффициент различий между языками» было выявлено, что по фонетическим, лексическим и морфологическим признакам коми-язьвинский говор значительно отличается от других коми диалектов. Степень сходства с этими диалектами составляет от 86 до 88%, что свидетельствует о том, что коми-язьвинский в настоящее время можно рассматривать как отдельный язык, сохранивший черты пракоми языка.

Архитектура системы сбора и извлечения информации для интеллектуальной поисково-аналитической системы

Данил Сергеевич СЕРЕНКО, Егор Дмитриевич ТЕРЕНТЬЕВ, Денис Владимирович ЗУБАРЕВ, Илья Владимирович СОЧЕНКОВ

PDF (Rus)

263-280

Аннотация

Данные из интернета служат основой для решения широкого круга задач, от информационного поиска до аналитической обработки. Рост объёмов данных повышает важность эффективного извлечения описательных сведений о документах (метаданные – заголовки, имена авторов, даты публикации и так далее) с научных и образовательных сайтов (веб-ресурсов). Традиционные методы сбора и извлечения информации на основе статических шаблонов малоэффективны при обработке веб-страниц с динамически формируемым содержанием. В работе предложена архитектура адаптивной системы сбора и извлечения информации, сочетающая стандартные методы извлечения данных с технологиями машинного обучения. Система имеет модульную структуру, включающую подсистемы управления заданиями, мониторинга и журналирования, краулинга (робота сбора информации), управления ссылками, извлечения метаданных. Подсистема краулинга обрабатывает как статически, так и динамически формируемое содержание через имитацию работы прикладного программного обеспечения для просмотра веб-страниц. Для извлечения метаданных применяется комбинированный подход, совмещающий структурированные правила и машинное обучение. Эксперименты показали успешное извлечение метаданных из различных веб-ресурсов, включая страницы с динамически формируемым содержанием и сложными структурами. Система обладает высокой точностью и устойчивостью к изменениям форматов данных, при этом строго соблюдаются этические нормы сбора данных, включая обязательное выполнение инструкций и применение разумных интервалов между запросами.

Модель детекции фибрилляции предсердий, основанная на дифференцировании и сжатии интервалограмм

Никита Сергеевич МАРКОВ

PDF (Eng)

281-300

Аннотация

Фибрилляция предсердий – это наиболее распространенная в популяции аритмия, оказывающая существенное влияние на систему здравоохранения. В данной работе представлена модель автоматической детекции эпизодов фибрилляции предсердий на ЭКГ, использующая сжатие информации и численное дифференцирование для классификации последовательностей интервалов между сердцебиениями. В основе модели лежит нормализованное расстояние сжатия, основанное на теории универсальных метрик информационной близости. Чтобы обеспечить дискриминацию классов путем сжатия, в работе рассматривается конечно-разностное представление интервальных последовательностей с последующей процедурой квантования. В частности, вводится простое Δ5RR-интервальное представление последовательности, которое улучшает чувствительность модели к флуктуациям сердечного ритма. Предлагаемая модель достигает 96.37% чувствительности, 97.74% специфичности и 0.935 коэффициента корреляции Мэтьюса при 8x5-кратной кросс-валидации на базе данных MIT-BIH AFDB с использованием окна из 128 R-пиков. Особым преимуществом модели является качество классификации при обучении с малым количеством проб, то есть обучающая выборка с небольшим числом наблюдений последовательностей может использоваться для классификации достаточно больших тестовых выборок.

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Труды Института системного программирования РАН

Использование куки-файлов