Preview

Труды Института системного программирования РАН

Расширенный поиск
Том 37, № 2 (2025)
Скачать выпуск PDF
7-18
Аннотация

Рассматривается проблема оценки неопределенности в задаче регрессии. Решение задачи регрессии в данной работе ищется в виде ряда из базисных функций. Коэффициенты при базисных функциях подбираются путем минимизации суммы среднеквадратичной ошибки аппроксимации искомой функцией данных обучающего множества и регуляризационного слагаемого, смысл которого в наложении ограничений на множество решений. Добавление регуляризационного слагаемого – один из способов борьбы с математической некорректностью задачи. Регуляризационное слагаемое состоит из штрафного функционала и регуляризационного множителя, который является дополнительным параметром регрессионной модели. Байесовский подход к оценке оптимального значения регуляризационного множителя дает возможность получить его непосредственно из данных, как наиболее правдоподобное. Выбор регрессионной модели в виде ряда базисных функций из заданного набора позволяет сократить высокую вычислительную стоимость байесовского подхода за счет замены итерационной процедуры, используемой для модели общего вида, аналитическими выражениями. В процессе поиска регуляризационного множителя байесовский подход вычисляет оценку неопределенности получаемого решения. Корректность данной оценки является предметом текущего исследования. Предложенный подход к оценке неопределенности тестируется на модельных данных, зашумленных искусственным шумом. Показывается, что полученная предлагаемым методом оценка величины шума, дает хорошее совпадение со значением, заданным при генерации данных. Точность предлагаемого метода превзошла на модельных примерах точность используемого для оценки неопределенности набора данных Гамма-теста.

19-32
Аннотация

Моделирование схем является неотъемлемой частью процесса проектирования микроэлектронных устройств. В статье представлен процесс проектирования с использованием инструмента для моделирования Qucs-S с Ngspice или QucsatorRF в качестве движка моделирование. Данное ПО может быть использовано как в академических, так и в промышленных целях. Qucs-S сочетает в себе современный графический интерфейс и движки для моделирования, такие как Ngspice, QucsatorRF и XYCE. В статье представлен обзор программной архитектуры Qucs-S и ее применения для проектирования интегральных схем. Предлагаемый рабочий процесс проиллюстрирован на примере извлечения параметров полупроводниковых резисторов и углового моделирования с использованием упомянутых инструментов с открытым исходным кодом. 

33-48
Аннотация

Задача разработки принципиальной электрической схемы, возникающая при создании аналоговых интегральных схем, сформулирована как задача оптимизации дифференцируемой гладкой функции с помощью комбинации методов дифференцируемого программирования и методов машинного обучения. Показано, что такой подход позволяет достичь требований спецификации и предложить оптимальную комбинацию схемотехнических шаблонов, составляющих аналоговую интегральную схему, без привлечения методов комбинаторной оптимизации и обучения с подкреплением. Показано, что такой подход дает значительные преимущества по скорости по сравнению с традиционными методами, основанными на обучении с подкреплением. Исследована возможность полностью автоматического синтеза аналоговой ИС от спецификации до топологии без участия эксперта с помощью программных средств с открытым исходным кодом. Показаны преимущества и недостатки такого подхода.

49-60
Аннотация

Разработка цифровой аппаратуры – длительный процесс, одними из основных этапов которого являются логический и физический синтез. Несмотря на автоматизацию синтеза в современных САПР, он может занимать часы или даже дни. Применение методов машинного обучения может помочь прогнозировать результаты синтеза и за счет этого ускорить весь процесс разработки. В данной статье описан опыт создания и оценки восьми моделей машинного обучения для прогнозирования площади и задержки СБИС по ее схеме на этапе логического синтеза. Полученные результаты показывают перспективность данного подхода и указывают направления для дальнейших исследований.

61-78
Аннотация

Механизм мандатного контроля целостности (МКЦ) – фундамент безопасности сертифицированной по высшим классам защиты и уровням доверия операционной системы (ОС) Astra Linux, обеспечивающий наряду с другими механизмами, включая замкнутую программную среду (ЗПС), защиту привилегированных процессов ОС, целостность исполняемых и конфигурационных системных файлов и каталогов ОС, а также пользовательских данных. Использование МКЦ направлено на защиту от вирусов (например, «шифровальщиков»), от эксплуатации многих типовых уязвимостей программного обеспечения (ПО) ОС семейства Linux, в том числе приводящих к атакам нарушителя с правами суперпользователя root. Научной основой реализации МКЦ в ОС Astra Linux является соответствующая критериям ГОСТ Р 59453.1-2021 мандатная сущностно-ролевая ДП-модель управления доступом и информационными потоками в ОС семейства Linux (МРОСЛ ДП-модель). При этом внедрение механизма МКЦ поверх штатного для ОС семейства Linux дискреционного управления доступом представляет существенные трудности, часто требует разработки технологий и сценариев согласованного с ним применения системного и прикладного ПО. Авторами проводятся исследования по проектированию, развитию и эффективному использованию МКЦ. Во-первых, это доработки МРОСЛ ДП-модели для теоретического описания механизма МКЦ с учетом вносимых в него изменений. Во-вторых, адаптированная к МКЦ технология контейнерной виртуализации, когда потенциально «опасное» ПО запускается в изолированных на промежуточных уровнях целостности (в сессиях администратора системы, работающего на максимальном уровне целостности) или отрицательных уровнях целостности (в сессиях непривилегированного пользователя, работающего на нулевом уровне целостности) контейнерах-«песочницах» (например, docker). В-третьих, технологии и сценарии непосредственного запуска прикладного ПО на промежуточных или отрицательных уровнях целостности с настройкой меню рабочего стола администратора системы или непривилегированного пользователя, соответственно.
В-четвертых, утилита настройки МКЦ, выставляющая файлам и каталогам уровни целостности или специальные флаги на основе правил профилей LSM-модуля AppArmor.

79-96
Аннотация

В статье представляется новый инструмент TSAR, предназначенный для оценки эффективности статических анализаторов. TSAR включает в себя три основных компонента: систему анализа статических анализаторов, генератор тестов, базирующийся на Common Weakness Enumeration (CWE), и механизмы трансформации кода (мутатора) для усложнения работы анализаторов. Система анализа позволяет выявлять слабые места в инструментах статического анализа, в то время как генератор тестов создает специфические случаи на основе известных уязвимостей. Трансформации кода позволяют создавать сложные структуры, затрудняющие анализ и призванные проверить устойчивость анализаторов к обнаружению реальных уязвимостей. Данный инструмент предоставляет исследователям и разработчикам возможность для более глубокой оценки качества статических анализаторов программного обеспечения для их дальнейшего улучшения.

97-114
Аннотация

С развитием современных информационных систем динамический анализ становится неотъемлемой частью процесса разработки программного обеспечения. Одной из самых эффективных и распространённых техник в этой области является фаззинг-тестирование (фаззинг). Суть этого метода состоит в передаче исследуемой программе большого количества случайных и неожиданных входных данных. Инструменты мутационного фаззинга генерируют тестовые данные, применяя модификации (мутации) к удачным из уже использованных вариантов, повышая таким образом число обнаруженных поведений и покрытие кода. Сами мутации при этом чаще всего выбираются случайным образом.
В данной работе предложен метод повышения эффективности мутационного фаззинга с помощью адаптивной стратегии выбора мутации. Предложенный метод апробирован на широко используемых Java-пакетах и продемонстрировал статистически значимый прирост количества найденных ошибок и числа различных поведений (трасс исполнения) тестируемых программ.

115-128
Аннотация

В данной работе исследуются методы улучшения процесса автоматизированного поиска архитектур для графовых нейронных сетей (ГНС). Мы предлагаем новый подход, основанный на адаптивном изменении пространства поиска посредством выделения приоритетных направлений, что позволяет повысить эффективность поиска архитектур. Еще один предлагаемый подход расширяет пространство поиска, разрешая комбинировать различные типы графовых сверточных слоев. Основное внимание уделяется максимизации точности архитектур в расширенном пространстве поиска при фиксированном бюджете поиска по количеству моделей. Наши эксперименты проводятся на наборах данных цитирования, химических молекул и графов покупок. Результаты экспериментов показывают, что предложенный подход позволяет находить более эффективные модели без увеличения вычислительных ресурсов и демонстрирует высокую перспективность для автоматизации решений реальных задачах анализа графовых данных.

129-140
Аннотация

В работе приведено построение гидравлической модели теплообменного аппарата (ТА). Исследуемый в работе многосекционный ТА включает в себя теплообменную матрицу из 11 секций, каждая из которых содержит 6 каналов малого диаметра. Построение гидравлической математической модели (ГММ) основано на результатах экспериментальных исследований и результатах математического моделирования. Численное моделирование проводилось в пакете OpenFOAM с использованием решателя simpleFoam. На основе математического моделирования проведены полноразмерные расчеты ТА в рабочем диапазоне чисел Рейнольдса, а также дополнительные расчёты течения в малоразмерных каналах с учетом внутреннего оребрения и наличия интенсификаторов теплообмена. В результате анализа распределения гидравлических потерь в многосекционном ТА построена гидравлическая математическая модель работы устройства. На основе сопоставления расчетных данных и результатов экспериментальных исследований проведена идентификация параметров ГММ теплообменного аппарата. Построенная модель в дальнейшем будет обобщена на широкий размерный ряд ТА данного вида.

141-152
Аннотация

В работе приведены результаты численного исследования влияния конструктивного параметра – зазора между охлаждающими пластинами конвективного теплообменного аппарата на его эффективность. Рассматривается единичная охлаждающая секция маслоохладителя, состоящая из разведённых на определенное расстояние охлаждающих пластин. Оценка эффективности устройства строится на основе анализа изменения коэффициентов теплоотдачи на границах рабочих сред от увеличения расстояния между пластинами. Рассматривается задача сопряженного теплообмена между нагретым гидравлическим маслом, пластинами маслоохладителя и холодным турбулентным потоком нагнетаемого вентилятором воздуха. Численное решение полученной системы уравнений строится методом контрольных объемов с использованием решателя chtMultiRegionFoam свободно распространяемого программного обеспечения OpenFOAM. Численное моделирование рабочих процессов, протекающих в единичной секции маслоохладителя, производилось методом установления. В результате численного моделирования получены поля физических величин, структура потока воздуха и масла в соответствующих каналах устройства. Выявлено и показано влияние величины зазора между пластинами на внутреннюю и внешнюю аэродинамику единичной секции маслоохладителя. Выявлен, описан и обоснован неравномерный нагрев корпуса охлаждающей секции с локализацией температурного максимума в области внутренних центральных каналов. Анализ полученных теплофизических характеристик позволил выявить оптимальное расстояние между пластинами маслоохладителя в 22 мм.

 

153-162
Аннотация

Проведено численное исследование турбулентного диффузионного пламени на поверхности полиметилметакрилата (ПММА). Для проведения расчетов использовалась программа с открытым кодом Fire Dynamics Simulator (FDS), в которой использовался метод LES для моделирования турбулентного пламени. Для визуализации результатов использовалась программа SmokeView, которая является модулем пакета FDS. По результатам исследования определены размеры области вблизи поверхности горения, в которой наблюдается ламинарный режим течения. Предлагается алгоритм для решения сопряженной задачи распространения турбулентного пламени по поверхности горючего материала. Алгоритм сопряженной задачи состоит в совместном расчете ламинарного пламени вблизи поверхности горения и турбулентного режима в остальной области.

163-180
Аннотация

В настоящей работе предложена математическая модель для решения задачи о течении развитого турбулентного потока в канале. В качестве уравнений, описывающих течение жидкости, используются уравнения Рейнольдса и уравнения модели турбулентности k-omega, приведенные к квазигидродинамическому виду. Для численного решения уравнений математической постановки использовался комбинированный подход, сочетающий метод контрольных объемов и метод конечных элементов на треугольных адаптивных сетках. Для верификации предложенной математической модели была решена задача о течении турбулентного потока в канале прямоугольной формы. Полученные результаты показали, хорошее согласование результатов по предложенной модели с результатами прямого численного моделирования в области турбулентного подслоя. Для дальнейшей верификации модели был выполнен расчет ряда задач об обтекании турбулентным потоком фиксированных песчаных дюн с различным углом подветренного склона. Выполнен сравнительный анализ расчетных характеристик потока с экспериментальными данными, который показал их качественное и количественное согласование, за исключением значений кинетической энергии турбулентности в случае обтекания пологих дюн. Хорошее согласование значений осредненного над одной дюной сдвигового напряжения Рейнольдса и общего касательного напряжения, полученных по предложенной модели, с экспериментальными данными позволяет использовать предложенную модель для расчета характеристик гидродинамического потока, проходящего над изменяющимися во времени донными формами.

181-194
Аннотация

В работе рассмотрена задача о воздействии турбулентной струи, на размываемое дно. Предложена математическая модель задачи, включающая уравнения Рейнольдса, уравнения переноса кинетической энергии, диссипации турбулентности, концентрации взвешенных частиц и уравнение русловых деформаций. Для описания изменений донной поверхности используется оригинальное уравнение донных деформаций, построенное на основе аналитической модели движения влекомых наносов. Предложен алгоритм решения задачи с помощью метода контрольных объемов. Численное моделирование задачи показало, что при размыве дна под воздействием турбулентной струи возникает характерная донная волна, параметры которой в области размыва, согласуются с известными экспериментальными данными.

195-206
Аннотация

В работе представлены результаты параметрических исследований особенностей столкновения сверхзвуковых недорасширенных струй аргона, вытекающих из соосных микросопел, расположенных навстречу друг другу. Для численного моделирования газодинамики сверхзвуковых струй использовалась математическая модель вязкого сжимаемого газа, основанная на классических уравнениях Навье-Стокса, дополненных уравнениями состояния совершенного газа. Задача решалась в двумерной осесимметричной постановке в рамках гипотезы симметричного взаимодействия потоков. Задача решалась методом контрольных объёмов. Для дискретизации конвективных членов использовался метод Годунова, а для дискретизации диссипативных членов использовалась линейная интерполяция значений на границах контрольных ячеек. Интегрирование по времени выполнялось методом Рунге-Кутты третьего порядка. Параметрический анализ был направлен на оценку влияния расстояния между соплами на размеры области взаимодействия струй, а также уровня плотности в этой зоне. Полученные распределения основных газодинамических величин позволили описать структуру течения и оценить форму и размеры локальных зон течения, а также уровень плотности в области контакта двух сверхзвуковых микроструй. Анализ показал, что более плотную зону можно получить сближением сопел, однако в этом случае происходит уменьшение продольного размера этой зоны, что необходимо учитывать при планировании экспериментальных исследований.

207-216
Аннотация

С точки зрения приложений представляет интерес распространение примеси в цилиндрическом объеме, заполненном воздухом низкой плотности. Она связана с испарением вещества из небольшого «стакана», в котором имеют место конвективные течения, связанные с нагревом его дна. Рассмотрено распространение примеси с учетом как диффузии, так и конвективного переноса за счет тепловых процессов внутри «стакана». Распределение скоростей в основном объеме ищется с помощью решения уравнения Навье – Стокса, для примеси решается уравнение переноса с диффузионным слагаемым. Использована конечно-разностная численная схема, реализованная с помощью собственного программного кода. Получены решения в случаях, соответствующих разной высоте стенок «стакана», различным соотношениям между коэффициентами, описывающими процессы конвективного переноса и диффузии. Показано, что высокие стенки существенно препятствуют процессу распространения примеси в основной объем, и вещество в основном концентрируются внутри «стакана», не переходя за его пределы. Данные результаты имеют сходство с данными о переносе одной из компонент векторного потенциала в задаче об усилении вмороженного магнитного поля за счет конвекции в задаче, решавшейся ранее. Обсуждается вопрос о применении данных результатов на практике и их экспериментальной проверке в лабораторных условиях. Отмечено, что в целом распространение примеси соответствует данным, полученным в ходе экспериментальных исследований, проведенных ранее.

217-236
Аннотация

В рамках работы создан специализированный словарь для поиска ключевых терминов в текстах медицинских инструкций, с использованием данных из глобальной базы данных VigiAccess, классификации МКБ-10 и ресурса rlsnet.ru. Текстовый корпус был предварительно очищен и приведён к единому формату для улучшения качества обучения модели. В дальнейшем планируется использовать источник grls.rosminzdrav.ru, как более авторитетный и полный, для получения информации о зарегистрированных лекарственных средствах. Для автоматизации аннотации данных разработан алгоритм, который выполняет поиск и разметку терминов из словаря в формате BIO (Begin, Inside, Outside), обеспечивая структурированную разметку для обучения моделей. Модель на основе глубоких нейронных сетей продемонстрировала высокую эффективность в распознавании именованных сущностей благодаря учёту контекстных зависимостей. Построение семантического графа лекарственных средств осуществлялось с помощью алгоритмов нахождения связей между именованными сущностями. Однако автоматическое выявление более глубоких связей между узлами графа затруднено и требует ручной доразметки данных для учёта сложных грамматических структур, что позволит улучшить анализ взаимодействий в текстах медицинских инструкций.

237-246
Аннотация

В данном исследовании объектом анализа выступает васюганский вариант хантыйского языка. Его статус вызывает противоречивые мнения в исследованиях хантологов. Для уточнения статуса васюганского идиома как отдельного диалекта или как говора вах-васюганского диалекта мы использовали современные методы анализа языковых данных. На платформе LingvoDoc были использованы корпусные данные двух вариантов хантыйского языка, а именно, ваховского хантыйского и васюганского хантыйского, для расчета их морфологической близости с помощью онлайн-инструмента виртуальной лаборатории. Результаты анализа указывают на то, что морфологические системы ваховского и васюганского вариантов хантыйского языка совпадают на 98%, что подтверждает их морфологическое единство и принадлежность к одному и тому же диалектному континууму. Машинный анализ морфологических словарей, родственных групп и транскрипций выявил только три автономных аффикса в каждом идиоме. В связи с тем, что объёмы корпусных данных двух диалектных разновидностей несбалансированы, уникальные автономные морфологические аффиксы в каждом идиоме можно рассматривать как аргумент, подлежащий дальнейшей корректировке.

247-254
Аннотация

В статье рассматриваются названия украшений в тюркских и финно-угорских языках Урало-Поволжья, выявляются общие и специфические особенности в их номинации. Исследования проводились с учетом данных лингвистических, этнографических, археологических трудов. Были построены ареалы распространения названий и предпринималась попытка датировать появление лексем. Поиск этимологий и картографирование проводились на лингвистической платформе Лингводок. Выявлены следующие особенности названий украшений в тюркских и финно-угорских языках Урало-Поволжья: 1) лексемы для обозначения кольца, серег и бус в тюркских языках являются более древними и восходят к праформам; в финно-угорских они являются либо заимствованиями, либо производными от других слов. Данный вывод полностью совпадает с результатами исследований археологов, которые относят украшения тюрков к гунно-сарматской эпохе; 2) названия подтверждают этнографические данные, например, арабское заимствование для обозначения бус из кораллов встречается в тех языках, в которых этот тип бус встречается; 3) названия налобной повязки соответствуют типам и функциям повязок. Таким образом, на основе лингвистических сведений нам удалось подтвердить данные археологических и этнографических исследований, в некотором смысле даже датировать происхождение названий.

255-262
Аннотация

Cтатья посвящена определению места коми-язьвинского идиома в коми диалектном континууме. Для этой цели на лингвистической платформе LingvoDoc было обработано 8 коми словарей (аудиословари коми-язьвинского, верхнекамского, верхнесысольского, мысовского и кудымкарского диалектов, а также морфологические словари коми-язьвинского, коми-зырянского и коми-пермяцкого идиомов). Благодаря применению инструментов «поиск когнатов языков/диалектов», «анализ когнатов языков/диалектов», «глоттохронология языков/диалектов», «степень морфологической близости между диалектами/языками», «суммарный коэффициент различий между языками» было выявлено, что по фонетическим, лексическим и морфологическим признакам коми-язьвинский говор значительно отличается от других коми диалектов. Степень сходства с этими диалектами составляет от 86 до 88%, что свидетельствует о том, что коми-язьвинский в настоящее время можно рассматривать как отдельный язык, сохранивший черты пракоми языка.

263-280
Аннотация

Данные из интернета служат основой для решения широкого круга задач, от информационного поиска до аналитической обработки. Рост объёмов данных повышает важность эффективного извлечения описательных сведений о документах (метаданные – заголовки, имена авторов, даты публикации и так далее) с научных и образовательных сайтов (веб-ресурсов). Традиционные методы сбора и извлечения информации на основе статических шаблонов малоэффективны при обработке веб-страниц с динамически формируемым содержанием. В работе предложена архитектура адаптивной системы сбора и извлечения информации, сочетающая стандартные методы извлечения данных с технологиями машинного обучения. Система имеет модульную структуру, включающую подсистемы управления заданиями, мониторинга и журналирования, краулинга (робота сбора информации), управления ссылками, извлечения метаданных. Подсистема краулинга обрабатывает как статически, так и динамически формируемое содержание через имитацию работы прикладного программного обеспечения для просмотра веб-страниц. Для извлечения метаданных применяется комбинированный подход, совмещающий структурированные правила и машинное обучение. Эксперименты показали успешное извлечение метаданных из различных веб-ресурсов, включая страницы с динамически формируемым содержанием и сложными структурами. Система обладает высокой точностью и устойчивостью к изменениям форматов данных, при этом строго соблюдаются этические нормы сбора данных, включая обязательное выполнение инструкций и применение разумных интервалов между запросами.

281-300
Аннотация

Фибрилляция предсердий – это наиболее распространенная в популяции аритмия, оказывающая существенное влияние на систему здравоохранения. В данной работе представлена модель автоматической детекции эпизодов фибрилляции предсердий на ЭКГ, использующая сжатие информации и численное дифференцирование для классификации последовательностей интервалов между сердцебиениями. В основе модели лежит нормализованное расстояние сжатия, основанное на теории универсальных метрик информационной близости. Чтобы обеспечить дискриминацию классов путем сжатия, в работе рассматривается конечно-разностное представление интервальных последовательностей с последующей процедурой квантования. В частности, вводится простое Δ5RR-интервальное представление последовательности, которое улучшает чувствительность модели к флуктуациям сердечного ритма. Предлагаемая модель достигает 96.37% чувствительности, 97.74% специфичности и 0.935 коэффициента корреляции Мэтьюса при 8x5-кратной кросс-валидации на базе данных MIT-BIH AFDB с использованием окна из 128 R-пиков. Особым преимуществом модели является качество классификации при обучении с малым количеством проб, то есть обучающая выборка с небольшим числом наблюдений последовательностей может использоваться для классификации достаточно больших тестовых выборок.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)