Preview

Труды Института системного программирования РАН

Расширенный поиск
Том 35, № 5 (2023)
Скачать выпуск PDF
7-22
Аннотация

Механизм управления доступом является базовым для обеспечения безопасности системного программного обеспечения (ПО) такого, как операционная система (ОС) или система управления базами данных (СУБД). В качестве научной основы реализации такого механизма, а также в соответствии с требованиями нормативных документов отечественных регуляторов к сертифицированным средствам защиты информации должна разрабатываться соответствующая критериям ГОСТ Р 59453.1-2021 формальная модель управления доступом. Такой формальной моделью для сертифицированной по высшим классам защиты и уровням доверия ОС Astra Linux является мандатная сущностно-ролевая ДП-модель управления доступом и информационными потоками в ОС семейства Linux (МРОСЛ ДП-модель). С учетом внедрения в механизм управления доступом ОС Astra Linux новых элементов, с целью обеспечения более точного соответствия описания модели этому механизму, развитию научно обоснованных технологий и практик разработки и верификации формальных моделей МРОСЛ ДП-модель регулярно перерабатывается. В настоящее время завершена очередная такая переработка модели для двух уровней ее иерархического представления, соответствующих ролевому управлению доступом (представляющему традиционное для ОС семейства Linux дискреционное управление доступом) и мандатному контролю целостности, отражающая наиболее существенные изменения в ОС Astra Linux релиза 2023 года. В статье анализируются основные результаты этой переработки, в рамках которой: введены функции, задающие новые метки сущностей, изменены состав и описания де-юре правил преобразования состояний системы, административных и запрещающих ролей, скорректированы формулировки и заново доказаны несколько утверждений, а также внесены другие изменения в описание модели.

23-36
Аннотация

Конфиденциальность является важным свойством безопасности при обмене данными по сети. Для её реализации используется семейство протоколов SSL/TLS, которые, однако, в полной мере не скрывают ни посещаемого сайта, ни действий пользователя. Помимо конфиденциальности приватность также играет значимую роль для пользователей сети. Для обеспечения дополнительной приватности были реализованы некоторые программные решения, такие как Tor и I2P. В качестве меры приватности соответствующих решений может использоваться их устойчивость к специализированному классу атак. Одной из атак является Website Fingerprinting, позволяющая по трафику, отправляемому и получаемому известным пользователем, определять, какие именно сайты он посещал. Website Fingerprinting — это задача классификации, где объектом является посещение пользователем веб-сайта, а классом сам веб-сайт. В данной статье исследуется атака Website Fingerprinting для HTTP/2 трафика. В работе присутствует описание и вычисление популярных признаков, используемых при классификации трафика, и оценивается их применимость к задаче Website Fingerprinting. Для реализации атаки Website Fingerprinting строится несколько классификаторов, среди которых выбирается алгоритм, дающий лучший результат на собранном наборе данных. Точность лучшего классификатора составляет 97.8% в определённых допущениях. Кроме того, в работе присутствует оценка и анализ некоторых ограничений реального мира, влияющих на точность классификации.

37-54
Аннотация

В статье исследуется известная криптографическая задача получения клиентом данных из базы, размещенной на сервере, таким образом, чтобы никто из имеющих доступ к серверу, кроме самого клиента, не смог получить информацию о содержании этого запроса. Задача, известная как PIR (Private Information Retrieval), была сформулирована в информационно-теоретической постановке в 1995 году Шором, Голдрайхом, Кушелевицем и Суданом. Предложена модель облачных вычислений, включающая облако, центр аутентификации, пользователя, клиентов, доверенное лицо (дилера), активного противника, работающего по протоколу, на облаке. Предполагается, что у атакующей стороны имеется возможность создания фальшивых клиентов для формирования неограниченного числа запросов. Предложен алгоритм размещения базы данных на облаке и алгоритм запроса требуемого бита. Применяется инъективное преобразование номеров битов, представленных в l-ичной системе счисления словами длины d, в слова без повторяющихся цифр той же длины с алфавитом из 𝒍̂ цифр, то есть {0, ..., l}d → {0, ..., 𝒍̂}d что позволяет уменьшить вероятность угадывания противником номера бита. Приведены оценки коммуникационной сложности и вероятности раскрытия запрашиваемого бита с учетом выполненного преобразования.

55-66
Аннотация

Фаззинг-тестирование JavaScript интерпретаторов является одним из наиболее сложных направлений в тестировании веб-браузера, ввиду сложности генерации его входных данных. Интерпретаторы обрабатывают JavaScript код на веб-странице и требуют постоянной поддержки новых стандартов языка и усложнения своей архитектуры. Наиболее распространенные сегодня фаззеры не способны эффективно мутировать сложноструктурированные входные данные при фаззинг-тестировании. Генерация JavaScript кода с нуля не позволяет инкапсулировать необходимую семантику, а текущие мутаторы быстро разрушают синтаксис и семантику языка входных данных. В данной статье представлена новая стратегия мутации, сохраняющая синтаксис и семантику входных данных за счет модификации AST-деревьев фрагментов JavaScript кода. Данный метод позволяет эффективно генерировать разнообразные и корректные входные данные, которые могут привести к выявлению ошибок и уязвимостей в интерпретаторах JavaScript. Данный метод может быть использован для повышения безопасности веб-браузеров и обеспечения надежности интерпретации JavaScript кода.

67-80
Аннотация

В статье проведен анализ существующих методов для оптимизации временных затрат и вычислений при высокоуровневом моделировании сетей на кристалле. Приведено описание параметров и характеристик сетей на кристалле, рассчитываемых различными моделями, и проанализировано их влияние на скорость высокоуровневого моделирования. Проведена адаптация существующих методов оптимизации моделирования для внедрения в систему автоматизации проектирования сетей на кристалле.

81-90
Аннотация

. В этой статье представлено программное обеспечение с открытым исходным кодом для генерации, хранения и анализа комбинационных схем. Оптимизированы созданные ранее методы генерации комбинационных схем и сформирован датасет. Генерация комбинационных схем может осуществляться на различных устройствах. В приложении реализована возможность объединения сгенерированных наборов данных в единое хранилище (Synology Drive), а также анализа отказоустойчивости комбинационных схем с использованием различных методов их оценки. Предложены новые возможные методы оценки надежности комбинационных схем с использованием машинного обучения.

91-106
Аннотация

Использование для численного решения задач механики сплошной среды метода граничных элементов приводит к необходимости решения системы линейных алгебраических уравнений с заполненной матрицей. Cтандартами де-факто интерфейса программных реализаций функций над заполненными матрицами являются BLAS/LAPACK. Среди оптимизированных открытых реализаций BLAS/LAPACK, только библиотека OpenBLAS включает в себя оптимизации под самый широкий спектр аппаратных платформ – Intel, AMD, ARM и RISC-V. Экосистема открытой архитектуры RISC-V в настоящее время активно развивается: европейские суперкомпьютерные центры открыли центры компетенции RISC-V в рамках правительственной грантовой поддержки EuroHPC, поскольку решения, основанные на архитектуре ARM, не были признаны частью европейской инициативы по развитию собственной технологической независимости. В настоящее время в мире разрабатываются не только высокопроизводительные RISC-V процессоры, но и AI-ускорители, а также видеокарты на RISC-V архитектуре. OpenBLAS активно поддерживается и оптимизируется под появляющееся RISC-V оборудование и расширения. Однако, к библиотекам, использующимся в продуктовом коде, традиционно предъявляются серьезные требования по стабильности и надежности, чтобы минимизировать возможные ошибки и сбои в продукте.  Как оказалось, с этой точки зрения, OpenBLAS имеет ряд проблем, которые нам пришлось решить с целью продуктизации этой библиотеки. В данной статье описывается тестовая система OpenBLAS, рассматриваются проблемы тестирования LAPACK-функционала библиотеки и пути их решения. Кроме того, анализируется тестовое покрытие BLAS-функционала и обсуждаются достигнутые результаты по его увеличению. В дальнейшем планируется внести описанные изменения в проект OpenBLAS.

107-126
Аннотация

Данная статья посвящена разработке доверенных средств проектирования цифровых схем в базисе гетерогенных программируемых логических интегральных схем (ПЛИС). Проектирование гетерогенных ПЛИС представляет собой одно из наиболее активно развивающихся направлений в российской микроэлектронике в настоящее время. В статье рассматриваются основные проблемы и вызовы, связанные с разработкой целевых доверенных средств проектирования. Авторы предлагают актуальный подход к разработке системы автоматизированного проектирования, основанный на использовании программных средств с открытым исходным кодом совместно с собственными наработками для её критически важных компонентов. Такой подход позволяет повысить эффективность и надёжность процесса проектирования в базисе гетерогенных ПЛИС. В статье рассмотрены такие этапы маршрута проектирования цифровых схем в базисе гетерогенных ПЛИС, как логический синтез и технологическое отображение, этапы топологического синтеза и статического временного анализа. Работа представляет интерес для специалистов в области микроэлектроники, а также для исследователей, занимающихся разработкой средств и систем проектирования ИС. Результаты исследования способствуют улучшению существующих методов и инструментов проектирования ИС, а также развитию и расширению отечественной электронной компонентной базы.

127-144
Аннотация

В статье рассматривается решение проблемы быстрого проведения статического анализа падения напряжения с использованием нейронной сети. Рассматривается методика генерации базы данных необходимой для обучения ML-модели. Описывается методика обучения ML-модели для анализа статического IR drop эффекта. Описывается алгоритм получения входных данные для обучения нейронной сети из SPICE представления. Предложенное решение задачи попало в ТОП3 конкурса ICCAD Contest 2023.

145-156
Аннотация

В работе исследуются возможности применения нейросетевых методов для решения задачи глобальной трассировки интегральных схем. Разработан алгоритм генерации обучающей выборки на основе волнового алгоритма Ли, позволяющий синтезировать трехмерные матрицы с препятствиями и точками, которые нужно соединить. Для обучения выбрана полносверточная нейронная сеть U-Net, эффективная для семантической сегментации изображений. Проведена оценка качества результатов на тестовой выборке. Показано значительное сокращение времени трассировки по сравнению с волновым методом, однако доля маршрутов без разрывов составила лишь 37%. Предложены пути улучшения обучающей выборки и адаптации подхода под реальные условия с использованием файлов DEF и GUIDE. В работе продемонстрирован потенциал нейросетевых методов для ускорения задачи трассировки, однако требуется продолжение исследований для повышения качества и надежности результатов. Работа полезна для специалистов в области проектирования интегральных схем и машинного обучения.

157-168
Аннотация

Система остаточных классов широко применяются в криптографии, цифровой обработке сигналов, системах обработки изображений и других областях, где требуется выполнение операций деления. Однако, операция деления является наиболее сложной с точки зрения вычислений в системе остаточных классов. В статье представлен оптимизированный алгоритм деления, основанный на функции ядра Акушского. Показано, что предложенный алгоритм по скорости вычислений эффективней, чем классическое итерационное деление.

169-192
Аннотация

MISRA C – это сборник правил и рекомендаций по программированию на языке C, который является фактическим стандартом в отраслях, где безопасность играет ключевую роль. Стандарт разработан консорциумом MISRA (Motor Industry Software Reliability Association) и включает в себя набор рекомендаций, которые позволяют использовать язык C для разработки безопасного, надежного и переносимого программного обеспечения. MISRA широко применяется во многих отраслях с высокими требованиями к надежности, включая аэрокосмическую, оборонную, автомобильную и медицинскую.

Мы разработали статические детекторы для проверки кода на соответствие рекомендациям стандарта безопасного кодирования MISRA C 2012. Средство проверки кода основано на компиляторной инфраструктуре LLVM/clang. В данной статье описываются стратегии, лежащие в основе проектирования и реализации детекторов. На тестовых примерах MISRA С предложенные детекторы с высокой точностью определяют соответствие или нарушение рекомендациям. Также детекторы показывают большее покрытие и лучшую скорость работы, чем Cppcheck, популярный статический анализатор с открытым исходным кодом.

193-214
Аннотация

В данной статье рассматривается задача извлечения именованных сущностей из рецензий исходного кода. В работе приводится сравнительный анализ существующих подходов и предлагаются собственные методы для улучшения качества решения задачи. Предложенные и реализованные улучшения включают в себя: методы борьбы с дисбалансом данных, улучшения токенизации входных данных, использование больших массивов неразмеченных данных и применение дополнительных бинарных классификаторов. Для оценки качества собран и размечен вручную новый набор из 3000 пользовательских рецензий. Показано, что предложенные улучшения позволяют значительно увеличить показатели метрик качества, вычисляемых как на уровне токенов (+22%), так и на уровне сущностей целиком (+13%).

215-228
Аннотация

Исследование сосредотачивается на проблеме того, как современные системы исправления грамматических ошибок обрабатывают ошибки на уровне слова. Работа обсуждает, как подобные ошибки могут взаимодействовать с эффективностью модели, и оценивает, как модели с разными архитектурами справляется с ними. Делается вывод о том, что специализированные системы исправления грамматических ошибок сталкиваются с проблемами при исправлении ошибок, приводящих к созданию несуществующих слов, и что предобработка с помощью простой системой обработки подобных ошибок значительно улучшает общую эффективность модели. Для оценки этого работа модели тестируется для нескольких валидационных датасетах. Вдобавок к валидационному датасету соревнования CoNLL-2014 в работе предлагается синтетический датасет с повышенной плотностью ошибок на уровне слова. На основании сравнения эффективности модели на двух датасетах, работа делает вывод о том, что валидационные датасеты с высокой плотностью ошибок, представляющих проблему для моделей, — это полезный инструмент для сравнения моделей. Кроме того, работа указывает на случаи некорректной аннотации несуществующих слов в разметке экспертов и предлагает очищенную версию датасета. В отличие от специализированных систем исправления грамматических ошибок, модель LLaMA, используемся для задачи исправления грамматических ошибок хорошо справляется с ошибками на уровне слова. Мы предполагаем гипотезу, в соответствии с которой этот результат объясняется тем фактом, что эта модель не обучается на специальной аннотированной выборке, содержащей ошибки, а получает в качестве входа грамматически и орфографически корректные тексты.

229-244
Аннотация

Предложена интеллектуальная модель на базе мультимодального трансформера для решения задачи прогнозирования времени и площади выхода различных углеводородных компонентов из состава тяжелой нефти при использовании катализаторов на основе шести металлов: никеля, меди, марганца, свинца, цинка и натрия. В качестве входных данных интеллектуальная модель принимает две модальности: хроматограмму образца чистой сырой нефти, представленную в виде графической информации и сопровождающие её табличные данные. На выходе мультимодальный трансформер позволяет получить прогнозные табличные данные, которые формализуют перераспределенный групповой состав нефти и описывают как наименования полученных углеводородов, так и две их качественные характеристики: время выхода спектров компонентов и их относительную площадь. Моделирование прогноза превращений высокомолекулярных соединений в легкомолекулярные на основе разработанной модели позволяет существенно сократить временные, аппаратные и человеческие ресурсы, необходимые для выбора нужного типа катализатора в нефтехимических лабораториях. В процессе исследования было обнаружено, что обучение интеллектуальной модели на данных одного месторождения позволяет в дальнейшем выполнять аналогичный прогноз с приемлемой точностью для данных другого месторождения тяжелой нефти. Величина ошибки прогноза интеллектуальной модели удовлетворяет требованиям, предъявляемыми нефтехимической лабораторией для практического применения мультимодального трансформера.

245-258
Аннотация

Рассматривается актуальный подход для разработки физически-обоснованной нейронной сети для решения модельных задач для течения Коважного, геофизического течения Бельтрами, течения на участке реки по теории мелкой воды. Физически-обоснованные нейронные сети (PINN) позволяют существенно сокращать время расчета по сравнению с обычными вычислениями. Для каждого модельного течения существует свое аналитическое решение. Обсуждается архитектура программной библиотеки DeepXDE, ее состав по модулям, приводятся фрагменты программного кода на языке программирования Python. Модель PINN протестирована на тестовой выборке. Оценка предсказания выполнена с помощью метрики MSE. Полносвязанная нейронной сеть может содержать в себе 4, 7,10 скрытых слоев c количеством нейронов 50, 50, 100 соответственно.  Обсуждается влияние гиперпараметров нейронной сети на величину ошибки предсказания. Расчеты, выполненные на сервере с графической картой Nvidia GeForce RTX 3070, позволяют существенно сократить время обучения для PINN.

259-270
Аннотация

Изучение обледенения судов является актуальной задачей в связи с судоходством в морях Северного Ледовитого океана. В работе рассматривается задача моделирования обтекания модельного рыболовецкого судна газокапельным потоком и возникновение процесса обледенения. Первоначально моделирование выполнялось с помощью решателя interDyMFoam с учетом задания волны Стокса первого рода для определения положения капель. В дальнейшем моделирование было выполнено с помощью решателя iceFoam в основе которого используется Эйлер-Лагранжев метод для описания газокапельного потока. Рассмотренная модель рыболовецкого судна имела масштаб 1:10. Положение капель задавалось на входе в расчетную прямоугольную область. Расчетная сетка имела от 1.5 до 10 млн. ячеек.  С помощью расчетов были получены траектории движения капель вокруг корпуса судна, распределение поля скорости воздуха, положение пленки воды и толщина льда на поверхности палубы. Была выполнена оценка массы наросшего льда. Моделирование выполнялось на вычислительном кластере ИСП РАН. Один типовой пример запускался на 48-96 вычислительных ядрах и продолжался не более трех дней.

271-286
Аннотация

Исследуется генерация пылевого аэрозоля при скачкообразном каскадном движении заряженных частиц над неровной поверхностью под влиянием ветра. Частицы движутся над двумя элементами типа ряби на эоловой поверхности под влиянием воздушного потока. За препятствиями поток сальтирующих частиц становится неравномерным, характер движения отмечается квазипериодичностью. Решалась задача включения электростатических эффектов в гидродинамическую модель, в которой учтено взаимовлияние частиц и воздушной среды. Предложена параметрическая модель, позволяющая учитывать в моделировании ветрового выноса заряженность самих пылевых частиц и подстилающей поверхности. Вычислительные эксперименты проведены с использованием открытого пакета OpenFOAM – Эйлерово-Лагранжевая турбулентная k-ω-модель. Соответственно, динамика заряженных частиц рассматривается с учётом электризации самой поверхности. Из результатов вычислительных экспериментов для различных плотностных характеристик частиц, заряженных одноименно с поверхностью, оценено влияние электрического поля на частоту изменения числа частиц в потоке, на разброс значений скоростей движения и высоту подскоков частиц, а также на ослабление эффекта воздействия частиц на среду за препятствиями. При учете влияния электростатических эффектов выявлено усиление возмущающего воздействия частиц, вылетающих после препятствий, на воздушную среду (увеличивается расстояние от препятствия, появляется больше локальных областей возмущения). Для скоростей движения сальтирующих частиц отмечается уменьшение величины дисперсии. Высота подскоков частиц увеличивается, что подтверждается известными экспериментами. Уменьшается нижнее значение характерных частот изменения числа частиц в потоке. Неравномерность потока частиц определяет изменения в интенсивности генерации пылевого аэрозоля.

287-302
Аннотация

В ходе численного решения задач механики сплошной среды основная часть вычислительных затрат, как правило, приходится на решение больших разреженных систем линейных алгебраических уравнений. По этой причине эффективное распараллеливание именно этой процедуры может значительно ускорить моделирование. Наиболее простой подход к решению этой задачи, заключающийся в распараллеливании матрично-векторных операций в обычном итерационном решателе, требует нескольких точек синхронизации и обменов коэффициентами на каждой итерации метода, что не позволяет значительно ускорить расчет в целом. Поэтому предпочтительнее оказываются методы декомпозиции области, которые подразумевают разбиение расчетной области на подобласти, построение и решение отдельных задач в них, а также некоторую процедуру согласования решения между подобластями для обеспечения глобальной сходимости. Подобласти могут перекрываться, как в методе Шварца, использующемся в OpenFOAM, или разделяться интерфейсными участками, для которых решается своя собственная интерфейсная задача, как в методе дополнения Шура. Последний метод используется в данной работе для построения параллельного алгоритма моделирования течений вязкой несжимаемой среды методом погруженных границ LS-STAG. Полученная матрица интерфейсной системы имеет блочную трехдиагональную структуру. Для ускорения прототипирования в программной реализации разработанного алгоритма использована технология параллельного программирования OpenMP, поэтому вычислительные эксперименты проводятся только на системах с общей памятью, в частности на отдельных узлах учебно-экспериментального кластера кафедры «Прикладная математика» МГТУ им. Н. Э. Баумана. Для верификации и оценки эффективности разработанного алгоритма рассмотрена хорошо исследованная тестовая задача о моделировании плоского обтекания неподвижного кругового профиля. Расчеты на последовательности сеток при их разделении на разное количество подобластей показывают, что параллельный алгоритм сходится к тому же решению, что и исходный алгоритм, а рассчитанные значения числа Струхаля и коэффициента лобового сопротивления хорошо согласуются с известными в литературе экспериментальными и расчетными данными. Эксперименты демонстрируют, что разработанный алгоритм с декомпозицией области позволяет ускорить моделирование даже в последовательном режиме за счет уменьшения количества итераций, то есть метод декомпозиции области действует как дополнительный предобуславливатель. Благодаря этому свойству при расчетах в параллельном режиме ускорение оказывается сверхлинейным до некоторого числа подобластей, зависящего от размера задачи.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)