Том 36, № 5 (2024)

Конструирование программных систем, нацеленное на обеспечение безопасности

Виктор Вячеславович КУЛЯМИН, Александр Константинович ПЕТРЕНКО, Екатерина Александровна РУДИНА

PDF (Rus)

7-16

Конструктивная информационная безопасность — один из подходов, нацеленных на обеспечение надежности и безопасности программных систем, занимающий среди них достаточно важное место. Он развивается уже более 50 лет, однако широкие массы разработчиков не знакомы с его принципами и методами. Важной задачей в рамках популяризации этого подхода является создание типологии задач и техник обеспечения конструктивной информационной безопасности и определение приоритетных направлений их развития.

Идентификация реквизитов сборки через отслеживание системных вызовов

Артемий Максимович ГРАНАТ, Павел Дмитриевич ДУНАЕВ, Артем Александрович СИНКЕВИЧ, Инна Александровна БАТРАЕВА, Дмитрий Юрьевич ПЕТРОВ

PDF (Rus)

17-30

Аннотация

В статье рассматриваются методы идентификации реквизитов сборки, описываются их сильные и слабые стороны. Представлен инструмент, обеспечивающий журналирование процесса сборки с помощью отслеживания системных вызовов. Приводится оценка временных затрат на сборку с использованием разработанного инструмента.

Открытое промежуточное представление специализированных потоковых вычислителей, основанное на MLIR

Александр Сергеевич КАМКИН, Михаил Юрьевич ЛИТВИНОВ, Иван Александрович ГРИГОРОВ

PDF (Rus)

31-46

Аннотация

В последнее время для решения вычислительных задач с жесткими ограничениями на производительность (пропускную способность) и энергопотребление (потребляемую мощность) широко используются гетерогенные компьютерные системы. Как правило, такие системы состоят из микропроцессоров общего назначения и аппаратных ускорителей на базе ПЛИС, реализующих наиболее затратные операции (обычно отражающих специфику предметной области). Данная статья посвящена автоматизации проектирования аппаратных ускорителей, ориентированных на задачи потоковой обработки данных (streaming data computing). Особенностями ускорителей этого типа (и решаемых ими задач) являются: (1) непрерывные (на каждом такте работы) прием и выдача данных; (2) ограниченная (по времени и памяти) зависимость выходных данных от входных. Потоковая обработка охватывает широкий класс приложений, включая цифровую обработку сигналов, шифрование трафика, численное моделирование, биоинформатику и другие. В работе предлагается концепция языка DFCIR (DataFlow Computer Intermediate Representation), предназначенного для промежуточного представления моделей потоковых вычислителей. Язык DFCIR основан на открытой компиляторной инфраструктуре MLIR (Multi-Level Intermediate Representation). Для построения RTL-моделей ускорителей по DFCIR-описаниям используются средства CIRCT (Circuit IR Compilers and Tools) – подпроекта MLIR, объединяющего инструменты для работы с моделями аппаратуры.

Декларативный синтез графических интерфейсов пользователя с помощью реляционного решателя ограничений

Дмитрий Сергеевич КОСАРЕВ, Петр Алексеевич ЛОЗОВ, Дмитрий Юрьевич БУЛЫЧЕВ

PDF (Rus)

47-66

Аннотация

Авторы представляют систему, которая по набору правил-ограничений на дизайн и по структурному описанию пользовательского интерфейса (GUI), порождает набор конкретных интерфейсов, каждый из которых по построению соблюдает эти ограничения. Задача, ставящаяся перед системой, описывается как проблема удовлетворения ограничений, после чего на основе реляционного подхода “решатель-из-верификатора” конструируется корректный и полный решатель. Также описывается набор улучшений, делающих предложенный решатель более эффективным.

Эффективность систем одинаково распределенных конкурирующих процессов при неограниченном и ограниченном параллелизме

Павел Александрович ПАВЛОВ

PDF (Rus)

67-80

Аннотация

В статье с учетом ограниченного числа копий структурированного программного ресурса проведен сравнительный анализ математических соотношений для вычисления общего времени выполнения множества одинаково распределенных конкурирующих процессов в асинхронном и двух синхронных режимах, в случае неограниченного и ограниченного параллелизма по числу процессоров многопроцессорной системы получено достаточное условие эффективности одинаково распределенной системы, доказано необходимое и достаточное условие существования эффективной системы одинаково распределенных конкурирующих процессов в зависимости от величины дополнительных системных расходов.

Программная среда выполнения методических прикладных тестов для численного исследования параметров высокопроизводительных вычислительных систем

Алексей Олегович ИГНАТЬЕВ, Сергей Юрьевич МОКШИН

PDF (Rus)

81-92

Аннотация

Неотъемлемой частью процесса создания высокопроизводительных вычислительных систем, предназначенных для решения задач численного моделирования различных физических процессов, является проверка их соответствия на заявленные при их проектировании характеристики. В статье рассматривается разработанная авторами программная среда выполнения методических прикладных тестов для численного исследования параметров высокопроизводительных вычислительных систем, позволяющая эффективно анализировать результаты выполнения прикладных тестов и выполнять оценку производительности и надежности вычислительных систем.

Эффективный метод с компрессией для распределенных и федеративных кокоэрсивных вариационных неравенств

Даниил Олегович МЕДЯКОВ, Глеб Львович МОЛОДЦОВ, Александр Николаевич БЕЗНОСИКОВ

PDF (Rus)

93-108

Аннотация

Вариационные неравенства как эффективный инструмент для решения прикладных задач, в том числе задач машинного обучения, в последние годы привлекают всё больше внимания исследователей. Области применения вариационных неравенств охватывают широкий спектр направлений – от обучения с подкреплением и генеративных моделей до традиционных приложений в экономике и теории игр. В то же время, невозможно представить современный мир машинного обучения без подходов распределенной оптимизации, которые позволяют значительно ускорить процесс обучения на огромных объемах данных. Однако, сталкиваясь с большими затратами на коммуникации между устройствами в вычислительной сети, научное сообщество стремится к разработке подходов, делающих вычисления дешевыми и стабильными. В этой работе исследуется техника сжатия передаваемой информации применительно к задаче распределенных вариационных неравенств. В частности, предлагается метод на основе продвинутых техник, исконно разработанных для задач минимизации. Для нового метода приводится исчерпывающий теоретический анализ сходимости для кокоэрсивных сильно монотонных вариационных неравенств. Проведенные эксперименты подчеркивают высокую производительность представленной техники и подтверждают практическую применимость.

Дилемма защитника: совместимы ли методы защиты от разных атак на модели машинного обучения?

Георгий Владимирович САЗОНОВ, Кирилл Сергеевич ЛУКЬЯНОВ, Игорь Николаевич МЕЛЕШИН

PDF (Rus)

109-126

Аннотация

В условиях растущего применения моделей искусственного интеллекта (ИИ) всё больше внимания уделяется вопросам доверия и безопасности систем использующих ИИ от разных типов угроз (атаки уклонения, отравления, вывод о членстве и т.д.). В этой работе мы сосредотачиваемся на задаче классификации вершин графов, выделяя ее как одну из самых сложных. Эта работа является первой, насколько нам известно, в которой исследуется взаимосвязь методов защиты моделей ИИ от разных типов угроз на графовых данных. Наши эксперименты проводятся на наборах данных: цитирования и графов покупок. Мы показываем, что в общем случае нельзя просто использовать комбинации методов защит от разных типов угроз и, что это может иметь серьезные негативные последствия вплоть до полной потери эффективности модели. А также, мы приводим теоретическое доказательство противоречия класса методов защит от атак отравления на графах и состязательного обучения.

Так ли безопасна интерпретируемость ИИ: взаимосвязь интерпретируемости и защищенности моделей машинного обучения

Георгий Владимирович САЗОНОВ, Кирилл Сергеевич ЛУКЬЯНОВ, Серафим Константинович БОЯРСКИЙ, Илья Андреевич МАКАРОВ

PDF (Rus)

127-142

Аннотация

В условиях растущего применения интерпретируемых моделей искусственного интеллекта (ИИ) всё больше внимания уделяется вопросам доверия и безопасности для всех типов данных. В этой работе мы сосредотачиваемся на задаче классификации вершин графов, выделяя ее как одну из самых сложных. Эта работа является первой, насколько нам известно, в которой комплексно исследуется взаимосвязь интерпретируемости и защищенности. Наши эксперименты проводятся на наборах данных: цитирования и графов покупок. Мы предлагаем методики построения атак черного ящика графовых моделей на основании результатов интерпретации, показываем, как добавление защиты влияет на интерпретируемость моделей ИИ.

Разработка вредоносного набора данных для защиты больших языковых моделей от атак

Ирина Сергеевна АЛЕКСЕЕВСКАЯ, Константин Владимирович АРХИПЕНКО, Денис Юрьевич ТУРДАКОВ

PDF (Rus)

143-152

Аннотация

Современные большие языковые модели представляют собой огромные системы со сложным внутренними механизмами, реализующие генерацию ответа на основе черного ящика. Несмотря на то, что выровненные большие языковые модели имеют встроенные механизмы защиты от атак, последние исследования демонстрируют уязвимость больших языковых моделей к атакам. В данном исследовании мы стремимся расширить существующие вредоносные наборы данных, полученные в результате атак, чтобы в будущем можно было устранить подобные уязвимости в больших языковых моделях путем процедуры выравнивания. Кроме того, мы проводим эксперименты с современными большими языковыми моделями на нашем вредоносном наборе данных, что демонстрирует существующие недостатки в моделях.

Автоматическое построение правил извлечения информации для новостных веб-сайтов

Сергей Сергеевич ДУБОВИЦКИЙ, Павел Александрович БЕДРИН, Александр Константинович ЯЦКОВ, Максим Игоревич ВАРЛАМОВ

PDF (Rus)

153-162

Аннотация

В данной работе представлен метод автоматической генерации правил извлечения информации (карт сбора) для новостных веб-сайтов. Данный подход по набору новостных страниц одного сайта генерирует карту сбора, позволяющую извлекать атрибуты из произвольных новостных страниц этого сайта. В основе метода лежит применение дообученной нейросетевой модели MarkupLM для извлечения информации из веб-страниц. Предложенный метод обобщает предсказания модели на уровне сайта, создавая универсальные правила извлечения атрибутов. Проведённые эксперименты показали, что использование карт сбора, сформированных на основе дообученной модели, превосходит по качеству как существующие открытые инструменты, так и дообученный MarkupLM на уровне отдельных страниц. Разработанный метод может быть обобщён на другие предметные области при наличии релевантных данных для дообучения модели.

Архитектура открытого программного комплекса UEMKA для управления целевыми устройствами SMART-наноспутников

Георгий Александрович ЩЕГЛОВ, Кристина Александровна ЖДАНОВА, Зайнулла Серикович ЖУМАЕВ, Никита Дмитриевич КАМЕНЕВ

PDF (Rus)

163-180

Аннотация

В работе показано, что актуальной проблемой при разработке наноспутников является отсутствие открытых программных средств для бортовых вычислительных устройств и «умной» полезной нагрузки. Рассматривается разработка открытого программного комплекса для централизованного управления целевыми конечными устройствами наноспутников на базе микросервисной архитектуры. Показаны преимущества использования данного подхода при создании программного комплекса. Предложено использование имитационной модели наноспутника для оперативной отладки и тестирования программного комплекса. Авторами работы приведена структура программного комплекса и показано место имитационной модели в ней. Работа является развернутым обзором разработанного авторами программного комплекса UEMKA.

Оценка коэффициента вертикальной диффузии газа в уплотняемых грунтах средствами математического моделирования

Елена Олеговна ТАРАСЕНКО

PDF (Eng)

181-190

Аннотация

Исследованы плотностные свойства просадочных лёссовых грунтов в рамках математического моделирования их уплотнения методом глубинных взрывов. Уплотнение грунтов производится для исключения свойства просадочности. Лёссовым грунтам характерна низкая плотность и высокая пористость. Плотностные свойства лёссов зависят от параметров диффузионного взаимодействия атомов газа, образующегося в результате взрыва, и уплотняемого грунта. Решение обратных прикладных задач, возникающих при исследовании математических моделей геологических систем, позволяет систематизировать знания о них. В работе рассмотрена обратная задача об оценке коэффициента диффузии. Проведено математическое моделирование коэффициента вертикальной диффузии в анизотропных и изотропных геологических системах. Исследован случай полного поглощения атомов газа окружающим его грунтом. Реализована численная оценка коэффициента вертикальной диффузии в грунте до и после его уплотнения, с течением времени и точностью достаточной для инженерных расчётов. Получены коэффициенты диффузии газа в грунтах различной плотности. Построенные математические соотношения оценки коэффициента вертикальной диффузии позволяют прогнозировать плотностные свойства грунтов на этапе проектирования оснований и фундаментов строительных объектов.

Аналитический обзор методов проектирования систем безопасности в телемедицинских системах

Мария Анатольевна ЛАПИНА, Елена Александровна МАКСИМОВА, Виталий Геннадьевич ЛАПИН, Никита Сергеевич БОЙКОВ

PDF (Rus)

191-218

Аннотация

В статье исследуются методы проектирования систем безопасности при обеспечении конфиденциальности данных в телемедицине. Рассмотрены подходы к аутентификации пациентов, используемые в телездравоохранении с учетом их эффективности и безопасности. Проведен анализ методов аутентификации, включая биометрическую идентификацию, двухфакторную аутентификацию и использование уникальных идентификационных кодов. Выявлены преимущества и недостатки каждого из этих методов, что дает медицинским организациям возможность принимать управленческие решения, наиболее соответствующие структуре информационных систем и уровням риска.

Использование клеточного автомата для оценки влияния городской планировки на социоэкономические показатели при распространении эпидемий

Степан Алексеевич ЕЛИСТРАТОВ

PDF (Rus)

219-226

Аннотация

В работе рассматривается влияние городской планировки на социоэкономические факторы, полученные из эпидемиологических показателей путем моделирования распространения эпидемии с помощью клеточного автомата. Показывается, что (при одинаковом соотношении площадей районов с высокой и низкой плотностью) планировка влияет на распространение эпидемии, причем существует оптимальная планировка, которая минимизирует экономические убытки и смертность. Несмотря на модельность подхода, результат свидетельствует о том, что ущерб от пандемии может быть снижен благодаря грамотной градостроительной политике.

H1: гибридная система извлечения информации для поиска товаров в электронной торговле

Федор Владимирович КРАСНОВ

PDF (Rus)

227-240

Аннотация

В данной статье обоснована продуктивность использования системы H1 для поиска товаров различных поставщиков на торговой интернет-площадке. Как и все современные системы поиска товаров, гибридная система H1 соединяет в себе преимущества лексических методов извлечения товаров и семантических методов, основанных на многомерных векторных представлениях. Новизна предложенного подхода заключается в объединении методов извлечения на уровне токенов. Дополнительное преимущество H1, по сравнению с другими индустриальными системами, – обработка поисковых запросов, состоящих из нескольких слов. Например, поисковые запросы «конфеты рот фронт», «gloria jeans детская одежда» будут выделять сущность бренда в отдельный токен – «рот фронт», «gloria jeans», что позволит уменьшить размер модели и улучшить автономные показатели системы извлечения. Полученные на публичном наборе данных WANDS значения показателей усредненной пороговой точности mAP@12 = 56.1% и пороговой полноты R@1k = 86.6% для H1 превышают самые современные аналоги.

Применение моделей машинного обучения для многоклассовой классификации дерматоскопических снимков новообразований кожи

Александр Васильевич КОЗАЧОК, Андрей Андреевич СПИРИН, Олег Ильгисович САМОВАРОВ, Елена Сергеевна КОЗАЧОК

PDF (Rus)

241-252

Аннотация

В статье рассмотрены вопросы практической оценки качества современных моделей машинного обучения, реализованных на основе глубоких нейронных сетей и визуальных трансформеров. Описаны параметры проведенного эксперимента на наборе данных ISIC 2018. Приведена статистика по категориям рассмотренных поражений кожи. Проведенный статистический анализ полученных результатов позволил авторскому коллективу сформировать новую бинарную категорию: меланоцитарные и немелонацитарные поражения кожи. Эксперименты по обучению нейросетевых моделей были выполнены на мощностях Цифровой экосистемы НЦМУ.

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Труды Института системного программирования РАН

Использование куки-файлов