Preview

Труды Института системного программирования РАН

Расширенный поиск
Том 36, № 5 (2024)
Скачать выпуск PDF
7-16
Аннотация

Конструктивная информационная безопасность — один из подходов, нацеленных на обеспечение надежности и безопасности программных систем, занимающий среди них достаточно важное место. Он развивается уже более 50 лет, однако широкие массы разработчиков не знакомы с его принципами и методами. Важной задачей в рамках популяризации этого подхода является создание типологии задач и техник обеспечения конструктивной информационной безопасности и определение приоритетных направлений их развития.

17-30
Аннотация

В статье рассматриваются методы идентификации реквизитов сборки, описываются их сильные и слабые стороны. Представлен инструмент, обеспечивающий журналирование процесса сборки с помощью отслеживания системных вызовов. Приводится оценка временных затрат на сборку с использованием разработанного инструмента.

31-46
Аннотация

В последнее время для решения вычислительных задач с жесткими ограничениями на производительность (пропускную способность) и энергопотребление (потребляемую мощность) широко используются гетерогенные компьютерные системы. Как правило, такие системы состоят из микропроцессоров общего назначения и аппаратных ускорителей на базе ПЛИС, реализующих наиболее затратные операции (обычно отражающих специфику предметной области). Данная статья посвящена автоматизации проектирования аппаратных ускорителей, ориентированных на задачи потоковой обработки данных (streaming data computing). Особенностями ускорителей этого типа (и решаемых ими задач) являются: (1) непрерывные (на каждом такте работы) прием и выдача данных; (2) ограниченная (по времени и памяти) зависимость выходных данных от входных. Потоковая обработка охватывает широкий класс приложений, включая цифровую обработку сигналов, шифрование трафика, численное моделирование, биоинформатику и другие. В работе предлагается концепция языка DFCIR (DataFlow Computer Intermediate Representation), предназначенного для промежуточного представления моделей потоковых вычислителей. Язык DFCIR основан на открытой компиляторной инфраструктуре MLIR (Multi-Level Intermediate Representation). Для построения RTL-моделей ускорителей по DFCIR-описаниям используются средства CIRCT (Circuit IR Compilers and Tools) – подпроекта MLIR, объединяющего инструменты для работы с моделями аппаратуры.

47-66
Аннотация

Авторы представляют систему, которая по набору правил-ограничений на дизайн и по структурному описанию пользовательского интерфейса (GUI), порождает набор конкретных интерфейсов, каждый из которых по построению соблюдает эти ограничения. Задача, ставящаяся перед системой, описывается как проблема удовлетворения ограничений, после чего на основе реляционного подхода “решатель-из-верификатора” конструируется корректный и полный решатель. Также описывается набор улучшений, делающих предложенный решатель более эффективным.

67-80
Аннотация

В статье с учетом ограниченного числа копий структурированного программного ресурса проведен сравнительный анализ математических соотношений для вычисления общего времени выполнения множества одинаково распределенных конкурирующих процессов в асинхронном и двух синхронных режимах, в случае неограниченного и ограниченного параллелизма по числу процессоров многопроцессорной системы получено достаточное условие эффективности одинаково распределенной системы, доказано необходимое и достаточное условие существования эффективной системы одинаково распределенных конкурирующих процессов в зависимости от величины дополнительных системных расходов.

81-92
Аннотация

Неотъемлемой частью процесса создания высокопроизводительных вычислительных систем, предназначенных для решения задач численного моделирования различных физических процессов, является проверка их соответствия на заявленные при их проектировании характеристики. В статье рассматривается разработанная авторами программная среда выполнения методических прикладных тестов для численного исследования параметров высокопроизводительных вычислительных систем, позволяющая эффективно анализировать результаты выполнения прикладных тестов и выполнять оценку производительности и надежности вычислительных систем.

93-108
Аннотация

Вариационные неравенства как эффективный инструмент для решения прикладных задач, в том числе задач машинного обучения, в последние годы привлекают всё больше внимания исследователей. Области применения вариационных неравенств охватывают широкий спектр направлений – от обучения с подкреплением и генеративных моделей до традиционных приложений в экономике и теории игр. В то же время, невозможно представить современный мир машинного обучения без подходов распределенной оптимизации, которые позволяют значительно ускорить процесс обучения на огромных объемах данных. Однако, сталкиваясь с большими затратами на коммуникации между устройствами в вычислительной сети, научное сообщество стремится к разработке подходов, делающих вычисления дешевыми и стабильными. В этой работе исследуется техника сжатия передаваемой информации применительно к задаче распределенных вариационных неравенств. В частности, предлагается метод на основе продвинутых техник, исконно разработанных для задач минимизации. Для нового метода приводится исчерпывающий теоретический анализ сходимости для кокоэрсивных сильно монотонных вариационных неравенств. Проведенные эксперименты подчеркивают высокую производительность представленной техники и подтверждают практическую применимость.

109-126
Аннотация

В условиях растущего применения моделей искусственного интеллекта (ИИ) всё больше внимания уделяется вопросам доверия и безопасности систем использующих ИИ от разных типов угроз (атаки уклонения, отравления, вывод о членстве и т.д.). В этой работе мы сосредотачиваемся на задаче классификации вершин графов, выделяя ее как одну из самых сложных. Эта работа является первой, насколько нам известно, в которой исследуется взаимосвязь методов защиты моделей ИИ от разных типов угроз на графовых данных. Наши эксперименты проводятся на наборах данных: цитирования и графов покупок. Мы показываем, что в общем случае нельзя просто использовать комбинации методов защит от разных типов угроз и, что это может иметь серьезные негативные последствия вплоть до полной потери эффективности модели. А также, мы приводим теоретическое доказательство противоречия класса методов защит от атак отравления на графах и состязательного обучения.

127-142
Аннотация

В условиях растущего применения интерпретируемых моделей искусственного интеллекта (ИИ) всё больше внимания уделяется вопросам доверия и безопасности для всех типов данных. В этой работе мы сосредотачиваемся на задаче классификации вершин графов, выделяя ее как одну из самых сложных. Эта работа является первой, насколько нам известно, в которой комплексно исследуется взаимосвязь интерпретируемости и защищенности. Наши эксперименты проводятся на наборах данных: цитирования и графов покупок. Мы предлагаем методики построения атак черного ящика графовых моделей на основании результатов интерпретации, показываем, как добавление защиты влияет на интерпретируемость моделей ИИ.

143-152
Аннотация

Современные большие языковые модели представляют собой огромные системы со сложным внутренними механизмами, реализующие генерацию ответа на основе черного ящика. Несмотря на то, что выровненные большие языковые модели имеют встроенные механизмы защиты от атак, последние исследования демонстрируют уязвимость больших языковых моделей к атакам. В данном исследовании мы стремимся расширить существующие вредоносные наборы данных, полученные в результате атак, чтобы в будущем можно было устранить подобные уязвимости в больших языковых моделях путем процедуры выравнивания.  Кроме того, мы проводим эксперименты с современными большими языковыми моделями на нашем вредоносном наборе данных, что демонстрирует существующие недостатки в моделях.

153-162
Аннотация

В данной работе представлен метод автоматической генерации правил извлечения информации (карт сбора) для новостных веб-сайтов. Данный подход по набору новостных страниц одного сайта генерирует карту сбора, позволяющую извлекать атрибуты из произвольных новостных страниц этого сайта. В основе метода лежит применение дообученной нейросетевой модели MarkupLM для извлечения информации из веб-страниц. Предложенный метод обобщает предсказания модели на уровне сайта, создавая универсальные правила извлечения атрибутов. Проведённые эксперименты показали, что использование карт сбора, сформированных на основе дообученной модели, превосходит по качеству как существующие открытые инструменты, так и дообученный MarkupLM на уровне отдельных страниц. Разработанный метод может быть обобщён на другие предметные области при наличии релевантных данных для дообучения модели.

163-180
Аннотация

В работе показано, что актуальной проблемой при разработке наноспутников является отсутствие открытых программных средств для бортовых вычислительных устройств и «умной» полезной нагрузки. Рассматривается разработка открытого программного комплекса для централизованного управления целевыми конечными устройствами наноспутников на базе микросервисной архитектуры. Показаны преимущества использования данного подхода при создании программного комплекса. Предложено использование имитационной модели наноспутника для оперативной отладки и тестирования программного комплекса. Авторами работы приведена структура программного комплекса и показано место имитационной модели в ней. Работа является развернутым обзором разработанного авторами программного комплекса UEMKA.

181-190
Аннотация

Исследованы плотностные свойства просадочных лёссовых грунтов в рамках математического моделирования их уплотнения методом глубинных взрывов. Уплотнение грунтов производится для исключения свойства просадочности. Лёссовым грунтам характерна низкая плотность и высокая пористость. Плотностные свойства лёссов зависят от параметров диффузионного взаимодействия атомов газа, образующегося в результате взрыва, и уплотняемого грунта. Решение обратных прикладных задач, возникающих при исследовании математических моделей геологических систем, позволяет систематизировать знания о них. В работе рассмотрена обратная задача об оценке коэффициента диффузии. Проведено математическое моделирование коэффициента вертикальной диффузии в анизотропных и изотропных геологических системах. Исследован случай полного поглощения атомов газа окружающим его грунтом. Реализована численная оценка коэффициента вертикальной диффузии в грунте до и после его уплотнения, с течением времени и точностью достаточной для инженерных расчётов. Получены коэффициенты диффузии газа в грунтах различной плотности. Построенные математические соотношения оценки коэффициента вертикальной диффузии позволяют прогнозировать плотностные свойства грунтов на этапе проектирования оснований и фундаментов строительных объектов.

191-218
Аннотация

В статье исследуются методы проектирования систем безопасности при обеспечении конфиденциальности данных в телемедицине. Рассмотрены подходы к аутентификации пациентов, используемые в телездравоохранении с учетом их эффективности и безопасности. Проведен анализ методов аутентификации, включая биометрическую идентификацию, двухфакторную аутентификацию и использование уникальных идентификационных кодов. Выявлены преимущества и недостатки каждого из этих методов, что дает медицинским организациям возможность принимать управленческие решения, наиболее соответствующие структуре информационных систем и уровням риска.

219-226
Аннотация

В работе рассматривается влияние городской планировки на социоэкономические факторы, полученные из эпидемиологических показателей путем моделирования распространения эпидемии с помощью клеточного автомата. Показывается, что (при одинаковом соотношении площадей районов с высокой и низкой плотностью) планировка влияет на распространение эпидемии, причем существует оптимальная планировка, которая минимизирует экономические убытки и смертность. Несмотря на модельность подхода, результат свидетельствует о том, что ущерб от пандемии может быть снижен благодаря грамотной градостроительной политике.

227-240
Аннотация

В данной статье обоснована продуктивность использования системы H1 для поиска товаров различных поставщиков на торговой интернет-площадке. Как и все современные системы поиска товаров, гибридная система H1 соединяет в себе преимущества лексических методов извлечения товаров и семантических методов, основанных на многомерных векторных представлениях. Новизна предложенного подхода заключается в объединении методов извлечения на уровне токенов. Дополнительное преимущество H1, по сравнению с другими индустриальными системами, – обработка поисковых запросов, состоящих из нескольких слов. Например, поисковые запросы «конфеты рот фронт», «gloria jeans детская одежда» будут выделять сущность бренда в отдельный токен – «рот фронт», «gloria jeans», что позволит уменьшить размер модели и улучшить автономные показатели системы извлечения. Полученные на публичном наборе данных WANDS значения показателей усредненной пороговой точности mAP@12 = 56.1% и пороговой полноты R@1k = 86.6% для H1 превышают самые современные аналоги.

241-252
Аннотация

В статье рассмотрены вопросы практической оценки качества современных моделей машинного обучения, реализованных на основе глубоких нейронных сетей и визуальных трансформеров. Описаны параметры проведенного эксперимента на наборе данных ISIC 2018. Приведена статистика по категориям рассмотренных поражений кожи. Проведенный статистический анализ полученных результатов позволил авторскому коллективу сформировать новую бинарную категорию: меланоцитарные и немелонацитарные поражения кожи. Эксперименты по обучению нейросетевых моделей были выполнены на мощностях Цифровой экосистемы НЦМУ.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)