Preview

Труды Института системного программирования РАН

Расширенный поиск
Том 37, № 4: часть 2. июль-август
Скачать выпуск PDF
7-16
Аннотация

В данной работе предлагается архитектура системы синхронизации времени вычислителей сети. Предложенная архитектура специфична для сети SpaceWire и основывается на механизме широковещательных кодов из стандарта ECSS-E-ST-50-12C. Рассматривается не только задача синхронизации часов реального времени вычислителей, но и задача синхронизации планировщиков операционных систем стандарта ARINC 653. Обсуждаются дополнение к интерфейсу ARINC 653 Interrupt Services, необходимые для функционирования системы синхронизации времени. Достигается точность синхронизации не хуже 5 мс.

 

 

17-30
Аннотация

В современном мире производительность и энергоэффективность процессоров играют ключевую роль при разработке компьютерных систем. Наряду с CPU, GPU являются мощными вычислительными устройствами и используются для обработки компьютерной графики, машинного обучения и многого другого. Процессоры оборудованы встроенными датчиками, доступ к которым осуществляется через специальные средства. Чип современной видеокарты может работать в достаточно широком диапазоне частот и лимитов мощности (PL). Очень часто при решении вычислительной задачи или рендеринге сцены видеокарта может работать более оптимально, без затрат избыточной мощности, что позволяет значительно экономить энергию при выполнении ресурсоёмких задач. Поэтому для заданного набора задач важно найти такие параметры, при которых отношение полезной работы к затраченной мощности будет максимальным. После проведения большого количества экспериментов можно научиться прогнозировать зависимость данной целевой функции от параметров. В данной статье рассматривается получение текущих значений параметров GPU при помощи различных инструментов. Представлены результаты сбора сырых данных с видеокарт NVIDIA и последующего построения модели оптимального энергопотребления.

31-46
Аннотация

Файловые системы являются важнейшим компонентом любой современной операционной системы, будь то вычислительная система общего назначения или специализированная система хранения данных. Стоимость ошибки файловой системы очень высока; следовательно, существует потребность в эффективных инструментах для анализа качества и обнаружения ошибок в файловых системах. В данной статье представлен инструмент DIFFuzzer, который основан на методах фаззинга с использованием принципов серого и черного ящиков и реализует подход дифференциального динамического анализа, при котором поведение целевой файловой системы сравнивается с поведением другой, более качественной файловой системы, которая служит генератором эталонного поведения. При сравнении поведения анализируются как возвращаемые значения системных вызовов, так и агрегированное состояние файловых систем. Инструментарий также включает в себя редуктор, который минимизирует ошибочную трассу выполнения и генерирует короткий фрагмент, в котором ошибка все еще появляется. Разработанный инструмент был протестирован на нескольких файловых системах, совместимых с POSIX, и обнаружил несколько ошибок в ходе относительно короткого эксперимента.

47-68
Аннотация

Структура модели процесса, полученной на основе журнала событий многoагентной системы, часто не отражает архитектуру системы с точки зрения взаимодействий между агентами. Существующие метрики проверки соответствия в основном оценивают степень соответствия поведения обнаруженной модели последовательностям событий, зафиксированным в журнале. Однако такие поведенческие метрики могут оказаться недостаточными для того, чтобы отличить модели процессов, извлеченные из журнала одной и той же многoагентной системы, с учетом степени независимости агентов и сложности их взаимодействий. В данной работе предлагается теоретически обоснованный подход к измерению структурной сложности модели процесса, представляющей многoагентную систему с асинхронным взаимодействием агентов. Также представлены ключевые результаты серии экспериментов, направленных на оценку чувствительности предложенного подхода к структурным изменениям в моделях процессов.

69-84
Аннотация

Для представления модели, включающей как данные, так и ресурсы, можно использовать сети Петри с данными. Каждому переходу в таких сетях сопоставлено ограничение, включающее условия на входные и выходные значения переменных. Условия на входные значения определяют правила, при которых переход может сработать. Условия на выходные значения определяют правила, согласно которым осуществляется изменение значений переменных при срабатывании перехода. Чтобы оставаться в границах разрешимости, условия не должны содержать арифметические операции, ввиду чего ресурсы обычно представляются как отдельные позиции. Существующие критерии бездефектности, такие как простая, ослабленная и ленивая бездефектность, могут быть адаптированы к ресурсно-ориентированным сетям Петри с данными, но для их вычисления требуется решение проблемы достижимости, имеющей высокую вычислительную сложность даже для классических сетей Петри. В этой статье мы предлагаем новое свойство бездефектности, называемое ослабленной ленивой бездефектностью, которое включает в себя основные характеристики вышеупомянутых свойств и которое может быть определено путем решения проблемы покрытия, имеющей меньшую вычислительную сложность чем проблема достижимости. Мы представляем алгоритм для проверки данного свойства, доказываем его корректность и реализуем его в существующем наборе инструментов проверки бездефектности. Результаты оценки производительности подтверждают применимость алгоритма для верификации моделей среднего размера. Алгоритм можно использовать как для проверки ресурсно-ориентированных моделей, так и для предварительной проверки произвольных моделей, представленных сетями Петри с данными.

85-102
Аннотация

Методы выбора точки обзора для 3D сцен находят применение в компьютерном зрении, компьютерной графике и научной визуализации для того, чтобы получить ракурсы, наиболее подходящие для решаемой задачи. В данной работе предлагается метод для выбора точек обзора на основе обратного рендеринга в приложении к задаче реконструкции материалов. Предложенный метод решает задачу выбора произвольных ракурсов (то есть не из предопределенного набора) на основе различных оценок качества ракурсов, использующих геометрические характеристики целевого 3D объекта. Предложенный метод позволяет использовать реализацию обратного рендеринга как на основе дифференцируемого рендеринга, так и с помощью безградиентных методов оптимизации. Предложенный метод был протестирован на открытом наборе данных для 3D реконструкции. Тестирование показало прирост в качестве реконструкции при использовании предложенного метода с различными методами оценки качества ракурсов по сравнению с наивными стратегиями выбора точек обзора.

103-116
Аннотация

Процесс обнаружения аномалий или отклонений от ожидаемого поведения в непрерывно поступающих данных является сложным и требует разработки эффективных моделей, которые могут адаптивно переобучаться со временем. Человеческий мозг служит ярким примером такой системы, так как он постоянно учится на протяжении всей жизни, а прошлый опыт, который когда-то казался ошибочным, постепенно интегрируется в обыденные знания. Хотя современные модели нейронных сетей достигли значительных успехов в распознавании текста и изображений, они значительно отклонились от оригинальных моделей нейронов и больше не представляют собой единственный алгоритм, аналогичный тому, который использует наш мозг. Специальные искусственные сети, такие как Long Short-Term Memory (LSTM), могут учитывать как длительную, так и непосредственную информацию; однако они имеют ограничения в своей способности к переобучению. В данном исследовании мы согласуемся с теориями, предложенными Джеффом Хокинсом, выдающимся исследователем в области биоподобного интеллекта, чья команда разрабатывает инновационные кортикальные алгоритмы, которые испрользуют современные исследования функционирования интеллектуального мозга. В этом контексте зрение и слух можно концептуализировать как сенсоры, данные от которых интегрируются в модель для генерации непрерывных прогнозов для каждого входного сигнала. В нашей статье мы исследуем современные теории по этой теме и представляем собственную реализацию этих концепций с использованием языка программирования Erlang.

117-132
Аннотация

В работе рассматривается задача автоматической генерации рецензий к исходному коду. Предложен и апробирован подход на основе больших языковых моделей, значительно повышающий практическую ценность рецензий кода за счет фокуса на применимости, настройки инструкций и интеллектуальной фильтрации. Рассмотрено систематическое инкрементальное применение следующих стратегий: пошаговое рассуждение, структурированный вывод, расширение контекста, обучение с примерами. Использован подход со специальной инструкцией к языковой модели для интеллектуального ранжирования и фильтрации нерелевантных комментариев. Использование предложенного подхода к конструированию инструкций к языковой модели позволило улучшить точность применимых рецензий в 2.5 раза по сравнению с базовой до 37%.

133-146
Аннотация

Устойчивость нейронных сетей к состязательным возмущениям в условиях «чёрного ящика» остаётся сложной проблемой. Большинство существующих методов атак требуют чрезмерного количества запросов к целевой модели, что ограничивает их практическую применимость. В данной работе мы предлагаем подход, в котором суррогатная модель-ученик итеративно обучается на неудачных попытках атак, постепенно изучая локальное поведение модели «чёрного ящика». Эксперименты показывают, что этот метод значительно сокращает количество необходимых запросов, сохраняя при этом высокую вероятность успеха атак.

147-174
Аннотация

Проблема обнаружения сетевых атак приобретает особую значимость в условиях роста сложности киберугроз и ограниченности традиционных сигнатурных методов. В данной работе проведен комплексный анализ пяти алгоритмов машинного обучения с фокусом на интерпретируемость моделей и обработку несбалансированных данных Simulated Network Traffic. Основная задача – повышение точности детектирования кибератак, включая DDoS и сканирование портов, с использованием дерева решений, логистической регрессии, случайного леса и других методов. Исследование выполнено на Python 3.13 с применением библиотек scikit-learn, XGBoost и TensorFlow. Выбор инструментов обусловлен спецификой задачи: для классических методов (деревья, логистическая регрессия) и ансамблевых подходов (Random Forest, XGBoost) scikit-learn оказался оптимальным, а для нейросетевых экспериментов (RProp MLP) TensorFlow/Keras предоставил удобный интерфейс для прототипирования. PyTorch не использовался, так как для бинарной классификации на структурированных данных он не давал преимуществ, но его применение могло бы быть оправдано для анализа последовательностей или неструктурированных логов в будущих исследованиях. Дерево решений продемонстрировало наивысшую точность – 99.4% при глубине 5 и выделении 8 ключевых признаков из 18. Градиентный бустинг после настройки показал сопоставимый результат – 99.58%, однако его обучение заняло значительно больше времени (576 секунд против 69 дерева решений). Случайный лес достиг точности 97.98%, а логистическая регрессия – 96.53%. Наивный Байес оказался наименее эффективным (86.48%), несмотря на попытки улучшения с помощью PCA. Линейная регрессия, преобразованная в классификатор, показала точность 94.94%, что ниже ансамблевых методов, но приемлемо для базового подхода. Практическая ценность работы подтверждена тестированием на реальных сетевых данных. Полученные результаты могут лечь в основу гибридных систем, комбинирующих несколько алгоритмов для повышения надежности детектирования. Например, сочетание быстрого дерева решений для первичного анализа и градиентного бустинга для уточнения сложных случаев позволит балансировать между скоростью и точностью. Отдельно стоит отметить важность интерпретируемости моделей: деревья и логистическая регрессия не только показали хорошие результаты, но и позволили выявить ключевые признаки атак, что критично для интеграции в существующие системы безопасности.

175-190
Аннотация

Продолжающаяся цифровизация образования требует новых способов представления информации и механизмов удержания внимания. Цель представленной работы – предложить решение на основе большой языковой модели, которая будет интерактивно генерировать подсказки различных типов в рамках электронного учебного курса по программированию. Основными подходами являются анализ существующих относительно небольших языковых моделей, TOPSIS-анализ (методика определения порядка предпочтения по сходству с идеальным решением), прототипирование и интеграция предлагаемого программного решения с образовательной системой вуза. В результате представлен сервис, который может быть интегрирован в системы управления обучением. В статье также представлены результаты тестирования моделей, которые легли в основу представленного решения.

191-206
Аннотация

В данном исследовании представлен прототип ассистента, управляемого искусственным интеллектом, который автоматизирует генерацию скриптов визуализации данных на основе запросов на естественном языке, устраняя необходимость пользователей владеть навыками программирования. В статье рассматриваются исследования, направленные на разработку средств для эффективной визуализации данных, проводится сравнение систем визуализации данных, основанных на использовании искусственного интеллекта, показаны ограничения существующих средств. Предлагаемый подход к визуализации данных основан на интеграции DSM-платформы (языкового инструментария), управляемого знаниями, и инструментов генеративного искусственного интеллекта. Предлагаемая методология разделяет задачи визуализации данных на два типа: стандартные и нестандартные. Стандартные задачи решаются с помощью генерации кода на основе подсказок в визуальной среде. Нестандартные задачи обрабатываются путем расширения существующих библиотек с помощью определяемых пользователем пакетов. Языково-ориентированный подход с использованием средств DSM эффективно объединяет обе категории: для стандартных задач пользователи работают с существующими DSL и настраивают параметры по мере необходимости, тогда как для нестандартных задач пользователи разрабатывают новые DSL с помощью языкового инструментария, автоматизирующего создание визуальных DSL и генерацию кода. Ядром языкового инструментария является многоаспектная онтология. Благодаря интеграции большой языковой модели (LLM) с фреймворком, управляемым знаниями, и многоаспектной онтологией, система обеспечивает динамические, контекстно-ориентированные рабочие процессы визуализации, которые гарантируют семантическую прослеживаемость и воспроизводимость. Онтология не только хранит описания задач визуализации данных, но и облегчает повторное использование сгенерированных скриптов, повышая тем самым адаптивность системы и способствуя совместной аналитической работе сообществ пользователей. Набор данных, содержащий записи и переменные, охватывающие различные предметные области, используется для демонстрации функциональности прототипа. В статье приведены примеры разработки нескольких вариантов визуализаций, демонстрирующие применение предлагаемого подхода. Приведённые примеры демонстрируют эффективность прототипа в создании гистограмм, точечных диаграмм и других методов визуализации и снижении технических барьеров для пользователей. В перспективе функциональность ассистента будет расширена за счёт поддержки пользовательских пакетов визуализации и дополнительного обучения LLM для решения нестандартных задач и сложных сценариев визуализации.

207-218
Аннотация

В статье представлено описание процесса разработки системы интеллектуальной оценки устойчивости на основе знаний (KISA) для комплексной оценки устойчивости российских регионов, которая использует большую языковую модель (LLM) с технологией дополненной генерации поиска (RAG) и данные Росстата. KISA автоматически отбирает релевантные показатели на основе текстовых запросов пользователей, определяет их веса и рассчитывает региональные рейтинги, преодолевая ограничения традиционных методов, связанные с высокими ресурсными затратами, субъективностью и низкой адаптивностью. Система сокращает время, необходимое для формирования рейтинга, до 10 минут – в 140 раз быстрее существующих подходов; финансовые затраты снижаются в 16 раз за счет минимизации участия экспертов. Согласованность с экспертными оценками составляет 68%, что подтверждает валидность метода. KISA предоставляет веб-интерфейс с картографической визуализацией, повышая гибкость анализа; возможность совершенствования посредством добавления новых источников обеспечивает непрерывное включение экспертного опыта. Результаты исследования способствуют совершенствованию оценки региональной устойчивости и могут использоваться при принятии управленческих решений.

219-234
Аннотация

Стремительное развитие технологий искусственного интеллекта, в частности больших языковых моделей (LLM), вызвало интерес к их интеграции в мультиагентные системы (МАС). Это открывает широкие перспективы в том числе для приложений умного дома, где они могут значительно улучшить пользовательский опыт за счет комфорта, энергоэффективности и безопасности. Несмотря на потенциальные преимущества, реализация МАС на основе LLM сталкивается с рядом проблем, включая риск возникновения галлюцинаций, проблемы масштабируемости и опасения по поводу надежности этих систем в реальных приложениях. В данном исследовании рассматривается разработка МАС, включающих LLM, с акцентом на уменьшение галлюцинаций путем интеграции формальных логических моделей для представления знаний и принятия решений, а также методов машинного обучения. Чтобы продемонстрировать эффективность этого подхода, были проведены эксперименты с симуляцией системы ухода за растениями в контексте умного дома. Результаты показали, что наш подход позволяет значительно уменьшить количество галлюцинаций и повысить общую надежность системы. Дальнейшие исследования будут направлены на доработку этих методов с целью повышения адаптивности и масштабируемости для обеспечения функциональности системы в реальных условиях.

235-250
Аннотация

Гибридный фаззинг и динамическая символьная интерпретация активно применяются в жизненном цикле разработки безопасного программного обеспечения. В настоящее время доля кода программ, разрабатываемых для архитектур ARM и RISC-V, постоянно увеличивается вместе с потребностью в их эффективном анализе. Данная работа посвящена решению этой задачи путем разработки методов динамической символьной интерпретации и гибридного фаззинга для современных RISC-архитектур – отечественной «Байкал-М» (ARM/AArch64) и открытой RISC-V 64. Разработанные подходы, основанные на моделировании символьной семантики машинных инструкций, интегрированы в инструмент Sydr в составе фреймворка Sydr-Fuzz и нацелены на повышение эффективности гибридного фаззинга. Ключевые результаты включают алгоритмы обработки косвенных переходов для точного определения целевых адресов и реализацию поддержки набора целочисленных инструкций RISC-V в открытом фреймворке Triton, что предоставляет сообществу готовую основу для создания инструментов динамического анализа.

251-270
Аннотация

Сегодня автоматизированные фреймворки динамического анализа для непрерывного тестирования востребованы как никогда – они обеспечивают безопасность программного обеспечения и соответствие требованиям Security Development Lifecycle (SDL). Эффективность поиска уязвимостей с помощью современных гибридных методов фаззинга превосходит традиционный фаззинг, основанный на покрытии кода. Мы предлагаем улучшенный конвейер динамического анализа для повышения результативности автоматизированного поиска ошибок, основанный на гибридном фаззинге. Его реализация – инструмент Sydr-Fuzz, в котором наш инструмент символьного выполнения Sydr интегрирован с libFuzzer и AFL++. В Sydr-Fuzz также входят проверка предикатов безопасности, инструмент triage для крашей Casr, а также утилиты минимизации корпуса и сбора покрытия. Бенчмаркинг показал, что Sydr-Fuzz превосходит фаззеры, ориентированные на покрытие, и сопоставим с современными гибридными фаззерами. В рамках проекта OSS-Sydr-Fuzz мы обнаружили 85 новых уязвимостей в реальных программах. Кроме того, мы открыли исходный код Casr для сообщества.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)