Preview

Труды Института системного программирования РАН

Расширенный поиск
Том 36, № 2 (2024)
Скачать выпуск PDF
7-20
Аннотация

Анализ сетевого трафика (NTA) помогает выявлять угрозы безопасности, наблюдать за производительностью сети и планировать емкость сети. Идеальным подходом в такой задаче выступает анализ в реальном времени, однако, он может быть затруднен из-за большого объема данных и сложности обрабатываемых данных. Большие объемы трафика требуют подробного разбора, а анализ данных в реальном времени может привести к пропуску скрытых угроз в трафике. Офлайн анализ может решить эти проблемы. Данный подход во многом зависит от выбора эффективного и подходящего решения для хранения данных. Существует множество систем хранения данных, каждая из которых использует разные подходы и форматы для хранения данных. Эта статья исследует применение различных систем хранения данных для результатов NTA. Рассматриваются три разных типа систем хранения, включая Greenplum, Nebula graph и OpenSearch. Используется сравнительный подход, анализирующий один и тот же набор данных в разных системах хранения. Это позволяет изучить, как различные структуры баз данных и возможности запросов влияют на эффективность и точность NTA. Полученные результаты не только предоставят ценные рекомендации по выбору оптимального решения для хранения данных для конкретных задач NTA, но также послужат основой для будущих исследований в этой области.

21-32
Аннотация

Предметно-ориентированные языки используются во многих современных приложениях и программных библиотеках, среди них: Wolfram Alpha, Microsoft Excel, Graphviz. Данная работа описывает опыт, полученный при разработке TQL (Talisman Query Language) – предметно-ориентированного языка, используемого в платформе Talisman. Платформа Talisman – набор инструментов для автоматизации задач обработки данных, разработанный институтом системного программирования РАН. Реализация TQL, описанная в данной статье, поддерживает восстановление после ошибок, может запущена как в браузере, так и на сервере, и имеет интерактивную среду, позволяющую визуализировать дерево разбора во время печати. Данная статья описывает подходы и технологии, которые сделали данные качества возможными при единой, поддерживаемой кодовой базе.

33-46
Аннотация

Киберфизические системы представляют собой симбиоз многоуровневых систем управления и учитывают физические аспекты функционирования целевых объектов. Ошибки в таких системах могут быть связаны как с неправильной организацией кода и работой аппаратных средств, так и с неверным пониманием физических законов и их численной аппроксимацией. Продолжая предыдущую работу, мы применяем технологии автоматизированного анализа коммитов в git-репозиториях некоторых известных киберфизических систем с последующей классификацией собранных сообщений о фиксации изменений, написанных разработчиками таких систем. В работе мы обсуждаем выявленные сильные ключевые слова и обобщенные сообщения об исправлениях, которые способны показать основные классы ошибок в этих проектах. Результаты исследования могут быть использованы при обучении и консультировании по ошибкам и уязвимостям в сложных системах.

47-58
Аннотация

В статье обсуждаются вопросы планирования и управления ресурсами в процессе тестирования программных систем. В работе представлен метод анализа ACC, используемый в Google для оптимизации распределения усилий по тестированию различных частей системы. Расширение метода путем добавления четвертой характеристики - актеров (роли пользователей системы) - позволяет более гибко оценивать требования к действиям и уровни навыков пользователей. Иллюстративные примеры атрибутов и компонентов системы помогают понять принципы метода. В работе предлагается новый подход к управлению рисками и улучшению процессов в тестировании программных систем в многомерном пространстве. Эффективность применения улучшенного метода анализа ACC с использованием риско-ориентированного подхода была продемонстрирована на примере системы управления технологическими операциями по ремонту электродвигателей, для которой были определены атрибуты, компоненты, актеры, проанализированы возможности их пересечения, проведено тестирование, что помогло улучшить качество системы.

59-72
Аннотация

Данная работа посвящена автоматической генерации модульных тестов для приложений на языке Java, использующих фреймворк Spring. Хотя в последние десятилетия было создано несколько инструментов автоматической генерации тестов для «чистой» Java, специфические особенности этого фреймворка, как правило, не принимались во внимание. Тем не менее, Spring используется при разработке многих промышленных приложений на Java. Использование фреймворка в приложении, для которого необходимо сгенерировать тесты, накладывает дополнительные требования не только к используемым методам анализа кода, но и к виду предлагаемых тестов. Главным источником информации о типах и свойствах объектов в Spring-приложении является его контекст. В данной работе предлагается механизм анализа контекста приложения, который в некоторых случаях позволяет генерировать тестовые сценарии, соответствующие реальному исполнению программы, избегая избыточного мокирования. При этом полная инициализация контекста приложения в процессе анализа не происходит, что делает генерацию тестов безопасной для пользовательских данных. Предложенный инструмент анализа контекста Spring приложения был интегрирован в инструмент автоматической генерации тестов UnitTestBot Java. В заключение приводятся примеры тестов, сгенерированных для некоторых проектов с открытым исходным кодом.

73-82
Аннотация

Статья освещает новаторский подход к управлению рисками в программных проектах с использованием генеративного искусственного интеллекта. Описывается методика, которая включает в себя применение общедоступных чат-ботов для выявления, анализа и приоритизации рисков. В качестве основы для выявления рисков используется метод Кроуфорда. Авторы предлагают конкретные формулировки запросов к чат-ботам (инстрактов, промптов), способствующие получению необходимой информации. Эффективность методики продемонстрирована на пяти небольших программных проектах и дюжине проектов экономических и организационных, причем существенно разного масштаба, от малых до федеральных. Это подтверждает ее применимость и практическую ценность.

83-90
Аннотация

Выбор образовательной программы — важный момент в жизни молодых людей. В условиях дефицита времени после экзаменов абитуриенты обычно не успевают проанализировать возможные образовательные маршруты. Кроме того, это требует тщательного изучения учебных планов. Данное исследование посвящено этой проблеме и предлагает алгоритм анализа учебных планов на основе обработки естественного языка названий курсов или компетенций, перечисленных в учебных планах. Описана архитектура интеллектуальной программной системы. Используемый метод протестирован на учебных планах, взятых с университетских сайтов. Для хранения содержания учебных планов было разработано хранилище данных. На данный момент тема исследования плохо изучена. Существующие статьи либо описывают ранние стадии разработки, либо скудны на детали реализации. Они кратко рассмотрены в данной статье.

91-108
Аннотация

В последнее время наблюдается всплеск интереса к использованию нейрокомпьютерных интерфейсов для реализации контуров управления, особенно для различных устройств в инфраструктуре интернета вещей. Однако из-за низкоуровневой природы таких устройств и соответствующих программных средств интеграция нейроинтерфейсов со множеством разнообразных IoT-устройств является довольно трудоемкой задачей, требующей определенных профессиональных знаний в области нейронауки и обработки сигналов. В данной работе мы предлагаем онтологически управляемое решение для реализации инструментальных средств унифицированной интеграции интерфейсов мозг-компьютер в экосистему интернета вещей. Мы демонстрируем как достигается адаптация к особенностям процесса конкретной интеграции за счет введения в систему промежуточного уровня – интеллектуального посредника, который отвечает за взаимодействие между окружающей средой и нейроинтерфейсом. Программное обеспечение посредника генерируется автоматически, и этот процесс управляется онтологией. Описываются предлагаемая формальная модель и реализация системы. Разработанный нами онтологически управляемый высокоуровневый подход позволяет исследователям и инженерам, не имеющим большого опыта работы с интерфейсом мозг-компьютер, автоматизировать интеграцию нейроинтерфейсов с различной инфраструктурой интернета вещей.

109-126
Аннотация

Неотъемлемой частью процесса создания высокопроизводительных вычислительных систем, предназначенных для решения задач численного моделирования различных физических процессов, является проверка их соответствия на заявленные при их проектировании характеристики. При этом существует проблема оценки производительности вычислительных систем на синтетических тестах, значительно уступающих по математической сложности реальным прикладным задачам. В статье рассматривается разработанный авторами набор тестовых программ, позволяющий более точно оценивать реальную производительность вычислительных систем. 

127-140
Аннотация

Предлагается метод визуализации данных, основанный на языково-ориентированном подходе. Проведен анализ инструментов визуализации данных и возможности их настройки на предметные области исходя из потребностей пользователей. Отмечено, что эти инструменты требуют от пользователей высокой квалификации для настройки формата визуализации данных (пользователи должны иметь навыки программирования). Предлагается настраивать средства визуализации под нужды пользователей и специфику решаемых пользователями задач путем создания предметно-ориентированных языков (DSL). Описывается архитектура системы, основанной на использовании многоаспектной онтологии. Онтология включает описания языков и предметных областей, а также правила генерации новых языков и трансформации построенных моделей. Языки предназначены для описания различных классов диаграмм. Эта система включает в себя инструменты для автоматического создания новых DSL посредством отображения онтологии предметной области на метамодель базового языка по заданным пользователем правилам. Выполнена классификация различных типов диаграмм и выявлены основные компоненты диаграмм каждого типа, что дает основу для создания онтологии языков визуализации данных. Предлагается базовый язык для создания диаграмм. Демонстрируется возможность настройки языка для конкретных предметных областей. Приведен пример созданных моделей визуализации данных.

141-168
Аннотация

Для создания современного конкурентоспособного и доверенного программного обеспечения необходимо использовать знания формальных методов. В настоящее время огромное количество студентов обучается специальностям, связанным с программированием. Однако при обучении в вузе сложно получить навык практического применения теоретических знаний. Короткие соревнования с нестандартными близкими к промышленным задачами могут пробудить интерес студентов к области формальных методов. В нашей статье описан первый опыт организации соревнования по формальной верификации программ среди студентов российских вузов. Соревнования проводились в связке с семинаром по семантике, спецификации и верификации программ (PSSV) в Иннополисе в ноябре 2023 года. Формат соревнования был близок к формату так называемых хакатонов. Участникам было предложено решить задачи по верификации с использованием заранее определенных инструментов проверки моделей и дедуктивной верификации. Мы рассмотрим вопросы организации такого мероприятия, предложенные задачи, результаты решений и обратную связь от участников.

169-180
Аннотация

Электровихревые течения возникают при прохождении электрического тока меняющейся плотности через хорошо проводящую жидкость (например, кислоту или расплав металла). В таком случае ток порождает магнитное поле, которое приводит к возникновению электромагнитной силы, вызывающей закрученные течения среды. Существуют разные методы теоретического исследования подобных течений. Как правило, чтобы избежать необходимости находить зависимость давления от координат, используются переменные «векторный потенциал скорости – завихренность» («скалярная функция тока – завихренность» в случае осесимметричных течений). В таком случае достаточно эффективно использование автомодельных переменных, позволяющих понизить размерность задачи. Это дает возможность искать решение для введенной функции в виде разложения по параметру электровихревого течения, пропорционального квадрату магнитного числа Рейнольдса. Также данное решение может быть получено численно, например с помощью конечно-разностных методов. В настоящее время все чаще решения исследуются методами прямого численного моделирования, когда не делается автомодельных приближений, снижающих точность решения. Тем не менее, в таком случае объем вычислений может оказаться достаточно большим и требует использования суперкомпьютерных ресурсов. Отдельную сложность представляют граничные условия: так, для векторного потенциала скорости получается уравнение четвертого порядка, что накладывает существенные ограничения на шаги по времени в эволюционном уравнении. Проблемы можно избежать, используя приближенные граничные условия, однако это вновь снижает точность решения. В настоящей работе на примере электровихревого течения между плоскостями рассмотрены решения, которые можно получить с использованием различных вычислительных подходов, указанных выше. Проводится сравнение полученных результатов, также они сравниваются с аналитическими приближениями.

181-192
Аннотация

В работе исследуются пространственно-временные ряды основных эпидемиологических показателей COVID-19 (распространенность, смертность, показатель выздоровления) для различных регионов России. С целью выявления пространственной корреляции применено POD-разложениеб выделены основные моды, получены соответствующие временные зависимости; к последним применено шумоподавление с помощью Empirical Mode Decomposition. Показано, что вследствие разного характера временных коэффициентов для исследуемых параметров совместное POD-разложение нецелесообразно. Исследована сходимость разложения к исходным данным в зависимости от числа мод разложения; выявлен экспоненциальных характер этой зависимости.

193-198
Аннотация

Целью исследования является сравнение устной речи советских и российских молодых людей в возрасте от 13 до 23 лет. Анализ проводился по единственному показателю: обилию структурно незавершённых высказываний в расшифрованных устных сообщениях. Образцы речи как советских, так и современных российских подростков взяты из СМИ. В результате исследования было показано, что советские школьники и студенты в 7 раз меньше использовали структурно незавершённые высказывания в своей устной речи, чем современная молодёжь. Исследование является продолжением более обширного сравнения устной речи школьников и студентов советской и российской эпох, а также образцов для речевого подражания, которые транслировали советские и российские СМИ. Основанием для выбора материала исследований стала нетривиальная задача установить роль воздействия на речь подростков современной медийной среды. Если советские школьники и студенты потребляли медиаконтент с лучшими для своего времени лингвистическими образцами для подражания, то современные подростки формируются в среде свободного интернета. В ходе исследования разработан метод объективного сравнения речи разных спикеров. Корпусы текстов сравнивались по количеству окказионализмов, авторских синтагм, фразеологизмов, профессионализмов, канцеляризмов, вульгаризмов, структурно незавершённых высказываний, обсценной лексики и т.д. В серии исследований было показано, что речевые образцы советской эпохи, то есть советской группы, лучше как в количественном, так и в качественном отношении, чем современные. Научная новизна заключается в оценке устной речи спикеров информационных и развлекательных медиапродуктов СМИ одной русскоязычной страны, но в разные эпохи, хотя и близкие по времени, с помощью нового комплексного метода лингвистического анализа. Ключевыми факторами, повлиявшими на речевые подходы создателей этих медийных продуктов, стали быстрые социальные и технические изменения.

199-210
Аннотация

В данной статье мы утверждаем, что описание категории именного склонения в ваховском хантыйском языке нуждается в пересмотре, в связи с наличием последних полевых данных, полученных в 2019 году. Эта задача считается актуальной, поскольку результаты исследования предоставят ученым необходимые данные для разработки единой системы обозначений падежных маркеров, которые будут использоваться при обработке текстового материала для размещения на платформе ЛингвоДок. Система склонения анализируемого диалекта восточных ханты неоднородна и относительно обширна. Дискуссия о синтетических средствах выражения семантических отношений в языковых единицах касается терминологии падежных маркеров, их количества, морфемного статуса и функциональных особенностей. Целью данной работы является уточнение функциональных и семантических аспектов падежных маркеров ваховских ханты на основе недавно полученного полевого материала. Эта цель достигается с помощью инструментов, доступных на платформе ЛингвоДок. Последние полевые данные по ваховскому хантыйскому диалекту были собраны в селе Корлики в 2019 году. Данные объемом более 6000 слов размещены на платформе документирования исчезающих языков ЛингвоДок. Часть материала, используемая при анализе, постепенно обрабатывается и интегрируется на платформу ЛингвоДок. В основе исследования лежат работы Н.И. Терёшкина (1961) и других исследователей (Я. Гуя, Л. Хонти и др.) хантыйского языка, которые ранее описывали систему склонения ваховского диалекта. Последние полевые данные содержат тексты и анкеты, позволяющие исследователям изучить функционирование морфологических маркеров и сравнить результаты с данными, ранее представленными в литературе. Такой подход предполагает наблюдение, ведущее к систематизации падежной категории в этом диалекте на современном этапе его развития. Изучение спектра значений, передаваемых падежными маркерами, в настоящее время позволило распределить их на группы семантических и синтаксических падежных маркеров. В результате исследования подтверждено, что система именного склонения включает в себя такие падежные маркеры, как аблативный, абессивный, аллативный, лативный, локативный, комитативный, дистрибутивный, обликативный и транслативный. Последние полевые данные подтверждают наличие дистрибутивного падежа в системе и статус сравнительного элемента niŋit как послелога. Каждый падежный маркер ваховско-хантыйского диалекта терминологически конкретизирован, что необходимо для разработки парсера этого диалекта. Развитие парсера в будущем ускорит процесс обработки и анализа языкового материала и приведет к устранению ошибок при разметке текстов.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)