Preview

Труды Института системного программирования РАН

Расширенный поиск
Том 33, № 2 (2021)
Скачать выпуск PDF
7-48 161
Аннотация

Современная реалистичная компьютерная графика базируется на физически корректном моделировании распространения света. Одной из основных и трудно вычислимых задач при этом является расчет глобальной освещенности, т.е. распределения света в виртуальной сцене, учитывающий множественные отражения и рассеяния света и всевозможные виды взаимодействия его с объектами сцены. Этой проблеме посвящены сотни публикаций, описывающие десятки методов вычисления глобальной освещенности и их модификации. В данной обзорной статье мы бы хотели не просто перечислить и кратко описать эти методы, но и дать некоторую «карту» существующих работ, которая позволит читателю сориентироваться, понять их достоинства и недостатки и, тем самым, выбрать для себя подходящий базовый метод. Особое внимание уделяется таким характеристикам методов как надёжность и универсальность в отношении используемых моделей, прозрачность их верификации, возможность эффективной реализации на GPU, а также накладываемые на сцену или феномены освещённости ограничения. В отличие от существующих обзорных работ анализируется не только эффективность методов, но также их ограничения и сложность программной реализации. Кроме того, мы предоставляем результаты собственных численных экспериментов с различными методами, служащих иллюстрациями к выводам.

49-64 44
Аннотация

В настоящее время обеспечение достаточного уровня качества данных является первостепенной задачей для поддержки успешной деятельности любой организации или предприятия. Поэтому внедрение практик управления качеством данных необходимо в ситуациях, требующих обеспечения определенного уровня качества данных для конкретной функциональности приложения или сервиса. Подобные специализированные практики управления качеством данных должны внедряться в процесс разработки программного обеспечения как можно раньше. На основе анализа существующих предложений в данной области было установлено, что все еще заметна нехватка методологических и технологических решений при разработке приложений, ориентированных на качество данных. Основываясь на достижениях области Web-проектирования под управлением моделей, данная работа представляет частичный результат наших исследований в этой области: предлагается использование метамодели и профиля UML как артефактов качества данных на стадии проектирования Web-приложений. Основной целью работы является предоставление инструментов для предотвращения проблем с качеством данных при проектировании Web-приложений.

65-76 55
Аннотация

Представлена реализация алгоритма распознавания Web-рекламы с использованием регулярных выражений. Сегодня при разработке программного обеспечения важную роль играет использование регулярных выражений, оптического распознавания символов, баз данных и автоматизированного тестирования. Тесты проводились в трех веб-браузерах. Результатом явилось выявление рекламы на испанском языке, которая отвлекает внимание пользователей, а прежде всего, позволяет получать информацию о них. Основная особенность алгоритма заключается в том, что его автоматическое и настраиваемое выполнение не требует доступа к коду рассматриваемой страницы, и будущем может появиться приложение, работающее в фоновом режиме. Кроме того, при поддержке оптического распознавания символов мы получаем приемлемую эффективность при выявлении рекламы.

77-92 30
Аннотация

На сегодняшний день в методологии разработки программного обеспечения Scrum предлагаются разные методы оценки трудозатрат и сложности пользовательских историй. В большинстве существующих методов факторы анализируются на уровне мелких структурных единиц, и эти методы не всегда точны. Хотя чаще всего для оценки пользовательских историй в Scrum используется покер планирования, он эффективен в основном для опытных команд, поскольку оценка строится на основе наблюдений экспертов, но у неопытных команд применение этого метода вызывает трудности. В данной статье мы предлагаем метод декомпозиции сложности на крупные блоки, позволяющий учитывать важные для оценки факторы. Для представления факторов и связей между ними используется байесовская сеть. Ребра взвешиваются на основе профессиональной оценки важности рассматриваемых факторов. Узлы сети представляют факторы. На этапе оценки Scrum-команда присваивает каждому фактору значение, что позволяет сети сгенерировать значения для сложности пользовательской истории с последующей трансформацией в номер карты покера планирования, которой представляет относительную оценку сложности пользовательской истории. Цель данного исследования состоит в том, чтобы предоставить командам разработчиков без опыта или без имеющихся статистических данных метод, позволяющий существенно повысить точность оценки сложности пользовательских историй с помощью модели, ориентированной на человеческий фактор разработчиков.

93-114 183
Аннотация

Сахарный диабет 2-го типа (СД2) составляет около 90% случаев диабета, и одним из ключевых аспектов СД2 являются жесткие требования к постоянному мониторингу и выявлению. Это исследование направлено на разработку ансамбля из нескольких моделей машинного и глубокого обучения для раннего обнаружения СД2 с высокой точностью. При большом разнообразии моделей ансамбль обеспечивает больше возможностей, чем отдельные модели. Предлагаемый ансамбль моделей основан на использовании известных моделей логистической регрессии, случайного леса, опорных векторов и глубокой нейронной сети. Выходные данные каждой модели в модифицированном ансамбле используются для определения окончательных выходных данных системы. Датасеты, используемые для этих моделей, включают Practice Fusion HER, Pima Indians diabetic's data, UCI AIM94 Dataset и CA Diabetes Prevalence 2014. По сравнению с ранее разработанными решениями, наше решение на основе ансамблевой модели демонстрирует высокие показатели точности, чувствительности и специфичности. В среднем обеспечиваются точность 87,5% от 83,51%, чувствительность 35,8% от 29,59% и специфичность 98,9% от 96,27%. Время работы предлагаемого решения составляет 96,6 мс, в то время как у наиболее по архитектуре известной системы – 97,5 мс. Предлагаемая усовершенствованная система улучшает возможности прогнозирования СД2 на основе использования ансамбля из нескольких моделей машинного и глубокого обучения. Для получения окончательного точного прогноза с использованием результатов отдельных моделей применяется схема мажоритарного голосования. В работе также изменена функция регуляризации, чтобы учесть регуляризацию всех моделей в ансамбле, что помогает предотвратить переобучение и поддержать возможность обобщений в предлагаемой системе.

115-124 27
Аннотация

Психические расстройства типа депрессии составляют 28% от общего числа заболеваний, связанных с инвалидностью, и около 7,5% инвалидов в мире имеют подобные расстройства. Депрессия – это распространенное расстройство, которое влияет на душевное состояние, ежедневную деятельность, эмоции, а также вызывает нарушения сна. По некоторым оценкам, примерно 50% пациентов с депрессией страдают от нарушений сна. В данной работе процесс извлечения данных для классификации депрессивных и недепрессивных эпизодов в ночное время осуществляется на основе формального метода обнаружения знаний в базах данных (Knowledge Discovery in Databases, KDD). При использовании KDD процесс интеллектуального анализа данных имеет следующие четко выраженные этапы: предварительное обнаружение знаний в базах данных, отбор, предварительная обработка, преобразование, собственно анализ, оценка и последующее обнаружение знаний в базах данных. Для классификации был использован набор данных DEPRESJON, в котором содержится информация о двигательной активности 23 пациентов с монополярным и биполярным расстройством и 32 здоровых людей. Для классификации депрессивных и недепрессивных эпизодов были использованы два различных метода – многомерный и одномерный анализ данных. Для многомерного анализа применяется алгоритм случайного леса с моделью, основанной на 8 признаках. Результаты классификации имеют специфичность 0,9927 и чувствительность 0,9991. Одномерный анализ показывает, что наиболее информативной характеристикой модели являются пики активности, обеспечивающие точность 0,908 при классификации депрессивных эпизодов.

125-136 118
Аннотация

В данной статье представлены методы управления спросом для участия центров обработки данных в умных электроэнергетических рынках в рамках парадигмы умных сетей электроснабжения. Для определения энергопотребления задач с интенсивным использованием процессора и памяти используется модель центра данных, основанная на эмпирической информации. Предлагаются переговорный подход между центром обработки данных и клиентами и эвристический метод планирования для оптимизации энергосбережения. Экспериментальная оценка осуществляется на примере реальных проблем, моделирующих разные типы клиентов. Результаты исследования свидетельствуют о том, что предложенный подход эффективен для обеспечения соответствующих мер по управлению спросом на электроэнергию в соответствии с денежными стимулами.

137-148 33
Аннотация

Современные компьютерные технологии открывают возможности для инноваций в широком спектре приложений. На смену традиционным подходам, в основе которых лежат визуальные и ручные методы, все чаще приходят автоматизированные процессы за счет использования киберфизических систем. Настоящая работа является примером этой тенденции и посвящена использованию машинного зрения на основе глубокого обучения для классификации действующих нагрузок на мосты и поддержки систем оптического сканирования для мониторинга состояния строительных конструкций. Система оптического сканирования контролирует состояние строительных конструкций (здания, мосты, дамбы и т.д.) путем измерения возможного смещения координат характерных точек, что позволяет выявить аномальное поведение конструкции, возможно, связанного с ее повреждением. При анализе мостовых конструкций использование подобной оптической сканирующей системы несколько затруднено из-за проезда транспортных средств по мосту, что вызывает его колебания. Причем эти колебания моста и, соответственно, смещения координат не обязательно связаны с повреждением моста. Таким образом, требуется классификатор нагрузок на мост для определения корреляции измеряемых смещений координат характерных точек с колебаниями, вызванными взаимодействием с ним транспортных средств, чтобы отличить нормальное поведение конструкции от аномального состояния и выявить тенденции, указывающие на нежелательную деформацию моста, или спрогнозировать поведение моста во времени под действием нагрузки.

149-162 37
Аннотация

Предлагается первый подход, основанный на применении вейвлет-анализа при обработке изображений с целью обнаружения объектов c повторяющимися чертами и двоичной классификации в плоскости изображения, в частности, для навигации в симулируемых средах. На сегодняшний день стало привычным использовать алгоритмы на основе сверточных нейронных сетей (Convolutional Neural Networks, CNN) для обработки изображений, полученных с бортовых камер беспилотных летательных аппаратов (Unmanned Aerial Vehicles, UAV), в пространственной области, что способствует решению задач обнаружения и классификации. Архитектура CNN позволяет обучать сеть, используя в качестве входных данных изображения без предварительной обработки. Это позволяет извлекать характерные признаки изображения. Тем не менее, в этой работе мы утверждаем, что спектральные характеристики изображений на разных частотах, низких и высоких, также влияют на производительность CNN во время обучения. Мы предлагаем архитектуру CNN, дополненную двумерным дискретным вейвлет-преобразованием как методом выделения признаков. Такая информация улучшает способность сети к обучению, устраняет переобучение и обеспечивает более высокую эффективность при обнаружении цели.

163-172 34
Аннотация

В данной статье представлена основанная на потоках формулировка проблемы обеспечения качества дерева многоадресной рассылки услуг в терминах смешанного целочисленного программирования. Это актуальная проблема, связанная с современными телекоммуникационными сетями, обеспечивающие распространение мультимедийного контента через облачные Internet-системы. Насколько нам известно, для проблемы обеспечения качества дерева многоадресной рассылки услуг формулировка в терминах смешанного целочисленного программирования ранее не предлагалась. Экспериментальная оценка выполняется на наборе реалистичных примеров из SteinLib, чтобы показать применимость стандартных точных решателей для нахождения решений реальных задач. Точный метод применяется для бенчмаркинга предлагаемых формулировок, а также для поиска оптимальных или близких к оптимальным решений за приемлемое время исполнения.

173-190 61
Аннотация

Приведен обзор современных подходов к работе с конфиденциальными данными в облачных вычислениях. Значительная часть хранилищ данных и систем их обработки используют облачные сервисы. Пользователи и организации рассматривают такие сервисы как поставщика услуг. В этом случае у них нет необходимости закупать, устанавливать и поддерживать дорогостоящее оборудование, они могут получить доступ к данным и результатам их обработки с любого устройства. Такое использование облачных сервисов несет в себе определенные риски, связанные с возможными угрозами раскрытия конфиденциальной информации, поскольку одним из участников протокола обеспечения безопасности доступа к облачным хранилищам данных может быть противник. Рассмотренные подходы предназначены для баз данных, в которых, с одной стороны, информация хранится в зашифрованном виде, а с другой, позволяют работать в привычной парадигме SQL-апросов. Такие подходы имеют, наряду с преимуществами, некоторые ограничения, в связи с необходимостью выбора метода шифрования, а также соблюдения баланса между его надежностью и необходимым пользователю набором запросов. Для случая, когда пользователь не ограничен рамками SQL-запросов, предложена организация облачных вычислений над конфиденциальными данными, основанная на использовании лямбда-архитектуры с ограничением на разрешенные дедуктивно безопасные запросы к базам данных и реализованная с использованием свободного программного обеспечения.

191-200 38
Аннотация

Пропозициональное модальное µ-исчисление является хорошо известным языком спецификаций систем помеченных переходов. В этой работе мы изучаем расширение этой логики с помощью обратных модальностей и арифметических ограничений Пресбургера, интерпретируемых на древовидных моделях. Мы описываем алгоритм выполнимости, основанный на построении по уровням моделей Фишера-Ларднера. Также сообщается о совместном выполнении нескольких экспериментов. Кроме того, мы описываем применение алгоритма для решения задач статического анализа полуструктурированных данных.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)