Preview

Труды Института системного программирования РАН

Расширенный поиск

Метод обучения персептрона на табличных данных с пропусками

https://doi.org/10.15514/ISPRAS-2025-37(6)-22

Аннотация

Обработка пропусков в табличных данных остаётся важной задачей при построении надёжных моделей машинного обучения. В данной работе рассматривается новый подход к заполнению пропущенных значений, основанный на идее унарной классификации. Предложенный метод использует ансамбль персептронов, обучаемых отдельно для каждого класса, для оценки правдоподобия восстанавливаемых значений относительно эмпирического носителя класса. В качестве фона используется равномерное распределение на ограниченной области признакового пространства. Это позволяет интерпретировать выход модели как аппроксимацию апостериорной вероятности принадлежности объекта к классу и использовать её в процессе итеративного заполнения пропусков и обучения классификатора. Теоретически обоснована состоятельность построенной оценки. Проведены эксперименты на синтетических двумерных выборках с пропусками, распределёнными по механизму MCAR. Полученные результаты демонстрируют преимущества предложенного подхода по сравнению с классическими методами заполнения, особенно при высокой доле пропусков и сложной геометрии классов.

Об авторах

Андрей Игоревич ПЕРМИНОВ
Институт системного программирования им. В.П. Иванникова РАН
Россия

Является аспирантом института системного программирования РАН. Научные интересы: нейросетевая обработка данных, цифровая обработка изображений, методы доверенного искусственного интеллекта.



Андрей Петрович КОВАЛЕНКО
Институт системного программирования им. В.П. Иванникова РАН
Россия

Доктор технических наук, исследователь центра доверенного искусственного интеллекта в институте системного программирования РАН. Научные интересы: методы доверенного искусственного интеллекта.



Денис Юрьевич ТУРДАКОВ
Институт системного программирования им. В.П. Иванникова РАН
Россия

Кандидат физико-математических наук, заведующий отделом ИСП РАН. Научные интересы: анализ социальных сетей, анализ текста, извлечение информации, обработка больших данных, методы доверенного искусственного интеллекта.



Список литературы

1. Lukyanov K. S. et al. Extrapolation of the Bayesian classifier with an unknown support of the two-class mixture distribution //Russian Mathematical Surveys. 2024. Vol. 79, No. 6, pp. 991-1015.

2. Cybenko G. Approximation by superpositions of a sigmoidal function //Mathematics of control, signals and systems. 1989. Vol. 2, No. 4, pp. 303-314.

3. Kovalenko A. Geometric interpretation of a multilayer perceptron with piecewise linear activation functions // 31st scientific and technical conference "MiTSOBIT". Saint Petersburg, 2022. pp. 34—35.

4. Devroye L. Nonparametric density estimation //The L_1 View. 1985.

5. Devroye L., Györfi L., Lugosi G. A probabilistic theory of pattern recognition. – Springer Science & Business Media, 2013. Vol. 31.

6. MissingDataPerceptron, https://github.com/dronperminov/MissingDataPerceptron, last accessed: 01 July 2025.


Рецензия

Для цитирования:


ПЕРМИНОВ А.И., КОВАЛЕНКО А.П., ТУРДАКОВ Д.Ю. Метод обучения персептрона на табличных данных с пропусками. Труды Института системного программирования РАН. 2025;37(6):93-106. https://doi.org/10.15514/ISPRAS-2025-37(6)-22

For citation:


PERMINOV A.I., KOVALENKO A.P., TURDAKOV D.Yu. Method for Training Perceptron on Tabular Data with Missing Values. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2025;37(6):93-106. (In Russ.) https://doi.org/10.15514/ISPRAS-2025-37(6)-22



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)