Preview

Труды Института системного программирования РАН

Расширенный поиск

Метод поиска реквизитов физических лиц в базах данных на основе нечёткого сравнения

https://doi.org/10.15514/ISPRAS-2015-27(3)-23

Полный текст:

Аннотация

При передаче данных от одного учреждения к другому возникает проблема персональной идентификации физических лиц, у которых частично или полностью не совпадают реквизиты. В работе представлены метод и реализующий его алгоритм нечеткого поиска, использующие модифицированную метрику Левенштейна. Разработанный алгоритм, спроектированный в виде процесса Data Mining, позволяет быстро определять людей, используя данные ранее проведенного поиска. Встроенная система приоритета реквизитов позволяет идентифицировать человека в таких случаях, как смена фамилии, имени, переезд, ошибки при ручном вводе данных, а также при частично отсутствующих реквизитах. Алгоритм реализован на языке PL-SQL в СУБД Oracle 11g.

Об авторах

Наталия Лиманова
Поволжский государственный университет телекоммуникаций и информатики
Россия


Максим Седов
Поволжский государственный университет телекоммуникаций и информатики
Россия


Список литературы

1. Подборка материалов о международном опыте законодательного регулирования использования систем идентификации личности (http://www.kongord.ru/Index/Prison/SViP.htm).

2. Отчёт о выполнении научно-исследовательской, опытно-конструкторской работы «Разработка механизмов однозначной идентификации данных о физических лицах и объектах недвижимости, хранящихся в различных информационных системах органов государственной власти и местного самоуправления (http://www.nisse.ru/business/article/article_464.html).

3. Положение о персональном идентификационном номере граждан Российской Федерации, проживающих или пребывающих на территории Санкт-Петербурга (http://iac.spb.ru/shablon.asp?subpage=171&id=40&dir=0).

4. Проект "Социальная карта москвича" (http://www.soccard.ru).

5. Сборник тезисов городской научно-практической конференции студентов, аспирантов, преподавателей вузов и специалистов муниципальных учреждений г.Тольятти «Информатизация в социальной сфере» (http://it-exclusive.ru/idperson/docs/stat.doc).

6. Хемминг Р.В. Теория кодирования и теория информации, пер. с англ. Под ред. Б.С. Цыбакова, Радио и связь, 1983.

7. Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов, доклады АН СССР т.163, 1965.

8. Бойцов Л.М. Анализ строк, http://itman.narod.ru/articles/infoscope/string_search.1-3.html.

9. Чубукова И.А., ”Data Mining”, учебный курс, издательство Интернет-университета информационных технологий (http://www.intuit.ru/), 2006.

10. Скотт Урман, “ORACLE 9i - Программирование на языке PL/SQL”, учебное пособие, Oracle Press - издательство “Лори”, 2004.


Для цитирования:


Лиманова Н., Седов М. Метод поиска реквизитов физических лиц в базах данных на основе нечёткого сравнения. Труды Института системного программирования РАН. 2015;27(3):329-342. https://doi.org/10.15514/ISPRAS-2015-27(3)-23

For citation:


Limanova N., Sedov M. Searching method of personal details on the basis of fuzzy comparison. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2015;27(3):329-342. (In Russ.) https://doi.org/10.15514/ISPRAS-2015-27(3)-23

Просмотров: 117


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)