Preview

Труды Института системного программирования РАН

Расширенный поиск

Алгоритм Shazam для обнаружения частичного видео копирования

https://doi.org/10.15514/ISPRAS-2025-37(6)-32

Аннотация

Алгоритм Shazam доказал свою надежность и эффективность в задачах идентификации аудио. В данной работе мы адаптируем основные принципы алгоритма Shazam для задачи обнаружения частичных видеокопий. Мы предлагаем новый метод выравнивания видеоотпечатков при поиске частичной видеокопии запроса по базе видео. Одно из лучших качеств данного метода – его высокая скорость исполнения на CPU, простота и одновременно с этим высокая эффективность. Экспериментальные результаты на общедоступных видео наборах данных демонстрируют, что наш подход достигает высокой точности в обнаружении частичных и модифицированных видеокопий, обладая конкурентной производительностью по скорости и масштабируемости. Наши результаты показывают, что создание отпечатков по принципам Shazam может служить эффективным инструментом для крупномасштабных приложений по обнаружению видеокопий.

Об авторах

Рустам Шамилевич УЗДЕНОВ
Институт системного программирования им. В.П. Иванникова РАН, Московский государственный технический университет им. Н. Э. Баумана
Россия

Является студентом факультета Фундаментальных Наук МГТУ им. Баумана, лаборант института системного программирования РАН. Научные интересы: нейросетевая обработка данных, цифровая обработка изображений, методы доверенного искусственного интеллекта.



Андрей Игоревич ПЕРМИНОВ
Институт системного программирования им. В.П. Иванникова РАН
Россия

Аспирант института системного программирования РАН. Научные интересы: нейросетевая обработка данных, цифровая обработка изображений, методы доверенного искусственного интеллекта.



Список литературы

1. Wang A. et al. An industrial strength audio search algorithm // Ismir. 2003. Vol. 2003, pp. 7-13.

2. Jiang Y. G., Jiang Y., Wang J. VCDB: a large-scale database for partial copy detection in videos // Computer Vision–ECCV 2014: 13th European Conference, Zurich, Switzerland, September 6-12, 2014, Proceedings, Part IV 13. Springer International Publishing, 2014, pp. 357-371.

3. Chen W., Gan W., Yu P. S. Digital Fingerprinting on Multimedia: A Survey // arXiv preprint arXiv:2408.14155. 2024.

4. Pizzi E. et al. The 2023 video similarity dataset and challenge // Computer Vision and Image Understanding. – 2024. Vol. 243, pp. 103997.

5. Vaswani A. et al. Attention is all you need // Advances in neural information processing systems. – 2017. Vol. 30.

6. Lu J. Video fingerprinting for copy identification: from research to industry applications // Media Forensics and Security. 2009. Vol. 7254, pp. 725402.

7. Hua X. S., Chen X., Zhang H. J. Robust video signature based on ordinal measure // 2004 International Conference on Image Processing, 2004. ICIP'04. IEEE, 2004. Vol. 1, pp. 685-688.

8. Malekesmaeili M., Fatourechi M., Ward R. K. Video copy detection using temporally informative representative images // 2009 International Conference on Machine Learning and Applications. IEEE, 2009, pp. 69-74.

9. Bradski G. The opencv library // Dr. Dobb's Journal: Software Tools for the Professional Programmer. 2000. Vol. 25, issue 11, pp. 120-123.

10. Buchner J. Image Hash library [Online] https://github.com/jgraving/imagehash (accessed 20.04.2025).

11. Jain T. et al. Imagededup [Online] https://github.com/idealo/imagededup (accessed 20.04.2025).

12. Mahanty A. Videohash [Online] https://github.com/akamhy/videohash (accessed 20.04.2025).

13. Katiyar A., Weissman J. {ViDeDup}: An {Application-Aware} Framework for Video De-duplication // 3rd Workshop on Hot Topics in Storage and File Systems (HotStorage 11). 2011.

14. Steinebach M. An analysis of photodna // Proceedings of the 18th International Conference on Availability, Reliability and Security. 2023, pp. 1-8.

15. Liu Z. et al. A similarity alignment model for video copy segment matching // arXiv preprint arXiv:2305.15679. 2023.

16. https://github.com/SUPERustam/frame_video_search (accessed 25.08.2025).


Рецензия

Для цитирования:


УЗДЕНОВ Р.Ш., ПЕРМИНОВ А.И. Алгоритм Shazam для обнаружения частичного видео копирования. Труды Института системного программирования РАН. 2025;37(6):237-248. https://doi.org/10.15514/ISPRAS-2025-37(6)-32

For citation:


UZDENOV R.Sh., PERMINOV A.I. Shazam Algorithm for Partial Video Copy Detection. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2025;37(6):237-248. https://doi.org/10.15514/ISPRAS-2025-37(6)-32



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)