Preview

Вестник Дагестанского государственного технического университета. Технические науки

Расширенный поиск

Модуль голосовой аутентификации с использованием мел-кепстральных коэффициентов

https://doi.org/10.21822/2073-6185-2024-51-2-77-82

Аннотация

Цель. Целью исследования является разработка и применение способа извлечения информации о личности пользователей из записей их голоса при помощи вычисления мел-кепстральных коэффициентов.
Метод. Входе исследования использованы методы извлечения информативных признаков из голосовой записи, позволяющие идентифицировать диктора, а также представлена схема аутентификации с использованием мел-кепстральных коэффициентов.
Результат. На основе данного метода был реализован модуль аутентификации с использованием аудио записей голоса пользователей простейшими MFCC. Модуль аутентификации был разработан с использованием языка Python.
Вывод. Метод биометрической аутентификации является недорогим и относительно простым способом проверки подлинности пользователей. Несмотря на очевидные преимущества мел-кепстральных коэффициентов, данный метод имеет определенные недостатки, для устранения которых могут быть использованы различные частотные фильтры, а также сторонние алгоритмы анализа аудиозаписей.

Об авторах

Д. А. Елизаров
Омский государственный университет путей сообщения
Россия

Елизаров Дмитрий Александрович, кандидат технических наук, доцент, доцент, кафедра «Информационная безопасность»

644046, г. Омск, пр. Маркса, 35



П. А. Ашаева
Омский государственный университет путей сообщения
Россия

Ашаева Полина Александровна, аспирант, кафедра «Информационная безопасность»

644046, г. Омск, пр. Маркса, 35



Е. А. Степанова
Омский государственный университет путей сообщения
Россия

Степанова Елизавета Андреевна, кандидат технических наук, доцент, кафедра «Информационная безопасность»

644046, г. Омск, пр. Маркса, 35



Список литературы

1. Jain A., Hong L., Pankanti S. Biometric identification //Communications of the ACM. – 2000. – Т. 43. – №. 2. – С. 90-98.

2. Размер рынка голосовой биометрии и анализ доли - Отчет об отраслевых исследованиях - Тенденции роста. URL: https://www.mordorintelligence.com/ru/industry-reports/voice-biometrics-market (дата обращения: 11.12.2023).

3. Руководство по биометрии / Р. М. Болл, Дж. Х. Коннел, Ш. Панканти, Н. К. Ратха, Э. У. Сеньор. М.: Техносфера, 2007. 368 с.

4. Stevens S. S., Volkmann J., Newman E. B. A scale for the measurement of the psychological magnitude pitch // The journal of the acoustical society of America. 1937. Т. 8, №. 3. P. 185-190.

5. Гоноровский И. С. Радиотехнические цепи и сигналы: учебник для вузов. М.: «Сов. радио», 1986. 512 с.

6. Судьенкова А. В. Обзор методов извлечения акустических признаков речи в задаче распознавания диктора // Сборник научных трудов Новосибирского государственного технического университета. 2019. №. 3-4. С. 139-164.

7. Alim S. A., Rashid N. K. A. Some commonly used speech feature extraction algorithms // IntechOpen. 2018. P. 2-19.

8. Allen J. B., Rabiner L. R. A unified approach to short-time Fourier analysis and synthesis // Proceedings of the IEEE. 1977. Т. 65, №. 11. P. 1558-1564.

9. Charan R., Manisha A., Karthik R., Rajesh K. M. A text-independent speaker verification model: A comparative analysis // 2017 International Conference on Intelligent Computing and Control (I2C2). – IEEE. 2017. P. 1-6.

10. Misra S. et al. Comparison of MFCC and LPCC for a fixed phrase speaker verification system, time complexity and failure analysis //2015 International Conference on Circuits, Power and Computing Technologies [ICCPCT-2015]. – IEEE, 2015. – С. 1-4.

11. SpeechRecognition-3.8.1. URL: https://pypi.org/project/SpeechRecognition/ (дата обращения: 10.08.2023).

12. Swaroop C. H. A byte of python. – Independent, 2013.

13. Pythonnet – Python.NET URL: https://github.com/pythonnet/pythonnet (дата обращения: 10.08.2023).

14. PyAudio-0.2.11. URL: https://pypi.org/project/PyAudio/ (дата обращения: 10.08.2023).

15. Random-Word-1.0.7. URL: https://pypi.org/project/Random-Word/ (дата обращения: 10.08.2023).


Рецензия

Для цитирования:


Елизаров Д.А., Ашаева П.А., Степанова Е.А. Модуль голосовой аутентификации с использованием мел-кепстральных коэффициентов. Вестник Дагестанского государственного технического университета. Технические науки. 2024;51(2):77-82. https://doi.org/10.21822/2073-6185-2024-51-2-77-82

For citation:


Elizarov D.A., Ashaeva P.A., Stepanova E.A. Voice authentication module using mel-cepstral coefficients. Herald of Dagestan State Technical University. Technical Sciences. 2024;51(2):77-82. (In Russ.) https://doi.org/10.21822/2073-6185-2024-51-2-77-82

Просмотров: 164


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2073-6185 (Print)
ISSN 2542-095X (Online)