Прототип системы распознавания усталости по видео-, аудио- и текстовым данным

Авторы

Киселёв Г. А. Вейценфельд Д. А.

Аннотация

Описан прототип системы, использующей видео-, аудио- и текстовые данные для распознавания состояния усталости и низкой работоспособности человека. Для этого также была изучена и подробно описана задача VQA, а также особенности ее реализации на примерах из других исследований. Проведены эксперименты на наборах с большой вариацией задач: стандартная задача VQA на наборе VQA v2, сложные сцены CLEVR CoGenT, анализ кассовых чеков Receipt-AVQA-2023.

Внешние ссылки

DOI: 10.56304/S2949609823010045

Скачать PDF или читать онлайн на сайте журнала «Физмат»: https://sciencejournals.ru/issues/fizmat/2023/vol_1/iss_1/FizMat2301004Veitsenfeld/FizMat2301004Veitsenfeld.pdf

Скачать PDF в библиотеке eLibrary (требуется регистрация): https://www.elibrary.ru/item.asp?id=57140023

Ссылка при цитировании

Вейценфельд Д. А., Киселёв Г. А., Коровин Я. С., Маков С. В. Прототип системы распознавания усталости по видео-, аудио- и текстовым данным // ФИЗМАТ, 2023, том 1, № 1, с. 65–73.