Описан прототип системы, использующей видео-, аудио- и текстовые данные для распознавания состояния усталости и низкой работоспособности человека. Для этого также была изучена и подробно описана задача VQA, а также особенности ее реализации на примерах из других исследований. Проведены эксперименты на наборах с большой вариацией задач: стандартная задача VQA на наборе VQA v2, сложные сцены CLEVR CoGenT, анализ кассовых чеков Receipt-AVQA-2023.
DOI: 10.56304/S2949609823010045
Скачать PDF или читать онлайн на сайте журнала «Физмат»: https://sciencejournals.ru/issues/fizmat/2023/vol_1/iss_1/FizMat2301004Veitsenfeld/FizMat2301004Veitsenfeld.pdf
Скачать PDF в библиотеке eLibrary (требуется регистрация): https://www.elibrary.ru/item.asp?id=57140023
Вейценфельд Д. А., Киселёв Г. А., Коровин Я. С., Маков С. В. Прототип системы распознавания усталости по видео-, аудио- и текстовым данным // ФИЗМАТ, 2023, том 1, № 1, с. 65–73.