Особливості застосування систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом інформації для людей з вадами зору

Денісов, Р. В.; Попович, П. В.

doi:10.30857/2786-5371.2024.3.2

Please use this identifier to cite or link to this item: https://er.knutd.edu.ua/handle/123456789/27085

Title:	Особливості застосування систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом інформації для людей з вадами зору
Other Titles:	Peculiarities of application of object recognation system in real time on microcontrollers with subsequent voise output of information for people with visual impairments
Authors:	Денісов, Р. В. Попович, П. В.
Keywords:	системи розпізнавання зображень мікроконтролери голосовий вивід інформації згорткові нейронні мережі image recognition systems microcontrollers voice output of information convolutional neural networks TensorFlow English eSpeak MobileNet
Issue Date:	2024
Citation:	Денісов Р. В. Особливості застосування систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом інформації для людей з вадами зору [Текст] / Р. В. Денісов, П. В. Попович // Технології та інжиніринг. - 2024. - № 3 (20). - С. 21-30.
Source:	Технології та інжиніринг
Abstract:	Дослідження мінімального і максимального часу необхідного на проходження одного повного циклу розпізнавання-оголошення назви об’єкту з урахуванням різної довжини слів, різної швидкості розпізнавання об’єктів, а також фізичних особливостей людей з вадами зору для систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом. Створення варіантів комбінацій слів різної довжини з урахуванням можливості задання швидкості генерації мови у Espeak, та середньої швидкості мови в Україні. Розрахунок мінімальної і максимальної відстані до об’єкту на момент початку циклу розпізнавання-оголошення. Встановлено мінімальний і максимальний час необхідний на повний цикл розпізнавання-оголошення назви об’єкту. На базі синтезатора мови Espeak та особливостях Українсько мови та мовлення було досліджено час необхідний для оголошення назв об’єктів різної довжини. Встановленого мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, швидкості їх руху та швидкості реакції на голосову інформацію. Також отримано мінімальну і максимальну відстань до об’єкту на момент початку циклу, в залежності від часу необхідного на проходження одного повного циклу. Отримано мінімальний і максимальний час необхідний на проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, технічних можливостей сучасних нейронних мереж та програм для синтезу мови, а також мінімальну і максимальну відстань до об’єкту на момент початку циклу. Досліджено мінімальну і максимальну відстань до об’єкту на момент початку циклу розпізнавання-оголошення. Отримані результати можуть бути використані при практичному створенні систем онлайн розпізнавання об’єктів, для оцінки можливості застосування тих чи інших нейронних мереж, спираючись на отриманий мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації, а також часу необхідного для проходження кожного з його окремих елементів. The study of the minimum and maximum time required to complete one full cycle of object name recognition-announcement taking into account different word lengths, different object recognition speeds, as well as physical characteristics of visually impaired people for real-time object recognition systems on microcontrollers with subsequent voice output. Creating variants of combinations of words of different lengths, taking into account the possibility of setting the speed of speech generation in Espeak, and the average speed of speech in Ukraine. Calculation of the minimum and maximum distance to the object at the start of the recognition-announcement cycle. The minimum and maximum time required for a full cycle of object name recognition-announcement is set. On the basis of the Espeak language synthesizer and the peculiarities of the Ukrainian language and speech, the time required to announce the names of objects of different lengths was investigated. The minimum and maximum time for completing the full cycle of information recognition-announcement is set, taking into account the physical characteristics of people with visual impairments, their speed of movement and the speed of reaction to voice information. The minimum and maximum distance to the object at the start of the cycle was also obtained, depending on the time required to complete one complete cycle. The minimum and maximum time needed to complete the full cycle of information recognition and announcement was obtained, taking into account the physical characteristics of visually impaired people, the technical capabilities of modern neural networks and programs for speech synthesis, as well as the minimum and maximum distance to the object at the time of the start of the cycle. The minimum and maximum distance to the object at the start of the recognition-announcement cycle was studied. The obtained results can be used in the practical creation of online object recognition systems, to assess the possibility of using certain neural networks, based on the obtained minimum and maximum time for passing the complete cycle of recognition-announcement of information, as well as the time required for passing each of its separate elements.
DOI:	10.30857/2786-5371.2024.3.2
URI:	https://er.knutd.edu.ua/handle/123456789/27085
ISSN:	2786-5371
Appears in Collections:	Наукові публікації (статті) Технології та інжиніринг

Files in This Item:

File	Description	Size	Format
TI_2024_N3(20)_P021-030.pdf		534,71 kB	Adobe PDF	View/Open

Show full item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets