Byte/RE ИТ-издание

Ввод текста глазами – разработка Microsoft Research

По сообщению Microsoft, исследователи из Microsoft Research и Университета Вашингтона реализовали удобный метод ввода текста взглядом, сделав его значительно более доступными для людей с недостатком двигательной способности (к примеру, страдающих боковым амиотропическим склерозом, который диагностирован у Стивена Хокинга).

Специальное оборудование, которое позволяло парализованным пациентам «печатать глазами», существовало и раньше. Оно работает так: сидящий перед камерой пользователь сначала переводит взгляд в сторону одной из нескольких групп букв, а вторым движением глаз выбирает конкретную букву в группе, затем повторяет это с каждой следующей буквой. Для отслеживания направления взгляда в таких системах используются инфракрасные датчики, которые плохо работают при свете, а стоимость всего комплекта может составлять 5–10 тыс. долл.

Ученым из Microsoft Research удалось не только значительно удешевить систему, но и упростить сам процесс ввода. Созданная ими программа Eye-gaze работает на обычном смартфоне и следит за глазами через его камеру. Из дополнительного оборудования понадобится лишь картинка с буквами, а сам смартфон даже не нужно закреплять на штативе. Отказ от инфракрасных датчиков означает также, что Eye-gaze можно использовать при ярком солнечном свете. Программа сканирует и захватывает изображение глаз с помощью технологии распознавания изображений Microsoft, после чего соотносит каждое движение глаз с соответствующими командами.

Процесс печати упрощается за счет предиктивного механизма ввода текста, аналогичного тому, который работает на телефоне с кнопками. Групп букв в Eye-gaze всего четыре, и пользователю достаточно выбирать лишь группу, но не букву в ней. Для удаления введенной буквы нужно моргнуть левым глазом, а для подтверждения слова — правым. Ассистент, держащий в руках телефон с Eye-gaze, видит список подсказок и может помогать вводить слова, выбирая подходящие по контексту варианты.

Метод заметно ускоряет и упрощает коммуникацию людям с ограниченными двигательными возможностями. В среднем на печать предложения при помощи Eye-gaze уходит примерно 1,5 мин, тогда как ввод того же предложения на более дорогой и сложной системе e-tran занимает более 2 мин. Опрос участников тестирования показал, что они находят Eye-gaze менее сложным и более приятным способом ввода.

Вам также могут понравиться