Шаг в будущее: голосовое управление

Автор:

В номере: 2019

© metamorworks - Fotolia.com

Фраза «Окей, Google» уже стала общеизвестной. Ее слышали многие, но далеко не все знают, как она появилась и что означает. Эта фраза — начало голосового управления сервиса поиска, который различает как буквенный запрос, так и голосовой. Такие программы — новы в глобальном смысле, но с успехом применяются с середины 90-х годов различными платформами.

Первые попытки внедрения таких программ не оценены должным образом пользователями, они оказались неудачными, а как современные программы?

Самые популярные голосовые помощники – это Alexa (разработка Amazon), Siri (от Apple), Cortana (от Microsoft) и Ok Google (от Google Now и Google Assistant). Зачем нужны они  в повседневной жизни, как работают и зачем создавались?

В чем смысл голосового помощника

Вариантов приложения к жизни этой программы много. Представьте, что лежите на диване, слушаете через динамик «Echo» от Amazon радиостанцию и захотели сменить волну. Вы будете вынуждены встать, подойти, отрегулировать поиск, найти желаемое, вернуться на диван и снова лечь. А что делает такая программа после команды, например, «Alexa, воспроизведи песню Адель на Spotify»? Она находит Адель, включает желаемую мелодию, но при этом вы как лежали на диване, так и продолжаете лежать.

Или, управляя автомобилем, вам захотелось узнать, какие музеи имеются в городе, который будете проезжать. «Окей, Googl, куда сходить в Мюнхене?». И вы получите немедленно полную информацию.

Конечно же, главное условие – наличие электронного девайся, поддерживающего нужную программу. С помощью голосового управления вы можете «без рук» узнать ответы на все вопросы: какая ожидается погода, сколько километров еще ехать, услышать последние новости, уточнить, кто выиграл вчера в регби, можно даже совершить покупку. И делается это просто: интернет-сообщество недавно обсуждало ситуацию, когда в США шестилетняя девочка, играя с маминым телефоном, купила кукольный дом и большую пачку печенья с немедленной доставкой.

Голосовой помощник и Умный дом

Умный дом – новый тренд обустройства жизненного пространства. Его концепция развивается по трем направлениям: повышение комфорта жизни, защита от нежелательных проникновений и предупреждение аварийных ситуаций. Сегодня голосовые программы уже помогают повышать комфорт жизни. Как? Через смартфон, установив соответствующие программы, вы можете включать и отключать отопление, что даст кроме несомненного комфорта еще и экономию средств на оплату тепла. Можете управлять кондиционером и освещением. Управляющий модуль включит в ваше отсутствие телевизор или аудиотехнику, что создаст иллюзию присутствия в доме хозяев, когда на самом деле вы покинули дом на период, например, отпуска. Вы можете составить список необходимых продуктов, а программа сразу же осуществит их заказ и доставку.

Корпорация Google планирует предложить Германии голосовой динамик «Google Home». Конкуренты из Apple и Microsoft также работают над аналогичными продуктами для нового класса устройств. Три основные компании-разработчики программного обеспечения доминируют на рынке операционных систем и уже длительное время используют голосовые помощники в смартфонах, а с прошлого года – и в настольных персональных компьютерах.

© Paolese - Fotolia.com

Проблемы понимания

Были протестированы на смартфонах и ноутбуках голосовые программы ведущих мировых производителей, задано около сорока вопросов различной направленности: от поиска информации до воспроизведения музыки и написания электронного письма.

Эти программы не устанавливаются в электронные девайсы, они там есть по определению. (Заметьте, каждый производитель электроники пользуется исключительно персональной программой, у Apple — Siri, у Amazon — Alexa и так далее).

Голосовой помощник активируется и должен иметь постоянный доступ к системе Интернет. Каждый помощник отбирает образцы голоса, чтобы знать произношение, темп и высоту голоса хозяина, а далее звучит коронная фраза «Oкей, Google», «Эй, Алекса», «Эй, Cortana», «Эй, Siri» и контакт налажен.

Задачи не сложные, типа установить будильник на конкретное время, отправить сообщение, позвонить абоненту или «какая погода в Париже» практически все программы выполняют безупречно.

С навигацией было некоторое недопонимание у Alexa. Неоднократное повторение адреса не помогало, Alexa мило извинялась и обещала, что в следующий раз она непременно поможет.

А вот с музыкой было еще сложнее. Разочаровала Siri – программа от Apple. У Siri, видимо, страдает восприятие звуков и она воспринимала группу «Muse» как «News», «Abba» – как «aber», «Seeed» – как «sieht». Google распознал песню Шарля Азнавура «Les Temps» как «Lutong», а Cortana – как «Lothar».

Но зато с музыкой порадовала Alexa: прекрасно определяла композиции и регулировала звук.

Понимание получается не всегда

На контакт голосовые программы часто идти не желают. Так, ни одна из них не разъясняет, почему, собственно, информация не была получена. В лучшем случае раздосадованный молчанием пользователь прочтет на дисплее что-то типа «я старалась, ничего не получилось, но надежду не теряю, попытаюсь помочь в следующий раз». Программа пытается максимально деликатно выкрутиться из ситуации, когда она не справляется со своими функциями, но пользователю от этого не легче.

Экспериментальным путем доказано, на общие запросы хорошо отвечают крупные поисковые платформы. Фраза «Oкей, Google» работает быстрее набора запроса на клавиатуре. Браузер Chrome поддерживает эту функцию во всех открытых вкладках. На смартфонах помощник Google и Siri четко ответили на поставленный вопрос, в то время как Cortana (программа Microsoft) отражала лишь результаты поиска, а динамик Amazon, из-за отсутствия дисплея, часто повторяя: «Извините, я не знаю, но давайте останемся друзьями».

Видимо, проблема в том, что Cortana опирается на поисковую платформу Bing, которая по мощности не конкурент Google.

Сильная сторона Siri

Сказано много нелестных слов о Siri, но хочется, наконец, похвалить и эту программу. Она отлично зарекомендовала себя при обработке текстовых сообщений. Чтение вслух электронного письма, написание нового сообщения, управление сроками отправки – все было на высшем уровне.

Google и Cortana регистрировали сроки, но не могли их удалить. Если эти голосовые ассистенты открыли новые заметки или сроки, их необходимо продублировать на клавиатуре.

Сделан вывод, данные программы не лучшие помощники для работы с электронной почтой. Процесс получается длинный и часто некорректный.

Общения не получится…

Со стороны весело выглядит, когда ты строгим голосом даешь команду смартфону. Но с  ним игра всегда в одни ворота: ты даешь команду, он выполняет, диалога ни с одним голосовым помощником не получится. И сколько бы раз подряд ты ни обращался к помощнику, память у программы короткая, каждый раз задавая вопрос, следует обращаться: «Эй, Siri» или «Окей, Google».

Вы, как пользователь, должны осознавать и еще один нюанс: голосовые помощники записывают ваши обращения к ним. Каждый запрос по всемирной системе Интернет попадает на главные серверы платформ. Там запрос обрабатывается, переводится, формируется ответ и пересылается обратно на ваш телефон или компьютер. При этом информация о пользователе накапливается, анализируются его интересы, GPS-данные, контакты и прочая информация. Обоснование? – «Чем больше мы помним о пользователе, тем полнее и качественнее помощь окажем в следующий раз». Да, персональные данные давно перестали быть персональными. Плохо это или хорошо – сложно сказать, сегодня это уже констатация факта.

Покупки через голосового помощника

Как ни странно, но покупки в интернет-магазинах совершенно неудобны через голосовое управление. При тестировании убедились, что компьютер не распознавал наименование товара или утомлял пользователя монотонным перечислением предлагаемых позиций. Только Alexa продумала программу в один клик, что значительно упрощает покупки.

Путем внесения изменений в настройках приложения Alexa, можно исключить риск осуществления ошибочных заказов, а также установить код подтверждения для голосовых покупок или полностью отключить функцию. По большому счету, Alexa вообще не произвела плохого впечатления. Звучание динамика удовлетворительное и управлять им проще, чем другими голосовыми помощниками.

Протестировав ряд голосовых программ ведущих мировых производителей, констатируем следующее: ни один ассистент даже близко не общается на равных с пользователем. Понятно, что машина есть машина. У любой техники разработан алгоритм действий, но ему еще очень далеко до совершенства. Всем диалоговым платформам не просто есть куда расти, им вообще надо расти и расти! Практически у всех нашлось огромное количество недостатков, но мы прекрасно понимаем, голосовой помощник – это новый этап технологического развития. Электроника — бездушна, человек наполняет ее разумом, реакцией, знаниями и скоростью. Конечно же, это не железо отстает от наших запросов, а люди не научились вкладывать в технику то, что желают получать обратно. Но мы не отчаиваемся, и верим, что пройдет десять – пятнадцать — тридцать лет и человечеству будет сложно представить себе время, когда оно справлялось без голосового ассистента или по пять раз подряд повторяло «Окей, Google».

Архив

Anzeige

Anzeige

Присоединяйся!