Наш магазин на eBay Наш магазин на AliExpress Наш канал в telegram

Алиса от Яндекса. Часть 1. Что такое голосовой помощник Алиса, как она работает и зачем нужна.

В последнее время появилась настоящая мода на голосовых помощников, особенно после того, как у IT-сообщества появилась возможность расширять возможности этих помощников своим собственным кодом. Естественно, я тоже не мог обойти эту тему стороной. Итак, сегодня мы начнём разбираться, что представляет собой голосовой помощник Алиса, что такое навыки для Алисы и самое главное — как написать для Алисы свой собственный навык.

Итак, голосовой помощник Алиса — это специальное программное обеспечение от компании Яндекс, позволяющее в режиме диалога с пользователем решать различные прикладные задачи. «Хм, ну так всё то же самое можно сказать вообще про любое другое прикладное ПО», — скажете Вы и будете абсолютно правы. Любое прикладное ПО должно как-то взаимодействовать с пользователем и решать поставленные задачи. В чём же тогда особенности именно Алисы, чем она отличается от других приложений?

Одна из главных фишек заключается в способе взаимодействия с пользователем. Взаимодействие с Алисой происходит не при помощи клавиатуры или мыши, как с традиционными программами, а при помощи речевого диалога. Проще говоря, с Алисой можно просто разговаривать, так же, как и с обычным человеком. Алиса умеет как распознавать человеческую речь (на основе технологии SpeechKit), так и генерировать её (на основе технологии Text-to-speech). Поэтому, собственно, она и называется голосовым помощником.

После установки Алисы на своё устройство, активировать её можно просто обратившись к ней по имени (в микрофон вашего устройства, естественно) фразами, типа «Привет, Алиса» или «Слушай, Алиса».

Дополнительно весь процесс общения визуализируется в специальном диалоговом окне (подобно общению в чате какого-нибудь мессенджера). В этом окне вы можете по старинке переписываться с Алисой при помощи клавиатуры.

Диалоговое окно Алисы

фото диалогового окна для общения с Алисой

[свернуть]

Ещё одна фишка заключается в том, что Алиса не заточена под какую-то конкретную задачу или узкую группу задач (как, например, калькулятор или весы), вместо этого она может решать широкий круг различных задач, от поиска информации в интернете и оформления заказов на какие-либо товары, до голосового управления компьютером или даже целым умным домом. Кроме того, Алиса может стать вашим будильником, может подсказать название прослушанной песни, может указать правильный маршрут, с учётом пробок и аварий, и много чего ещё. Полный список возможностей можно посмотреть вот здесь.

Вообще говоря, Алиса стремится научиться всему, что в принципе можно сделать при помощи интернета. Для этого она, во-первых, интегрирована практически со всеми сервисами Яндекса (Поиск, Пробки, Погода, Еда и так далее), а во-вторых, разработчики предоставили всем желающим возможность использовать её в своих собственных разработках (можно писать свои навыки для Алисы). Более того, Яндекс всячески стимулирует разработчиков расширять навыки Алисы, например, проводит конкурсы на самые лучшие из них со вполне приличными денежными призами. К навыкам мы обязательно вернёмся, нам, как сторонним разработчикам, это вообще интереснее всего, но это будет в следующих статьях, а пока продолжим наше знакомство с Алисой.

Как Алиса работает? Она работает как типичное распределённое приложение, построенное на основе клиент-серверной архитектуры. То есть у Алисы есть клиентская часть, которая выполняется на устройстве пользователя, и есть серверная часть, которая выполняется на серверах Яндекса.

Клиентская часть отвечает за взаимодействие с пользователем, которое может включать:

  • получение звука с микрофона
  • получение ввода с клавиатуры
  • отправку запросов на сервера Яндекса и получение сформированных ответов
  • отображение запросов и ответов в специальном диалоговом окне
  • озвучивание полученных с сервера ответов
  • выполнение каких-либо действий с устройством (например, запуск приложения, изменение уровня звука, выключение устройства и так далее)

Серверная часть отвечает за обработку полученного от пользователя запроса, которая может включать:

  • распознавание речи и преобразование её в текст
  • анализ полученного текстового запроса
  • формирование ответа и отправка его клиенту
  • выполнение каких-либо действий на стороне сервера

При этом, в ходе обработки данных, на разных этапах активно используются нейронные сети, например, для распознавания речи в текст, для формирования осмысленных ответов (технология Turing), для синтеза речи из текста.

Как установить Алису? Клиентская часть может быть установлена под различные ОС (Windows, Android, iOS). Когда всё только начиналось, клиентскую часть можно было установить на компьютер или телефон как самостоятельное приложение, однако в настоящее время такая возможность отсутствует. Сейчас Алису нельзя установить отдельно, она поставляется только встроенной в различные продукты Яндекса — Яндекс.Браузер, Яндекс.Станция, Яндекс.Лаунчер и так далее. С моей точки зрения решение очень неоднозначное, отдельное приложение мне нравилось гораздо больше, но похоже в Яндексе есть свои эффективные менеджеры, которые пытаются с помощью Алисы продвигать другие продукты.

Как бы то ни было, сейчас чтобы установить Алису, скажем, к себе на компьютер, — можно просто установить на него самую свежую версию Яндекс.Браузера. Для установки на мобильный телефон с андроидом — нужно просто ввести слово «Алиса» в поисковой строке плэймаркета и выбрать из представленного списка одно из приложений со встроенным голосовым помощником от Яндекса.

Установка Алисы на Windows и Android

страница загрузки Яндекс-браузера с Алисой под Windows
страница установки приложений с Алисой под Android

[свернуть]

На этом закончим с вводной частью, а в следующий раз начнём изучать самое интересное — разработку собственных навыков для голосового помощника Алиса.

  1. Часть 1. Что такое голосовой помощник Алиса, как она работает и зачем нужна.
  2. Часть 2. Что такое навыки Алисы, как они работают и что нужно для разработки своего собственного навыка?
  3. Часть 3. Проектирование сценария навыка.

Добавить комментарий