Файл: 1 На протяжении многих лет человечество мечтало о голосовом интерфейсе, описанном в научной фантастике.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.03.2024

Просмотров: 6

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1: На протяжении многих лет человечество мечтало о голосовом интерфейсе, описанном в научной фантастике. И вот в наше время, благодаря новым информационным технологиям и Интернету, виртуальные голосовые помощники появились и набирают популярность среди пользователей по всему миру.

[1]История голосовых помощников началась в конце 1930-х годов, когда, по данным экспертов, ученые впервые предприняли попытки распознавать голос человека. В первый раз была анонсирована голосовая система распознавания номеров «Bell». В 1962 году миру был продемонстрирован новый инструмент «Shoebox» от компании «IBM». Инструмент был способен совершать математические функции, а помимо прочего идентифицировать шестнадцать произносимых слов и чисел от 1 до 9. Последующим шагом стала система «Harpy», сформированная учеными из Питтсбурга, в 1970-х годах, которое уже распознало более тысячи слов. В 1990-х годах компании «IBM», «Apple» и другие, разрабатывали решения, в которых использовалось распознавание голоса.

[2]В настоящее время наиболее полным продуктовым решением в области настоящих исследований стала являться новая информационная технология «голосовой помощник», поскольку описываемое решение включает в себя использование всех существующих голосовых технологий. Они включают в себя системы распознавания голоса, системы анализа и обработки речи, системы преобразования текста в речь и голосовую биометрию.

При этом данная технология «голосовой помощник» на сегодняшний день стала общедоступна. Активность подсистемы происходит от ввода голосовой команды. Полученный сигнал преобразуется в цифровую форму и подвергается фильтрации внешнего шума. Кроме всего прочего, преобразованный сигнал отправляется в подсистему идентификации. В этой подсистеме сначала делается запрос к базе данных сигналов, чтобы распознать команду. Если введенные и сохраненные сигналы совпадают, обнаружение считается успешным, и команда передается на исполняющее устройство, которое выполняет определенное действие. Если голосовая команда не распознается, система возвращается к началу — вводу голосовой команды, и алгоритм действий повторяется снова до получения положительного результата, то есть до тех пор, пока голосовая команда не будет распознана.


Можно сказать, что голосовой помощник — это современный сервис на базе искусственного интеллекта, распознающий человеческую речь. Такие помощники имеют все шансы выполнять различные действия в ответ на голосовые команды. 

Сейчас мы расскажем о самых популярных голосовых помощниках в мире.

Google/Google Now, Apple Siri, Microsoft Cortana, а в России особо популярен голосовой помощник от Яндекс Алиса.

2: [3]Алиса - голосовой помощник разработанный отечественной компанией

Яндекс для русскоговорящего человека. По функционалу практически не уступает Siri. Обладает неплохим поиском. Отлично понимает даже нечеткую русскую речь. Из минусов можно отметить несовместимость со многими приложениями.

[4]Google/Google Now - является самым популярным голосовым помощником в мире работающим на устройствах Android, iOS и в браузере Chrome. Из плюсов можно отметить быстроту, точность в построении маршрута, отслеживание пользователя, взаимодействие с управлением заметок, сообщениями, воспроизведением музыки, обширные запасы данных.

Имеет также два недостатка в виде излишней инициативности (показывает лишние предложения), и в отличие от Siri и Алисы не способен разговаривать на разные темы как человек.

Может взаимодействовать с большинством приложений и может устанавливаться практически на любое устройство. Также для русскоговорящего человека не настолько удобен как Алиса. У Алисы весь интерфейс на русском, и имеется полная поддержка языка с распознаванием до 96% слов. Так же Алиса способна понимать нечеткий русский, что с трудом удается Google и Siri.

[5]Apple Siri - является первым ассистентом с умением общаться с пользователем и давать ему различные рекомендации. Например, присылать пользователю только те новости, которые его заинтересуют. Также исходя из его предпочтений давать рекомендации на новые фильмы и приложения. Из-за того, что помощник изначально создавался для операционной системы iOS, он очень хорошо оптимизирован. Понимает и находит необходимую информацию лучше, чем Google Now. Но имеет несколько недостатков: неполноценная беседа и неумение взаимодействовать с большинством приложений, доступен только для устройств с операционной системой iOS. Так же, по сравнению с Алисой, Siri намного хуже понимает русский язык.

[6]Microsoft Cortana - виртуальный ассистент доступный на Windows, iOS и Android может хорошо общаться с человеком и даже шутить. Помощник призван предугадывать потребности пользователя и выдать ту информацию, которая интересна ему в данный момент.

Интерфейс имеет гибкие настройки конфиденциальности, позволяющие пользователю самому определять, какого рода информацию предоставлять виртуальному ассистенту. Также можно отметить функцию озвучки элементов, находящихся на экране. Такая функция очень полезна для людей с проблемами со зрением и выделяет помощник среди конкурентов. Проблемы возникают на основе плохой оптимизации на телефонах. Также помощник не имеет поддержку русского языка, что делает его практически бесполезным для русскоговорящего человека.

[7]Характеристики.



1: [8]Голосовые помощники несовершенны, у них есть как небольшие баги, так и значительные угрозы безопасности.

Как случайно перезагрузить iPhone и другие баги Siri

Считается, что техника Apple — образец надежности и безопасности. Но несколько лет назад в сети появилась информация о необычной реакции голосового помощника Siri на слово «дефис». При включенном ассистенте после пяти повторений этого слова iOS-устройство зависает, а потом самопроизвольно перезагружается. 

Совсем недавно у Siri обнаружился и еще один баг — к счастью, не столь неприятный — проблемы с подсчетом возраста владельца гаджета. Похоже, что голосовой помощник не учитывает дни и месяцы рождения, а ориентируется только на год. 

Как «сломать» Алису

Алиса — пожалуй, самый популярный голосовой помощник у нас в стране. В сети можно найти немало статей, как «сломать» Алису, но почти ничего из этого не работает. Уже не работает — разработчики оперативно устраняют такие баги. 

Но все же есть баг, которому уже немало времени, а он все еще не исправлен. Попробуйте сами: спросите Алису про расстояние от Минска до Рима. Чуть задумавшись, она ответит, что дорога займет больше 110 часов, а расстояние составит более 7700 километров (точные цифры варьируются). Не находите, что многовато по масштабам Европы? И вы абсолютно правы: на карте видно, что маршрут Алиса строит не до итальянской столицы, а до нигерийской — города Абуджа. 
2:[9]Широкое распространение голосовых помощников и развитие Интернета поднимают вопрос безопасности для всех тех, кто активно пользуется этими современными технологиями.


Многие владельцы голосовых помощников и домашних умных динамиков, легко распознающих команды, довольно серьезно обеспокоены тем, какой объем информации получают указанные устройства, записывая разговоры. Несмотря на тот факт, что сама по себе зашифрованная речь, как правило, сохраняется именно на серверах разработчика, микрофон можно отключить, а любые записи легко удаляются ручным способом, но рассматриваемая технология ещё очень, очень далека от совершенства и что от нее ждать не всегда понятно.

Соответственно, голосовые помощники многие пользователи сейчас характеризуют, как самый настоящий кошмар для конфиденциальности, поскольку такими системами с каждым годом обрабатывается все больше и больше информации из повседневной жизни каждого пользователя. Это связано с тем, что люди почти «полностью» доверяются новым информационным технологиям, не задумываются о личной информационной безопасности и как результат, зачастую не проверяют качество работы голосовых помощников, а они, в свою очередь способны обнаруживать и транслировать сугубо личную информацию. Однако на рейтинг продаж подобное пользовательское отношение если и повлияло, то очень незначительно. Современные голосовые помощники бьют все рекорды популярности, многие пользователи считают их наличие не только удобным, но и перспективным, очень престижным.

[10]Таким образом можно сказать, что голосовой помощник — это современный сервис на базе искусственного интеллекта, распознающий человеческую речь. Такие помощники имеют все шансы выполнять различные действия в ответ на голосовые команды.

Внедрение и распространение новейших голосовых интерфейсов происходит чрезвычайно быстро, и скоро, вероятно, можно будет увидеть чудесные персонализации, которые на сегодняшний день совершенно недоступны в условиях текстового поиска. При этом, необходимо отметить, что несмотря на то, что голосовые помощники (интерфейсы) сегодня довольно хорошо развиты, но технология еще не достигла своего предела. В ближайшие годы она будет развиваться в разных направлениях. Новые голосовые помощники достаточно скоро найдут «собственное лицо», которое расширит их потенциальные возможности.[11]