Голосовой интерфейс: сегодня и завтра

Стоит поразмыслить о том, как было бы здорово руководить компьютером и другими цифровыми девайсами только голосом, как в уме тут же появляется образ разумного компьютера HAL 9000 из фильма Стэнли Кубрика «2001: Космическая Одиссея». Его голос воодушевляет и будоражит до сих пор.

И не смотря на то, что мысль создания ИИ была скомпрометирована в массовом сознании такими блокбастерами, как «Терминатор» либо кроме того недавним «Превосходством» с незабвенным Джонни Деппом в ключевой роли, все же программисты и девелоперы в мире не оставляют попыток создать что-то подобное, что и сейчас существует только в воображении режиссёров и сценаристов.

  • Будет ли человечество стёрто с лица земли неестественным разумом?

Перспективность голосового сотрудничества

Предсказания, сделанные Артуром Ч. Кларком (Arthur Clarke) и столь правдоподобно воплощенные в культовой ленте Кубриком, хоть и опоздали осуществиться к 2001 году, но, по словам основателя Expect Labs Тима Таттла (Tim Tuttle), разработкам голосового интерфейса в течение ближайших двух лет будет уделено внимание разработчиков, и процесс ускорится в десятки раз.

Платформа голосового интерфейса MindMeld, созданная самой Expect Labs, уже удачно используется программистами для встраивания голосового сотрудничества в разнообразные программы и мобильные приложения.Голосовой интерфейс: сегодня и завтра Таттл без тени скромности заявляет, что для того чтобы рода интерфейс, в отличие от созданных ранее совокупностей, есть наиболее дружелюбным для конечного пользователя. Сейчас MindMeld выходит на рынок, на котором уже господствуют совокупности Гугл Now и Siri, но такая твёрдая борьба неизбежность того, что совсем не так долго осталось ждать руководить техникой своим голосом станет делом привычным.

Многие компании уже тратят миллионы долларов на внедрение и разработку в совокупность пользовательского сотрудничества с продуктом возможности речевого управления: для некоторых категорий товаров это в самом деле выяснилось бы нужной находкой. Смартфоны — достаточно избитый пример, а вот голосовое управление автомобилем Ford посредством совокупности Sync — уже весьма интересно: голосом вы имеете возможность включить музыку либо запросить дорогу у GPS-навигатора. Голосовые разработки добрались кроме того до последних поколений приставок: посредством Kinect вы имеете возможность руководить своим Xbox one, — а в 2011 году издание Bloomberg Business уже сказало о финише эры пультов от телевизоров.

Доступность

В случае если сказать об адаптивности голосового интерфейса к разным платформам, то уже сейчас возможно легко подметить, что подобные разработки не имеют каких-либо значительных ограничений: они легко приживаются как на Android и iOS, так и на Windows OS.

Помимо этого, Консорциум Глобальной Паутины (World Wide Web Consortium (W3C)) создал последовательность предложений по улучшению юзабилити сайтов, включающий в себя кроме этого и другой текст для изображений, что возможно осознан современными программами чтения с экрана. Очевидно, что такие программы, как Nuance s Dragon, отыщут отклик у тех пользователей, каковые не смогут трудиться с клавиатурой и мышью. Подобные ответы разрешают им делать все распространенные операции (поиск информации, работа с текстовыми документами) без рук.

По этим и многим вторым обстоятельствам голосовое управление делается в полной мере достижимым в уже обозримом будущем: user experience будущего уже запрещено будет представить без возможности речевого сотрудничества. Но, остается открытым вопрос, что еще десять лет назад, позвал бы лишь ухмылку: какой голос должен быть у компьютера?

  • Будущее ИИ — как отыскать «неспециализированный язык» с компьютером?

Ужасная равнина

Одной из обстоятельств, из-за чего разработчики наделяют собственные творения голосом более роботизированным, нежели человеческим, есть так называемая концепция «ужасной равнины» (The uncanny valley). Эта концепция была предложена в первой половине 70-ых годов XX века японским робототехником Масахиро Мори (Dr. Masahiro Mori), и эта мысль лежит в базе современной коммуникации между человеком и компьютером.

Схематическое изображение «ужасной равнины». Чем посильнее сходство роботов с людьми, тем громадную симпатию они вызывают у последних, но ровно до того момента, в то время, когда роботы начинают напоминать живых мертвецов: тогда симпатия уступает место страху.

Сущность данной концепции в том, что по мере эволюции автомобилей симпатия к ним людей будет лишь расти, но только до определенного предела. Когда роботы станут сильно похожи на людей, симпатия быстро сменится неприязнью и страхом. В теории, в случае если сходство продолжит рост, то симпатия снова возвратится, но это промежуточное состояние, в то время, когда роботы похожи на передвигающихся мертвецов и не вызывают ничего, не считая страха, и именуется «ужасной равниной».

Данный термин отражает естественную для нас неприязнь к человекоподобным роботам. Одновременно с этим эта теория обрисовывает внешний вид тех роботов, каковые вызывают у нас чувство умиления (хороший пример, робот WALL-E).

В недавней статье Николаса Боумана (Nicholas Bowman), размещённой в издании Ux Booth, создатель приходит к мысли, что эта концепция может сработать и в области голосового сотрудничества. Интерфейс голосового сотрудничества, что реализован в Siri, формирует у пользователя чувство близкого контакта с устройством, и во многом это возможно растолковать тем, что вся интеракция строится на привычной нам речи. Мы слышим тут и голос робота же приписываем устройству какие-то человеческие черты.

Это неотъемлемая изюминка каждого из нас, так мы выстраиваем связи с внешним миром. Разумеется, что Siri далеко не человек, но в программе реализовано то, что ее делает похожим на людей: к примеру, юмор.

Так, Apple удалось пройти по узкой грани: сделать Siri похожим на человека, но не так, дабы мы все решили, словно бы бы с нами в самом деле говорит живая дама. Мы все стремимся к совершенному интерфейсу, но приемлемым для нас он будет лишь тогда, в то время, когда останется роботизированным.

  • Эволюция компьютеров. В соответствии с закону Мура, к 2025 году PC смогут мыслить как люди

Заключение

Любой текст, озвученный современными цифровыми устройствами, может привести к чувству неприязни, в случае если голос будет или излишне роботизированным, или через чур очеловеченным. В этом кроется огромная сложность при создании голосовых интерфейсов. Но опыт проектирования Siri, в которой разработчикам удалось отыскать верный баланс, убедительно говорит о том, что достаточно придать совокупности кое-какие человеческие черты (к примеру, юмор), но наряду с этим покинуть очевидное отличие от человека.

В случае если исследования голосовых интерфейсов продолжаться, то, быть может, совсем не так долго осталось ждать мы сможем говорить со смартфонами и своими компьютерами в контексте свершено разных и спонтанных обстановок..

Высоких вам конверсий!

По данным usertesting.com,Image source: Kate McCully

Случайные статьи:

Сегодня с дачи выгонят, завтра из квартиры


Подборка похожих статей:

admin