Rozpoznawanie głosu – przyszłość zakupów
Rozpoznawanie głosu staje się coraz powszechniejszą funkcjonalnością w naszych urządzeniach. Korzystamy z niej w telefonach, samochodach oraz coraz częściej także w naszych domach.
Jak wynika z informacji Juniper Research, „wartość rynku, tzw. voice commerce, w 2023 r. sięgać ma 80 mld USD„. Z kolei Analytics Research Consulting podkresla, że rynek związany z rozpoznawaniem głosu i mowy będzie miał 35% tempo wzrostu rocznie. Gartner natomiast przewiduje, że blisko 50% call center będzie obsługiwane przez wirtualnych asystentów.
Rozpoznawanie głosu a rozpoznawanie mowy – jakie są różnice?
Projektanci interfejsów głosowych mają wciąż wiele wyzwań. Nadal pracują nad doprowadzeniem do sytuacji, w której
- dane urządzenie będzie reagowało na głos tylko i wyłącznie danego użytkownika,
- urządzenie będzie ten głos odpowiednio rozumiało i być może dopasuje nawet swoje brzmienie do nastroju użytkownika.
Wyzwaniem dla algorytmów jest poprawne identyfikowanie niektórych słów – w szczególności gdy są wypowiadane szybko lub niewyraźnie. Problem stanowią także kolokwializmy, wulgaryzmy oraz skróty.
Zacznijmy jednak od początku – czym różni się rozpoznawanie mowy od rozpoznawania głosu?
Rozpoznawanie mowy (Speech Recognition)
To technologia, która pozwala komputerowi na poprawną identyfikację słów, które wypowiadamy. Komputer nie analizuje w niej żadnych innych czynników takich jak akcent, ton głosu czy jego barwa. Obecnie urządzeniom nadal nie udaje się osiągnąć 100-procentowej poprawności.
Rozpoznawanie głosu (Voice Recognition)
To technologia, która umożliwia komputerowi na zidentyfikowanie osoby mówiącej na bazie analizy barwy jej głosu. Zastosowanie Voice Recognition pozwala na aktywację wybranych funkcji interfejsu poprzez wypowiadanie słów aktywacyjnych jedynie przez osobę do tego upoważnioną.
Rozpoznawanie głosu a zakupy głosowe
Technologia rozpoznawania głosu przeszła długą drogę. Dzisiejsze urządzenia z obsługą głosu wykonują tak wiele różnych zadań, że zyskały przydomek „wirtualni asystenci”. Niektórzy mają nawet własną osobowość.
Wirtualni asystenci, a wśród nich najpopularniejsi Alexa i Cortana, nie tylko przesyłają strumieniowo muzykę, sprawdzają wiadomości i prognozę pogody. Rozwiązania te umożliwiają także rozwiązywanie zagadek czy zapisywanie zadań na kolejne dni. Z biegiem czasu na znaczeniu zyskują jednak inne – bardziej komercyjne – funkcje, które mają nam ułatwiać życie. Z badań eMarketer wynika, że 4 na 10 użytkowników inteligentnych głośników w USA będzie używać swoich urządzeń do robienia zakupów. Oczekuje się, że wydatki na zakupy głosowe tylko w 2 krajach – USA i Wielkiej Brytanii – przekroczą 40 miliardów dolarów do 2022 roku.
Handel stale ewoluuje i korzysta z coraz nowocześniejszych rozwiązań technologicznych. Pandemia COVID-19 także przyspieszyła upowszechnianie się inteligentnych głośników. Nowe badania pokazują, że adopcja inteligentnych głośników wśród dorosłych w Stanach Zjednoczonych osiągnęła obecnie 24%. Miliony Amerykanów, którzy nie dojeżdżają już do pracy i chcą ograniczyć fizyczny kontakt terminalami płatniczymi w miejscach publicznych, bardziej niż kiedykolwiek zwracają się w stronę technologii zbliżeniowych i głosowych.
Pytanie czy inteligentne głośniki naprawdę przydadzą się na dużą skalę i będą tak powszechne jak laptop, telewizor czy telefon w każdym domu? Dokąd zmierza technologia? Ponieważ handel rozwija się w szybkim tempie, o czym powinny myśleć firmy, aby sprostać potrzebom dzisiejszego konsumenta?
Rozpoznawanie głosu w inteligentnych głośnikach
Większość konsumentów wprowadzała technologię aktywowaną głosem za pośrednictwem Alexy od Amazona, Siri od firmy Apple lub Cortany Microsofta. Pojawienie się inteligentnych głośników zmieniło sposób, w jaki wiele osób podchodzi do zakupów, rozrywki i życia jako całości. Od strumieniowego przesyłania muzyki i gier po opowiadanie dowcipów. Zakres zastosowań dla konsumentów w każdym wieku jest praktycznie nieograniczony.
Oprócz rozrywki szukamy także technologii, która zapewni nowe sposoby na codzienne życie. Inteligentne głośniki pomagając w różnych sprawach, w tym w zakupach spożywczych i edukacji. Użytkownicy mogą teraz tworzyć listy zakupów i planować dostawy, używając tylko głosu. Uczniowie mogą używać inteligentnego głośnika do nauki innego języka lub prowadzenia badań. Młodsze dzieci mogą uzyskać pomoc przy prostych zadaniach domowych, takich jak problemy z pisownią lub sprawdzaniem matematyki.
Oczywiście inteligentne głośniki mają ogromny potencjał, z obietnicą zwiększonej produktywności. Niezależnie od tego, czy planujesz spotkania, wykonujesz połączenia telefoniczne, wysyłasz wiadomości tekstowe czy robisz zakupy online bez użycia rąk. Inteligentne głośniki pomagają użytkownikom przeglądać listy zadań, gdy są zajęci czymś innym. Inteligentne głośniki bez użycia rąk przenoszą wielozadaniowość na zupełnie nowy poziom.
W jaką stronę to się rozwija?
Inteligentne głośniki jako pierwsze zwróciły uwagę konsumentów na ich wartość rozrywkową. Dlatego nie jest zaskoczeniem, że większość zakupów dokonanych za pomocą tych urządzeń dotyczyła przesyłania muzyki i filmów. Jednak urządzenia te oferują również wygodne, aktywowane głosem zakupy innych towarów konsumpcyjnych. Pozostaje więc pytanie: w jaki sposób konsumenci przejdą od używania inteligentnych głośników do rozrywki i zwiększania produktywności do robienia zakupów?
Eksperci zauważają, że nowi użytkownicy inteligentnych głośników testują funkcje związane z zakupami na swoich urządzeniach, a także proszą swoje urządzenia o wyszukiwanie produktów i pytają o ceny. Możliwość robienia zakupów bez wyjmowania smartfona jest niezwykle atrakcyjna. Jednak polecenia głosowe bez elementu wizualnego nadal stanowią barierę dla konsumentów, być może dlatego, że asystenci głosowi często nie odpowiadają na konkretne pytania handlowe.
Branża reaguje na te przeszkody, dodając inteligentne ekrany, które wyświetlają informacje wizualne towarzyszące odpowiedziom inteligentnych głośników.
Chociaż przyszłość zakupów dokonywanych przez inteligentne głośniki nie jest jeszcze znana, to jedno jest pewne: handel nie zwalnia tempa. Podłączenie znanych marek do innego kanału zakupów może wymagać zupełnie nowego sposobu myślenia.
Płatności aktywowane głosem
Kluczową kwestią przy rozwoju funkcjonalności związanych z rozpoznawaniem głosu jest bezpieczeństwo. W jaki sposób uwierzytelniać płatności za zakupy aktywowane głosem? Co zrobią globalne marki, aby zapewnić klientów, że ich obsługa płatności aktywowanych głosem jest bezpieczna?
Płatności głosowe mogą być rewolucją na miarę zmian w urządzeniach mobilnych sprzed 10 lat czy przemian zapoczątkowanych blisko 20 lat temu przez rozwój sprzedaży przez internet – stwierdził wiceprezes Amazon Pay Patrick Gauthier w czerwcu 2019 w wywiadzie dla CNBC.
Płatności aktywowane głosem testuje Google. Nowa funkcja pojawiła się w pierwszym półroczu 2020 w Asystencie Google i można z niej będzie korzystać m.in. w smart głośnikach. Na razie jego testy ograniczają się do zakupów w aplikacjach i składania zamówień w restauracjach. Google wprowadził też limit środków, jakie użytkownik może wydać korzystając z tego narzędzia oraz ograniczyła liczbę transakcji dokonywanych jednego dnia. Opcja potwierdzania płatności przy użyciu funkcji Voice Match stała się już widoczna w ustawieniach Asystenta Google niektórych użytkowników za oceanem, ale nie jest to równoznaczne z jej dostępnością. Wyzwaniem największym są kwestie bezpieczeństwa. Asystent głosowy może przyjąć potwierdzenie płatności od osoby o podobnym głosie albo po odtworzeniu nagrania.
Nasuwa się w pytanie o zmianę nawyków klientów: czy klienci są gotowi na handel aktywowany głosem? Jakie informacje lub wskazówki będą musiały proponować klientom, aby pomóc im poczuć się komfortowo podczas zakupów?
Przyszłość urządzeń i procesów aktywowanych głosem
Innowacje technologiczne szybko zmieniają sposób interakcji konsumentów z markami, a technologia głosowa może stać się podstawą naszych zakupów. Technologia głosowa umożliwia markom obsługę konsumentów z większą wydajnością i zaangażowaniem.
Analitycy przewidują, że do 2025 r. 95% interakcji z klientami będzie napędzanych przez sztuczną inteligencję i algorytmy reagujące głosem na nasz głos. Dlatego warto, żeby sprzedawcy detaliczni krytycznie przemyśleli, jak brzmi ich marka i jaki ma tembr głosu, gdy wchodzi w interakcję z konsumentami. Dzięki temu będą mogli mieć pewność, że robią właściwe wrażenie na docelowych odbiorcach. Kluczowe jest jednak zadanie pytania – czy marki są przygotowane na kolejną rewolucję? Bo jeśli większość interakcji będzie przebiegać za pośrednictwem komunikacji głosowej to zasadniczo może to wpłynąć na odbiór marek przez konsumentów.
Ewolucja systemów rozpoznawania mowy od czystej rozrywki do kanału e-commerce niesie ze sobą zarówno możliwości, jak i wyzwania. Jak długo potrwa, zanim aktywowane głosem zakupy staną się czwartym kanałem handlu elektronicznego, dopiero się okaże.