Voiceboty: głos sztucznej inteligencji

Voiceboty już od kilku lat zapowiadane były jako narzędzie AI z ogromnym potencjałem dla biznesu. Jak to się dzieje, że sztuczna inteligencja potrafi prowadzić konwersację, która jest coraz bliższa rozmowie z prawdziwym człowiekiem? Jakie technologie stoją za chatbotami głosowymi i w czym mogą pomóc już dzisiaj? Co warto wiedzieć o krótkiej historii, teraźniejszości i przyszłości jednego z najwidoczniejszych trendów ostatnich lat – voicebotach? Na podsumowanie wiedzy o chatbotach głosowych bazujących na AI zapraszamy do poniższego artykułu. 

Voiceboty: czym są głosowi asystenci i boty telefoniczne?

Voicebot to program komputerowy działający dzięki inteligentnym algorytmom, dostępny dla użytkowników poprzez interfejs głosowy. Voiceboty można w praktyce podzielić na dwie podgrupy:

  • osobistych asystentów głosowych (Alexa Amazona, Asystent Google’a, Siri Apple’a, Cortana Microsoftu),
  • boty głosowe, głównie telefoniczne, które wdrażane są w obszarze biznesu, instytucji; szczególnie popularne w call center, gdzie automatyzują komunikację z użytkownikami.

Wdrożenia biznesowe mogą być wspierane rozwiązaniami gigantów z Doliny Krzemowej, ale też, ze względu na specyfikę języka polskiego, biznes w praktyce często korzysta z NLP rodzimych dostawców.

ASR, NLP, baza wiedzy, czyli – jak działa voicebot?

Jak to się dzieje, że voiceboty mogą zrozumieć ludzką mowę i same się nią posługiwać? Za tą umiejętnością stoi oczywiście technologia. Kluczowy jest tutaj system rozpoznawania mowy (ASR – ang. Automatic Speech Recognition)oraz konwersji mowy na tekst (STT –  ang. Speech To Text). Za ich pomocą  STT następuje przetworzenie mowy na tekst, który trafia do silnika przetwarzania języka naturalnego (NLP). Dzięki NLP generowana jest odpowiedź (najpierw w formie tekstu), która następnie wyrażana jest głosowo. Zwrot informacji do użytkownika w kanale głosowym odbywa się za pomocą syntezatora lub nagrania lektorskiego.

Voicebot potrafi rozmawiać dzięki sztucznej inteligencji (przedstawionym powyżej technologiom), ale bardzo ważnym „elementem składowym” jest też baza wiedzy. Baza wiedzy to, opisując w dużym skrócie, zbiór pytań i odpowiedzi. Dzięki nim voicebot wie, jakie informacje wyświetlać przy zapytaniach użytkowników. Pytania te konfiguruje się tak, by jak najlepiej pasowały też do kontekstu prowadzonej rozmowy. Dodatkowo, voiceboty łączy się jeszcze w dodatkowymi źródłami informacji (systemy ERP, CRM), aby były bardziej samodzielne. Voicebot nie jest jedynie modnym gadżetem, ale wymiernym wsparciem dla organizacji.

Głosowi asystenci i boty telefoniczne: dane z rynku voice

Obie przedstawione kategorie voicebotów: osobiści asystenci i boty telefoniczne rozwijają się z coraz większą dynamiką i wszystko wskazuje na to, że najbliższe lata przyniosą dalszy wzrost ich popularności. Taki wniosek można wyciągnąć chociaż przyglądając się danym publikowanych przez firmy badawcze i inne instytucje:

  • McKinsey&Company prognozuje, że globalne oszczędności dzięki wirtualnym konsultantom (w tym również tym w wersji voice) będą już niedługo warte 185 mld dolarów rocznie;
  • Wg eMarketer liczba użytkowników asystentów głosowych (jak np. Siri, Alexa) w samych tylko Stanach Zjednoczonych ma osiągnąć 122,7 mln użytkowników w roku 2021;
  • Wg Adobe aż 94% użytkowników przyznaje, że voice search (wyszukiwanie głosowe) jest proste w obsłudze;
  • Wg Capgemini do 2021 roku 18% wszystkich zakupów dokonanych za pomocą platform internetowych realizowanych będzie za pomocą obsługi głosowej.

Historia voicebotów zaczyna się dziś

Trudno opisywać historię voicebotów, ponieważ są to rozwiązania nowe. Można zaryzykować stwierdzenie, iż historia voicebotów pisze się raczej dzisiaj, na naszych oczach. Oczywiście ich geneza jest związana z chatbotami, a wcześniej – rozwojem sztucznej inteligencji. Bez problemu przy voicebotach można nawiązać do testu Turinga i początków maszyn liczących. Realne wdrożenia botów telefonicznych to jednak domena ostatnich lat. Co więcej, boty telefoniczne na infoliniach wciąż są pewnego rodzaju nowością, która jednak będzie zyskiwać na znaczeniu ze względu na szerokie możliwości ich zastosowania.

Wdrożenia voicebotów: czy są udane?

wdrożenia voicebotów

Pierwsze wdrożenia innowacyjnych technologii nie zawsze należą do trafionych, chociaż odpowiednie przygotowanie się do tych działań, wraz ze skompletowaniem kompetentnego zespołu, z pewnością pozwala zmniejszać ryzyko projektowe.

Jak wygląda ocena projektów głosowych na chwilę obecną? Temat podjął m.in. Voicebot.AI, który szacował odsetek udanych i nieudanych implementacji. Aż 50% voice app zostało przez voice developerów określonych jako jednoznacznie udane, przy zaledwie 1 projekcie na 10, który otrzymał ocenę negatywną. To dane za rok 2019, opublikowane w maju 2020. Optymistyczne przesłanie jest też takie, że odsetek dobrych ocen jest wyższy niż ten z roku 2018. 

O sporych sukcesach donoszą także nasi rodzimi dostawcy usług voicebotowych. Coraz częściej usłyszeć można o wdrożeniach, w których boty telefoniczne rozumieją nawet 95-98% zapytań użytkowników. Wysoką skuteczność voiceboty wykazują przede wszystkim w branżach i obszarach, gdzie są najpopularniejsze:

  • call center i pierwsza linia wsparcia;
  • windykacja;
  • HR i komunikacja wewnętrzna.

Proof of concept, czyli ograniczanie ryzyka przy wdrożeniach voicebotów

Projekty pilotażowe i przedprodukcyjne to idealny sposób na ograniczenie ryzyka przy pierwszych implementacjach voicebotów. Świetnym przykładem jest tutaj proof of concept (PoC) to próba realizowana na mniejszą skalę, jeszcze przed wdrożeniem produkcyjnym. PoC jest jednak zadaniem zamkniętym i symulującym rzeczywiste działanie. Projekt pilotażowy ma pomóc ocenić, czy większa implementacja oparty na danej technologii (bardzo często sztucznej inteligencji) ma szanse zakończyć się powodzeniem. Realizacja PoC oraz poleganie na doświadczonych partnerach to czynniki, które stwarzają duże szanse na powodzenie wdrożeń voicebotów.