Quando parli con una persona al telefono e ti risponde dopo dieci secondi, ti sembra normale. Ma se a farlo è un’intelligenza artificiale, lo percepisci come
un’eternità. Perché?
Perché il silenzio, in un’interazione vocale, è un amplificatore di ansia e fastidio.Ed è qui che nasce uno dei problemi più sottovalutati dell’AI vocale:
la gestione della percezione dell’attesa.
Il tempo tecnico vs il tempo percepitoIn uno scenario classico, una voce AI al telefono riceve l’audio, lo trasforma in testo, lo elabora con un motore di AI generativa, passa eventualmente tra più agenti intelligenti, normalizza la risposta, la sintetizza vocalmente e infine la rimanda in cuffia. Una sequenza che può richiedere anche solo 3-6 secondi.
Il punto è che
quei secondi, in silenzio, sembrano 20. O 30. O infiniti.Nessun umano risponde così: anche quando sta pensando,
parla,
riempie i vuoti,
tiene viva la relazione.
La nostra soluzione: non sembrare un robot che caricaNel nostro sistema vocale, abbiamo inserito un
modulo multistrato di gestione della comunicazione, pensato proprio per
simulare il comportamento umano e
ottimizzare la percezione del tempo.
Cosa facciamo?
- Inseriamo rumori di contesto (brusio, tastiere, ambiente d’ufficio)
- Aggiungiamo frasi di cortesia (“un attimo solo”, “sto controllando…”)
- Usiamo un driver SIP standard che ci permette di comportarci come un normale interno del centralino aziendale
Il risultato? L’utente non si sente mai abbandonato. Non ha la percezione di parlare con un “sistema che pensa”. Ha la percezione di
parlare con qualcuno che sta lavorando per lui.
Anche l’AI deve imparare a fare small talkQuando un tecnico ti dice al telefono “aspetta che mi collego… ok, ci siamo, vediamo un attimo”, non lo odi. Anzi,
ti rassicura.
Con il nostro motore vocale, possiamo replicare lo stesso comportamento: anche mentre l’AI interroga un database, fa una diagnosi, recupera dati da un sistema esterno… può comunicare,
aggiornare, coinvolgere. E quindi mantenere
la relazione attiva.
Non è quanto tempo ci metti. È come lo fai.La verità è questa:
l’utente non misura i secondi. Misura la qualità dell’esperienza.E un silenzio assordante tra una domanda e una risposta è peggio di una risposta sbagliata.
Per questo, quando si progetta un sistema vocale intelligente,
non basta connettere AI e telefono. Serve progettare il tempo. Serve gestire l’attesa. Serve far sembrare tutto… normale.
Anche quando dietro c’è una complessità enorme.