Blog

Voce & AI: il nemico è il silenzio (non il tempo)

Voce & AI: il nemico è il silenzio (non il tempo)

Quando parli con una persona al telefono e ti risponde dopo dieci secondi, ti sembra normale. Ma se a farlo è un’intelligenza artificiale, lo percepisci come

un’eternità

. Perché?

Perché il silenzio, in un’interazione vocale, è un amplificatore di ansia e fastidio.

Ed è qui che nasce uno dei problemi più sottovalutati dell’AI vocale:

la gestione della percezione dell’attesa

.

Il tempo tecnico vs il tempo percepito

In uno scenario classico, una voce AI al telefono riceve l’audio, lo trasforma in testo, lo elabora con un motore di AI generativa, passa eventualmente tra più agenti intelligenti, normalizza la risposta, la sintetizza vocalmente e infine la rimanda in cuffia. Una sequenza che può richiedere anche solo 3-6 secondi.

Il punto è che

quei secondi, in silenzio, sembrano 20. O 30. O infiniti.

Nessun umano risponde così: anche quando sta pensando,

parla

,

riempie i vuoti

,

tiene viva la relazione

.

La nostra soluzione: non sembrare un robot che carica

Nel nostro sistema vocale, abbiamo inserito un

modulo multistrato di gestione della comunicazione

, pensato proprio per

simulare il comportamento umano

 e

ottimizzare la percezione del tempo

.

Cosa facciamo?

  • Inseriamo rumori di contesto (brusio, tastiere, ambiente d’ufficio)
  • Aggiungiamo frasi di cortesia (“un attimo solo”, “sto controllando…”)
  • Usiamo un driver SIP standard che ci permette di comportarci come un normale interno del centralino aziendale

Il risultato? L’utente non si sente mai abbandonato. Non ha la percezione di parlare con un “sistema che pensa”. Ha la percezione di

parlare con qualcuno che sta lavorando per lui

.

Anche l’AI deve imparare a fare small talk

Quando un tecnico ti dice al telefono “aspetta che mi collego… ok, ci siamo, vediamo un attimo”, non lo odi. Anzi,

ti rassicura

.

Con il nostro motore vocale, possiamo replicare lo stesso comportamento: anche mentre l’AI interroga un database, fa una diagnosi, recupera dati da un sistema esterno… può comunicare,

aggiornare, coinvolgere

. E quindi mantenere

la relazione attiva

.

Non è quanto tempo ci metti. È come lo fai.

La verità è questa:

l’utente non misura i secondi. Misura la qualità dell’esperienza.

E un silenzio assordante tra una domanda e una risposta è peggio di una risposta sbagliata.

Per questo, quando si progetta un sistema vocale intelligente,

non basta connettere AI e telefono

. Serve progettare il tempo. Serve gestire l’attesa. Serve far sembrare tutto… normale.

Anche quando dietro c’è una complessità enorme.