Controllo vocale

Scrivere con un personal computer è sempre un problema per chi non ha particolare dimestichezza con la tastiera. Solitamente, poi, chi non è esperto nell’uso della tastiera tradizionale mal digerisce quelle digitali dei tablet e degli smartphone, che sono troppo piccole, troppo sensibili, troppo virtuali, soprattutto per chi aveva, prima, una Olivetti 98 che costringeva anulare e mignolo a pesanti sedute di body building per azionare il cestello e battere i caratteri sul nastro, magari con la carta copiativa.

Nel corso degli anni le aziende hanno privilegiato un approccio di tipo meccanico alla scrittura, pur non disdegnando il ricorso a metodi alternativi, ma senza riuscire a superare l’approccio di tipo wysiwyg che aveva caratterizzato la prima grande rivoluzione dell’interfaccia di controllo del personal computer, con l’adozione del mouse e del sistema a finestre ed icone.

Da qualche anno, sebbene con timidi approcci già a partire dagli anni ’80, grazie all’aumento della potenza di calcolo del microprocessori e della velocità delle memorie, si sta facendo strada quella che potrebbe essere la seconda rivoluzione delle interfacce di comunicazione con i sistemi informatici, caratterizzata dall’uso della voce e dalla possibilità di colloquiare con il computer come se si fosse in presenza di una persona.

Alla fine degli anni ’80 il sistema operativo OS2 della IBM aveva introdotto il controllo vocale con un programma che consentiva di scandire alcun comandi di sistema ed ottenere l’attivazione delle applicazioni senza utilizzare tastiera e mouse, ma era rimasto poco più di un esperimento, anche per lo scarso successo della piattaforma, annichilita da una politica commerciale suicida.

Con l’avvento del Dragon Dictate, nato dalle ceneri di quel progetto, il controllo vocale ebbe un’ottima evoluzione durante i primi anni del nuovo millennio, soprattutto negli studi legali e notarili, dove la possibilità di dettare lunghi testi, direttamente al computer oppure attraverso un registratore vocale, consentì a più di un professionista di affrancarsi dall’essere ostaggio della segretaria.

L’alta percentuale di errore che caratterizzava tale tipo di dettatura vocale (e , conseguentemente, costringeva a lunghe sedute di correzione), unita alla procedura di campionamento della voce piuttosto macchinosa e pronta ad essere messa in discussione da un semplice raffreddore, complice anche la crescente alfabetizzazione informatica dell’utente medio, impedì al controllo vocale di avere il sopravvento su tastiera e mouse nella gestione del desktop e nella stesura dei documenti.

Di recente, però, Samsung e Apple sono tornate alla carica con due progetti antagonisti e molto performanti, chiamati Siri e Galaxy, definiti dalle aziende veri e propri sistemi di intelligenza artificiale applicati alle interfacce di controllo di tablet e smartphone.

Samsung ha poi sfruttato la scia dei film di James Bond e di Supercar degli anni ’80, regalando ai suoi consumatori un orologio in grado di trasmettere comandi vocali ai suddetti dispositivi.

Entrambi i sistemi funzionano bene, non hanno bisogno di procedure di apprendimento e sono discretamente cordiali nel rapportarsi con gli utenti, come se fossero effettivamente in grado di comprendere quello che dicono, senza ridurre il confronto ad una fredda sequenza di numeri e bit.

Non stupitevi, quindi, se nei prossimi giorni mi incontrerete in giro per Teramo mentre parlo con il mio orologio. In realtà sto utilizzando il vivavoce del Galaxy per rispondere ad una chiamata, per dettare un messaggio da inviare ad un amico o per annotare un appuntamento sull’agenda. Tutto tramite controllo vocale, grazie al microfono nascosto nel cinturino dell’orologio. Posso anche scattare foto e video semplicemente chiedendolo. Anche questo articolo è stato scritto iniziando con la frase “Ciao Galaxy”. E non avete ancora visto i Google Glass.

Gianluca

Lascia una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *