Alzi il mouse chi non ha nel proprio curriculum professionale o intellettuale un discorso davvero figo e indubbiamente lucido, proferito a braccio, magari estemporaneo, da cui vorrebbe trarre, non dico un saggio. ma almeno un articolo, o anche soltanto un post.

Accade però che, nonostante in molti casi il discorso stesso sia stato fortunatamente raccolto in un filmato analogico poi digitalizzato e collocato su Youtube, oppure in un più recente video realizzato con uno smartphone , autrici e ed autori non trovino il tempo, la voglia o adeguati mezzi di ricatto o seduzione nei confronti di terzi per “sbobinarlo”, ovvero per trascrivere le parole pronunciate in un testo coerente e coeso.

Io mi colloco in questo insieme e perciò da un po’ di tempo sto esplorando accrocchi vari che possono offrire una soluzione, se non ottimale, almeno facilitante.

Ci sono, in primo luogo, i sottotitoli di Youtube.

Non certo quelli che deve inserire l’umano in prima persona: si può fare, l’ambiente di lavoro è anche chiaro ed efficiente, ma la rottura di scatole è ancora peggiore di quella di “sbobinare”.

Sto parlando di quelli inseriti dal sistema, usando in modo automatico Google Web Speech API. Molti filmati depositati su Youtube ne sono provvisti, anche non sempre è stata azzeccata la lingua di partenza e quindi c’è qualche situazione davvero grottesca.

I sottotitoli di questo tipo ci sono, anche se non perfetti, e ripropongono quanto detto a voce.

Possiamo quindi scaricarli per poi migliorarli e farne un testo vero e proprio; uno dei modi per realizzare questo obiettivo è DIYCaptions, che offre anche altre due possibilità: aprire i sottotitoli  esistenti ed editarli, più interessante, o realizzare una trascrizione originale da zero, soluzione questa – nella nostra prospettiva – da catalogare, ma da aborrire come la peste.

Non accontentarmi delle prime soluzioni mi è servito anche questa volta, perchè -incaponendomi- ho scoperto un’altra cosuccia, verificandone pure l’effettivo funzionamento: come ingannare il proprio dispositivo e costringerlo a dettarsi un testo da solo.

La condizione di base è la sottomissione ufficiale a Google: se usiamo Chrome per lavorare con un documento di testo di Google, infatti, possiamo fruire della funzione di “Digitazione vocale” del menu “Strumenti”, che si appoggia sul citato Web Speech API, riconoscimento vocale imperiale, ma con due indubbi pregi: un buon livello di efficienza e un miglioramento continuo.

Come anticipato, ci  vuole però un trucchetto: Google docs deve credere di ricevere il proprio input vocale dal microfono dell’utente.

Per far questo ci sono vari software: adeguatamente impostati, configurano una schedia sonora virtuale, che consegnerà il suono in uscita di un file audio o video eseguito sul dispositivo come ingresso alla “Digitazione vocale” di Google Docs, la quale lo trascriverà nel documento.

L’utente deve solo aspettare la fine della autodettatura ed eventualmente sistemare il testo finale.

Io ho provato l’efficacia di Soundflower per MacOSX e di VoiceMeeter per Windows. Alternativeto.net offre un elenco ampio di alternative, per vari sistemi operativi e dispositivi fisici.

 Google Web Speech APIDIY Captions Captions

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.