venerdì 27 aprile 2012

Sintesi vocale naturale

Per realizzare un corretto sintetizzatore vocale il modo più efficiente è probabilmente quello di assegnare a ogni parola, in un dizionario, il suo corrispettivo nell'alfabeto fonetico internazionale (Ipa) e far leggere al sintetizzatore quest'ultimo. In questo modo la lettura, trovando correttamente codificati accenti e suoni, non dovrebbe presentare sorprese (per esempio "asino" letto con la esse dolce e non pronunciata come in Sassari).

Ma le persone non imparano a leggere in questo modo. Noi associamo mnemonicamente dei suoni a dei segni, e in genere buona parte di questi sono parole intere. Quello che un bambino fa, per prima cosa, è creare un dizionario di suoni e segni associati. Le regole fonetiche applicate alle singole lettere si applicano soltanto sulle parole sconosciute, di quelle conosciute la pronuncia è associata alla parola, non alle lettere che la compongono. In italiano una chiara dimostrazione di questo meccanismo emerge dall'uso della s: nessuno confonde la pronuncia da affidare a questa lettera in "sale" o "asta" con quella che alla stessa lettera viene assegnata in "visuale" o "tesoro". Eppure si tratta di due suoni diversi. Ma la cosa più sorprendente è che in genere nessuno si accorge che si tratti di suoni diversi finché la sua attenzione non viene portata sul problema.

Perciò un sintetizzatore che segua il percorso di apprendimento umano deve prima essere educato alle parole intere con un processo di imitazione (pronuncia della parola, comparazione del suono originale con quello pronunciato, correzione e nuova pronuncia, in un ciclo che termina quando la parola pronunciata e quella originale si assomigliano molto) e solo dopo essere educato alle lettere. In questo modo, come nel caso umano, le regole di pronuncia delle lettere saranno applicate alle parole solo in via complementare e non in via prioritaria. Così la pronuncia risulterà naturale e l'apprendimento della macchina risulterà simile a quello umano.

Diversamente, occorrerà associare a ogni parola il suo corrispettivo codice fonetico, che non sempre è disponibile, e il comportamento della macchina sulla pronuncia delle parole sarà molto artificiale e del tutto separato dall'apprendimento del linguaggio (in termini di significato e uso delle parole), a cui invece dovrebbe essere legato.

giovedì 26 aprile 2012

Jobs off topic

Questo è un post un po' fuori tema ma ho deciso di pubblicarlo lo stesso, mi sembra pertinente ai problemi dell'intelligenza... :)

Il fatto che Steve jobs sia diventato un leader carismatico è la conseguenza del fatto che viviamo in una società che non crede e non vuole credere più a niente. Tra gli anni 50 e 70 i leader carismatici erano considerati Gandhi, Che Guevara, Mao: persone che, nel bene o nel male, proponevano un cambio radicale della società. Oggi il leader carismatico è un uomo che promuove il sogno di fare dei telefonini migliori, più belli e funzionali. E' il segno che la società non vuole credere in qualcosa, non ne ha più il coraggio, ma ha bisogno di credere in qualcuno e si sceglie dei leader minimalisti. E' ben triste il nostro destino se a cambiare le nostre vite è la grafica rinnovata di un cellulare.

giovedì 12 aprile 2012

Questo non c'è ciccio

"Questo non c'è ciccio". Mia figlia, 17 mesi, indica la catenina di plastica che serve a evitare che il ciuccio cada per terra quando se lo toglie di bocca. A una estremità della catenita è legata una pinzetta che si stringe sul colletto. All'altra è legata il ciuccio. Solo che, staccato per essere lavato, adesso il ciuccio, il "ciccio" come lo chiama lei, non c'è. La frase vuole dire a tutti gli effetti "Sulla catenina manca il ciuccio". La prima cosa che manca alla frase è la preposizione. Le prime frasi complete dei bambini mancano di preposizioni, o di casi, a seconda delle lingue. Il tipo di complemento (se di termine, di specificazione, oggetto, ecc) si capisce dal contesto. Mia figlia poi usa in modo particolare "c'è", che può assumere vari significati: "è", "c'è", "voglio", "dammi". Per esempio "non c'è pappa" vuol dire "non voglio più pappa".

Oppure "questo è nonno", indicando un'auto, significa "questa è la macchina di nonno". Una cosa che sembra mancare è la nozione di soggetto. Le frasi sembrano essere piane, senza un centro e una periferia, come in genere sono le frasi degli adulti: un soggetto, un'azione, un oggetto e vari complementi, con un progressivo spostamento dal centro dell'azione alla sua periferia. E' difficile stabilirlo però con certezza, potrebbe essere solo una suggestione. O potrebbe indicare che il cervello è più predisposto per una organizzazione piatta del linguaggio che per una gerarchica e funzionale, come quella che si acquisisce da adulti.