Appunti sulle reti neurali: gennaio 2012

Cancellato il mio vecchio blog su Splinder per motivi tecnici apro questa nuova pagina. In coda alcuni vecchi post.
Qui ci sono spunti e riflessioni sull'intelligenza artificiale.

domenica 4 settembre 2011

La memoria è una forma di apprendimento. La mente umana non ha a disposizione una sorta di hard disk esterno composto da una griglia in cui ciascuna casella corrisponde a un ricordo.

Le persone ricordano per associazione di idee. Questo è evidente a qualsiasi studente che abbia dovuto sostenere un esame. Le date di storia si ricordano meglio se associate a qualche elemento già radicato nella nostra testa, possibilmente personale. La data della rivoluzione fracese, 1789, non si dimentica più se si osserva che 17 corrisponde al civico del proprio indirizzo di casa e 89 all'età della propria nonna.

Se un conoscente fa riferimento a un fatto che è avvenuto in passato e che immediatamente non ricordiamo, iniziamo a pensare alle persone a cui quel fatto fa riferimento e ci aiutiamo con fatti accaduti nello stesso periodo che riguardino le stesse persone. Dopo qualche "esplorazione" di questo genere spesso arriviamo a ricordarci del fatto in questione.

Allo stesso modo, se un conoscente ci parla di una persona che non ricordiamo iniziamo a passare in rassegna nella mente tutte le persone che vi potremmo associare. Per esempio, se cerchiamo di ricordare un vecchio compagno di scuola pensiamo a tutti gli altri compagni di scuola che ci ricordiamo, se è un parente, a tutti i membri della famiglia vicini a quella persona, a fatti che siano avvenuti intorno a quel gruppo, cercandone uno in cui quella persona fosse presente.

Il fatto che la mente umana ricerchi i ricordi in questo modo dimostra che non esiste una griglia, ma un albero di associazioni, e che i ricordi possono essere raggiunti attraverso percorsi di associazioni di idee. La controprova è che fatti isolati, per esempio una vacanza che abbiamo fatto da soli, sfuma di molto nei dettagli. Ed è per questo che le foto sono tanto importanti per le persone. Perchè offrono un supporto alla memoria fatto di elementi visivi che possiamo immediatamente associare ad altri ricordi. Rappresentano una forma di "scorciatoia" nei percorsi della memoria.

Nella mente si forma perciò un albero della memoria. Quali sono le radici di questo albero, i punti di partenza? I cinque sensi. Da vista, udito, olfatto, tatto e gusto partono tutti i percorsi della memoria.

Dalla vista parte la maggior parte delle esperienze mentali di alto livello, a cui associamo quelli in genere che consideriamo ricordi e che ci consentono una elaborazione astratta. Dall'olfatto apparentemente iniziano percorsi meno lunghi, e in genere associati agli altri sensi. Per esempio l'odore di caffè è associato alla colazione, al risveglio e alla corsa verso l'ufficio. Oppure l'odore di un particolare sapone che abbiamo sentito soltanto in un determinato hotel ci richiama alla memoria immediatamente quell'hotel.

Come si realizza questo albero della memoria? Con l'apprendimento, fin dal primo giorno di vita. L'odore viene associato alla mamma, figura che viene associata al soddisfacimento dei bisogni primari. L'odore della mamma calma il bambino, lo fa sentire al sicuro. Questo è un primo percorso di associazioni che si radica nella memoria. Allo stesso percorso è associato il gusto del latte.

Come si evolve però la memoria? Perchè impariamo a parlare? Associando questi elementi al soddisfacimento di bisogni essenziali in teoria non abbiamo ultieriori necessità. Di conseguenza dovrebbe fermarsi la costruzione della memoria, in altre parole l'apprendimento.

Invece prosegue con l'assimilazione di una infinità di elementi, giorno per giorno. All'età di un anno il bambino è irriconoscile per chi lo ha visto soltanto nei primi giorni di vita, non solo fisicamente, ma soprattutto per le capacità che ha maturato.

Il bambino sembra seguire un percorso evolutivo preordinato, dal momento che le fasi di apprendimento sembrano seguirsi in modo molto simile nei tempi e nei modi tra tutti i bambini.

Apparentemente ci sono perciò dei meccanismi biologici radicati che spingono il bambino a cercare ulteriori soddisfazioni, una volta ottenute quelle basilari del cibo e della sicurezza.
Ne ho individuati tre ma sono probabilmente molti di più: l'imitazione, l'umorismo e l'interazione sociale.

L'attitudine di un bambino a imitare i movimenti di tutte le persone che gli stanno intorno è evidente. Il bambino osserva in continuazione i genitori e i nonni e li imita. Scatta nella sua mente un meccanismo associativo complesso che lo porta a mettere in relazione la figura della mamma con la propria. Se la mamma fa un gesto con la mano, per esempio prende la forchetta, il bambino associa alla mano della madre la propria mano e poi tenta con quest'ultima di fare lo stesso gesto. Si tratta di un processo di apprendimento estremamente complesso alla base del quale c'è un esigenza continua per il bambino di imitare. Imitare è un obiettivo in sè per il bambino. Mutate le condizioni, l'imitazione rimane un potente strumento di integrazione sociale per l'adulto. Il bambino osserva con particolare attenzione i bambini poco più grandi. Vi si identifica più facilmente, riesce ad associare meglio le proprie parti del corpo alle loro e di conseguenza a imitarli meglio.

L'umorismo è fondamentale perchè rappresenta una associazione imprevista di elementi che dà piacere alla mente. Rappresenta quindi una forma di soddisfazione per ottenere la quale il bambino si misura con una forte spinta alla ricerca di nuovi percorsi, di associazioni di idee alternative che rappresenta un potente strumento di apprendimento e sta alla base della creatività.

L'interazione sociale è un altro degli obiettivi base dell'essere umano. Il bambino non ha bisogno solo di mangiare, dormire, stare caldo e sicuro. Ha bisogno di non essere solo. Anche questo, come gli altri due, è un elemento che ci portiamo dietro per tutta la vita. Nessun essere umano mai vuole restare completamente solo. Nel film "Io sono leggenda" il protagonista, interpretato da Will Smith, sopra ogni altra cosa cerca di mettersi in contatto con altri esseri umani. L'umanità è praticamente scomparsa, lui è solo e ha disposizione viveri e ogni genere di conforto di una intera città, ma ha bisogno di interagire con altre persone. In Cast Away, bloccato su un'isola deserta, Tom Hanks disegna una faccia su un pallone e quello diventa il suo amico, a cui parla continuamente. L'essere umano ha bisogno di interagire con altri esseri umani, è uno dei suoi bisogni di base. Nel bambino questa esigenza si trasforma nella necessità via via di saper interpretare le espressioni del viso e i toni della voce, di emettere suoni ed espressioni che gli adulti siano in grado di interpretare e poi di imparare a parlare. Tutto questo avviene attraverso una progressiva associazione di immagini e di suoni, per cui i primi fonemi che il bambino è in grado di emettere sono associati alla mamma e poi progressivamente a tutto il resto. Il linguaggio è la più evidente dimostrazione del fatto che la memoria è una forma di apprendimento.

Una intelligenza artificiale che voglia avvicinarsi al potenziale della mente umana deve tenere conto di questi meccanismi. E' sbagliato percorre la strada dell'organizzazione modulare del cervello positronico, dividendo le funzioni in moduli specifici. La sintesi vocale per parlare, un modulo di riconoscimento immagini per individuare i volti, un modulo dell'equilibrio per camminare e così via. Questo è probabilmente il massimo che siamo in grado di realizzare attualmente e centinaia di ricerche su ciascuno di questi aspetti aggiungono pezzi di conoscenza che convergono tutti verso la realizzazione di un robot "completo".

Ma la verità è che quando saremo arrivati a quel punto avremo solo realizzato una macchina estremamente evoluta con qualche principio di intelligenza in alcuni dei suoi elementi. A quel punto occorrerà ricominciare da capo per realizzare un robot che impari tutto da solo a partire dai suoi "cinque sensi" e rappresenti un organismo intelligente nel senso umano del termine. Per fare questo occorrerà lavorare con una decisamente maggiore attenzione proprio sui sensori che consentono al robot di interagire col mondo. L'equilibrio, la vista, l'udito di cui dispongono i robot oggi sono estremamente poveri. Il minimo indispensabile per individuare, con una programmazione complessa, gli elementi necessari a portare a termine il compito: camminare, individuare i volti eccetera. Stiamo compensando una scarsità strutturale, hardware, con una iniezione di intelligenza precotta. Occorre passare da un approccio analitico-funzionale a uno sistemico-olistico.

Occorre cioè intraprendere la strada opposta: dotare il robot di un mare di sensori, tattili, dell'olfatto, con telecamere stereoscopiche ad alta definizione e cattura di immagine a 180 gradi con una gestione della messa a fuoco simile a quella umana, un sistema dell'equilibrio più complesso, vicino a quello umano, e un udito ad altissima definizione. Poi occorre sviluppare i meccanismi associativi di apprendimento a reti neurali partendo da alcuni processi base, come imitazione, umorismo e interazione. Solo a quel punto, con un progressivo affinamento di tutti questi elementi, potremo andare realmente verso la costruzione di quella che si possa definire una intelligenza artificiale.

Da aggiungere:

Oltre all'umorismo esiste un'altra potente forma di apprendimento: le emozioni. Ricordiamo i particolari di una vecchia vacanza soltanto nella misura in cui ci hanno colpito fortemente con una emozione. Per esempio se in quella vacanza siamo stati rapinati e abbiamo provato una forte paura è probabile che lo ricordiamo perfettamente.

lunedì, 29 maggio 2006
Il sonno

29 maggio 2006

Stamattina mi sono svegliato con ancora in mente un sogno fresco, di pochi minuti prima. E mi ricordavo un'espressione, utilizzata a descrivere una situazione che avevo sognato. Nella mia mente, durante il sogno, era apparsa perfettamente costruita. Ma quando l'ho richiamata alla mente da sveglio, mi sono ritrovato in mano tra locuzioni: schianto, fondo, tazzina di caffè. Mentre nel sogno erano perfettamente collegate in una frase, una volta sveglio non sapevo più collegarle. Nel sogno avevano costituito una espressione molto efficace, da sveglio non sapevo più neanche metterle insieme. Perché? La risposta è semplice.

La differenza tra il sonno e la veglia è nel linguaggio. Il nostro cervello ha bisogno di riposare perché pensa tutto il giorno con una griglia di regole stabilite, acquisite con la crescita e senza le quali non è in grado di esprimere pensieri compiuti: è il linguaggio. L'insieme di sintassi, grammatica, lessico, eccezioni, che il nostro cervello si è abituato ad utilizzare, gli costano una grande fatica in termini di organizzazione del pensiero.

Nel sonno questo insieme di regole salta, e il cervello può pensare senza queste regole. Esamina ricordi, immagina situazioni, raccoglie particolari sedimentati a cui non abbiamo dato importanza, e fa tutto questo senza dare vita ad una costruzione coerente e organizzata, che poi non è altro che un testo. Nel sogno si fa un passo indietro verso una condizione di acquisizione sensoriale, senza l'elaborazione strutturata del linguaggio, che la riorganizza e la interpreta. Il sonno si ferma al primo livello, e taglia quell'insieme di strumenti che danno un senso logico coerente alla nostra esperienza sensoriale. Quando il sonno è più affaticato dalle preoccupazioni e meno restauratore, il cervello non si abbandona completamente e una certa porzione di questa struttura rimane attiva. Così ricordiamo meglio le frasi che abbiamo ascoltato nel sogno, le persone, i dettagli. L'offuscamento riguarda spesso più il rapporto tra una scena e la successiva del nostro sogno, che mentre dormivamo apparivano perfettamente collegate, e di cui da svegli non riconosciamo più il nesso logico. Ma ciò che le persone hanno detto o fatto lo ricordiamo. Avviene perché il coinvolgimento emotivo ha spinto il nostro cervello a mantenere un certo livello di soglia, cioè una parte dei suoi strumenti del linguaggio, attivo.

Un cervello artificiale potrebbe aver bisogno di sognare? Forse si. L'interpretazione delle percezioni è il processo che costruisce il reticolo di relazioni che forma il linguaggio. Questo processo continuo, progressivo, ininterrotto, raccoglie e processa anche molto “rumore”. Informazioni sensoriali ridondanti, o incoerenti, si inseriscono nel reticolo di relazioni che costituisce il linguaggio. Facciamo un esempio: fumare una sigaretta. E' un'azione piacevole ma al tempo stesso ripugnante. Stimola alcune terminazioni nervose che danno un senso di benessere, ma affatica i nostri polmoni e il nostro cuore, e il nostro cervello ha entrambe le informazioni. Fumiamo per rilassarci, ma dopo un certo numero di sigarette il fumo rende più difficile la concentrazione e affatica l'organismo. Sfoghiamo sulla sigaretta il nostro stress, ma allo stesso tempo il fumo indebolisce la nostra capacità di reazione. E d'altra parte, però, rappresenta uno stimolante come la caffeina. Insomma, una serie di elementi contrastanti tra loro che creano un mix di percezioni contrapposte. Infatti accendere una nuova sigaretta è spesso una decisione che è il risultato di due volontà opposte, che avvertiamo. Per i fumatori prevale il senso positivo dell'odore del fumo, o del suo ricordo. Per i non fumatori naturalmente prevale il senso di ripugnanza.

Naturalmente gli esempi nella nostra vita di questo tipo di combinazione tra percezioni opposte sono molti e su diversi livelli. Sono stanco ma ho bisogno di fare una passeggiata, mi piace questo film ma mi fanno male gli occhi, mi piace quella persona ma non mi fido, sto comodo in questa posizione ma sento la schiena affaticarsi, e così via. Dietro ciascuno di questi banali esempi c'è la sfida tra due volontà distinte che sono il frutto di una serie di percezioni sensoriali del nostro cervello. Naturalmente queste sono le contraddizioni che avvertiamo in maniera consapevole. Ad un livello più basso ci sono tutte quelle che non avvertiamo consciamente ma che il nostro cervello deve governare. Il reticolo di interrelazioni che costituisce il nostro cervello si riempie di connessioni in più o in meno, o rinforzate, o indebolite, sulla base di percezioni contraddittorie e confuse, che tendono a spingere il cervello, dai livelli biologici a quelli consapevoli, verso l'ingovernabilità. Per fortuna rappresentano solo una parte dell'insieme delle percezioni.

Il sonno è uno strumento che permette all'organismo di ripulirsi, di riportare il caos allo stato di quiete, in modo che non diventi divergente a lungo andare, ma rimanga governabile.

Per un cervello artificiale complesso, che in futuro conterà su una quantità crescente di percezioni sensoriali, potrebbe rendersi necessario lo stesso strumento. Regredire l'attività ad un livello meno strutturato, con una fluttuazione casuale dei pensieri, governato proprio dalle connessioni eccitate maggiormente, in modo da mettere in moto un processo di riesame di queste connessioni che ne ristabilisca il peso in relazione alle altre con un processo di retroazione interno.

lunedì, 29 maggio 2006

La memoria

La memoria fa parte del processo di apprendimento. La memoria viene distorta e subisce continue modifiche: questo è dovuto al fatto che in realtà si tratta di un processo di ricostruzione del cervello, partendo dalle caratteristiche apprese della cosa oggetto di memoria.
Molto spesso infatti non ricordiamo una cosa, ma se ci viene riportata siamo in grado di riconoscerla. Non ricordiamo il viso di una persona, ma se ci viene mostrato siamo in grado di riconoscerlo.
Se ci viene fornita una sequenza di numeri normalmente non siamo in grado di ricordarne tutti gli elementi, ma se ce ne viene proposto uno siamo in grado di ricordarci se era presente o no. La nostra mente apprende una serie di caratteristiche delle cose da ricordare (una serie di pesi), poi utilizza il pattern fornito in ingresso per dire se l'uscita che ne consegue corrisponde a quello che stiamo cercando oppure no.
Infatti siamo in grado di ricordare una cosa molto meglio e più efficientemente quando l'abbiamo capita. Quando ne abbiamo individuato i contorni, le cause, le conseguenze. Quando il fatto rappresenta un flusso indistinto siamo molto più in difficolà nel ricordarle. d'altra parte questo potrebbe essere spiegato anche dal fatto che ricordare le caratteristiche salienti rappresenta una specie di "compressione" dell'informazione da salvare in memoria, quindi non dobbiamo ricordarne tutti gli elementi visivi (o più in generale percettivi) ma ci bastano le caratteristiche salienti. Comunque rimane il fatto che una parte o una caratteristica dell'elemento sono in grado di richiamare alla memoria l'intero elemento. Questo fenomeno è molto simile all'apprendimento di una rete neurale. la memoria potrebbe essere solo una forma di apprendimento specifico.

lunedì, 29 maggio 2006
l'apprendimento del linguaggio
22 gennaio 2005 - 1.56 am

LA BASE DELL'APPRENDIMENTO DEL LINGUAGGIO
quando un bambino impara a parlare lo fa associando delle parole a delle immagini. per corollario tutto il nostro modo di pensare durante l'arco della nostra vita è di tipo prevalentemente visivo. noi capiamo meglio le cose quando siamo in grado di dare appunto una forma, (non per niente si dice così), quando siamo in grado di associare a un concetto un'immagine. e dato che la memoria non è separata come in un computer dalla rete di neuroni che apprende e capisce, siamo in grado di ricordare meglio quando associamo le cose a delle immagini.
un robot può apprendere il linguaggio nella stessa maniera.
dopo aver costruito un modulo del linguaggio in grado di ascoltare i suoni, depurarli dal rumore, distinguere e riprodurre i fonemi, il modo migliore per insegnare il linguaggio al robot è attraverso le immagini. questo si presta molto bene alla struttura di una rete neurale. le coppie di vettori di apprendimento sono formate per il vettore di input dall'immagine di un oggetto, e per il vettore di output dalla parola da riprodurre. in questo modo la parola "palla" può essere associata all'immagine di una palla. Se oltre all'immagine di una palla, il robot può avere della palla anche l'esperienza tattile attraverso arti e sensori, se scopre che spingendo la palla questa si muove, allora la parola palla è associata a un'immagine a cui sono associate anche una serie di caratteristiche di tipo sensoriale. questo insieme di elementi diventa un concetto. non è più una simulazione, come fannno i software tipo eliza, che scompongono in maniera analitica la sintassi della frase, riconoscono le parole principali e associano la frase in ingresso con una delle n possibili frasi di uscita. quella è una simulazione perchè il significato delle parole è del tutto trasparente al computer, che le elabora secondo un algoritmo analitico sviluppato dal programmatore. con l'approccio a reti neurali delle parole collegate alle immagini invece, il robot, costruisce il concetto "palla". Il robot impara in effetti cos'è una palla.

L'EVOLUZIONE
La palla però si può muovere. Se si insegna al robot che "prendi la palla" indica il comando di individuare la palla, costringerla nel proprio arto e riportarla alla persona che dà il comando, il robot apprende essenzialmente anche concetti più complessi come le azioni. Se "prendi la palla" si riferisce all'azione rivolta alla palla, "prendi la forchetta" si riferisce all'azione rivolta alla forchetta e così via il robot è potenzialmente in grado di capire da solo che "prendi la penna" si riferisce alla stessa azione rivolta alla penna, se ha già appreso cos'è la penna. in questo modo il robot ha sostanzialmente imparato un concetto molto astratto come quello di "prendere", che è un'azione e non più un oggetto.

In generale l'apprendimento della sintassi da parte di un bambino si basa sull'imitazione e non sull'analisi. "il cane corre" non contiene nel bambino il concetto di singolare e plurale. ma il bambino non si sbaglia mai dicendo "il cane corrono" semplicemente perchè non lo sente mai dire. Il linguaggio viene appreso costruendo una serie di collegamenti più o meno forti tra le diverse parole. Il collegamento (la sinapsi) tra "cane" e "corre" è molto più forte di quello tra "cane" e "corrono". infatti dire "il cane corrono" suona molto strano. non siamo abituati a sentirlo e non ci verrà mai in mente di dirlo. Ma l'analisi grammaticale che stabilisce che "cane" è singolare e vuole una declinazione del verbo singolare è una cosa che apprendiamo solo molto dopo e con grande fatica. semplicemente non ci serve per parlare, ma per capire perchè parliamo così.
In effetti imparare una seconda lingua è molto più difficile perchè il bagaglio di apprendimento costituito dalla rete di collegamenti forti e deboli tra le parole lo abbiamo già modellato sulla nostra prima lingua. nella seconda non dobbiamo modellarlo da zero, ma correggerlo per funzionare correttamente sia per la prima che per la seconda lingua. che è un'operazione molto più complessa che modellarlo da zero. Per questo motivo un bambino impara molto più facilmente due o tre lingue contemporaneamente da piccolo mentre è molto più difficile impararle in sequenza. per lo stesso motivo per cui le immagini da analizzare in una rete devono essere fornite in maniera incrociata. per distinguere gianni da alfredo, la rete deve avere un'immagine di gianni, poi una di alfredo, poi un'altra di gianni, poi alfredo e così via. altrimenti, se diamo prima tutte quelle di gianni e poi tutte quelle di alfredo la rete impara prima a riconoscere gianni, ma poi quando impara anche alfredo si sbilancia verso alfredo e non è equilibrata, dunque non impara correttamente. correggere un apprendimento già fatto per aggiungere l'apprendimento su altro è molto più difficile che imparare le due cose contemporaneamente, perchè gli stessi collegamenti devono servire due target differenti. e correggere una rete orientata a un target per servirne anche un secondo è un'operazione molto più fine e complessa che allenare la rete contemporaneamente sui due target.

Appunti sulle reti neurali

giovedì 19 gennaio 2012

la memoria

Archivio blog