2008/03/16

Redes neuronales artificiales en el estudio del desarrollo cognitivo

Juan Felipe Martínez Florez®

E-mail: nadagreen137@hotmail.com

Grupo de investigación Mentis en Filosofía de la Mente y Ciencias Cognitivas, Dpto. de Filosofía Edf.: 386; Of.: 2017.

Programa académico de Psicología, Instituto de Psicología Edf. 387; Of

Universidad del Valle (Cali-Colombia).

Resumen: Los modelos conexionistas hoy en día ofrecen un aparato conceptual y tecnológico alternativo para el estudio de los procesos implicados en el desarrollo cognitivo. En este trabajo principalmente se presentan los presupuestos genérales del modelo conexionista en el estudio del desarrollo cognitivo. Se consideran las limitaciones de estos modelos como modelos de la mente y se presentaran algunas consideraciones epistemológicas que permitan establecer un panorama de discusión en cuanto a la implementación tecnológica en ámbito del desarrollo cognitivo. Se argumentara una apología al diferenciar sus tipos de implementación ya sea como modelo, metodología y teoría. Finalmente se concluirá la argumentación a favor, a partir del trabajo investigativo llevado a cabo hoy en día, tanto en el ámbito global como local, presentando las aplicaciones en cuanto a la emulación y modelizaciòn en el desarrollo del cognitivo del lenguaje, sus características, deficiencias y posibilidades

La psicología cognitiva, como rama de las ciencias cognitivas utiliza la idea básica del paradigma cognitivo y es la idea de la información. Dentro de esta idea el cerebro es una entidad capaz de recibir, almacenar y procesar de diversos modos la información, y de generar una conducta en consonancia con dichas actividades. En cierto sentido podemos decir que la psicología cognitiva pretende estudiar la mente a través de la observación de los procesos implicados en la conducta. Ya que, dentro de este modelo la mente es referenciada como causa de la conducta, pero a su vez también se accede a la observación objetiva de la conducta para el elicitamiento de los estados mentales internos.

A lo largo del desarrollo de la psicología se han formulado diferentes metáforas o modelos explicativos de la mente humana entre ellas esta quizá la más popular de todas, la metáfora del ordenador. Esta idea se liga básicamente al concepto de información y procesamiento. Estas ideas fueron importantes dentro del desarrollo tecnológico en los años 50 y 60 del siglo XX donde se desarrollaron los primeros sistemas artificiales de procesamiento de datos. Las propiedades mostradas por el ordenador se hicieron irresistibles a ser comparadas y asemejadas al funcionamiento mental humano. La psicología cognitiva clásica tomó estas ideas y las trasladó a la psicología: se entendió que la mente era como un programa informático y el cerebro como el hardware del ordenador. Tomando las reglas de procesamiento y las representaciones como parte fundamental del programa de investigación que mas adelante seria conocido como conexionista Entre ellas la de idea de la información está localizada y se puede acceder a ella mediante un sistema preciso de dirección, además que la información se procesa “en serie” a partir de unas reglas de procesamiento. La adopción de esta ideas supuso una división dentro del la hipótesis del ordenador creándose entonces la corriente blanda de la computación y una corriente dura donde los procesos mentales podrían ser explicados en su totalidad con base a una analogía computacional. Mi idea no es descartarme por ninguna de estas dos posturas en particular, si bien me alineo por proponer un estudio fundamentado a partir de los modelos de procesamiento de información y computación, en la línea en la que el funcionamiento de estos modelos es entendido en términos de manipulación de símbolos[1] por un sistema físico. En tal medida:

“Un sistema simbólico físico consiste en un conjunto de entidades, llamadas símbolos que son patrones físicos que pueden aparecer como componentes de otro tipo de entidades llamadas expresiones (o estructuras simbólicas) Así una estructura simbólica esta constituida por un cierto numero de instancias (o <>) de símbolos relacionados de alguna forma física (como por ejemplo que se encuentren uno junto al otro) en cualquier momento, el sistema contendrá un conjunto de estas estructuras simbólicas. Además, el sistema contiene una colección de procesos que actúan sobre las expresiones para producir otras expresiones: procesos de creación, modificación reproducción, y destrucción. Un sistema simbólico físico es pues, un mecanismo que produce a lo largo del tiempo un conjunto en evolución de estructuras simbólicas. Tal sistema se encuentra en un mundo de objetos mas amplio que ellas mismas” (Newell y Simon, 1976)

Es aquí donde el concepto de computación entra a jugar un papel preponderante en el discernimiento de los procesos asociados a la cognición. En tal medida, es de precisar la idea de computación que se pretende manejar en el presente trabajo.

Si bien se retoma el concepto de cómputo, este no necesariamente hace referencia algún tipo de analogía necesaria de la mente con chips, transistores, o silicio, confusión muy común incluso entre los académicos. De manera tal, que tiende a generarse uno de los malentendidos más comunes en la Ciencia Cognitiva, y es presupuesto de llegar a considerar la mente como el Hardware o el software de los ordenadores comunes, presupuesto totalmente alejado de la realidad. Es de precisar que, el concepto de computo desde al ciencia cognitiva vas mucho mas allá de los ordenadores a los que estamos acostumbrados en nuestras casas, de hecho las características que llevan a establecer una analogía a priori entre los sistemas de computo y los ordenadores comunes, en realidad no tienen que ver entre si. ¿Cómo se definiría entonces el concepto de cómputo?

En líneas generales podríamos decir que, un sistema de computo es aquel cuyas funciones de intercambio con le medio se describen óptimamente como funciones de manejo sistemático de información, por las cuales esta es tomada, almacenada transformada y devuelta al entorno (P. Adarraga 1994 pg, 47) En otras palabras las características de un sistema de computo se explican por el manejo de información, o datos, y las operaciones que aplique sobre ellos en la consecución de un producto.

Ahora bien, este presupuesto es de vital importancia para introducir y a la postre entender la manera como se describe el funcionamiento cognitivo a partir de sistemas de computo y manipulación de información dentro de la perspectiva de las redes neuronales artificiales. Este concepto se traslada al interior del conexionismo a partir del uso de las redes neuronales artificiales como modelos de computación informática que permiten una aproximación para comprender y explicar los procesos asociados a la mente y la conducta. Las redes neuronales dentro de este paradigma son conjuntos de unidades interconectadas masivamente capaces de procesar y almacenar información mediante la modificación de sus estados. (E. Caicedo Bravo, J. Alfonso López 2000) Esta afirmación exigiría importantes precisiones, pero en general se puede decir que el psicólogo computaciónalista considera que ha explicado un fenómeno psicológico (el reconocimiento de formas, la producción de lenguaje, la memoria, etc....) cuando el modelo neuronal artificial que construye se comporta, o exhibe las mismas características de procesamiento de información que los seres humanos cuando realizan la misma tarea.

II

Redes neuronales artificiales en el marco de la psicología del desarrollo cognitivo

Hoy en día se ha realizado diferentes tipos de modelamiento a través de redes neuronales artificiales enfocadas a discernir los procesos relacionados con la cognición y el desarrollo cognitivo. Mucho de este boom sucedió a partir de la publicación del libro Introducción al Procesamiento Distribuido en Paralelo (Rumelhart, McClelland 1986) y principalmente tuvo una acogida dentro de la psicología genética dentro de las posturas neoconstructivistas del desarrollo que enfatizan procesos de interacción a varios niveles entre las predisposiciones innatas y la experiencia en la construcción del conocimiento(Véase Karmiloff-Smith 1994 para una revisión y discusión detallada) La discusión entre el innatismo y la experiencia es una discusión bastante larga y polarizada tanto en la psicología del desarrollo como en al filosofía, la cual en cierta manera se ve mediada y parcialmente superada, principalmente por el trabajo de teóricos como Vigotsky y Piaget quienes enfatizan una perspectiva de interacción entre el organismo y el medio en la construcción del sujeto. Mi interés aquí no es ahondar en esta discusión, sino presentar la el enfoque de las redes neuronales artificiales adscritas dentro de esta perspectiva de interacción ofreciendo, un marco teórico y metodológico que permita re-entender y reformular de una manera mas precisa, datos, intuiciones e hipótesis, para generar nuevas ideas empíricamente contrastables.

Un ejemplo del acople de la perspectiva conexionista dentro del estudio del desarrollo lo tenemos la gracias a la propuesta de aprendizaje por redescripción representacional de Karmiloff-Smith. El proceso de redescripción representacional básicamente explica el aprendizaje como la transformación de información concreta de entrada la cual llega a un nivel de maestría lo que la lleva a una nueva categoría más compleja que permite un nuevo tipo de manejo. Pasando así, del conocimiento implícito a una maestría metateoría del mismo conocimiento. Esto podría ser fácilmente explicado si lo comparamos con la lectura de una palabra, en un inicio, lo primordial seria leer cada letra, hasta que se lee de modo que se comprende un grupo de letras con sentido. Mayor experiencia entonces permitiría encontrar las reglas que se hayan tras la formación de las palabras (pro ejemplo la gramática u ortografía)

Dentro de esta perspectiva el desarrollo no es un proceso global (como pretendía Piaget) sino de domino especifico. Esta visión se basa en la concepción de la mente compuesta por módulos predeterminados de información encapsulada activado según la maduración del individuo y computan información para la cual se encuentran genéticamente determinados. Desde esta perspectiva el desarrollo del reconocimiento visual de rostros y del lenguaje no forman parte del mismo espacio de información entrante ni tampoco comparten métodos similares. De hecho, podrían no tener ningún parecido.

Como se relacionaría esto con una red neuronal? Una red neuronal es Básicamente un conglomerado de neuronas o nodos conectados entre sí que pasan activación por entre sus conexiones. Generalmente las redes neuronales están organizadas por capas y pueden tener una o varias capas ocultas, las cuales transmiten la activación en direcciones específicas.

Aquí tenemos dos capas de h y m numero neuronas. Cada nodo de la primera capa lanza una conexión a un nodo de la segunda siendo la dirección de la propagación de la activación siempre la misma. Estas conexiones tendrían unos valores de entrada denominados pesos (X1, X2, Xi, Xn) de modo que la activación que un nodo transmite a los posteriores es producto de la conexión que mantienen entre sí y de la activación que tenía el primer nodo. Supongamos que un peso es de 0.5 y que la activación del nodo es de 1. ¿Qué ocurre con la activación que alcanza el nodo de la segunda capa? Es evidente que entre las neuronas que se conectan con el las de la segunda capa, podrían estar varias de ellas activados teniendo un peso distinto de cero. Bueno, pues aquí aparece la función de activación que integra toda la activación que alcanzan las neuronas, habitualmente siendo una función no lineal como la sigmoide. El empleo de una función no lineal modifica con bastante el procesamiento de la red (este tipo de función es similar al que se da en las neuronas reales), de modo que activaciones bajas y altas son llevadas al extremo, acercándose más a 0 o 1, mientras que las activaciones medias siguen una progresión básicamente lineal. Ahora, aplicándosele una función de aprendizaje, de las diferentes que existen, hace que las presentaciones de estímulos vayan modificando cuantitativamente los pesos de las conexiones “En otras palabras, las computaciones sencillas de elementos se combinan e interactúan de múltiples formas para producir resultados complejos y cambiantes los que sirven para modelar los procesos cognitivos y de desarrollo” (Gutierrez Martinez, 2005, pg262)

Este tipo de sistema distribuido presenta varias características "generales" de la cognición. Como por ejemplo, es capaz de reaccionar ante la similitud de los estímulos, a no ser que sea la función de aprendizaje de una diferencia significativa. Asimismo puede generalizar a nuevos estímulos de la misma categoría siempre que mantengan ciertas propiedades básicas comunes, detectando invarianzas o "reglas"; y además, presentan una comportamiento dirigido por etapas, basada en un aprendizaje cuantitativo. Igualmente presentan numerosas dependencias al contexto y a los sesgos estadísticos de las entradas. Por ejemplo, si han de aprender a transformar una serie de rasgos fonéticos en letras, la adquisición se verá influida por la proporción de letras y rasgos fonéticos, de la semejanza fonética entre dos letras y demás; propiedades que en numerosas ocasiones se hallan en experimentación diversa.

“…lo importante, es que estos procedimientos proporcionan un nuevo marco computacional, en el que ya no es necesario formular reglas explicitas sobre la información representada y las operaciones del procesamiento implicadas, sino que todo ello puede describirse en referencia a los patones cambiantes de activación y de conexión dentro de una red de procesamiento distribuido en paralelo (…) básicamente el procesamiento se refleja en los cambios del patrón de activación, mientras que los patrones conectivos representan el conocimiento del sistema, que van cambiando como consecuencia de la propia actividad de la red”


[1] Si bien los modelos del desarrollo basados en el uso de redes neuronales artificiales en su corriente mas dura apelan a modelos de procesamiento sub-simbólico basado en las restricciones impuestas al sistema, en contraposición a los modelos formales abstractos tradicionales basados en la estructura y manipulación simbólica, se han desarrollado posturas intermedias como el modelo de anexo competitivo o el conexionismo hibrido las que tratan de hallar un punto intermedio entre las teorías simbólicas basadas en sistemas formales abstractos y los modelos conexionistas de procesamiento basados en estructuras neurales, como enfoque a la hora de arrojar modelos sobre el procesamiento cognitivo (Para una discusión detallada véase E. Lepore, Z. Pylyshyn, S. Stevenson 2003 pg 403)

1 comentario:

Boris dijo...

Está como enredada la red; pero si así es, así habrá que estudiarla.