sábado, junio 14Una producción de Corporación Medios Digitales del Sur

Cómo el cerebro despliega diferentes estrategias de razonamiento para abordar tareas mentales desafiantes


El cerebro humano es muy hábil para resolver problemas complejos. Una razón es que podemos dividir los problemas en subtareas manejables que son fáciles de resolver individualmente.


por el Instituto Tecnológico de Massachusetts


Esto nos permite completar una tarea diaria, como salir a tomar un café, dividiéndola en pasos: salir de la oficina, llegar a la cafetería y, una vez allí, comprar el café. Esta estrategia nos ayuda a superar obstáculos con facilidad. Por ejemplo, si el ascensor se avería, podemos revisar cómo salir del edificio sin cambiar los demás pasos.

Si bien existe mucha evidencia conductual que demuestra la habilidad de los humanos en estas tareas complicadas, ha sido difícil diseñar escenarios experimentales que permitan una caracterización precisa de las estrategias computacionales que usamos para resolver problemas.

En un nuevo estudio, investigadores del MIT han modelado con éxito cómo las personas implementan diferentes estrategias de toma de decisiones para resolver una tarea compleja: en este caso, predecir cómo se desplazará una pelota por un laberinto cuando esté oculta a la vista. El trabajo se publica en Nature Human Behaviour .

El cerebro humano no puede realizar esta tarea a la perfección porque es imposible seguir todas las trayectorias posibles en paralelo, pero los investigadores descubrieron que las personas pueden hacerlo razonablemente bien si adoptan con flexibilidad dos estrategias conocidas como razonamiento jerárquico y razonamiento contrafáctico.

Los investigadores también pudieron determinar las circunstancias en las que las personas eligen cada una de esas estrategias.

«Lo que los humanos somos capaces de hacer es dividir el laberinto en subsecciones y luego resolver cada paso mediante algoritmos relativamente simples. En efecto, cuando no tenemos los medios para resolver un problema complejo, lo logramos mediante heurísticas más sencillas que nos permiten realizar el trabajo», afirma Mehrdad Jazayeri, profesor de ciencias cerebrales y cognitivas, miembro del Instituto McGovern para la Investigación Cerebral del MIT, investigador del Instituto Médico Howard Hughes y autor principal del estudio.

El Dr. Mahdi Ramadan y el estudiante de posgrado Cheng Tang son los autores principales del artículo. El Dr. Nicholas Watters también es coautor.

Estrategias racionales

Cuando los humanos realizan tareas sencillas con una respuesta correcta clara, como categorizar objetos, su desempeño es excepcional. Cuando las tareas se vuelven más complejas, como planificar una visita a tu cafetería favorita, puede que ya no haya una respuesta claramente superior. Y, en cada paso, hay muchas cosas que podrían salir mal.

En estos casos, los humanos son muy buenos a la hora de encontrar una solución que permita realizar la tarea, aunque puede que no sea la solución óptima.

Estas soluciones suelen implicar atajos para la resolución de problemas, o heurísticas. Dos heurísticas destacadas en las que los humanos confiamos habitualmente son el razonamiento jerárquico y el contrafáctico.

El razonamiento jerárquico es el proceso de descomponer un problema en capas, comenzando por lo general y avanzando hacia lo específico. El razonamiento contrafáctico implica imaginar qué habría sucedido si se hubiera tomado una decisión diferente. Si bien estas estrategias son bien conocidas, los científicos desconocen cómo el cerebro decide cuál usar en una situación determinada.

Esta es una pregunta crucial en la ciencia cognitiva : ¿Cómo resolvemos problemas de forma subóptima, ideando heurísticas ingeniosas que encadenamos de forma que nos acerquemos cada vez más hasta resolver el problema?, dice Jazayeri.

Para superar esto, Jazayeri y sus colegas idearon una tarea que es lo suficientemente compleja como para requerir estas estrategias, pero lo suficientemente simple como para que los resultados y los cálculos que las sustentan puedan medirse.

La tarea requiere que los participantes predigan la trayectoria de una pelota a medida que recorre cuatro posibles caminos en un laberinto. Una vez que la pelota entra en el laberinto, no se puede ver qué camino recorre. En dos cruces del laberinto, se escucha una señal auditiva cuando la pelota llega a ese punto. Predecir la trayectoria de la pelota es una tarea imposible de resolver con precisión para los humanos.

«Requiere cuatro simulaciones paralelas en la mente, algo que ningún humano puede hacer. Es como tener cuatro conversaciones a la vez», dice Jazayeri. «Esta tarea nos permite aprovechar este conjunto de algoritmos que usan los humanos, ya que no se puede resolver de forma óptima».

Los investigadores reclutaron a unos 150 voluntarios humanos para participar en el estudio. Antes de que cada sujeto comenzara la tarea de seguimiento de la pelota, evaluaron la precisión con la que podían estimar lapsos de tiempo de varios cientos de milisegundos, aproximadamente el tiempo que tarda la pelota en recorrer un brazo del laberinto.

Para cada participante, los investigadores crearon modelos computacionales que podían predecir los patrones de errores que se observarían en ese participante (en función de su habilidad para cronometrar) si estuvieran ejecutando simulaciones paralelas, utilizando solo razonamiento jerárquico, solo razonamiento contrafactual o combinaciones de las dos estrategias de razonamiento.

Los investigadores compararon el desempeño de los sujetos con las predicciones de los modelos y descubrieron que, para cada sujeto, su desempeño estaba más estrechamente asociado con un modelo que utilizaba el razonamiento jerárquico pero que a veces cambiaba al razonamiento contrafactual.

Esto sugiere que, en lugar de rastrear todas las posibles trayectorias que podía tomar la pelota, los participantes dividieron la tarea. Primero, eligieron la dirección (izquierda o derecha) en la que creían que giraba la pelota en el primer cruce, y continuaron siguiéndola mientras se dirigía al siguiente giro. Si la sincronización del siguiente sonido que oían no coincidía con la trayectoria elegida, revisaban su primera predicción, pero solo en algunas ocasiones.

Volver al otro lado, lo que representa un cambio hacia el razonamiento contrafáctico, requiere que las personas revisen su memoria de los tonos que escucharon. Sin embargo, resulta que estos recuerdos no siempre son fiables, y los investigadores descubrieron que las personas decidían si retroceder o no según la calidad de su memoria.

«La gente recurre a los contrafácticos en la medida en que les resulta útil», dice Jazayeri. «Quienes sufren una gran pérdida de rendimiento al aplicar contrafácticos los evitan. Pero si eres alguien realmente bueno recuperando información del pasado reciente, podrías recurrir al otro lado».

Limitaciones humanas

Para validar aún más sus resultados, los investigadores crearon una red neuronal de aprendizaje automático y la entrenaron para completar la tarea. Un modelo de aprendizaje automático entrenado en esta tarea rastreará la trayectoria de la pelota con precisión y realizará la predicción correcta en cada ocasión, a menos que los investigadores impongan limitaciones a su rendimiento.

Al añadir limitaciones cognitivas similares a las de los humanos, los investigadores descubrieron que el modelo alteraba sus estrategias. Al eliminar su capacidad para seguir todas las trayectorias posibles, comenzó a emplear estrategias jerárquicas y contrafácticas, como las de los humanos.

Si los investigadores redujeron la capacidad de memoria del modelo, este comenzó a cambiar al modo jerárquico sólo si pensaba que su capacidad de recordar sería lo suficientemente buena para obtener la respuesta correcta, tal como lo hacen los humanos.

«Lo que descubrimos es que las redes imitan el comportamiento humano cuando les imponemos las mismas restricciones computacionales que encontramos en el comportamiento humano «, afirma Jazayeri. «Esto indica que los humanos actúan racionalmente bajo las restricciones que les imponen su funcionamiento».

Al variar ligeramente la cantidad de deterioro de la memoria programado en los modelos, los investigadores también vieron indicios de que el cambio de estrategias parece ocurrir gradualmente, en lugar de en un punto de corte definido.

Ahora están realizando más estudios para intentar determinar qué sucede en el cerebro cuando se producen estos cambios de estrategia.

Más información: Bases computacionales del procesamiento de información jerárquica y contrafáctica, Nature Human Behaviour (2025). DOI: 10.1038/s41562-025-02232-3