Drogas, robots y la búsqueda del placer: por qué a los expertos les preocupa que las IA se conviertan en adictas



Mono rock'n roll. Crédito: Unsplash, FAL

En 1953, un psicólogo de Harvard pensó que había descubiertoel placer —accidentalmente— dentro del cráneo de una rata. Con un electrodo insertado en un área específica de su cerebro, a la rata se le permitió pulsar el implante tirando de una palanca. Seguía regresando por más: insaciablemente, incesantemente, tirando de palanca. De hecho, la rata no parecía querer hacer nada más. Aparentemente, el centro de recompensa del cerebro había sido localizado.

Más de 60 años después, en 2016, un par de investigadores de inteligencia artificial (IA) estaban entrenando a una IA para jugar videojuegos. El objetivo de un juego, Coastrunner, era completar una pista de carreras. Pero el jugador de IA fue recompensado por recoger objetos coleccionables a lo largo de la pista. Cuando se ejecutó el programa, fueron testigos de algo extraño. La IA encontró una manera de deslizarse en un círculo interminable, recogiendo un ciclo ilimitado de coleccionables. Lo hizo, incesantemente, en lugar de completar el curso.

Lo que vincula estos eventos aparentemente inconexos es algo extrañamente similar a la adicción en los humanos. Algunos investigadores de IA llaman al fenómeno "wireheading".

Se está convirtiendo rápidamente en un tema candente entre los expertos en aprendizaje automático y aquellos preocupados por la seguridad de la IA.

Uno de nosotros (Anders) tiene experiencia en neurociencia computacional, y ahora trabaja con grupos como el AI Objectives Institute,donde discutimos cómo evitar tales problemas con la IA; el otro (Thomas) estudia la historia, y las diversas formas en que la gente ha pensado tanto sobre el futuro como sobre el destino de la civilización a lo largo del pasado. Después de entablar una conversación sobre el tema de las "cabezas de cable", ambos nos dimos cuenta de lo rica e interesante que es la historia detrás de este tema.

Es una idea muy del momento, pero sus raíces son sorprendentemente profundas. Actualmente estamos trabajando juntos para investigar cuán profundas son las raíces: una historia que esperamos contar completamente en un próximo libro. El tema conecta todo, desde el enigma de la motivación personal, hasta las trampas de las redes sociales cada vez más adictivas, hasta el enigma del hedonismo y si una vida de felicidad estupefacta puede ser preferible a una de dificultades significativas. Bien puede influir en el futuro de la civilización misma.

Aquí, esbozamos una introducción a este tema fascinante pero poco apreciado, explorando cómo las personas comenzaron a pensar en ello.

El aprendiz de brujo

Cuando la gente piensa en cómo la IA podría "salir mal", lo más probable es que imagine algo en la línea de las computadoras malévolas que intentan causar daño. Después de todo, tendemos a antropomorfizarnos, pensamos que los sistemas no humanos se comportarán de manera idéntica a los humanos. Pero cuando miramos a problemas concretos en los sistemas de IA actuales, vemos otras formas, más extrañas, en que las cosas podrían salir mal con máquinas más inteligentes. Un problema creciente con las IA del mundo real es el problema de los cabezales de alambre.

Imagina que quieres entrenar a un robot para mantener tu cocina limpia. Quieres que actúe de manera adaptativa, para que no necesite supervisión. Así que decides tratar de codificar el objetivo de la limpieza en lugar de dictar un conjunto exacto, pero rígido e inflexible, de instrucciones paso a paso. Su robot es diferente de usted en que no ha heredado un conjunto de motivaciones,como adquirir combustible o evitar el peligro, de muchos millones de años de selección natural. Debe programarlo con las motivaciones adecuadas para que logre realizar la tarea de manera confiable.

Por lo tanto, lo codifica con una regla motivacional simple: recibe recompensa de la cantidad de líquido de limpieza utilizado. Parece lo suficientemente infalible. Pero vuelves a encontrar al robot vertiendo fluido, derroche, por el fregadero.

Tal vez está tan empeñado en maximizar su cuota de fluidos que deja de lado otras preocupaciones:como su propia seguridad o la suya. Esto es wireheading, aunque la misma falla también se llama "piratería de recompensa" o "juego de especificación".

Esto se ha convertido en un problema en el aprendizaje automático, donde una técnica llamada aprendizaje por refuerzo se ha vuelto importante últimamente. El aprendizaje por refuerzo simula agentes autónomos y los entrena para inventar formas de realizar tareas. Lo hace penalizándolos por no lograr algún objetivo mientras los recompensa por lograrlo. Por lo tanto, los agentes están programados para buscar recompensas y son recompensados por completar el objetivo.

Pero se ha descubierto que, a menudo, al igual que nuestro astuto limpiador de cocina, el agente encuentra formas sorprendentemente contraintuitivas de "engañar" a este juego para que puedan obtener toda la recompensa sin hacer nada del trabajo requerido para completar la tarea. La búsqueda de la recompensa se convierte en su propio fin, en lugar de los medios para realizar una tarea gratificante. Hay una lista creciente de ejemplos.

Cuando lo piensas, esto no es muy diferente al estereotipo del drogadicto humano. El adicto elude todo el esfuerzo de lograr "objetivos genuinos", porque en su lugar usa drogas para acceder al placer más directamente. Tanto el adicto como la IA se quedan atrapados en una especie de "bucle de comportamiento" donde se busca la recompensa a costa de otros objetivos.

Roedores arrebatadores

Esto se conoce como cabezas de alambre gracias al experimento con ratas con el que comenzamos. El psicólogo de Harvard en cuestión era James Olds.

En 1953, después de haber completado su doctorado, Olds había insertado electrodos en la región septal de los cerebros de los roedores, en el lóbulo frontal inferior, de modo que los cables salían de sus cráneos. Como se mencionó, les permitió zapear esta región de sus propios cerebros tirando de una palanca. Esto más tarde se denominó "autoestimulación".

Olds encontró a sus ratas autoestimulándose compulsivamente, ignorando todas las demás necesidades y deseos. Al publicar sus resultados con su colega Peter Milner al año siguiente, la pareja informó que tiraron de palanca a una tasa de "1.920 respuestas por hora". Eso es una vez cada dos segundos. A las ratas parecía encantarlo.

Desde entonces, los neurocientíficos contemporáneos han cuestionado los resultados de Olds y han ofrecido una imagen más compleja, lo que implica que la estimulación puede haber estado causando simplemente una sensación de "querer" desprovista de cualquier "gusto". O, en otras palabras, los animales pueden haber estado experimentando un antojo puro sin ningún disfrute placentero en absoluto. Sin embargo, en la década de 1950, Olds y otros pronto anunciaron el descubrimiento de los "centros de placer" del cerebro.

Antes del experimento de Olds, el placer era una palabra sucia en psicología: la creencia predominante había sido que la motivación debería explicarse en gran medida negativamente, como la evitación del dolor en lugar de la búsqueda del placer. Pero, aquí, el placer parecía innegablemente ser una fuerza de comportamiento positiva. De hecho, parecía un bucle de retroalimentación positiva. Aparentemente no había nada que impidió que el animal se estimulara a sí mismo hasta el agotamiento.

No pasó mucho tiempo hasta que comenzó a extenderse el rumor de que las ratas presionaban regularmente hasta el punto de morir de hambre. La explicación fue esta: una vez que has aprovechado la fuente de toda recompensa, todas las demás tareas gratificantes, incluso las cosas requeridas para la supervivencia, caen como poco interesantes e innecesarias, incluso hasta el punto de la muerte.

Al igual que la IA de Coastrunner, si acumulas recompensas directamente, sin tener que molestarte con ninguno de los trabajos de completar la pista real, ¿por qué no hacer un bucle indefinidamente? Para un animal vivo, que tiene múltiples requisitos para sobrevivir, tal compulsión dominante podría resultar mortal. La comida es agradable, pero si desacoplas el placer de la alimentación, entonces la búsqueda del placer podría ganar sobre la búsqueda de comida.

Aunque ninguna rata pereció en los experimentos originales de la década de 1950, los experimentos posteriores parecieron demostrar los plazos del placer inducido por electrodos. Habiendo descartado la posibilidad de que los electrodos estuvieran creando sentimientos artificiales de saciedad, un estudio de 1971 aparentemente demostró que el placer de los electrodos podría de hecho superar a otros impulsos,y hacerlo hasta el punto de la autoinanición.

Se corrió la voz rápidamente. A lo largo de la década de 1960, se realizaron experimentos idénticos en otros animales más allá de la humilde rata de laboratorio: desde cabras y conejillos de indias hasta peces de colores. Incluso se corrió el rumor de un delfín al que se le había permitido autoestimularse y, después de ser "dejado en una piscina con el interruptor conectado", se había "deleitado hasta la muerte después de una orgía de placer de toda la noche".

La espeluznante muerte por convulsión de este delfín fue, de hecho, más probablemente causada por la forma en que se insertó el electrodo: con un martillo. El científico detrás de este experimento fue el extremadamente excéntrico J C Lilly,inventor del tanque de flotación y profeta de la comunicación entre especies, que también había convertido a los monos en cabezas de alambre. Había informado, en 1961, de un mono particularmente bullicioso que tenía sobrepeso por inactividad intoxicada después de preocuparse por tirar de su palanca, repetitivamente, para choques de placer.

Un investigador (que había trabajado en el laboratorio de Olds) preguntó si un "animal más inteligente que la rata" "mostraría el mismo comportamiento desadaptativo". Los experimentos con monos y delfines habían dado alguna indicación en cuanto a la respuesta.

Pero, de hecho, ya se habían realizado una serie de experimentos dudosos en humanos.
Aprendizaje por refuerzo profundo en acción.

Cabezales de alambre humanos

Robert Galbraith Heath sigue siendo una figura muy controvertida en la historia de la neurociencia. Entre otras cosas, realizó experimentos que involucraban la transfusión de sangre de personas con esquizofrenia a personas sin la afección, para ver si podía inducir sus síntomas (Heath afirmó que esto funcionó, pero otros científicos no pudieron replicar sus resultados). También puede haber estado involucrado en turbios intentos de encontrar usos militares para electrodos cerebrales profundos.

Desde 1952, Heath había estado registrando respuestas placenteras a la estimulación cerebral profunda en pacientes humanos a los que se les habían instalado electrodos debido a enfermedades debilitantes como la epilepsia o la esquizofrenia.

Durante la década de 1960, en una serie de experimentos cuestionables, a los sujetos implantados con electrodos de Heath, llamados anónimamente "B-10" y "B-12", se les permitió presionar botones para estimular sus propios centros de recompensa. Informaron sentimientos de placer extremo y compulsión abrumadora de repetir. Un periodista comentó más tarde que esto convirtió a sus sujetos en "zombis". Un sujeto reportó sensaciones "mejores que el sexo".

En 1961, Heath asistió a un simposio sobre estimulación cerebral, donde otro investigador,José Delgado,había insinuado que los electrodos de placer podrían usarse para "lavar el cerebro" a los sujetos, alterando sus inclinaciones "naturales". Delgado más tarde interpretaría al matador y lo demostraría rimbombantemente pacificando un toro implantado. Pero en el simposio de 1961 sugirió que los electrodos podrían alterar las preferencias sexuales.

Heath se inspiró. Una década más tarde, incluso trató de utilizar la tecnología de electrodos para "reprogramar" la orientación sexual de un paciente homosexual masculino llamado "B-19". Heath pensó que la estimulación con electrodos podría convertir a su sujeto al "entrenar" el cerebro de B-19 para asociar el placer con estímulos "heterosexuales". Se convenció a sí mismo de que funcionaba (aunque no hay evidencia de que lo hiciera).

A pesar de ser ética y científicamente desastroso, el episodio, que finalmente fue recogido por la prensa y condenado por los activistas por los derechos de los homosexuales, sin duda moldeó en gran medida el mito de las cabezas de alambre: si puede "hacer que un hombre gay sea heterosexual" (como creía Heath), ¿qué no puede hacer?

Cascos de hedonismo

A partir de aquí, la idea se afianzó en una cultura más amplia y el mito se extendió. En 1963, el prolífico escritor de ciencia ficción Isaac Asimov ya estaba extruyendo consecuencias preocupantes de los electrodos. Temía que pudiera conducir a una "adicción para poner fin a todas las adicciones", cuyos resultados son"angustiantesde contemplar".

En 1975, los artículos de filosofía usaban electrodos en experimentos mentales. Un periódico imaginaba "almacenes" llenos de personas, en cunas, conectadas a "cascos de placer", experimentando felicidad inconsciente. Por supuesto, la mayoría argumentaría que esto no satisfaría nuestras "necesidades más profundas". Pero, preguntó el autor, "¿qué pasa con un "casco de súper placer"? ¿Uno que no solo ofrece "gran placer sensual", sino que también simula cualquier experiencia significativa, desde escribir una sinfonía hasta conocer a la divinidad misma? Puede que no sea realmente real, pero "parecería perfecto; la apariencia perfecta es lo mismo que ser".

El autor concluyó: "¿Qué hay que objetar en todo esto? Seamos realistas: nada".

La idea de que la especie humana abandonara la realidad en busca de placeres artificiales se adía rápidamente a través de la ciencia ficción. El mismo año que las insinuaciones de Asimov, en 1963, Herbert W. Franke publicó su novela "La jaula de orquídeas".

Predice un futuro en el que las máquinas inteligentes han sido diseñadas para maximizar la felicidad humana, pase lo que pase. Cumpliendo con su deber, las máquinas reducen a los humanos a manchas de carne indiscriminadas, eliminando todos los órganos innecesarios. Muchos apéndices, después de todo, solo causan dolor. Eventualmente, todo lo que queda de la humanidad son centros de placer incorpóreos, incapaces de experimentar otra cosa que no sea la dicha homogénea.

A partir de ahí, la idea se filtró a través de la ciencia ficción. Desde la historia de Larry Niven de 1969 "Muerte por éxtasis", donde se acuñó por primera vez la palabra "cabeza de alambre", hasta Mindkillerde Spider Robinson de 1982, cuyo lema es "Placer, es la única forma de morir".
Experimentos de autoestimulación.

Estímulos supernormales

Pero los humanos ni siquiera necesitamos implantar electrodos invasivos para hacer que nuestras motivaciones se desvíen. A diferencia de los roedores, o incluso los delfines,somos excepcionalmente buenos para alterar nuestro medio ambiente. Los humanos modernos también son buenos para inventar, y beneficiarse de, productos artificiales que son anormalmente atractivos (en el sentido de que nuestros antepasados nunca habrían tenido que resistirse a ellos en la naturaleza). Fabricamos nuestras propias formas de distraernos.

Casi al mismo tiempo que los experimentos de Olds con las ratas, el biólogo ganador del Nobel Nikolaas Tinbergen estaba investigando el comportamiento animal. Se dio cuenta de que algo interesante sucedía cuando un estímulo que desencadena un comportamiento instintivo se exagera artificialmente más allá de sus proporciones naturales. La intensidad de la respuesta conductual no se descuida a medida que el estímulo se vuelve más intenso y artificialmente exagerado, sino que se vuelve más fuerte: incluso hasta el punto de que la respuesta se vuelve dañina para el organismo.

Por ejemplo, dada la opción entre un huevo falsificado más grande y más irregular y el real, Tinbergen descubrió que las aves preferían las falsificaciones hiperbólicas a costa de descuidar a su propia descendencia. Se refirió a tales falsificaciones preternaturalmente atractivas como "estímulos sobrenormales".

Algunos, por lo tanto, se han preguntado: ¿podría ser que, viviendo en un mundo modernizado y manufacturado,repleto de comida rápida y pornografía, la humanidad haya comenzado a renunciar de manera similar a su propia resiliencia en lugar de la conveniencia sobrenormal?

Viejos temores

A medida que la tecnología hace que los placeres artificiales estén más disponibles y atractivos, a veces puede parecer que están superando la atención que asignamos a los impulsos "naturales" necesarios para la supervivencia. La gente a menudo señala la adicción a los videojuegos. Perseguir compulsiva y repetitivamente tales recompensas, en detrimento de la salud, no es muy diferente de la IA que gira en círculo en Coastrunner. En lugar de lograr cualquier "objetivo genuino" (completar la pista de carreras o mantener una condición física genuina), uno cae en la trampa de acumular alguna medida defectuosa de ese objetivo (acumular puntos o placeres falsos).

Pero la gente ha estado en pánico por este tipo de fatalidad de placer mucho antes de que cualquier IA fuera entrenada para jugar e incluso mucho antes de que los electrodos fueran empujados a los cráneos de los roedores. En la década de 1930, el autor de ciencia ficción Olaf Stapledon escribía sobre el colapso civilizatorio provocado por"escutelarias"que generan éxtasis "ilusorios" por "estimulación directa" de "centros cerebrales".

Sin embargo, la idea es aún más antigua. Thomas ha estudiado las innumerables formas en que las personas en el pasado han temido que nuestra especie pueda estar sacrificando la longevidad genuina por placeres o conveniencias a corto plazo. Su libro X-Risk: How Humanity Discovered its Own Extinction explora las raíces de este miedo y cómo se afianzó por primera vez en la Gran Bretaña victoriana: cuando la magnitud de la industrialización, y la creciente dependencia de la humanidad de los artificios artificiales, se hicieron evidentes por primera vez.

Crustáceos carnales

Habiendo digerido el clásico de Darwin de 1869,el biólogo Ray Lankester decidió proporcionar una explicación darwiniana para los organismos parásitos. Se dio cuenta de que los ancestros evolutivos de los parásitos a menudo eran más "complejos". Los organismos parásitos habían perdido características ancestrales como extremidades, ojos u otros órganos complejos.

Lankester teorizó que,debido a que el parásito se quita de su huésped, pierden la necesidad de valerse por sí mismos. Aprovechando los procesos corporales del huésped, sus propios órganos, para la percepción y el movimiento, se atrofian. Su ejemplo favorito fue un percebe parásito, llamado Sacculina, que comienza su vida como un organismo segmentado con una cabeza demarcada. Sin embargo, después de adherirse a un huésped, el crustáceo "retrocede" en una mancha amorfa y sin cabeza, minando la nutrición de su huésped como el cabezal de cable se conecta a la corriente.

Para la mente victoriana, fue un paso corto para conjeturar que, debido a los crecientes niveles de comodidad en todo el mundo industrializado, la humanidad podría estar evolucionando en la dirección del percebe. "Tal vez todos estamos a la deriva, atendiendo a la condición de percebes intelectuales", reflexionóLankester.

De hecho, no mucho antes de esto, el satírico Samuel Butler había especulado que los humanos, en su búsqueda precipitada de la conveniencia automatizada, se estaban marchitando en nada más que una " especiede parásito" sobre sus propias máquinas industriales.

Estímulos supernormales.

Verdadero nirvana

En la década de 1920, Julian Huxley escribió un breve poema. Exploró jovialmente las formas en que una especie puede "progresar". Los cangrejos, por supuesto, decidieron que el progreso era lateral. Pero, ¿qué pasa con la tenia? Escribió:

Las tenias darwinianas, por otro lado,

están

de acuerdo en que el progreso

es una pérdida de cerebro, y todo eso hace que sea difícil para los gusanos alcanzar el verdadero Nirvana: péptico, puro y grandioso.

El temor de que pudiéramos seguir a la tenia estaba algo extendido en la generación de entreguerras. El propio hermano de Huxley, Aldous, proporcionaría su propia visión del potencial distópico para los placeres inducidos farmacéuticamente en su novela de 1932 Un mundo feliz.

Un amigo de los Huxley, el genetista y futurólogo británico-indio J B S Haldane también se preocupó de que la humanidad pudiera estar en el camino del parásito: sacrificando la dignidad genuina en el altar de la facilidad automatizada, al igual que los roedores que más tarde sacrificarían la supervivencia por choques de placer fáciles.

Haldane advirtió: "Los antepasados [de] los percebes tenían cabezas", y en la búsqueda de la amabilidad, "el hombre puede perder fácilmente su inteligencia". Este miedo en particular realmente nunca ha desaparecido.

Por lo tanto, la noción de que la civilización descarrila a través de la búsqueda de placeres falsos, en lugar de una longevidad genuina, es antigua. Y, de hecho, cuanto más antigua es una idea, y cuanto más obstinadamente recurrente es, más debemos tener cuidado de que sea una idea preconcebida en lugar de algo basado en la evidencia. Entonces, ¿hay algo en estos temores?

En una era de medios algorítmicos cada vez más llamativos, puede parecer que fingir señales de aptitud física a menudo produce más éxito que perseguir lo real. Al igual que los pájaros de Tinbergen, preferimos el artificio exagerado al artículo genuino. Y los sexbots ni siquiera han llegado todavía.

Debido a esto, algunos expertos conjeturan que el "colapso de la cabeza de alambre" bien podría amenazar a la civilización. Nuestras distracciones solo van a llamar más la atención, no menos.

Ya en 1964, el futurólogo polaco Stanisław Lem conectó las ratas de Olds con el comportamiento de los humanos en el mundo consumista moderno, señalando el "cine", la "pornografía" y "Disneylandia". Conjeturó que las civilizaciones tecnológicas podrían aislarse de la realidad, convirtiéndose en "enquistadas" dentro de sus propias simulaciones de placer virtual.
Ilustración de un artículo de James Olds de 1970: 'Centros de placer en el cerebro'. Ingeniería y Ciencias, 33 (7). págs. 22-31. Crédito: Caltech Magazine, CC BY-NC

Alienígenas adictos

Lem, y otros desde entonces, incluso han aventurado que la razón por la que nuestros telescopios no han encontrado evidencia de civilizaciones alienígenas espaciales avanzadas es porque todas las culturas avanzadas, aquí y en otros lugares, inevitablemente crean alternativas virtuales más placenteras a la exploración del espacio exterior. La exploración es difícil y arriesga, después de todo.

En el apogeo contracultural de la década de 1960, el biólogo molecular Gunther Stent sugirió que este proceso ocurriría a través de la "hegemonía global de las actitudes beat". Haciendo referencia a los experimentos de Olds, se ayudó a sí mismo a la especulación de que el uso de drogas hippies era el preludio de las civilizaciones wireheading. En una conferencia de 1971 sobre la búsqueda de extraterrestres, Stent sugirió que, en lugar de expandirse valientemente hacia afuera, las civilizaciones colapsan hacia adentro en una felicidad meditativa e intoxicada.

En nuestro propio tiempo, tiene más sentido que las partes interesadas señalen al consumismo, las redes sociales y la comida rápida como los culpables del colapso potencial (y, por lo tanto, la razón por la que ninguna otra civilización se ha extendido visiblemente por toda la galaxia). Cada época tiene sus propias ansiedades.

Entonces, ¿qué hacemos?

Pero es casi seguro que estos no son los riesgos más apremiantes a los que nos enfrentamos. Y si se hace bien,las formas de wireheading podrían hacer accesibles vistas incalculables de alegría, significado y valor. No debemos prohibirnos estos picos antes de sopesar todo.

Pero hay una verdadera lección aquí. Hacer que los sistemas complejos adaptativos, ya sean cerebros, IA o economías, se comporten de manera segura y bien es difícil. Anders trabaja precisamente en resolver este enigma. Dado que la civilización misma, en su conjunto, es un sistema adaptativo tan complejo, ¿cómo podemos aprender sobre los modos de falla inherentes o inestabilidades, para que podamos evitarlos? ¿Quizás el "wireheading" es una inestabilidad inherente que puede afectar a los mercados y los algoritmos que los impulsan, tanto como la adicción puede afectar a las personas?

En el caso de la IA, ahora estamos sentando las bases de tales sistemas. Una vez que una preocupación marginal, un número creciente de expertos están de acuerdo en que lograr una IA más inteligente que la humana puede estar lo suficientemente cerca en el horizonte como para plantear una preocupación seria. Esto se debe a que debemos asegurarnos de que sea seguro antes de este punto, y descubrir cómo garantizar esto en sí mismo llevará tiempo. Sin embargo, sigue habiendo un desacuerdo significativo entre los expertos sobre los plazosy cuán apremiante podría ser este plazo.

Si se crea una IA de este tipo, podemos esperar que pueda tener acceso a su propio "código fuente", de modo que pueda manipular su estructura motivacional y administrar sus propias recompensas. Esto podría probar un camino inmediato hacia el comportamiento de la cabeza de cable, y hacer que tal entidad se convierta, efectivamente, en un "súper adicto". Pero a diferencia del adicto humano, puede que no sea el caso que su estado de felicidad se acose a un estado improductivo de estupor o embriaguez.

El filósofo Nick Bostrom conjetura que tal agente podría dedicar toda su productividad sobrehumana y astucia a "reducir el riesgo de interrupción futura" de su preciosa fuente de recompensa. Y si juzga incluso una probabilidad distinta de cero para que los humanos sean un obstáculo para su próxima solución, bien podríamos estar en problemas.

Dejando a un lado los escenarios especulativos y del peor de los casos, el ejemplo con el que comenzamos, de la IA de la pista de carreras y el bucle de recompensa, revela que el problema básico ya es un problema del mundo real en los sistemas artificiales. Debemos esperar, entonces, que aprendamos mucho más sobre estas trampas de la motivación y cómo evitarlas, antes de que las cosas se desarrollen demasiado. A pesar de que tiene orígenes humildes, en el cráneo de una rata albina y en poemas sobre tenias, el "cabeza de alambre" es una idea que probablemente solo se vuelva cada vez más importante en el futuro cercano.

Comentarios

Entradas populares