Alex Reid / Vivir en planicies digitales: Ensamblajes de visión de ordenador

Estética, Filosofía

Este artículo explora la visión por ordenador no sólo en términos de su uso con máquinas «inteligentes», como los vehículos autónomos, sino también en términos más amplios de la visión humana cotidiana mediada digitalmente, como la que se experimenta a través de los teléfonos inteligentes. Basándome en la teoría del ensamblaje y la arqueología radical de los medios de comunicación, describo los procesos tecnológicos que enlazan ensamblajes espacio-temporales materialmente diferentes para producir una condición posthumana de la visión por ordenador tipificada por lo que Wolfgang Ernst denomina el «impulso epistemogénico» de las «configuraciones tecno-matemáticas». Las ontologías planas de Manuel DeLanda resultan útiles aquí para describir cómo interactúan los ensamblajes que operan en diferentes espacio-tiempos. A continuación, recurro al estrato tecno-semiológico de Deleuze y Guatarri, concretamente a su análisis de la superlinealidad espacio-temporal del estrato, para articular una capa digital-calculativa emergente. Sostengo que para entender los conjuntos de visión por ordenador no basta con establecer descripciones técnicas junto a una crítica cultural e ideológica, sino que también es necesario un análisis integrado de las funciones que desempeñan los no humanos digitales en la producción de un nuevo régimen visual con nuevas capacidades y deseos. La capacidad compartida entre humanos y no humanos de la visión por ordenador desplaza la vista de los conjuntos biológicos y lingüísticos de los humanos a conjuntos digitales en los que la visión se vuelve calculable y sujeta a modificaciones algorítmicas. El resultado no son sólo imágenes digitalmente compuestas y proyectadas, sino también nuevos medios de producción, organización e identidad.

[1] En septiembre de 2021, el New York Times informó del asesinato del principal científico nuclear iraní, Mohsen Fakhrizadeh (Bergman y Fassihi). El asesinato fue inusual en su dependencia de «la prueba de debut de un francotirador computarizado de alta tecnología, equipado con inteligencia artificial y ojos de múltiples cámaras, operado vía satélite y capaz de disparar 600 balas por minuto». El asesinato de Fakhrizadeh demuestra literalmente la vanguardia de la visión por ordenador. Como viene ocurriendo desde hace tiempo a la hora de comprender el alcance de los complejos militar-industrial y militar-entretenimiento, no nos queda más remedio que considerar la conexión entre esta capacidad de acción a distancia y los dispositivos más cotidianos de visión, interacción y visualización por ordenador. Además de los juicios morales, éticos o políticos que podamos hacer sobre este asesinato concreto, la acción esboza algunos de los límites pragmáticos contemporáneos de los espacios en los que los humanos y las máquinas pueden ver o actuar. Mañana o el año que viene, los límites serán seguramente diferentes.

[2] Durante más de sesenta años, el campo de la visión por ordenador ha tratado de modelar la visión humana, enseñar a los ordenadores a ver como los humanos, aumentar la visión humana y, en última instancia, superar los límites visuales de los humanos. Desde una perspectiva posthumana, la visión por ordenador también podría describirse como el desarrollo de una capacidad visual compartida entre humanos y no humanos. Es decir, somos copartícipes del ensamblaje de un tipo de visión que incorpora materialidad, biología, cultura, codificación y cálculo (estas cinco cosas están siempre entrelazadas). Estos ensamblajes impregnan nuestras vidas en el selfie cotidiano y el vídeo en línea; las tecnologías militares, policiales y de vigilancia; el arte y el cine digitales; las aplicaciones industriales y científicas; los dilemas éticos de los deepfakes y otras noticias falsas; y las tecnologías emergentes, desde la RA y la RV hasta los vehículos autónomos y los robots. Como exploro en este ensayo, el ensamblaje humano-no humano de la visión por ordenador es más que una continuación de la sociedad de la información del siglo XX o de lo que Lev Manovich denomina nuestra «cultura del software» (38). La capacidad compartida entre humanos y no humanos de la visión por ordenador desplaza la vista de los conjuntos biológicos y lingüísticos de los humanos a conjuntos digitales en los que la visión se vuelve calculable y sujeta a modificaciones algorítmicas. El resultado no son sólo imágenes digitalmente compuestas y proyectadas, sino también nuevos medios de producción, organización e identidad.

[3] En general, reconocemos que la visión humana construye el espacio y el tiempo tanto como representa una realidad independiente y que tales construcciones implican deseo e ideología. Reconocemos que las tecnologías de la visión también construyen espacio y tiempo. Mientras que la visión de cualquier tipo comienza con la entrada de ondas electromagnéticas (luz), el territorio espaciotemporal subsiguiente de lo que se percibe puede ensamblarse a partir de una gama de materiales dispares con resultados muy diferentes. Si, como señala Walter Benjamin, la cámara cinematográfica nos introdujo en la «óptica inconsciente».[1] ¿cómo podríamos describir los resultados de la visión por ordenador? (237) Es evidente que la escala espacio-temporal de los cálculos que se ejecutan a través de los circuitos de una placa base es muy diferente de la escala del tiempo y el espacio humanos conscientes. Sin embargo, el espacio-tiempo de las tecnologías digitales no es simplemente más pequeño o más rápido que el espacio-tiempo biológico. La visión por ordenador produce nuevas relaciones espaciotemporales en las que participamos con tanta seguridad como el telescopio cambió nuestra relación con las estrellas. Pero, ¿cómo caracterizar estas nuevas relaciones? Combinando la arqueología radical de los medios y la teoría del ensamblaje, conecto lo que Wolfgang Ernst denomina el «impulso epistemogénico» de las tecnologías digitales con el relato ontológico plano de Manuel DeLanda sobre cómo se entrecruzan los ensamblajes que funcionan a diferentes escalas espaciotemporales para describir estos procesos técnicos y sus intersecciones con los usuarios humanos.

[4] Aunque las tecnologías de visión por ordenador pueden encontrarse en infinidad de aplicaciones especializadas, también son tan habituales como los smartphones. Con casi cuatro mil millones de usuarios en todo el mundo, los teléfonos inteligentes impulsan la vanguardia de las tecnologías de consumo. Pantallas táctiles capacitivas proyectadas, pantallas OLED, sensores de luz con cámara CMOS, lidar y procesadores gráficos integrados son sólo algunos de los elementos de visión por ordenador de los últimos smartphones. El examen de aplicaciones especializadas concretas revelaría otras dimensiones de la visión por ordenador pero, en mi opinión, el smartphone demuestra un equilibrio entre las capacidades atípicas de la visión por ordenador y las exigencias materiales de ofrecer esas capacidades a miles de millones de usuarios humanos (o, al menos, tal y como ese equilibrio está optimizado por los objetivos capitalistas). En resumen, el smartphone es la interfaz a través de la cual la mayoría de los humanos experimentan la visión por ordenador. Aunque tengo en cuenta el funcionamiento técnico específico de los componentes de los teléfonos inteligentes, mi interés se centra en los ensamblajes formados entre los teléfonos inteligentes y los seres humanos en la formación de una capacidad compartida de visión por ordenador. En última instancia, esa capacidad compartida pasa a través de la pantalla plana del smartphone, que es donde las producciones técnicas del smartphone se encuentran con los usuarios humanos.

[Como exploro aquí, la pantalla plana del smartphone es una realización técnica de las ontologías planas de DeLanda, del mismo modo (y con advertencias y limitaciones similares) que el hipertexto realizó el rizoma. La ontología plana describe una relación no jerárquica y no determinista entre dos o más conjuntos que operan a diferentes escalas espaciotemporales y sirve de intersección a través de la cual pueden viajar fuerzas e información. Es decir, la pantalla plana proporciona una retroalimentación bidireccional tanto para el ser humano como para la máquina, sin la cual no podrían formarse ensamblajes de visión por ordenador. Los procesos tecnológicos digitales que producen imágenes de pantalla plana presentan una nueva articulación del tiempo y la historia que diverge del movimiento y la medición continuos que caracterizan el cronometraje analógico y la historiografía. Entre estos ensamblajes se encuentran los usuarios humanos y las comunidades que formamos a través y con nuestras pantallas.

[6] Aunque estos métodos producen ideas útiles, las preocupaciones comunes con las ontologías planas sugieren que borran las relaciones de poder político e ignoran la historia. Rosi Braidoitti escribe: «La fuerza política de la interconexión relacional entre las diferentes entidades del mundo es negada por la ontología plana defendida por Latour y sus defensores de la ontología objetual (Harman 2014)… ninguna reivindicación de la igualdad entre actores humanos y no humanos, que ANT ha expresado tan explícitamente, puede compensar la falta de una epistemología que haga justicia a las estructuras de poder de los sujetos contemporáneos» (56).[2] La asociación de Latour con la ontología plana siempre me ha parecido extraña. No conozco ningún caso en el que utilice el término. Su argumento a favor de la simetría, que podría malinterpretarse como similar, no tiene nada que ver con esto. Como escribe Latour, «ANT no es, repito, no es, el establecimiento de una absurda ‘simetría entre humanos y no humanos’. Ser simétrico, para nosotros, significa simplemente no imponer a priori alguna asimetría espuria entre la acción intencional humana y un mundo material de relaciones causales» (76). Del mismo modo, desde la perspectiva ontológica orientada al objeto (donde el término se utiliza aunque no necesariamente se adopta sin crítica), la ontología plana afirma que «todas las cosas existen por igual, pero no existen por igual» (Bogost 11; énfasis en el original). Como explicaré más adelante, las posturas de la ANT y la OOO guardan una modesta relación con la ontología plana de DeLanda, pero ninguna de estas posturas afirma que no existan diferencias histórico-materiales entre los humanos y los no humanos. Por el contrario, particularmente en los casos de DeLanda y Latour, sostienen que todas las diferencias entre humanos y no humanos son materiales e históricas en lugar de haber sido creadas a priori por algún creador divino que construyó jerarquías esenciales fuera de los reinos del espacio y el tiempo (que, por lo que puedo imaginar, es la única alternativa a afirmar que estas diferencias son materiales e históricas).

[7] Dicho esto, como discuto aquí, el descentramiento radical de los humanos por parte del nuevo materialismo puede dificultar la reconexión con las preocupaciones humanas. En el caso de DeLanda, esta dificultad surge de su falta de atención al deseo-producción. El deseo-producción, aunque no es antropocéntrico en sí mismo, es la fuerza que anima los ensamblajes (al menos para Deleuze y Guattari). Desde esta perspectiva, Braidotti identifica la necesidad de una fuerza vibrante «impulsada por el deseo ontológico de expresar su libertad más íntima» (47). Sin embargo, este deseo no es antropocéntrico. Por el contrario, surge en las relaciones entre humanos y no humanos: «[e]sta comprensión de la materia anima la composición de los sujetos posthumanos del conocimiento como incrustados, encarnados y, sin embargo, fluyendo en una red de relaciones con otros humanos y no humanos. La subjetividad posthumana es un conjunto impuesto de organismos zoe-lógicos, geológicos y tecnológicos; es un ensamblaje zoe/geo/techno» (47). En este ensamblaje zoe/geo/tecnológico, podemos ver los estratos de Deleuze y Guattari, todos ellos activados por el deseo-producción, adaptados en el nuevo materialismo/posthumanismo de Braidotti. En conjunto, añadir estos estratos y el deseo-producción a métodos ontológicos planos y arqueológicos mediáticos radicales facilita el tratamiento de las preocupaciones políticas y éticas de una visión informática humana-no humana compartida sin reafirmar el antropocentrismo.

El espacio-tiempo de las ontologías planas

[8] El origen de la ontología plana es fácil de rastrear hasta la Ciencia Intensiva y la Filosofía Virtual de Manuel DeLanda, aunque su uso posterior se vuelve más complicado.[3] DeLanda emplea el término en su exploración de la individuación biológica. Mientras que Darwin proporciona un punto de partida materialista histórico para la evolución, DeLanda señala que «la idea de que las especies son individuos, no clases, sólo ha ganado terreno recientemente (y todavía de forma controvertida)» (Intensivo 46).[4] A diferencia de la explicación tipológica convencional en la que yo soy un individuo, que es un tipo de homo sapiens sapiens, que es un tipo de homínido, etc., cada uno de estos «tipos» es en cambio otro individuo, sólo que a una escala espaciotemporal diferente. DeLanda escribe: «Hay que destacar una consecuencia filosófica de esta nueva concepción de las especies: mientras que una ontología basada en las relaciones entre tipos generales e instancias particulares es jerárquica, y cada nivel representa una categoría ontológica diferente (organismo, especie, género), un planteamiento en términos de partes interactuantes y enteros emergentes conduce a una ontología plana, hecha exclusivamente de individuos únicos y singulares, diferentes en escala espaciotemporal pero no en estatus ontológico» (47). En otras palabras, cada ser humano forma parte de una especie, que también es un individuo con cualidades emergentes que difieren de las de las partes individuales (es decir, los seres humanos reales) que la componen. En otras palabras, la especie existe desde hace milenios y se extiende por todo el mundo, mientras que yo no. Este ejemplo biológico de las relaciones no jerárquicas (es decir, planas) entre conjuntos que operan a diferentes escalas espaciotemporales sirve como herramienta conceptual útil para abordar las relaciones entre otros conjuntos con diferencias espaciotemporales.

[9] En ausencia de relaciones jerárquicas esenciales, las ontologías planas (y la teoría del ensamblaje más amplia de la que forman parte) investigan las relaciones espacio-temporales entre los ensamblajes en términos de historia material. Es decir, por seguir con el ejemplo biológico, si mi humanidad individual no es una esencia que me viene dada por mi situación dentro de mi especie, que obtiene sus cualidades esenciales de una «ley natural», una divinidad o algo similar, entonces la relación biológica entre yo, otros humanos y nuestra especie sólo puede describirse como histórica. Un examen superficial de los temas básicos o incluso de los títulos de las obras de DeLanda, como La guerra en la era de las máquinas inteligentes, Mil años de historia no lineal y Una nueva filosofía de la sociedad, revelaría un interés explícito por los temas sociales y políticos. De hecho, una parte significativa del trabajo que realizan la ontología plana y la teoría del ensamblaje consiste en dar cuenta de la emergencia material-histórica y el funcionamiento de las relaciones de poder socioculturales y las estructuras económicas. Las dinámicas no lineales no sólo forman parte de la teoría de la historia de DeLanda, sino del nuevo materialismo en general. Al igual que las ontologías planas, la historia no lineal describe conjuntos que operan a diferentes escalas espaciotemporales e interactúan de forma no jerárquica. Por ejemplo, se consideraba que las escalas espaciotemporales geológica y climatológica, al menos antes del Antropoceno, operaban más allá de la capacidad de afectación de los conjuntos sociales, aunque es evidente que nos afectaban. Sin embargo, la relación entre el fuego del carbón, las chimeneas, los motores de los coches y el clima global, con el consiguiente impacto del cambio climático en una serie de actividades humanas que van desde las granjas a las ciudades costeras, es un ejemplo demasiado familiar de procesos históricos no lineales en funcionamiento.

[10] La historia material no lineal del cambio climático es más que un buen ejemplo del concepto: es una importante intersección entre la visión por ordenador y las preocupaciones ético-políticas. La climatología contemporánea es imposible sin la visión informática de las imágenes por satélite, los modelos digitales y las simulaciones. Si, como escribe Bradiotti, las humanidades medioambientales, junto con las humanidades digitales y los estudios sobre medios de comunicación, son cuestiones centrales de las «posthumanidades críticas», entonces su intersección es crucial (116). Geology of Media, de Jussi Parikka, es uno de los ejemplos más reconocidos de esa intersección. Como él mismo describe, esas conexiones estaban latentes en el interés de Foucault por una arqueología del conocimiento, que inspiró a Kittler y a la arqueología de los medios, y en la teoría del ensamblaje geológico de Deleuze y Guattari. Sigo aquí una línea similar y afirmo que las ontologías planas trazan conexiones a través de estos diversos ensamblajes espacio-temporales, desde los estratos cosmológicos y geológicos hasta el estrato bio/zoo-lógico y el estrato tecno-semiológico del hardware digital y las redes de datos globales. No basta con examinar cada uno de estos estratos por separado. Parikka describe estas conexiones en términos de medianaturas, «un régimen constituido tanto por el trabajo de microorganismos, componentes químicos, minerales y metales como por el trabajo de obreros mal pagados en las minas o en las fábricas de producción de componentes de dispositivos de entretenimiento de alta tecnología, o de personas en Pakistán y China que sacrifican su salud por restos de aparatos electrónicos» (14). Medianatura, al igual que la naturaleza-cultura de Donna Haraway, es un concepto que resulta cada vez más útil cuando se utiliza para investigar contextos particulares, como la visión informática de los ensamblajes de usuarios de smartphones.

[11] Estas nuevas investigaciones materialistas y arqueológicas de los medios de comunicación pueden complementar otros métodos, en lugar de oponerse a ellos. Como sostiene Ernst, «mientras que un análisis más orientado al discurso (como los Estudios de Ciencia y Tecnología) realiza una anatomía crítica de los sesgos culturales, éticos, políticos y económicos subyacentes que actúan en los algoritmos, la arqueología mediática radical, en alianza con la ontología orientada al objeto, se centra en el impulso epistemogénico que deriva del interior de las configuraciones tecno-matemáticas» («Existentes» 4). Puntualmente, si estudiamos cómo funcionan las tecnologías mediáticas, tenemos que estudiar su funcionamiento. Ernst deja abierta la cuestión de cómo se entrecruzan estos análisis arqueológicos y discursivos. Como discuto aquí, un posible enfoque reside en la teoría del ensamblaje y su capacidad ontológica plana para describir las intersecciones entre los ensamblajes que operan a diferentes escalas espacio-temporales sin insistir en una jerarquía particular. Es decir, el funcionamiento algorítmico del hardware informático a microescalas espaciotemporales se cruza con el funcionamiento de conjuntos institucionales más amplios sin que uno determine al otro.

[12] Por supuesto, el espacio y el tiempo forman parte de estos conjuntos. Es decir, los ensamblajes construyen su propio espacio y tiempo de maneras particulares a sus historias materiales. Esta noción puede resultar contraintuitiva en el sentido de que, aunque las escalas espaciotemporales van de lo subatómico a los años luz, tendemos a considerarlas todas parte de un sistema común de medidas. Sin embargo, esas medidas no son más que otro conjunto. No se trata sólo de que el espacio-tiempo de la Tierra o el sistema solar sean inmensos en comparación con las escalas humanas. Sus mecanismos son diferentes. Si el giro y la órbita de los planetas alrededor del sol y del sol alrededor de un núcleo galáctico se producen por la gravedad, entonces nuestros días y años se cruzan con esos ensamblajes. Sin embargo, nuestros calendarios no son producidos por la gravedad. Los producen las observaciones del Sol en el cielo y la creciente capacidad de observación y cálculo, que, por supuesto, nos lleva a un modelo heliocéntrico. Como exploro aquí, los medios digitales construyen el espacio y el tiempo como dimensiones calculables, abriéndolos a manipulaciones algorítmicas. Nuestras pulsaciones y clics pasan a formar parte de un coro oscilante de frecuencias de actualización de pantalla, ciclos de CPU y velocidades de red. En nuestra participación digital-cultural en medianías posthumanas que van de lo cosmológico y geológico a lo digital y tecnológico, no estamos simplemente en medio, en escalas que van de lo más grande y lento a lo más pequeño y rápido; participamos en ensamblajes espacio-temporales ontológicamente diferentes que no anidan unos dentro de otros.

Especulando sobre los pisos Smartphone

[13] Para investigar la construcción medianatural de la óptica algorítmica y, en particular, el papel de las pantallas planas en ella, me ocuparé primero de su funcionamiento técnico. Además de las propias pantallas, la superficie de los teléfonos inteligentes se basa en otras dos innovaciones técnicas de finales del siglo XX: la tecnología de pantalla táctil y la vitrocerámica. La vitrocerámica proporciona una superficie resistente a los golpes. La vitrocerámica contemporánea combina el sólido amorfo del vidrio con la cristalización controlada de la cerámica, y los smartphones son sólo una de las muchas aplicaciones militares, médicas, industriales y comerciales de esta tecnología. Sin la durabilidad de esta superficie, la movilidad práctica y la usabilidad de estos dispositivos se verían gravemente limitadas. Bajo esta capa protectora se encuentra la tecnología de diodos orgánicos emisores de luz (una pantalla OLED), así como la tecnología táctil capacitiva proyectada. A su vez, está el hardware del smartphone que interactúa con la pantalla y una infraestructura de redes eléctricas y de datos que van desde la «última milla» que llega hasta nuestros hogares y bolsillos hasta cables de datos submarinos y servidores en cámaras de temperatura controlada. Estos conjuntos se extienden por la superficie del planeta y llegan hasta los satélites en órbita baja (para el GPS). Toda esta tecnología se ha vuelto mundana para los usuarios de teléfonos inteligentes, a pesar de que las tecnologías que componen la Internet móvil contemporánea no se han ensamblado hasta los últimos 15 años. Alternativamente, siguiendo la geología de los medios de Jussi Parikka, podemos rastrear la historia de los estratos y ensamblajes que producen los más de sesenta metales que se encuentran en un smartphone y las líneas filogenéticas de Deleuze y Guattari que «recorren largas distancias entre ensamblajes de diversas épocas y culturas (de la cerbatana al cañón… de la rueda de oración a la hélice… de la olla al motor…)». (407). Después de todo, ya en la Edad de Bronce podemos encontrar los inicios de los códigos escritos, la metalurgia, la cerámica y la fabricación de vidrio que se unirán para formar el smartphone milenios más tarde.

[14] Estos son algunos de los ensamblajes que se cruzan con la población de smartphones contemporáneos, y cada uno de ellos ofrece una oportunidad para rastrear la aparición de las tendencias y capacidades particulares que exhiben estas tecnologías. Al mismo tiempo, el conjunto de teléfonos inteligentes exhibe su propia existencia espaciotemporal emergente. A diferencia de los relojes mecánicos, que miden el tiempo mediante un muelle enrollado, el hardware informático construye el tiempo a través de las puntuaciones piezoeléctricas de un oscilador de cristal. Como escribe Wolfgang Ernst, «la arqueología de los medios de comunicación nos recuerda principalmente el rígido régimen de frecuencias de la informática digital en sus instancias electrónicas, que cuenta en lugar de cronometrar. La informática digital trata el tiempo como algo discreto, transformando así el tiempo mismo en computación» («Existentes» 14). Y continúa: «A diferencia del tiempo fenomenológico de la experiencia vivida, el procesamiento de datos no es en absoluto un ‘flujo’ continuo, sino un microalmacenamiento y transferencia no lineales» (15). Esta transformación del tiempo en microalmacenamiento computacional no lineal es comparable a la digitalización más familiar del texto y otros medios analógicos. También en este caso se pasa de la medición y variación continuas de una grabación sonora o cinematográfica o de la escritura manuscrita a una serie de puntos discretos muestreados que se ponen a disposición de la manipulación computacional.

[15] En las pantallas planas, la discretización del tiempo se mide por la frecuencia de refresco. En los smartphones actuales, es de 60-120 Hz (es decir, 60-120 veces por segundo), pero pronto alcanzará los 240 Hz (rivalizando con los monitores de ordenador de gama alta). Con cada refresco, cada píxel se carga para emitir un color. El píxel no recibe ni necesita información sobre si forma parte de una foto, un vídeo, una pantalla de fondo, un icono, una animación, un documento de texto o lo que sea. De hecho, los píxeles no reciben mensajes codificados de ningún tipo, sino una carga eléctrica que produce un color. Estos píxeles se componen de subpíxeles azules, rojos y verdes dispuestos en rombo, cada uno de los cuales recibe cargas separadas. Trabajando al revés, esos impulsos eléctricos son enviados a los subpíxeles por unidades de procesamiento gráfico integradas en los smartphones, y esos procesadores gráficos reciben sus instrucciones de CPU que deben manejar diversas entradas, cada una de ellas calculable por las oscilaciones de un cristal. ¿Se ha activado la pantalla táctil? ¿Está el acelerómetro iniciando un cambio de vertical a horizontal? ¿Ha llegado una notificación a través de la red que hay que mostrar? Pero ninguna de estas preguntas importa a la propia pantalla. Así que, como mínimo, aquí se cruzan tres conjuntos: el procesador con sus cadenas binarias, la pantalla con sus píxeles cargados y el ser humano que mira la pantalla. Aunque ni el procesador ni el ser humano den mucha importancia a una serie de píxeles cargados, a través de la interfaz de esos píxeles, ambos entran en un régimen visual compartido. Sin embargo, para que esto ocurra, al menos en un smartphone, también debe emplearse la tecnología de pantalla táctil.

[16] Las tecnologías táctiles capacitivas proyectadas introducen otro cálculo espaciotemporal en la superficie del smartphone. Mientras que la imagen de la pantalla es producida por millones de impulsos eléctricos contados ~60 veces por segundo, nuestros toques son también señales eléctricas que se capturan de forma similar dentro de la espaciotemporalidad calculada del teléfono. Sin esas entradas gestuales, el teléfono no puede hacer mucho más que esperar y permanecer alerta a los mensajes de la red de datos. La pantalla táctil está formada por dos capas, columnas y filas, de sensores capacitivos. Una carga de bajo nivel recorre continuamente la pantalla mientras el teléfono está en funcionamiento. Cuando los usuarios tocan la pantalla con uno o varios dedos, esa carga se interrumpe. Esta tecnología hizo posibles los teléfonos inteligentes y las tabletas actuales, ya que sin ella los usuarios necesitarían los teclados en miniatura conocidos de los teléfonos Blackberry. Las tecnologías táctiles contemporáneas proporcionan una interacción adicional. Estos toques activan algoritmos: abrir aplicaciones, seguir enlaces, teclear letras, dar «me gusta» a publicaciones, realizar compras, etc. En resumen, las tecnologías táctiles convierten la pantalla en una superficie programable por el usuario. Estos toques también entran en la temporalidad calculadora de los medios digitales. Esta cualidad calculadora es probablemente más clara en los videojuegos, donde la sincronización de los toques es a menudo crucial. Sin embargo, cada toque se produce dentro de una cadencia computacional y en una ubicación calculada de la pantalla. Cuando los usuarios pulsan y arrastran un control deslizante virtual para ajustar la calidad de una imagen (el nivel de saturación, por ejemplo), responden a los cambios analógicos de la luz de color proyectada desde la pantalla, pero el teléfono está realizando alteraciones discretas, incrementales y matemáticas en las instrucciones que envía al procesador gráfico, que a su vez varía las cargas eléctricas enviadas a millones de píxeles. Los usuarios ven las ondas de luz que inciden en sus ojos; las pantallas táctiles registran el desplazamiento de la corriente a través de las capas conductoras; la programación y los procesadores del teléfono convierten esa información en ajustes de un archivo de imagen en la memoria RAM y envían instrucciones a la pantalla, y ésta cambia su visualización.

[En algún punto de ese proceso distribuido surge la capacidad de ver una imagen, y a menudo ese proceso distribuido implica a actores que van más allá del usuario y de un único dispositivo. Aunque el píxel no sabe nada de la imagen en la que participa, yo puedo reconocer mi cara en un selfie como diferente del fondo y lo mismo puede hacer mi software de edición fotográfica. Las plataformas de redes sociales en las que publico mi selfie ven algo parecido a lo que ve mi software de edición de imágenes. Me invitan a confirmar que el recuadro que han dibujado alrededor de parte de una imagen es la cara de un amigo o familiar.[5] ¿La identificación de un rostro en una imagen digital es una alucinación? Si es así, es una que compartimos con el software. Por otro lado, si veo esa imagen como un área plana de píxeles coloreados pero por lo demás indiferenciados, ¿es eso una alucinación? Supongo que podríamos preguntar a un Magritte de la IA, que podría decirnos que las representaciones siempre han funcionado así y que, en algunos aspectos, los píxeles no son diferentes de las exposiciones químicas o las pinceladas. En otros aspectos, por supuesto, los píxeles son muy diferentes, ya que se calculan. Como he estado describiendo, los píxeles son los objetivos técnicos de los algoritmos de procesamiento de imágenes. Tanto si esos algoritmos son las herramientas de compresión que crean imágenes GIF y JPG como las redes generativas adversariales (GAN), que se emplean para producir falsificaciones profundas, escriben instrucciones para píxeles. Al mismo tiempo, la respuesta humana a estas imágenes pixeladas proporciona una valiosa retroalimentación a esos algoritmos adaptativos. Estamos co-creando un ensamblaje compartido de visión por ordenador. Sin estas tecnologías, nuestra capacidad de ver y tocar el mundo se vería gravemente mermada. Sin embargo, con la misma certeza, nuestros teléfonos inteligentes tienen pocas posibilidades de ver e interactuar con el mundo sin nuestra participación. Es cierto que sólo el antropomorfismo nos permitiría afirmar que los ordenadores ven o actúan. Pero como sostiene Jane Bennett

un elemento antropomórfico en la percepción puede descubrir todo un mundo de resonancias y semejanzas -sonidos y vistas que resuenan y rebotan mucho más de lo que sería posible si el universo tuviera una estructura jerárquica… [y] catalizar una sensibilidad que encuentra un mundo lleno no de categorías de seres ontológicamente distintos (sujetos y objetos), sino de materialidades compuestas de diversas maneras que forman confederaciones. [y] catalizar una sensibilidad que encuentra un mundo lleno no de categorías de seres ontológicamente distintos (sujetos y objetos), sino de materialidades compuestas de diversas maneras que forman confederaciones. (99)

[18] En este contexto, el antropomorfismo de la visión por ordenador nos permite rastrear el paso de afectos y efectos a través de las conexiones ontológicas planas entre los usuarios humanos y sus ordenadores. Para Bennett, inspirándose en Latour, la representación de los no humanos es tanto un reto científico-empírico como político-cultural, y el antropomorfismo se convierte en una estrategia para reconocer isomorfismos a través de esas divisiones material e históricamente gestionadas. Como escribe, «se ha demostrado que los grupos de neuronas de un cerebro humano, las agrupaciones de edificios de una ciudad y las colonias de mohos de limo siguen reglas organizativas similares» (100). En la visión por ordenador, la «visión» es ya un gesto antropomórfico que reconoce un isomorfismo. Los ordenadores no «ven» como nosotros, pero responden a la misma entrada de ondas de luz y, como los ordenadores y los humanos nos hemos desarrollado juntos, formamos un ensamblaje (aunque Bennett prefiere aquí «confederación») que produce representaciones de un mundo observado empíricamente, pero simultáneamente produce representaciones políticas en la forma en que esas observaciones son necesariamente valoradas y puestas a disposición para el cálculo.

Explotar el estrato digital

[19] Aunque a menudo pasamos de la representación del mundo que hace una cámara a las representaciones y juicios políticos, como cuando se graba a un acusado cometiendo un delito, en términos filosóficos faltan algunos pasos. En Alien Phenomenology, Ian Bogost analiza el uso que hacemos de las metáforas para comprender las experiencias no humanas. Escribe que vincular los sensores de las cámaras con los voltajes, los procesadores, los controladores gráficos y los píxeles de la pantalla «implica cadenas de margaritas fenoménicas, construidas de especulaciones sobre especulaciones a medida que nos adentramos más y más en las extrañas relaciones entre los objetos». El esfuerzo filosófico por vincular tales metáforas no es trivial, y equivale a un complejo entramado de relaciones sensuales entre objetos, cada una de ellas portadora de una forma de metáfora heredada, aunque más débil, con la que representar a su vecina» (81). Como he estado describiendo el paso de un ensamblaje al siguiente de forma lineal, una margarita en cadena es una descripción adecuada. Sin embargo, cualquier ensamblaje tiene múltiples intersecciones con otros y se puede seguir cualquiera de esos caminos. Así, puedo seguir una cadena de margaritas desde la superficie de vitrocerámica de un smartphone hasta la pantalla táctil y las capas OLED que hay debajo, o puedo seguir el proceso de fabricación o las propiedades químicas de las moléculas o la historia de la cerámica o las ciencias de los materiales. Sin embargo, el argumento general de Bogost sigue siendo válido. Existe una relación no determinista, no jerárquica y plano-ontológica entre estos ensamblajes, y las cadenas de margaritas identifican el reto filosófico de moverse a través de los ensamblajes.

[20] Aunque DeLanda toma la decisión de integrar el concepto de estrato de Deleuze y Guattari en su teoría del ensamblaje, los estratos son conceptualmente útiles para abordar este reto.[6] Deleuze y Guattari describen tres estratos principales: el geológico, el biológico y el antropomórfico (aunque siguiendo a Ian Buchanan, prefiero «tecnosemiológico» para el tercer estrato) (Buchanan 28). Entre los estratos existe una progresión histórica lineal, pero cada estrato también afecta y crea condiciones para los demás a través de relaciones no deterministas. Como escribe Buchanan, «‘nosotros’ los humanos dependemos de las propiedades de la tierra para nuestra existencia (geología) y ‘nosotros’ dependemos de las propiedades de nuestros cuerpos para lo que ‘nosotros’ podemos hacer en la tierra (biología), pero ‘nosotros’ constantemente excedemos esos límites en las efusiones de nuestras mentes… la producción de signos (tanto símbolos como lenguaje) permite al tercer estrato traducir a los otros dos y en cierto sentido ir más allá de ellos» (29). Sin embargo, como sugieren las comillas alrededor de «nosotros», hay algo más en este asunto, como ha sido el tema de este ensayo: no somos simple o únicamente «nosotros» los que sobrepasamos estos límites, sino más bien los humanos ensamblados con los no humanos. Deleuze y Guattari así lo reconocen: «El contenido no debe entenderse simplemente como la mano y las herramientas, sino como una máquina técnica social que las preexiste… La expresión no debe entenderse simplemente como el rostro y el lenguaje, o lenguajes individuales, sino como una máquina semiótica colectiva que los preexiste» (63). Teniendo esto en cuenta, el estrato tecnosemiológico no debe considerarse esencial o exclusivamente de o para los humanos, aunque es evidente que participamos en él, como lo hacemos en los estratos geológico y biológico. Desde las tablillas de arcilla hasta los minerales de tierras raras de los smartphones, el estrato geológico ha desempeñado un papel material en el tecnosemiológico, al igual que el biológico, ya que los procesos tecnosemiológicos han tenido que interactuar con la biología humana: los sonidos que podían emitir nuestras voces y oír nuestros oídos; los signos, gestos e imágenes que podían ver nuestros ojos y producir nuestras manos y cuerpos. Con la tecnología digital, también hay que tener en cuenta los estratos cosmológicos, ya que los límites actuales de lo tecnosemiológico chocan con las propiedades de la luz, las partículas subatómicas y los estados cuánticos.

[21] A pesar de las restricciones que lo cosmológico, lo geológico y lo biológico imponen al contenido y la expresión del estrato tecnosemiológico, Deleuze y Guattari identifican la capacidad única del estrato en su temporalidad: «Los signos vocales tienen una linealidad temporal, y es esta superlinealidad la que constituye su desterritorialización específica y los diferencia de la linealidad genética» (62, énfasis en el original). Siguiendo su ejemplo, cuando los humanos desarrollan el habla, pasan del estrato biológico de los ruidos animales que existen dentro de una temporalidad fija a una capacidad para referirse a otros tiempos y espacios. Esta capacidad de traducción espaciotemporal marca el estrato tecnosemiológico y representa «la capacidad del lenguaje, con sus propios datos en su propio estrato, para representar todos los demás estratos y lograr así una concepción científica del mundo» (62). Este acto de representación es otro eslabón de la cadena de estratos y ensamblajes. Sin embargo, la superlinealidad espaciotemporal de los códigos tecnosemióticos permite un nuevo tipo de flexibilidad y reversibilidad. Por ejemplo, esta frase puede revisarse, desplazarse o suprimirse. Como observa Buchanan, «no se puede llegar al significado de una frase u oración de forma aditiva… Podemos ser capaces de adivinar adónde va una frase -como intentan hacer la autocorrección y el autorrelleno de nuestros teléfonos inteligentes, con diversos grados de éxito-, pero incluso teniendo en cuenta las redundancias incorporadas de la sintaxis y la gramática no podemos saber con absoluta certeza dónde acabará» (42). El smartphone es un ejemplo interesante, y sin duda acertado (aunque confesaré que a menudo no estoy seguro de dónde o cómo acabarán mis propias frases, hasta que lo hacen). Sin embargo, el smartphone también apunta a una capa digital emergente que, como sostiene Ernst, introduce una nueva temporalidad calculada. Aunque las máquinas no sean mejores que los humanos a la hora de terminar las frases de los demás, cada vez son más capaces de escribir sus propios guiones. Son capaces de conversar. Nos identifican a nosotros y al mundo que compartimos y producen sonidos, voces, imágenes y vídeos con sentido, incluidas ficciones generadas algorítmicamente como los deepfakes. Hipotéticamente, se puede hacer que cualquier imagen, audio o vídeo parezca y suene como cualquier otra cosa. Es esta capacidad de convertir el tiempo y el espacio en territorios calculables sujetos a intervenciones matemáticas lo que caracteriza la nueva y expandida espaciotemporalidad superlineal del estrato o capa digital-calculable.[7]

[22] Además, la capa digital-calculativa introduce una condición posthumana en la que los humanos están descentrados. Desde los inicios del comportamiento simbólico hasta el siglo XX, era posible argumentar que las máquinas colectivas técnicas, sociales y semióticas requerían la cognición humana directa para funcionar. Los libros no podían escribirse ni leerse a sí mismos ni entre sí. Como escriben Deleuze y Guattari, «Todo está en la cabeza… Lo que intentamos decir es que, en efecto, hay un medio exterior para todo el estrato, que impregna todo el estrato: el medio cerebro-nervioso» (64). Sin embargo, con la llegada del estrato digital-calculatorio, al menos es posible considerar que esta contención dentro del «medio cerebro-nervioso» ya no es así. Aunque no hemos llegado (y puede que nunca lleguemos) al punto de la inteligencia general artificial, la era posthumana se ha conformado por nuestra confrontación con máquinas cada vez más «inteligentes» que operan con mayor independencia de los humanos que las tecnologías anteriores. Esta condición posthumana digital resulta familiar a cualquiera que haya seguido las indicaciones de un algoritmo para conducir o las recomendaciones de un libro. De hecho, la diferencia entre un mapa de carreteras impreso y los asistentes digitales que indican a los conductores cuándo y dónde girar refleja perfectamente los cambios que se producen en nuestras vidas digitales. Seguimos en contacto con estas tecnologías, pero nuestras interacciones con ellas nos introducen en un espacio y un tiempo nuevos.

[23] Nuestra experiencia de la capa digital-calculativa apunta a otra forma en que Deleuze y Guattari describen los estratos. Como observa Buchanan, los estratos nos ayudan a «analizar y explicar el hecho de que la vida cotidiana es experimentada por la mayoría de la gente como multicapa, sin estar necesariamente organizada e interconectada» (48). Por ejemplo, en nuestro trabajo «nos relacionamos con máquinas, nos relacionamos con personas, nos relacionamos con estructuras de mando y horarios, y con toda una serie de otros tipos de insumos y variables» (48). En cuanto a la llegada de la tecnología digital y sus efectos en la vida académica, añade que «La respuesta más interesante y mucho menos sensiblera, sin embargo, sería preguntarse si han aparecido nuevos ensamblajes. ¿Es una conferencia en línea diferente de una conferencia en directo? ¿Es diferente un libro electrónico de uno hecho con árboles?» (49). En términos más generales, la mayoría de la gente diría que tiene una vida digital, una nueva capa, que se cruza con el resto de sus vidas. Tienen identidades digitales, comunidades en línea y amigos. Participan en prácticas semióticas novedosas que incluyen no sólo géneros y formatos mediáticos emergentes, sino también una forma totalmente nueva de creación de significado que surge del análisis algorítmico de los grandes datos a los que cada uno contribuye. Concebida de este modo, la capa digital-calculativa tiene claramente sus propias máquinas colectivas técnicas, sociales y semióticas. Antes, como hicieron Deleuze y Guattari, sólo podíamos hablar de representaciones tecnosemióticas de otros estratos. Los libros, las imprentas, las emisoras de radio y los televisores no podían actuar por sí solos. Sin embargo, al pasar de la tercera revolución industrial (la de la información) de finales del siglo XX a una cuarta revolución industrial (caracterizada por las máquinas inteligentes y la automatización), los ensamblajes formados entre los seres humanos y las tecnologías digitales conectan con esta capa para establecer una nueva espaciotemporalidad superlineal en la que los códigos calculados no se limitan a representar los otros estratos, sino que también producen una nueva materialidad. En nuestra vida cotidiana, este nuevo estrato se manifiesta no sólo en las conexiones permanentes y la disponibilidad de medios y datos y nuestras relaciones sociales mediadas digitalmente, sino también en el régimen algorítmico en desarrollo que organiza nuestras vidas y el orden social más amplio. Volviendo a la cadena de ensamblajes de los teléfonos inteligentes, desde la entrada de luz en la lente de la cámara hasta la salida de luz de la pantalla plana, hay una serie de ensamblajes que se conectan a través de estratos que se mueven por las distintas partes del dispositivo: ondas de luz cosmológicas, ondas de radio y electrones; lentes geológicas, cerámicas y metales; moléculas orgánicas biológicas; y códigos tecnosemiológicos. Ningún estrato sustituye a los demás, pero en la capa digital, una temporalidad calculada superlineal codifica un nuevo régimen visual puntuado por velocidades de red, ciclos de reloj y frecuencias de actualización.

[24] Por significativa que pueda ser la aparición de una capa digital-calculativa, esta explicación tecnológica de estos ensamblajes es incompleta si no se tiene en cuenta el papel de la producción deseante. Buchanan nos recuerda que, en última instancia, los ensamblajes tienen que ver con el deseo y la producción: «Es el deseo el que selecciona los materiales y les confiere las propiedades que tienen en el ensamblaje. Esto se debe a que el propio deseo es productivo» (énfasis en el original, 56). Así pues, estos ensamblajes no deben confundirse con «meros» dispositivos técnicos extremadamente complejos. Si el deseo «se define como un proceso de producción sin referencia a ninguna agencia exterior», como escriben Deleuze y Guattari, entonces no es necesariamente humano (154). En concreto, como también escriben, «la racionalidad, la eficacia, de un ensamblaje, no existe sin las pasiones que el ensamblaje pone en juego, sin los deseos que lo constituyen tanto como él los constituye» (399). Así, concebir la visión por ordenador como un ensamblaje es describir no sólo un dispositivo complejo, sino una máquina productiva que ensambla y es ensamblada por el deseo. Por elusivo que pueda ser el concepto de deseo, sin él existe el peligro de que el nuevo análisis materialista de los medios digitales se convierta en poco más que una descripción imprecisa de funciones técnicas mejor comprendidas por los ingenieros. La arqueología mediática radical ofrece parte de una respuesta a este problema. Ernst escribe: «No hay tecnología que sea puramente ‘digital’, información libre de materia y energía en esencia -al igual que el valor monetario siempre está materializado, ya sea en la moneda, el billete o su equivalente electrónico en la criptodivisa bitcoin. A la materia se le asigna una agencia diferente cuando se informatiza matemáticamente en lugar de simplemente formatearse técnicamente» (Techologos 3). En los ensamblajes de medios digitales, los contenidos y expresiones del estrato tecnosemiológico se cruzan con el estrato geológico donde se graban en la superficie del óxido de silicio, «como materia electrónicamente programable» (2). En este grabado opera el deseo-producción. Al igual que con la moneda, es bastante fácil ver deseos humanos familiares en la creación y uso de los medios digitales, pero, como con el dinero, también es bastante fácil ver deseos fluyendo a través del ensamblaje en lugar de imaginar antropocéntricamente a los humanos como su alfa y omega. En resumen, la reincorporación de los estratos y el deseo-producción en la teoría del ensamblaje proporciona una transición entre el enfoque de una nueva arqueología materialista y radical de los medios de comunicación sobre la epistemogénesis de las configuraciones tecno-matemáticas dentro de los dispositivos digitales y las preocupaciones ético-políticas que Ernst caracteriza como el foco del «análisis orientado al discurso». Es, sin duda, una transición más que una síntesis, un medio para investigar los encuentros ontológicos no jerárquicos, no deterministas y planos en esta cadena de seres.

[25] En resumen, la reintegración de los estratos y la producción deseante en la teoría del ensamblaje proporciona un medio más exhaustivo de investigar el vínculo humano-no humano en la visión por ordenador que el proporcionado por la antropomorfización metafórica en cadena. Aporta la geología de los medios desde los comienzos y finales de las tecnologías como materias primas y, más tarde, como residuos electrónicos, hasta el bucle continuo del ensamblaje en el que los estratos cosmológicos y geológicos forman los impulsos piezoeléctricos que se hacen calculables en la capa digital. La lente de la cámara, como el ojo humano, percibe la luz, pero no puede ver sin alguna intención, algún deseo, ni puede ver sin establecer alguna relación, algún estímulo o intensificación. Es decir, ver es ver algo, aunque sea ver «nada», lo que crea su propio estímulo. Al hacerlo, el ensamblaje de la visión por ordenador hace un bucle a través de los estratos biológicos y la vista humana. En teoría, el objetivo de la inteligencia artificial general puede ser eliminar la deliberación y la acción humanas del bucle de los procesos automatizados. En el caso de los vehículos autónomos, desde cierta perspectiva esto se consigue; el humano no necesita tocar el volante. Por supuesto, el vehículo autónomo no elige su destino. Del mismo modo, desde cierta perspectiva, decimos que el pasajero humano elige el destino, pero ¿en qué sentido elegimos ir al trabajo, hacer la compra el fin de semana o incluso dar un relajante paseo por el campo? También en este caso formamos parte de ensamblajes en bucle a través de estratos y participamos en la producción de deseos. En el supuesto futuro próximo de los vehículos autónomos cotidianos, el trayecto diario al trabajo se convierte en tiempo adicional para la productividad laboral, los viajes de compras se mezclan con ponerse al día en las redes sociales y los trayectos por carretera se convierten en oportunidades para ver la última película taquillera. En otras palabras, los antiguos conductores hacen ahora lo que los demás pasajeros de sus coches llevan haciendo desde hace una década. Por supuesto, para todos esos otros pasajeros esas interacciones se han producido a través de sus teléfonos inteligentes.

[26] El asesinato de Fakhrizadeh proporciona una distinción más marcada entre los deseos humanos y no humanos en competencia y el papel que podrían desempeñar las máquinas inteligentes. Como escribe DeLanda, «en situaciones adversas, verse obligado a tratar a una máquina como un sistema intencional puede considerarse un buen criterio para la inteligencia mecánica. En el caso de las máquinas depredadoras, no sólo tendríamos que luchar contra ellas en el «plano intencional», sino que también podríamos suponer que nos tratarían a nosotros, sus presas, como conjuntos predecibles de creencias y deseos. Se trataría, pues, de un choque de ‘mentes’ o de ‘voluntades racionales'» (Guerra 157). El deseo del Estado de ver y actuar a escala global da forma al desarrollo de la visión por ordenador con tanta seguridad como el deseo corporativo de fábricas robotizadas, vehículos automatizados y drones de reparto: tal es la larga historia del complejo militar-industrial. Es otro recordatorio de la advertencia de Walter Benjamin de que «la destructividad de la guerra demuestra que la sociedad no ha madurado lo suficiente para incorporar la tecnología como su órgano, que la tecnología no se ha desarrollado lo suficiente para hacer frente a las fuerzas elementales de la sociedad» (242). Al mismo tiempo, las capacidades materiales y tecnosemiológicas de los medios digitales tienen sus propias expresiones. Es decir, aunque el Estado pueda desear la capacidad de vigilancia y acción instantáneas, sin errores y globales, existen límites materiales a la mediación digital. Como objetivo potencial de un ataque con drones o de un asesinato robotizado, responder a los deseos demasiado humanos de técnicos militares distantes o de sus responsables políticos es menos útil que predecir las intenciones y capacidades de la «máquina depredadora». Esas predicciones exigen comprender el espacio-tiempo de cálculo de las máquinas digitales y las capacidades que engendran para un conjunto más amplio de visión informática. Nuestros encuentros cotidianos con la visión y la inteligencia informática de consumo son menos conflictivos y quizá incluso simbióticos, pero, a medida que negociamos nuestra participación en estos ensamblajes, también podríamos beneficiarnos de la comprensión de cómo los ensamblajes de visión informática nos atraen hacia nuevos deseos y relaciones espacio-temporales con el mundo.

Obras citadas

Benjamin, Walter. “The Work of Art in the Age of Mechanical Reproduction.” Translated by Harry Zohn, Illuminations, Harcourt, Brace & World, 1968, pp. 217-42.

Bennett, Jane. Vibrant Matter. Duke UP, 2010.

Bergman, Ronen and Farnaz Fassihi. “The Scientist and the A.I.-Assisted, Remote-Control Killing Machine.” The New York Times, 24 September 2021, nytimes.com/2021/09/18/world/middleeast/iran-nuclear-fakhrizadeh-assassination-israel.htm.

Bogost, Ian. Alien Phenomenology, or What It’s Like to Be a Thing. U of Minnesota P., 2012.

Braidotti, Rosi. Posthuman Knowledge. Polity, 2019.

Buchanan, Ian. Assemblage Theory and Method. Bloomsbury, 2021.

DeLanda, Manuel. Assemblage Theory. Edinburgh UP, 2016.

—–. Intensive Science and Virtual Philosophy. Continuum, 2002.

—–. “Ontological commitments.” Speculations: A Journal of Speculative Realism, vol. 4, 2013, pp. 71-73.

—–. A New Philosophy of Society: Assemblage Theory and Social Complexity. Continuum, 2006.

—–. A Thousand Years of Nonlinear History. Zone Books, 1997.

—–. War in the Age of Intelligent Machines. Zone Books, 1991.

De Landa, Manuel, and Graham Harman. The Rise of Realism. Polity, 2017.

Deleuze, Gilles, and Félix Guattari. A Thousand Plateaus: Capitalism and Schizophrenia. Translated by Brian Massumi. U of Minnesota P, 1987.

Ernst, Wolfgang. “Existing in Discrete States: On the Techno-Aesthetics of Algorithmic Being-in-Time.” Theory, Culture & Society, Nov. 2020, doi:10.1177/0263276420966396.

—–. Technologos in Being: Radical Media Archaeology & the Computational Machine. Bloomsbury, 2021.

Harman, Graham. The Quadruple Object. Zero Books, 2011.

Huneman, Philippe, and Denis M. Walsh, eds. Challenging the Modern Synthesis: Adaptation, Development, and Inheritance. Oxford UP, 2017.

Manovich, Lev. Software Takes Command. Bloomsbury, 2013.

Parikka, Jussi. A Geology of Media. University of Minnesota P, 2015.

Notas

  1. Para contextualizar mejor esa frase, Benjamin escribe «la cámara nos introduce en la óptica inconsciente como el psicoanálisis lo hace en los impulsos inconscientes» (237). Llega a esta conclusión, en parte, al reconocer que «al explorar los medios comunes bajo la ingeniosa guía de la cámara, el cine, por un lado, amplía nuestra comprensión de las necesidades que rigen nuestras vidas; por otro, consigue asegurarnos un inmenso e inesperado campo de acción» (236). No se trata simplemente de que la cámara nos muestre el mundo de una manera nueva, la cámara produce un nuevo territorio espaciotemporal que produce nuevo conocimiento y engendra nueva agencia. Dentro del territorio de la cámara, la psicología humana se expresa y revela de forma nueva, pero también lo hacen movimientos políticos más amplios, desde el montaje soviético hasta las multitudes fascistas. Para Benjamin, el primero politizaba el arte, mientras que el segundo convertía la política en estética. La cámara, sin embargo, servía a ambos propósitos. Aquí planteo cuestiones similares. ¿Cómo podríamos describir el territorio espaciotemporal de la visión por ordenador? ¿Qué nuevas condiciones epistemológicas y ontológicas (y por extensión éticas y políticas) nos produce?
  2. Algunos de esos «defensores de la ontología objetual» han afirmado anteriormente que el énfasis deleuziano en la inmanencia que prefiere Braidotti, al que denominan «socavamiento», también crea una ontología indiferenciada y plana, una acusación que Braidotti les devuelve aquí (véase Harman, 7-19). ¿Tiene razón alguno de ellos? ¿Acaso importa? Lo que parece claro es que los filósofos/teóricos no tienden a describir su propio trabajo como incapaz de reconocer diferencias en el mundo o de no ser útil para sus semejantes.
  3. En su conversación con Graham Harman en Rise of Realism, DeLanda dice: «Nunca me había dado cuenta de que la expresión ‘ontología plana’ podía utilizarse en una variedad tan grande de sentidos diferentes. Debería tener más cuidado cuando la uso porque, como usted señala, hay diferentes maneras de aplanar las ontologías» (87). Aquí se refiere a las diferentes maneras de aplanar dentro de los discursos de la filosofía. Por ejemplo, el aplanamiento realizado por el empirismo es bastante diferente al del realismo de DeLanda. Sin embargo, estas variaciones se hacen más pronunciadas más allá de las discusiones filosóficas sobre ontología, como cuando la ontología plana se cruza con las preocupaciones culturales y políticas de la retórica.
  4. La síntesis moderna de la herencia de Mendel y el cambio poblacional de Darwin constituye la base de una teoría unificada de la evolución a principios y mediados del siglo XX. Se ha adaptado con éxito durante el último siglo, aunque «en los últimos años se ha convertido en un lugar común escuchar afirmaciones de que la síntesis moderna debería replantearse por completo (Laland et al., 2014), revisarse o ampliarse (Pigliucci y Müller, 2010)» (Huneman y Walsh, 1). Como explican Huneman y Walsh, «los retos, de un modo u otro, se refieren a la herencia, el desarrollo y la adaptación, y a las relaciones entre ellos» (13). DeLanda se posiciona con quienes piden un replanteamiento más drástico de la síntesis moderna, y esto se refleja en su interés por la biología evolutiva del desarrollo, un campo que se desarrolló en la década de 1990.
  5. El 2 de noviembre de 2021, Meta, la empresa matriz de Facebook, anunció que cerraría el sistema de reconocimiento facial en Facebook, aunque planea seguir utilizando la tecnología y otros datos biométricos como parte de su propuesta de aplicación «metaverso».
  6. No estoy sugiriendo ninguna reconciliación o reformulación entre los estratos y ensamblajes de Deleuze y Guattari y la teoría de los ensamblajes de DeLanda, aunque la primera influye explícitamente en la segunda. Ian Buchanan se opone específicamente al enfoque de DeLanda sobre los ensamblajes, pero tampoco me interesa entrar en ese debate. En su lugar, simplemente considero que los estratos ofrecen un enfoque conceptual relacionado con la cuestión de cómo los ensamblajes digitales-tecnológicos construyen relaciones espacio-temporales y cómo nuestras intersecciones con esos ensamblajes establecen un régimen informático-visual.
  7. En su análisis de los estratos, Deleuze y Guattari mencionan los sustratos, epístratos y parastratos para dar cuenta de las diversas relaciones no jerárquicas entre los estratos y dentro de ellos, aunque en última instancia hay poco que distinguir entre ellos. «Los epistrata y parastrata que subdividen un estrato pueden considerarse estratos en sí mismos (por lo que la lista nunca es exhaustiva)» y «un estrato es siempre capaz de servir de sustrato a otro, o de colisionar con otro, independientemente de cualquier orden evolutivo» (502, énfasis en el original). He decidido emplear el término más genérico «capa» (como también hacen Deleuze y Guattari), ya que una capa digital-calculativa podría denominarse estrato (o epi-, para- o subestrato) en un momento dado.

Fuente: Reid, Alex. “Living on Digital Flatlands: Assemblies of Computer Vision.” Rhizomes: Cultural Studies in Emerging Knowledge, no. 38, 2022, doi:10.20415/rhiz/038.e03

Descarga este artículo como un e-book

Print Friendly, PDF & Email

Deja un comentario