Podcast CB SyR 497: Einstein en Argentina, DeepSeek, simetría del espejo en gravitación, y tokamaks EAST y SMART
Te recomiendo disfrutar del episodio 497 del podcast Coffee Break: Señal y Ruido [iVoox A, iVoox B; ApplePodcast A, ApplePodcast B], titulado “Deep Seek; Einstein; Fusión; Quiralidad Cósmica”, 30 ene 2025. «La tertulia semanal en la que […] La entrada Podcast CB SyR 497: Einstein en Argentina, DeepSeek, simetría del espejo en gravitación, y tokamaks EAST y SMART fue escrita en La Ciencia de la Mula Francis.
Te recomiendo disfrutar del episodio 497 del podcast Coffee Break: Señal y Ruido [iVoox A, iVoox B; ApplePodcast A, ApplePodcast B], titulado “Deep Seek; Einstein; Fusión; Quiralidad Cósmica”, 30 ene 2025. «La tertulia semanal en la que repasamos las últimas noticias de la actualidad científica. Cara A: 100 años de Einstein en Argentina (9:00). DeepSeek, nuevo LLM de uso comercial (28:00). Cara B: Debate: Deep Seek y la I.A. (00:05). Un método para probar la simetría de paridad en la gravedad (40:20). El reactor de fusión de China alcanza un nuevo récord de tiempo (1:10:00). SMART, el reactor de la universidad de Sevilla, da un paso más (1:21:00). Señales de los oyentes (1:43:50). Imagen de portada realizada por Héctor Socas. Todos los comentarios vertidos durante la tertulia representan únicamente la opinión de quien los hace… y a veces ni eso».
¿Quieres patrocinar nuestro podcast como mecenas? «Coffee Break: Señal y Ruido es la tertulia semanal en la que nos leemos los papers para que usted no tenga que hacerlo. Sírvete un café y acompáñanos en nuestra tertulia». Si quieres ser mecenas de nuestro podcast, puedes invitarnos a un café al mes, un desayuno con café y tostada al mes, o a un almuerzo completo, con su primer plato, segundo plato, café y postre… todo sano, eso sí. Si quieres ser mecenas de nuestro podcast visita nuestro Patreon (https://www.patreon.com/user?u=93496937). ¡Ya sois 319! Muchas gracias a todas las personas que nos apoyan. Recuerda, el mecenazgo nos permitirá hacer locuras cientófilas. Si disfrutas de nuestro podcast y te apetece contribuir… ¡Muchísimas gracias!
Descargar el episodio 497 cara A en iVoox.
Descargar el episodio 497 cara B en iVoox.
Como muestra el vídeo participamos por videoconferencia Héctor Socas Navarro @HSocasNavarro /@hectorsocas.bsky.social / @HSocasNavarro@bird (@pCoffeeBreak / @pCoffeeBreak.bsky), Sara Robisco Cavite @SaraRC83 / @ViajandoConCiencia.bsky, José Edelstein @JoseEdelstein, Gastón Giribet @GastonGiribet (solo cara B), y Francis Villatoro @eMuleNews / @eMuleNews.bsky / @eMuleNews@mathstodon. Por cierto, agradezco a Manu Pombrol @ManuPombrol el diseño de mi fondo para Zoom; muchas gracias, Manu.
Tras la presentación de Héctor, José nos habla de las actividades por el centenario de la visita de Einstein a Argentina en 1925 (desde el 24 de marzo hasta el 23 de abril). En las actividades que se celebrarán en Argentina nos anuncia que se incluyen las intervenciones de Juan M. Maldacena, Gastón Giribet, Javier Santaolalla y un familiar vivo de Einstein. En esta fotografía aparece Albert Einstein en Córdoba (Argentina) durante su visita.
Sara nos habla de la inteligencia artificial de moda (sobre todo entre los especuladores bursátiles) DeepSeek-R1, el nuevo modelo de lenguaje (LLM) de origen chino. Nos cuenta Sara cuáles son las características específicas de DeepSeek. Destaca que usa aritmética flotante de 8 bits (FP8) para las multiplicaciones de matrices (aunque ciertas partes usan 16 bits BF16 y 32 bits FP32). Además, usa una arquitectura tipo combinación de expertos (mixture-of-experts, MoE), llamada DeepSeekMoE. DeepSeek-V3 tiene 671B (0.671 billones) de parámetros, habiendo sido sido entrenado con 14.8T (14.8 billones) de tokens de alta calidad y alta diversidad. Para cada token se activa un experto (sistema MoE) que está representado por 37B (37 millardos) de parámetros. Este LLM se ha preentrenado para ser luego postentrenado; en esta segunda fase se ha incrementado el tamaño de contexto hasta 128K tokens y se han aplicado técnicas de ajuste fino supervisado (SFT) y de aprendizaje con refuerzo (RL).
Entre los expertos se ha destacado el uso del aprendizaje con refuerzo, que en los LLM fue estudiado hace unos años sin mucho éxito, pero que ahora ofrece resultados muy competitivos. Y entre los especuladores que DeepSeek-V3 ha sido entrenado en un «pequeño» cluster equipado con 2048 NVIDIA H800 GPUs. Pequeño comparado con los recursos que consume el entrenamiento de los LLM de OpenAI, Anthropic, o incluso para Llama (Meta); se estima en un 6 millones de dólares el coste del entrenamiento de DeepSeek-R1, muy poco comparado con el coste estimado de los demás LLM de potencia similar.
La versión que ha generado mucho eco mediático es DeepSeek-R1, que es capaz de razonar durante cierto tiempo (como lo hace GTP-o1 de OpenAI; de hecho, des de OpenAI dicen que tienen pruebas de que DeepSeek ha sido destilado de GPT-o1, es decir, que se o1 para entrenar a R1, algo que es ilegal en EEUU). Se ha usando postentrenamiento basado en aprendizaje con refuerzo específico para razonamiento. El resultado es sorprendente en muchas cosas, por ejemplo, en la aparición de momentos ajá (aha moments) en su razonamiento: la IA plantea un razonamiento y a mitad del mismo se da cuenta de algo que no tuvo en cuenta; en una línea antropomórfica, afirma «este es un momento ajá» y después empieza a repetir el razonamiento desde el principio pero con un cambio que simplifica o mejora dicho razonamiento.
Una ventaja de DeepSeek son sus modelos destilados de tamaño pequeño (algo que ya hacía META con sus Llama); el modelo grande DeepSeek-671B (cuya ejecución requiere una ordenador con al menos 1 TB de memoria RAM) ha sido destilado a modelos más pequeños DeepSeek-70B (ejecutable en 128 GB de RAM) y DeepSeek-32B (en 64 GB), que son un poco menos poderosos, pero que para la mayoría de las aplicaciones ofrecen resultados muy similares. Si quieres probar DeepSeek-V3 puedes hacerlo en la web https://www.deepseek.com/ (como dice Héctor, funciona muy parecido a GPT-o1, pero en ciertas cuestiones puede que te guste más, o menos). Más información divulgativa en Elizabeth Gibney, «China’s cheap, open AI model DeepSeek thrills scientists,» Nature 23 Jan 2025; DeepSeek-AI, «DeepSeek-V3 Technical Report,» arXiv:2412.19437 [cs.CL] (27 Dec 2024), doi: https://doi.org/10.48550/arXiv.2412.19437; DeepSeek-AI, «DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning,» arXiv:2501.12948 [cs.CL] (22 Jan 2025), doi: https://doi.org/10.48550/arXiv.2501.12948.
Nos cuenta Gastón un estudio teórico en Physical Review Letters (PRL) sobre el estudio de la simetría del espejo (mirror symmetry) usando ondas gravitacionales. Esta simetría corresponde a lo que se suele llamar simetría de paridad (P), asociada a reflexiones especulares en el espacio, pero en el contexto gravitacional. La asimetría del espejo en relatividad general se puede cuantificar usando el escalar de Chern–Pontryagin, una integral que cuyo valor es un pseudoescalar sin dimensiones, es decir, que cambia de signo en una simetría especular. Una onda gravitacional tiene dos polarizaciones lineal (sean h+ y h×) que se pueden combinar (h+ − i h× y h+ − i h×) dando lugar a dos polarizaciones circulares (levógira y dextrógira, respectivamente). Los parámetros de Stokes que describen la polarización son I, Q, U y V, siendo V el asociado a polarización circular. Cada onda gravitacional observadas mostrará una polarización circular levógira (V < 0) o dextrógira (V > 0); pero en una población de muchas ondas gravitacionales se espera que en promedio se compensen dichas polarizaciones circulares y la polarización circular total sea 〈VGW〉 = 0, pues así lo predice el principio cosmológico, lo que implica que se cumple la simetría del espejo.
El español Juan Calderón Bustillo (IGFAE, Santiago de Compostela), colega de José, y sus coautores publican en PRL un estudio de 47 ondas gravitacionales, que concluye un valor observado para la polarización circular total 〈VGW〉 = −0.013 ± 0.140, que es compatible con 〈VGW〉 = 0. Sin embargo, se observa una gran desviación para la onda gravitacional GW200129, con una significación bayesiana superior a 12.6 (como muestra la figura de arriba). La razón de esta anomalía podría ser que esta onda gravitacional está generada por una fusión de agujeros negros con alta precesión orbital (con un valor normalizado de la precesión cercano a la unidad). Como es obvio, y así se comenta en este artículo, la anomalía de un único evento (GW200129) no tiene ninguna implicación respecto a una posible violación de la simetría del espejo.
Comenta Gastón que en algunos medios se han hecho eco de este resultado con titulares que no describen de forma correcta el resultado obtenido, afirmando de forma incorrecta que se ha observado una violación de la simetría especular. El artículo es Juan Calderón Bustillo, Adrian del Rio, …, Samson H. W. Leong, «Testing Mirror Symmetry in the Universe with LIGO-Virgo Black-Hole Mergers,» Phys. Rev. Lett. 134: 031402 (23 Jan 2025), doi: https://doi.org/10.1103/PhysRevLett.134.031402; también recomiendo el reciente Samson H. W. Leong, …, Juan Calderón Bustillo, …, Nicolas Sanchis-Gual, «Gravitational-wave signatures of mirror (a)symmetry in binary black hole mergers: measurability and correlation to gravitational-wave recoil,» arXiv:2501.11663 [gr-qc] (20 Jan 2025), doi: https://doi.org/10.48550/arXiv.2501.11663. Entre los medios que menciona Gastón encontramos «Evidence for Mirror Symmetry Breaking in Gravitational Wave Emissions from Black Hole Mergers,» Science News Today, 24 Jan 2025.
Me toca comentar un par de noticias sobre fusión nuclear (que ha seleccionado Héctor a petición de oyentes en redes). Por un lado, el reactor de fusión EAST de China alcanza un nuevo récord de tiempo. En enero de 2022 fue noticia que «el tokamak chino EAST logró estabilizar el plasma durante un tiempo récord de 1056 segundos», LCMF, 04 ene 2022. Ahora en enero de 2025 vuelve a ser noticia un nuevo récord chino, 1066 segundos (que parece pecata minuta comparado con los 1056 anteriores. Varios medios se han hecho eco del publirreportaje chino a Gong Xianzu, jefe de operaciones de EAST (Experimental Advanced Superconducting Tokamak), y Lu Kun, subdirector del Instituto de Física del Plasma de la Academia de Ciencias de China (ASIPP) de Chen Na, «Chinese «Artificial Sun» Sets New Record in Milestone Step Toward Fusion Power Generation,» Chinese Academy of Science, 21 Jan 2025; como «Chinese ‘artificial sun’ sets a record towards fusion power generation,» Phys.org, 21 Jan 2025.
EAST es un pequeño tokamak superconductor chino cuyo programa de investigación se centra en apoyar a la investigación que se realizará en ITER (Cadarache, Francia), junto con el también pequeño tokamak francés WEST (Cadarache, Francia). En concreto se prueban diferentes técnicas de control del plasma para estabilizarlo durante largo tiempo, al menos durante unos 1000 segundos. Se prueban diferentes técnicas de control con objeto de determinar cuáles son, a priori, las mejores para ITER. Saberlo permitirá acelerar la primera fase de estudios de los plasmas en ITER, antes de la inyección del combustible para demostrar la ignición con Q > 10 durante al menos 3 minutos. Sin lugar a dudas los avances de EAST son noticias interesantes, pero muchos medios presentan esta noticia como si fuera una competencia con ITER, cuando en realidad solo es un apoyo.
Por otro lado, ha sido noticia que se ha inyectado el primer plasma en el pequeño tokamak esférico SMART (SMall Aspect Ratio Tokamak) de la Universidad de Sevilla. No hay artículo científico (supongo que se publicará a finales de 2025), solo se ha publicado una nota de prensa con la foto del plasma. El objetivo de SMART es estudiar el plasma en dos configuraciones, con triangularidad positiva (con forma de letra D), como en la primera inyección mostrada en la parte izquierda de la figura, y con triangularidad negativa (con forma de letra D invertida, ꓷ), como en el dibujo artístico con el interior de SMART que aparece en la parte derecha de la figura. SMART es un tokamak esférico para permitir estudiar ambas configuraciones del plasma. Según las simulaciones por ordenador, la triangularidad negativa producirá una plasma más estable (pues se evitan ciertas inestabilidades) y más fácil de controlar; el objetivo científico de SMART es demostrarlo de forma experimental.
Los investigadores principales de SMART son Manuel García Muñoz y la joven Eleonora Viezzer. El primer plasma es una gran noticia, pero habrá que esperar a la publicación de un artículo científico que compare las observaciones experimentales con las simulaciones teóricas. La nota de prensa de la Universidad de Sevilla se ha acompañado de una cita al última artículo de SMART, sobre simulaciones, D.J. Cruz-Zabala, …, E. Viezzer, J.W. Berkery, «Performance prediction applying different reduced turbulence models to the SMART tokamak,» Nuclear Fusion 64: 26071 (07 Nov 2024), doi: https://doi.org/10.1088/1741-4326/ad8a70. El artículo presenta simulaciones con el código TRANSP con diferentes condiciones de contorno y diferentes modelos para la turbulencia. Los resultados son muy prometedores, pero no se sabe cuáles son los que mejor reflejan lo que se observará en los experimentos. Lo cierto es que lo habitual en fusión es que las simulaciones reflejen solo una parte de la complejidad dinámica del plasma. De ahí la necesidad de tener tokamaks experimentales para estudiar los plasmas.
La nota de prensa es «El tokamak SMART, un paso más cerca de la fusión nuclear con su primer plasma», Universidad de Sevilla, 21 ene 2025; aunque Héctor la leyó en «SMART: One step closer to nuclear fusion with its first plasma», Phys.org, 21 Jan 2025.
Y pasamos a Señales de los Oyentes. Bromea Thomas Villa: «¿Marie Kondo es el fracaso de la segunda ley de la termodinámica?» Sara le aclara a Héctor quien era Marie Kondo, una obsesa del orden, famosa por sus consejos en redes sociales. Gastón contesta que es un poco Marie Kondo y tiene su oficina muy ordenada. Sara confiesa que vive en el caos.
Thomas Villa pregunta: «Si se demostrara una quiralidad izquierda en las ondas de gravedad, ¿sería una prueba experimental de que la gravedad tiene un «googly problem» tal como predice la teoría de twistores?» Ni Héctor ni Gastón conocen ese problema. Héctor le pregunta a DeepSeek. Mientras Gastón nos recuerda que si las ondas gravitacionales tuvieran quiralidad izquierda y se incumpliera su invarianza ante la simetría del espejo significaría que la teoría general de la relatividad no es la teoría correcta de la gravitación, que cumple la simetría del espejo. Hay muchas propuestas de gravitación alternativa que incumple esta simetría, como la teoría de Chern–Simmons, pero hay muchas otras formas.
Héctor nos resume la larga respuesta de DeepSeek (yo le acabo de preguntar en español y me ofrece una extensa respuesta tras pensar durante 103 segundos, con una parte inicial en inglés y un resumen final en español): afirma que el problema «googly» en la teoría de twistores de Penrose es la dificultad de describir los dos estados de helicidad del gravitón, pues describe bien los estados de helicidad izquierda (−2) pero tiene problemas con los de helicidad derecha (+2). Además, comenta que el problema «googly» es una limitación del formalismo de los twistores, no siendo una característica de la naturaleza. Héctor concluye que «amigos, creo que hemos quedado obsoletos, es el fin de Coffee Break, somos prescindibles»; y bromea con que «quedan solo Francis y DeepSeek compitiendo». Por fortuna para nosotros, me parece que la respuesta de DeepSeek es incompleta y además incorrecta. Por cierto, el término «googly» se usa en el juego del cricket, donde se suele traducir por «bola envenenada» o «bola con efecto».
Tras consultar «The Road to Reality» de Penrose (que leí hace veinte años) he recordado esta cuestión. La teoría de twistores describe ambas helicidades del gravitón, como partícula de espín dos en un espacio plano de Minkowski (complexificado). Las ondas gravitacionales son soluciones de las ecuaciones de Einstein linealizadas, luego sus dos helicidades se describen sin problemas en la teoría de twistores. El problema «googly» tiene su origen en lo que Penrose llama el «gravitón no lineal», que sería una solución de las ecuaciones de Einstein no lineales de tipo gravitón (que solo existiría en la teoría de twistores). Con twistores se puede construir dicha solución para helicidad izquierda (−2), pero no para helicidad derecha (+2). Para resolver este problema con twistores hay varias soluciones, siendo la más sencilla es usar duales de los twistores, capaces de describir la helicidad derecha (+2), pero no la izquierda (−2); el resultado es la llamada teoría de ambitwistores.
El origen último del problema es que las ecuaciones de Einstein (o el tensor de curvatura, o el tensor de Weyl) se pueden separar en una parte autodual y una parte antiautodual (lo mismo pasa con las ecuaciones de Yang–Mills, cuyas ecuaciones autoduales son integrables, pero que son no integrables debido a su parte antiautodual). El «gravitón no lineal» sería solución de la parte autodual de las ecuaciones, siendo el problema «googly» que la versión linealizada de dichas ecuaciones solo describe el gravitón de helicidad derecha. Se requiere la linealización de la parte antiautodual de las ecuaciones, más allá de la teoría de twistores, para describir la otra helicidad. Además, de la teoría de ambitwistores hay otras variantes de la teoría de twistores que permiten resolver el problema «googly». Pero sin observaciones experimentales es imposible saber qué variante de la teoría es la correcta.
Pregunta de cebra: «¿La polarización de una onda gravitacional implica el avance de la onda?» Reforma la pregunta: «¿La polarización de una onda gravitacional qué expresa? ¿El sentido de avance o es más parecido a los modos B convergentes?» Contesta Gastón que lo más fácil es recurrir al campo electromagnético de espín uno. Una partícula es una oscilación de un campo cuántico. Un partícula de espín uno con masa tiene dos polarizaciones transversales y una polarización longitudinal al movimiento (como los bosones W y Z). Sin embargo, el fotón no tiene masa y se mueve a la velocidad de la luz en el vacío, luego no puede tener polarización longitudinal (que exige oscilar en la dirección del movimiento y superar la velocidad de la luz en el vacío). Así corresponde a dos oscilones en un plano perpendicular al movimiento, que son las dos polarizaciones del fotón. Lo mismo ocurre con el gravitón de espín dos, que tiene dos polarizaciones transversales a su movimiento a la velocidad de la luz en el vacío (aunque un gravitón masivo tendría cinco polarizaciones).
Ligeia pregunta: «¿Si hubiera una predilección [por la simetría especular], qué efectos tendría en el universo? Contesta Gastón que si existiera tendría que ser muy pequeña (pues no ha sido observada). En su opinión, si existiera podría influir en la formación de grandes estructuras en el universo, dejando una pequeña marca que sería observable.
Pregunta Gabriel Espín: «Y la expansión del universo, el aumento de espacio, ¿es simétrico? ¿Es posible que el espacio crezca por igual de manera omnidireccional?» Gastón contesta que así lo afirma el principio cosmológico y lo confirman las observaciones, la expansión es isotrópica (igual en todas las direcciones). Gastón recurre a la clasificación de (Luigi) Bianchi de las variedades reales tridimensionales, que son nueve; estos espaciotiempos homogéneos tienen como simetría un grupo de Lie; algunas de estas variedades homogéneas no son isótropas. Además, menciona un caso adicional, «el universo de Finkelstein–Szekeres, o algo así». Supongo que se refiere a la solución de Kantowski–Sachs (y que ha mezclado en su mente las coordenadas de Finkelstein–Kruskal para agujeros negros con las soluciones no homogéneas de Szekeres, estas últimas más allá de la clasificación de Bianchi).
Javier Benavides pregunta: «¿Dónde fue toda la energía generada en la aniquilación materia-antimateria primordial?» Contesta Gastón que por cada mil millones de pares barión-antibarión solo sobrevivió un barión y se generaron unos dos mil millones de fotones. Gastón bromea con que es «el residuo de la luz», porque su madre se llama Luz.
¡Que disfrutes del podcast!
La entrada Podcast CB SyR 497: Einstein en Argentina, DeepSeek, simetría del espejo en gravitación, y tokamaks EAST y SMART fue escrita en La Ciencia de la Mula Francis.