Showing posts with label Teorema de Noether. Show all posts
Showing posts with label Teorema de Noether. Show all posts

A cien años del nacimiento del teorema de Noether: su relación con la Relatividad General

Para noviembre de 1915, Albert Einstein había dado a la relatividad general su forma final a través de las ecuaciones que llevan su nombre. Unos días después, el poco menos conocido para la población general pero también brillantísimo David Hilbert, enviaría para publicación las mismas ecuaciones de campo obtenidas independientemente (aunque ya con la mesa conceptual puesta por Einstein) a través del irrazonablemente efectivo principio de mínima acción. Tanto menos conocida todavía es Amalie Emmy Noether, que por el mismo tiempo, e influenciada/motivada por Hilbert y el desarrollo de la relatividad general, tenía listo ya (aunque se publicaría en 1918) el bellísimo teorema que hoy en física se conoce por su nombre.

Imagen sobre Emmy Noether creada por el Perimeter Institute (publicada en su cuenta de Twitter)

Aunque desconozco su nivel de popularidad entre los matemáticos, Emmy Noether ciertamente es una rockstar entre los físicos y aún más entre los teóricos. Su vida es en sí misma bastante interesante, siendo desfavorables gran parte de las circunstancias de la época para una mujer que extrañamente estaba interesada en las matemáticas (concretamente se dice que la segunda mujer en dedicarse a las matemáticas en la historia reciente). Irónicamente, aunque Noether es ampliamente celebrada en la física, su teorema no fue más que un pequeño paseíllo en su interés por la teoría de grupos y el resto de su trabajo se restringió únicamente a las matemáticas.


Aunque el teorema de Noether no es del mismo calibre que el de una teoría (como la propia relatividad general), es un ingrediente esencial en el entendimiento de la realidad física. Aunque a muchas personas la palabra teorema les invoque algo escalofriante, la idea central del teorema de Noether es realmente simple: A cada simetría continua de las leyes de la física corresponde una cantidad conservada.


Usualmente se parafrasea de este modo para no meter la pata en algo esencial (como la palabra continua). Para los dummies como yo, básicamente se trata de que cuando un sistema físico permanece inalterado ante una alteración pequeñita dada, existirá una cantidad que no cambiará con el tiempo. El ejemplo más común es el que se enseña en la secundaria sobre la conservación de la energía (la energía no se crea ni se destruye) que corresponde a que las leyes de la física son las mismas sin importar el paso del tiempo (hay una simetría temporal continua: traslaciones temporales). De manera análoga, la conservación de momento (o cantidad de movimiento) corresponde a una simetría ante traslaciones espaciales y la conservación de momento angular corresponde a una simetría ante rotaciones espaciales. Estos son los casos más sencillos en la mecánica clásica, pero seguido las teorías físicas contienen otros tipos de simetría (a veces más evidentes, a veces menos evidentes) y aparecen nuevas cantidades conservadas: el mejor ejemplo es el de la carga eléctrica, que surge de la simetría de la propia teoría electromagnética. Así pues, el teorema de Noether es de una importancia crucial en la física aunque no se trate de una teoría en particular.

Vale, ya entrando en materia, aunque normalmente el teorema de Noether se introduce en mecánica clásica a los estudiantes de licenciatura, el teorema realmente germinó en Emmy Noether a través de la relatividad general cuando en 1915 fue invitada por David Hilbert y Felix Klein a trabajar a la Universidad de Gotinga. Una famosa anécdota*, que refleja claramente las ideas de género de la época, es la de algunos profesores de humanidades reclamando a la llegada de Noether
¿Qué pensarán nuestros soldados cuando regresen a la Universidad y encuentren que deben aprender a los pies de una mujer?
y Hilbert contestando
No veo que el género del candidato sea un argumento contra su admisión como Privatdozent. Después de todo, somos una Universidad, no un baño público.
A pesar de las objeciones, Emmy llegó a Gotinga, aunque sin recibir un salario (siendo mantenida por su familia, misma situación que tuvo, ya como profesora, desde hacía casi 7 años en su ciudad natal) por algún tiempo y tratada como mera ayudante de Hilbert, justo prácticamente al mismo tiempo en que Einstein fue invitado a dar una serie de charlas sobre sus ideas en relatividad general. Hilbert estaba ampliamente interesado en la teoría de Einstein y en la física en general, por lo que obtuvo por su cuenta (quizá poco antes o poco después de Einstein) las ecuaciones de campo de la teoría y las publicó apenas unos días después de que lo hiciera Einstein. Como sea, aunque como menciona Einstein en su artículo, la relatividad general estaba completa como construcción lógica, aún había un detalle que era desconcertante: la hasta entonces bien establecida conservación de la energía, que deja de ser cierta en esta teoría.

Desde Galileo (básicamente desde el inicio de la ciencia moderna), el concepto de simetría en física ha sido vital. Un grupo de simetría es una colección de un tipo particular de funciones matemáticas (como las traslaciones o las rotaciones) llamadas transformaciones, que al aplicarse a un objeto dado, lo dejan inalterado. Se dice entonces que un grupo de simetría X corresponde a una teoría física cuando las ecuaciones de la teoría no cambian al aplicarles las transformaciones de X. En particular, el grupo de simetría de la mecánica clásica es llamado grupo de Galileo y contiene las transformaciones de traslación, rotación y desplazamientos a velocidad constante. De manera análoga, el grupo de simetría de la relatividad especial es el llamado grupo de Poincaré, que contiene traslaciones, rotaciones y un tipo especial de rotaciones llamados boosts. En el caso de la relatividad general, el grupo de simetría es el de los 'cambios de coordenadas', de modo que la teoría es exactamente la misma sin importar con qué coordenadas se le vea (lo que los físicos llaman covariancia general y que hace a la teoría naturalmente formulable en términos tensoriales, lo que seguido es atemorizante cuando uno como estudiante la quiere aprender).

Una diferencia crucial entre los cambios de coordenadas y las traslaciones, las rotaciones o los 'boosts', es que de los primeros existe una infinidad, mientras que de los otros existe solamente una cantidad finita con la que se puede generar cualquier otro. Este detalle es básicamente el que hace que la conservación de energía no se cumpla en la relatividad general, pues la 'energía', o más precisamente el tensor de energía-momento, termina dependiendo de las coordenadas que se usan para calcularlo. Emmy Noether, pues, entendió esta diferencia esencial en lo que Hilbert llamaba 'teoremas de energía propios e impropios' y lo empleó para formular su teorema, que en realidad son dos, uno para cada caso.

Para entender con mayor profundidad la historia del desarrollo del teorema ciertamente se requiere al menos cierta familiaridad con la relatividad general; un recuento bastante interesante y que vale la pena leer es el siguiente:
E. Noether's Discovery of the Deep Connection Between Symmetries and Conservation Laws
Nina Byers
arXiv:physics/9807044 [physics.hist-ph]

Emmy Noether proved two deep theorems, and their converses, on the connection between symmetries and conservation laws. Because these theorems are not in the mainstream of her scholarly work, which was the development of modern abstract algebra, it is of some historical interest to examine how she came to make these discoveries. The present paper is an historical account of the circumstances in which she discovered and proved these theorems which physicists refer to collectively as Noether's Theorem. The work was done soon after Hilbert's discovery of the variational principle which gives the field equations of general relativity. The failure of local energy conservation in the general theory was a problem that concerned people at that time, among them David Hilbert, Felix Klein, and Albert Einstein. Noether's theorems solved this problem. With her characteristically deep insight and thorough analysis, in solving that problem she discovered very general theorems that have profoundly influenced modern physics.
Asimismo en el arXiv se encuentra una traducción al inglés del artículo original de Noether:
Invariant Variation Problems
Emmy Noether, M. A. Tavel

The problems in variation here concerned are such as to admit a continuous group (in Lie's sense); the conclusions that emerge from the corresponding differential equations find their most general expression in the theorems formulated in Section 1 and proved in following sections. Concerning these differential equations that arise from problems of variation, far more precise statements can be made than about arbitrary differential equations admitting of a group, which are the subject of Lie's researches. What is to follow, therefore, represents a combination of the methods of the formal calculus of variations with those of Lie's group theory. For special groups and problems in variation, this combination of methods is not new; I may cite Hamel and Herglotz for special finite groups, Lorentz and his pupils (for instance Fokker), Weyl and Klein for special infinite groups. Especially Klein's second Note and the present developments have been mutually influenced by each other, in which regard I may refer to the concluding remarks of Klein's Note.

Variaciones bajo transformaciones de Lorentz infinitesimales

He estado procurando introducirme por mi cuenta a QFT con estas notas de David Tong y he empezado por la teoría clásica. Como ilustra Abstruse Goose, el camino a la frontera de la física (no necesariamente cuerdas, como lo ilustra en una de las caricaturas) es un poco largo ;-)

En fin, me encontré con una cuestión interesante y que puede valer la pena discutir. El teorema de Noether puede leerse como
toda simetría continua del Lagrangiano $\mc{L}$ da cuenta a una corriente conservada
siempre que se relaciona con la acción por $S=\int{d}^4x\mc{L}$ y aquí consideraré un Lagrangiano $\mc{L}=\mc{L}(\phi,\p_\mu\phi)$ con el campo $\phi$ dependiente de las variables espaciotemporales $x$. En general se dice que una transformación infinitesimal $\phi\to\phi+\delta\phi$ es una simetría si la variación del Lagrangiano es una derivada total, i.e. si $\delta\mc{L}=\p_\mu{f}^\mu$ para algún $f=f(\phi)$.

Lo que me interesa aquí es el caso particular de transformaciones de Lorentz infinitesimales, que tienen la forma
\begin{equation}{\Lambda^\mu}_\nu={\delta^\mu}_\nu+{\omega^\mu}_\nu\end{equation} con ${\omega^\mu}_\nu$ infinitesimal y antisimétrico (puedes probarlo a partir de la definición misma de ${\Lambda^\mu}_\nu$, i.e. $\eta_{\mu\nu}={\Lambda^\alpha}_\mu{\Lambda^\beta}_\nu\eta_{\alpha\beta}$). En general una transformación de Lorentz para un escalar es $\phi(\Lambda)\to\phi(\Lambda^{-1}x)$; de la definición misma de la inversa, se puede ver que ${(\Lambda^{-1})^\mu}_\nu={\delta^\mu}_\nu-{\omega^\mu}_\nu$, entonces a primer orden en $\omega$,
\begin{align}\phi(x)&\to\phi(x^\mu-{\omega^\mu}_\nu{x}^\nu)\nonumber\\&\simeq\phi(x)-{\omega^\mu}_\nu{x}^\nu\p_\mu\phi(x)\end{align} i.e.
\begin{equation}\delta\phi=-{\omega^\mu}_\nu{x}^\nu\p_\mu\phi\label{eq1}\end{equation}
El problema que me encontré (primero) fue con la variación de $\mc{L}$; precisamente por el resultado (\ref{eq1}), debería tenerse
\begin{equation}\delta\mc{L}=-{\omega^\mu}_\nu{x}^\nu\p_\mu\mc{L}\end{equation} que es exactamente lo mismo que $\delta\mc{L}=\p_\mu(-{\omega^\mu}_\nu{x}^\nu\mc{L})$, ya que ${\omega^\mu}_\nu\p_\mu{x}^\nu={\omega^\mu}_\nu{\delta^\nu}_\mu=0$ por la antisimetría de $\omega$. De cualquier modo si uno calcula directamente $\delta\mc{L}=\frac{\p\mc{L}}{\p\phi}\delta\phi+\frac{\p\mc{L}}{\p(\p_\mu\phi)}\delta(\p_\mu\phi)$, se obtiene que
\begin{equation}\delta\mathcal{L}=-\partial_\mu({\omega^\mu}_\nu{x}^\nu\mathcal{L})-\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}{\omega^\sigma}_\mu\partial_\sigma\phi\label{2}\end{equation} donde la forma más sencilla de calcular $\delta(\p_\mu\phi)$ conociendo $\delta\phi$ es usar $\delta(\p_\mu\phi)=\p_\mu(\delta\phi)$ (que desconozco rigurosamente por qué es cierta, pero supongo que básicamente es porque el campo está en $\mathbb{R}^{1,3}$ y todo es lindo y continuo), de donde surge el término extra,
\begin{equation}\partial_\mu(\delta\phi)=-{\omega^\sigma}_\nu\left[{\delta^\nu}_\mu\partial_\sigma\phi+x^\nu\partial_{\mu\sigma}\phi\right]=-{\omega^\sigma}_\mu\partial_{\sigma}\phi-{\omega^\sigma}_\nu{x}^\nu\partial_{\mu\sigma}\phi\label{3}\end{equation} de cualquier modo uno puede emplear la regla de transformación de las derivadas del campo (básicamente la de una 1-forma o covector), $\partial_\mu\phi(x)\to{(\Lambda^{-1})^\nu}_\mu\partial_\nu\phi(\Lambda^{-1}x)$, y se obtiene
\begin{align}{(\Lambda^{-1})^\nu}_\mu\partial_\nu\phi(\Lambda^{-1}x)&=({\delta^\nu}_\mu-{\omega^\nu}_\mu)\partial_\nu\phi(x^\sigma-{\omega^\sigma}_\rho{x}^\rho)\nonumber\\&\simeq({\delta^\nu}_\mu-{\omega^\nu}_\mu)\left[\partial_\nu\phi(x)-{\omega^\sigma}_\rho{x}^\rho\partial_{\sigma\nu}\phi(x)\right]\nonumber\\&=\partial_\mu\phi-{\omega^\sigma}_\rho{x}^\rho\partial_{\sigma\mu}\phi-{\omega^\nu}_\mu\partial_\nu\phi\end{align} y en efecto $\delta(\p_\mu\phi)$ coincide con (\ref{3}).

Hice esta pregunta en Physics SE y la respuesta es de hecho sencilla: en (\ref{2}) se tiene que
\begin{equation}\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}{\omega^\sigma}_\mu\partial_\sigma\phi=0\end{equation} dado que $\frac{\partial\mathcal{L}}{\partial(\partial_\mu\phi)}\propto\p^\mu\phi$ pues $\mc{L}=\mc{L}(\phi,\p_\mu\phi)$ únicamente y la expresión se reduce a una contracción de un tensor antisimétrico $\omega^{\mu\nu}$ con uno simétrico $\p_\mu\phi\p_\nu\phi$.

El desconcierto tal vez me surge de que esperaba tener $\p_\mu\phi\to\p_\mu\phi-{\omega^\sigma}_\rho{x}^\rho\partial_{\sigma\mu}\phi$, como se señala en estas soluciones (sol 6) elaboradas por Peng Zhao (autor al que ya había encontrado antes estudiando AdS-Schwarzschild); el meollo tal vez es que simplemente lo escribe así y no lo calcula directamente; de cualquier modo, como se vio, el término extra al final no es relevante.

Considando luego el caso del Lagrangiano de campo electromagnético $\mc{L}=\frac{1}{4}F_{\mu\nu}F^{\mu\nu}$ (en vacío/sin carga) con $F_{\mu\nu}=\p_\mu{A}_\nu-\p_\nu{A}_\mu$, invariante ante transformaciones de norma $A_\mu\to{A}_\mu+\p_\mu\zeta$ con $\zeta=\zeta(x)$ suficientemente continua, nuevamente surge algo parecido. Al tomar traslaciones infinitesimales $x^\mu\to{x}^\mu+\epsilon^\mu$, puede considerarse una matriz ${{\tilde\Lambda}^\mu}_\nu={\delta^\mu}_\nu+\epsilon^\mu\p_\nu$ en el grupo de Poincaré, de modo que el potencial $A$ transforma como $A^\mu(x)\to{\tilde{\Lambda}^\mu}_\nu{A}^\nu(x)(\tilde{\Lambda}^{-1}x)$, i.e. a primer orden en $\epsilon$,
\begin{align}A^\mu&\to({\delta^\mu}_\nu+\epsilon^\mu\p_\nu)A^\nu(x^\sigma-\epsilon^\sigma)\nonumber\\&\simeq({\delta^\mu}_\nu+\epsilon^\mu\p_\nu)[A^\nu(x)-\epsilon^\sigma\p_\sigma{A}^\nu(x)]\nonumber\\&=A^\mu-\epsilon^\sigma\p_\sigma{A}^\mu+\epsilon^\mu\p_\nu{A}^\nu\end{align} y nuevamente sobra un término, $\epsilon^\mu\p_\nu{A}^\nu$, respecto a lo que escribe Zhao (sol 7, simplemente $A^\mu\to{A}^\mu-\epsilon^\sigma\p_\sigma{A}^\mu$). En este caso es evidente que este término no es relevante pues es una derivada total y se sabe de antemano que $\mc{L}$ es invariante ante transformaciones de norma. Si nuevamente se calcula a pie la variación $\delta\mc{L}$, el resultado debe ser simplemente $\delta\mc{L}=\p_\mu(-\epsilon^\mu\mc{L})$, sabiendo que un escalar transforma como $\phi(x)\to\phi(\tilde{\Lambda}^{-1}x)=\phi(x)-\epsilon^\nu\p_\nu\phi$ bajo esta traslación; esto evidentemente ocurre, ya que $\mc{L}$ sólo depende de $\p_\mu{A}^\nu$ y al calcular $\p_\mu(\delta{A}^\nu)$, el término extra desaparece.

Podría haber quedado satisfecho con esto, de cualquier modo mi terquedad exigía al menos otra prueba de que este término extra es inofensivo, e.g. al calcular la corriente conservada. Como puede leerse en las notas de Tong, por teorema de Noether, la corriente conservada $j^\mu$ debida a una transformación de simetría $\phi\to\phi+\delta\phi$ está dada por
\begin{equation}j^\mu=\frac{\p\mc{L}}{\p(\p_\mu\phi)}\delta\phi-f^\mu(\phi)\end{equation} En este caso en lugar del escalar $\phi$ se tiene el potencial vectorial $A^\mu$ y $f^\mu=-\epsilon^\mu\mc{L}$. Así, puede calcularse que la corriente conservada es
\begin{equation}j^\mu=-\epsilon^\sigma{T^\mu}_\sigma+\epsilon^\nu\p_\sigma{A}^\sigma\frac{\p\mc{L}}{\p(\p_\mu{A}^\nu)}\end{equation} donde
\begin{equation}{T^\mu}_\sigma=\frac{\p\mc{L}}{\p(\p_\mu{A}^\nu)}\p_\sigma{A}^\nu-{\delta^\mu}_\sigma\mc{L}\end{equation} es el tensor de energía-momento, que por construcción satisface $\p_\mu{T^\mu}_\sigma=0$; escribir $j^\mu$ de esta forma es conveniente porque se sabe que debe satisfacer $\p_\mu{j}^\mu=0$, de modo que
\begin{equation}\epsilon^\nu\p_\sigma{A}^\sigma\p_\mu\left(\frac{\p\mc{L}}{\p(\p_\mu{A}^\nu)}\right)=0\end{equation} lo que por supuesto ocurre, siendo que $\frac{\p\mc{L}}{\p(\p_\mu{A}^\nu)}\propto{F^\mu}_\nu$ y de las ec. de movimiento (Maxwell), $\p_\mu{F}^{\mu\nu}=0$. Esto da indicios de que todo sigue siendo consistente, como se espera; al final lo que tiene que ocurrir es que todo debe ser consistente con el teorema de Noether; diría que por ello es inofensivo desechar el término extra que aparece en la transformación de vectores (o los términos extras que aparecerían si se tratara de tensores de mayor rango) casi como se desechan los órdenes mayores del término infinitesimal.