Showing posts with label Teorías de Norma. Show all posts
Showing posts with label Teorías de Norma. Show all posts

Dualidad color-cinemática y la relación de doble copia

Hace algunos meses concluí la segunda parte de la maestría con la entrega de mi proyecto de investigación. Los proyectos en general son de tres meses y uno termina escribiendo un trabajo de alrededor de 50 páginas de texto (generar uno o más artículos no es propiamente un requisito). En mi proyecto básicamente escribí código en Mathematica que permite obtener y manipular identidades de Jacobi en el contexto de la dualidad color-cinemática a través de los diagramas de Feynman asociados a los numeradores cinemáticos de las amplitudes de dispersión a nivel árbol.

Vale, acá voy explicar qué significa todo esto. Para hacerlo, en la segunda parte seguiré algunas de las diapositivas que hice recientemente para un seminario en la UAM-I.

Las ideas generales para dummies* y motivación
* dummies: Lectores perspicaces (con o sin formación en física) que ignoran la mayoría de conceptos, argot y lenguaje matemático de la física "de partículas" 😉
Las amplitudes de dispersión son el corazón de la física de partículas, o más en general incluso, de las teorías cuánticas de campo. Una amplitud de dispersión puede decirse a groso modo que es el objeto matemático que está relacionado a través del cuadrado de su norma con la sección eficaz, que es la que codifica la probabilidad de que una dada colección de partículas se dispersen. En el régimen perturbativo de una teoría cuántica de campo la manera más sencilla de lidiar con las contribuciones más significativas de una amplitud es a través de los diagramas de Feynman, que luego se organizan de modo progresivo por el número de bucles (loops y ciclos) que contienen, haciendo los cálculos más complicados mientras más bucles se agregan. La discusión sobre qué son los diagramas de Feynman se puede extender bastante, la idea simplemente es que son grafos que representan (no que describen per se) la información física de las interacciones de dadas partículas (o más precisamente campos) respetando ciertas reglas dictadas por la teoría en cuestión, e.g. el tipo de vértices permitidos, y que dificultan el cálculo de amplitudes cuando se agregan bucles (que en términos de teoría de grafos también incluyen los llamados ciclos) porque éstos implican integrales sobre todos los momentos posibles que estos bucles pueden acarrean.

Ejemplo de una expansión perturbativa en diagramas de Feynman hasta dos bucles.
Fuente: Nucl.Phys. B875 (2013) 738-756

Notablemente, en 1986, para los diagramas de Feynman más simples (sin bucles), llamados diagramas de árbol, Hideyuki Kawai, David Charles Lewellen y S.H. Henry Tye mostraron que
Amplitud de cuerda cerrada es igual a amplitud de cuerda abierta al cuadrado
La hoja de mundo de una cuerda cerrada (abierta) es conformalmente equivalente a una esfera (disco)
Un poco más de detalle aquí
en lo que hoy se conoce como las relaciones KLT y donde las palabras cerrado y abierto se refieren a conceptos en teoría de cuerdas; sin embargo, en el límite de bajas energías (i.e. cuando las cuerdas se reducen a partículas) de una cierta teoría de cuerdas, esto da el eslogan
Amplitud en gravedad es igual a amplitud en Yang-Mills al cuadrado

que aunque originalmente fue descubierto usando cuerdas, no las necesita para funcionar. La teoría de Yang-Mills es simplemente una teoría de campo (de norma o gauge, que simplemente implica que describe campos mediadores de interacciones) que puede considerarse como una extensión no-abeliana (donde los campos no conmutan) de una teoría de campos electromagnéticos: naturalmente, mientras la teoría abeliana (Maxwell) sirve para describir fotones en electrodinámica cuántica (QED por quantum electrodynamics), la teoría no-abeliana es útil para describir gluones, i.e. los mediadores de interacciones en cromodinámica cuántica (QCD por quantum chromodynamics).

Las amplitudes de dispersión naturalmente satisfacen ciertas propiedades. En particular, para el caso de Yang-Mills, las llamadas amplitudes parciales ordenadas por color (factores de las amplitudes totales que no dependen de factores cinemáticos como momentos, polarizaciones o helicidades) a nivel árbol satisfacen un conjunto de relaciones que surgen del álgebra que obedecen los campos de la teoría, conocida como álgebra de color. Tan sólo hace ocho años, en el artículo New Relations for Gauge-Theory Amplitudes, Zvi Bern, John Joseph M. Carrasco y Henrik Johansson obtuvieron un nuevo conjunto de relaciones para las amplitudes parciales conocidas como las relaciones BCJ usando una identidad satisfecha por los factores cinemáticos de las amplitudes de árbol que ellos previamente obtuvieron. Esta nueva identidad es una bastante sorprendente, contenida en lo que se conoce hoy como la dualidad color-cinemática: básicamente, que pueden hallarse factores cinemáticos de una amplitud de árbol tales que satisfagan las mismas propiedades algebraicas (antisimetría y una identidad de Jacobi) de los factores de color. En el mismo artículo, los autores usan esta dualidad color-cinemática para aportar claridad en las relaciones KLT; como ellos lo dícen:
Las relaciones KLT [4] nos dicen que amplitudes árbol en gravedad pueden expresarse directamente en términos de amplitudes árbol de una teoría de norma. Estas relaciones fueron originalmente derivadas en teoría de cuerdas y son válidas en teoría de campo, dado que el límite de bajas energías de teoría de cuerdas es teoría de campo. De cualquier modo, desde un punto de vista puramente de teoría de campo, partiendo de Lagrangianos de Einstein-Hilbert y de Yang-Mills, estas relaciones han permanecido arcanas (...) usamos la (identidad de Jacobi de numerador cinemático) para clarificar la relación entre gravedad y las teorías de norma, argumentando que las relaciones KLT son equivalentes a una relación de 'elevar al cuadrado' los numeradores diagrama a diagrama de una teoría de norma.
De modo que básicamente si uno ha obtenido la amplitud de árbol en una teoría de norma, uno sólo tiene que reemplazar los factores de color por numeradores cinemáticos (que aún más pueden pertenecer a alguna teoría de norma distinta) para obtener la amplitud de gravedad. Ésto es lo que se conoce como la relación de doble-copia entre gravedad y teorías de norma.

Esta sorprendente historia entre gravedad y teorías de norma es una de las más excitantes hoy en día en la física teórica y mucho esfuerzo se está poniendo para clarificar más esta relación así como los fundamentos subyacentes y las consecuencias. A nivel árbol la dualidad color-cinemática ha sido ampliamente estudiada y demostrada usando teoría de cuerdas e ideas en teoría de campo como las relaciones de recursión BCFW, mientras que a nivel de bucles la dualidad aún es una conjetura conocida como la conjetura BCJ.

Los detalles para no tan dummies
Contexto
El contexto con el cual se suele exponer el tema (y con el que BCJ hallaron la dualidad) es el más sencillo: teoría de Yang-Mills pura y no masiva. Resistiendo por el momento la tentación de escribir el Lagrangiano de Yang-Mills, sólo establezcamos que el grupo de simetría de la teoría es el grupo especial unitario $SU(n)$. Los generadores del correspondiente álgebra $\mathbf{T}^a$ con $a=1,\ldots,\dim{SU(n)}=n^2-1$ satisfacen
\begin{align}
\mathrm{e}^{i\epsilon^a\mathbf{T}^a}&\in{SU(n)}\\
[\mathbf{T}^a,\mathbf{T}^b]&=\tilde{f}^{abc}\mathbf{T}^c\\
\mathrm{tr}\mathbf{T}^a\mathbf{T}^b&=\delta^{ab}
\end{align} donde $\tilde{f}^{abc}\equiv{i}\sqrt{2}f^{abc}$ con $f^{abc}$ las constantes de estructura. Además consideraré todos los campos de la teoría, $A^\mu$, no masivos, transformando en la representación adjunta (únicamente "gluones"):
\begin{align}
A_\mu^aT^a\,\text{ con }\,(T^{a})^{bc}&=-\tilde{f}^{abc}\\
\Longrightarrow\,[T^a,T^b]&=\tilde{f}^{abc}T^c\\
\mathrm{tr}T^aT^b&=n\delta^{ab}
\end{align} Los generadores (para ambas representaciones) satisfacen la identidad de Jacobi
\begin{equation}[T^a,[T^b,T^c]]+[T^b,[T^c,T^a]]+[T^c,[T^a,T^b]]=0\end{equation} lo que luego implica que
\begin{equation}\tilde{f}^{ab\color{red!80!black}d}\tilde{f}^{\color{red!80!black}d\color{black}ce}+\tilde{f}^{bc\color{red!80!black}d}\tilde{f}^{\color{red!80!black}d\color{black}ae}+\tilde{f}^{ca\color{red!80!black}d}\tilde{f}^{\color{red!80!black}d\color{black}be}=0\label{Jacobistruct}\end{equation} y que las constantes de estructura son totalmente antisimétricas (antisimétricas en sus tres índices). Aunque la anterior ecuación (\ref{Jacobistruct}) parece un desastre, se puede reconocer rápidamente notando que los índices $d$ y $e$ en cada sumando están en la misma posición, mientras que $abc$ se permuta cíclicamente.

La teoría tiene vértices de 3 y 4 aristas que se visten con factores de color $c_i$ (polinomios en las $f^{abc}$) y factores cinemáticos $N_i$ (funciones de momentos, polarizaciones u otra información cinemática).


Antes de seguir, debo aclarar que, aunque en la sección anterior para dummies escribí sobre diagramas de Feynman, en lo siguiente más bien se consideran grafos parecidos pero que no sólo no describen per-se sino que tampoco representan procesos físicos, i.e. no hay direcciones espacial y temporal en estos diagramas ni partículas que entran y luego salen, los diagramas únicamente codifican la información cinemática y de grupo de los procesos físicos pero nada más, e.g. usualmente se ponen todas las partículas como entrantes (o salientes) y se rastrea conservación de momento (al menos en Yang-Mills; partículas externas on-shell).

Vale, considerando el vértice de 4 puntos, con momentos (todos salientes o todos entrantes) $p_1,p_2,p_3,p_4$ (tales que $p_i^2=0$), éste tendrá una regla de Feynman de la forma
\begin{align}V_4&\propto\,\tilde{f}^{a_1a_2b}\tilde{f}^{ba_3a_4}N_{12}+\tilde{f}^{a_4a_1b}\tilde{f}^{ba_2a_3}N_{14}+\tilde{f}^{a_3a_1b}\tilde{f}^{ba_2a_4}N_{13}\nonumber\\
&\equiv{c_s}N_{12}+c_tN_{14}+c_uN_{13}\nonumber\\
&=c_sN_{12}\left(\frac{s}{s}\right)+c_tN_{14}\left(\frac{t}{t}\right)+c_uN_{13}\left(\frac{u}{u}\right)\end{align} donde $s=(p_1+p_2)^2$, $t=(p_1+p_4)^2$, $u=(p_1+p_3)^2$ son las variables de Mandelstam y $c_i$ es el llamado factor de color asociado al diagrama etiquetado por $i$. De aquí se puede reconocer, pues, que un vértice de 4 puntos puede extenderse en uno de 3 puntos y que hay tres posibles formas: los canales $s$, $t$ y $u$. Los vértices de 3 puntos son usualmente llamados vértices trivalentes y los diagramas con únicamente vértices trivalentes son llamados diagramas cúbicos.


De manera similar este argumento funciona si la teoría permitiera vértices de $n$ puntos, dando $(2n-5)!!$ posibles formas de extender un $V_n$ en diagramas de 3 puntos únicamente. La demostración es sencilla y a su vez demuestra que una amplitud a nivel árbol de $n$ puntos tendrá $(2n-5)!!$ factores o diagramas.



Con las definiciones hechas para los factores de color, la identidad de Jacobi puede ponerse sencillamente como
\begin{equation}c_s-c_t+c_u=0\label{colorJac}\end{equation} Para el caso de $n$ partículas, de manera similar, se satisface en general $c_i\pm{c}_j\pm{c}_k=0$ dependiendo de las definiciones de los factores de color, y donde ahora los índices de las constantes de estructura que se contraen corresponden al propagador alrededor del cual se está aplicando la identidad de Jacobi. Explícitamente, en términos de las constantes de estructura, la identidad de Jacobi alrededor de un propagador dado es de la forma
\begin{equation}f^{a_1a_2b_1}f^{b_1a_3b_2}\cdots{f}^{b_{n-3}a_{n-1}a_n}+f^{a_2a_3b_1}f^{b_1a_1b_2}\cdots{f}^{b_{n-3}a_{n-1}a_n}+f^{a_3a_1b_1}f^{b_1a_2b_2}\cdots{f}^{b_{n-3}a_{n-1}a_n}=0\end{equation}
que igualmente a primer vista es intimidante pero realmente la idea para reconocerla es la misma que para la identidad de 4 puntos (\ref{Jacobistruct}) y en este caso las permutaciones cíclicas ocurren para los índices que comparten el propagador alrededor del cual se toma la identidad (en este caso $b_1$). En términos de diagramas, uno puede partir de un diagrama en forma multiperiferal (primer diagrama de izquierda a derecha) y luego hacer ambos un intercambio de aristas y una forma de "tenedor-Y" alrededor del propagador en cuestión. Lo del tenedor-Y es relevante porque puede generar diagramas con topologías distintas a la del diagrama original.

Amplitudes
Regresando a la idea de que sólo se requieren diagramas cúbicos, basado en la discusión hecha arriba, ésto hace que las amplitudes a nivel árbol adquieran la forma general
\begin{equation}\mathcal{A}_n^{(0)}=g^{n-2}\sum_{i\in\Gamma_3}\frac{N_ic_i}{\prod_{\alpha_i}p^2_{\alpha_i}}\label{amptrival}\end{equation} con $i$ corriendo en diagramas cúbicos solamente.

Una relación sumamente importante en lo siguiente es la llamada descomposición por ordenamiento de color de una amplitud de árbol,
\begin{equation}\mathcal{A}_n^{(0)}=g^{n-2}\sum_{\mathcal{P}(23\ldots{n})}\mathrm{tr}[\mathbf{T}^{a_1}\mathbf{T}^{a_2}\cdots\mathbf{T}^{a_n}]A_n^{(0)}[12\ldots{n}]\end{equation} con la suma sobre permutaciones $\mathcal{P}$ de $(23\ldots{n})$ y que introduce las llamadas amplitudes parciales $A_n^{(0)}$ que contienen información dinámica únicamente y que son invariantes de norma. Uno puede ejemplificar la obtención de esta relación fácilmente para $n=4$ puntos. Primero notamos que
\begin{equation}\mathrm{tr}[\mathbf{T}^a,\mathbf{T}^b]\mathbf{T}^c=\tilde{f}^{abc}\,\Longrightarrow\,c_s=\mathrm{tr}\left([\mathbf{T}^{a_1},\mathbf{T}^{a_2}]\mathbf{T}^b\right)\mathrm{tr}\left([\mathbf{T}^b,\mathbf{T}^{a_3}]\mathbf{T}^{a_4}\right)\label{ck1}\end{equation} y de manera similar para $c_t$, $c_u$. Usando la relación de completitud conocida como identidad de Fierz,
\begin{equation}(\mathbf{T}^a)^i_j(\mathbf{T}^a)^\ell_k=\delta^\ell_j\delta^i_k-\frac{1}{n}\delta^i_j\delta^\ell_k\hspace{0.25in}\text{con}\hspace{0.25in}i,\ldots,\ell=1,\ldots,n\end{equation} podemos expandir el producto de trazas en la ec. previa (\ref{ck1}) como
\begin{equation}c_s=\mathrm{tr}(\mathbf{T}^{a_1}\mathbf{T}^{a_2}\mathbf{T}^{a_3}\mathbf{T}^{a_4})+\mathrm{tr}(\mathbf{T}^{a_1}\mathbf{T}^{a_4}\mathbf{T}^{a_3}\mathbf{T}^{a_2})-\mathrm{tr}(\mathbf{T}^{a_1}\mathbf{T}^{a_2}\mathbf{T}^{a_4}\mathbf{T}^{a_3})-\mathrm{tr}(\mathbf{T}^{a_1}\mathbf{T}^{a_3}\mathbf{T}^{a_4}\mathbf{T}^{a_2})\end{equation} y de manera similar para los otros dos factores de color, con lo que finalmente, sabiendo que la amplitud es $g^2$-proporcional a la suma de cada factor de color, obtenemos
\begin{equation}\mathcal{A}_4^{(0)}=g^2\left\{A_4^{(0)}[1234]\mathrm{tr}(\mathbf{T}^{a_1}\mathbf{T}^{a_2}\mathbf{T}^{a_3}\mathbf{T}^{a_4})+\mathcal{P}_\text{dist}(234)\right\}\end{equation} y al comparar con la amplitud completa escrita en la forma (\ref{amptrival}) podemos identificar las amplitudes parciales
\begin{align}A_4^{(0)}[1234]&=\frac{N_s}{s}+\frac{N_t}{t}=A_4^{(0)}[1432]\label{partampsnums1}\\
A_4^{(0)}[1243]&=-\frac{N_s}{s}+\frac{N_u}{u}=A_4^{(0)}[1342]\label{partampsnums2}\\
A_4^{(0)}[1324]&=-\frac{N_t}{t}-\frac{N_u}{u}=A_4^{(0)}[1423]\label{partampsnums3}\end{align} que satisfacen
\begin{equation}A_4^{(0)}[1234]+A_4^{(0)}[1243]+A_4^{(0)}[1324]=0\end{equation} llamada identidad de desacople $U(1)$ (o de fotones) para $n=4$, entre otras relaciones relevantes para el cálculo de amplitudes.

La dualidad color-cinemática
En el ahora famoso artículo de Bern, Carrasco y Johansson (enlace), los autores argumentan que la mencionada identidad de desacople $U(1)$ sólo puede ser no trivial si tiene la forma
\begin{equation}(s+t+u)\chi=0\hspace{0.25in}\text{con}\hspace{0.25in}\chi=\chi(\text{momentos, polarizaciones})\end{equation} pues precisamente $s+t+u=0$ dado que $p_i^2=0$ y que las amplitudes parciales sólo pueden ser $A_4^{(0)}[1234]=u\chi$, $A_4^{(0)}[1243]=t\chi$ y $A_4^{(0)}[1324]=s\chi$, de modo que resolviendo para $\chi$,
\begin{equation}A_4^{(0)}[1234]=\frac{u}{t}A_4^{(0)}[1243]=\frac{u}{s}A_4^{(0)}[1324]\end{equation} y de donde se sigue que, junto con las ecuaciones (\ref{partampsnums1},\ref{partampsnums2},\ref{partampsnums3}) y la condición $s+t+u=0$,
\begin{equation}N_s-N_t+N_u=0\end{equation} que tiene exactamente la misma forma que la identidad de Jacobi para los factores de color (\ref{colorJac}). Éste resultado es, en breve, la dualidad color-cinemática.

Específicamente: La dualidad color-cinemática asegura que las amplitudes en (súper-)Yang-Mills pueden darse en una representación
donde los numeradores cinemáticos tienen las mismas propiedades algebraicas que los factores de color:
\begin{align}c_i\to-c_i\,&\Longleftrightarrow\,N_i\to-N_i\\
c_i\pm{c}_j\pm{c}_k=0\,&\Longleftrightarrow\,N_i\pm{N}_j\pm{N}_k=0\end{align} Uno de los aspectos que hace sorprendente este resultado es que los factores de color evidentemente deben tener cierta estructura, pues provienen del álgebra de grupo de simetría, sin embargo los factores cinemáticos no tienen un grupo de simetría subyacente evidente y en principio no habría razón por la cual debieran obedecer la dualidad. Y en efecto, en general los factores cinemáticos no obedecen la dualidad, e.g. si uno comienza con el Lagrangiano usual de Yang-Mills, $\mathcal{L}_\text{YM}=-\frac{1}{4}F^{a\mu\nu}F^{a}_{\mu\nu}$ y obtiene las reglas de Feynman, los numeradores no obedecerán la dualidad. Podemos notar, primero, que aunque las amplitudes parciales son invariantes de norma, los $N_i$'s no son ni invariantes de norma ni son únicos: existen transformaciones de los numeradores, $N_i\to{N}_i+\Delta_i$ (usualmente llamadas transformaciones de norma generalizadas, i.e. se transforman los numeradores en lugar de los campos) que mantienen la amplitud total invariante (cualquiera en que la deformación es proporcional a la identidad de Jacobi de color) pero no en general a la dualidad; ésta es precisamente la principal razón por la cual la dualidad había permanecido escondida, en general no es trivial obtener explícitamente estos numeradores (o en su caso las transformaciones correspondientes).

Algunas consecuencias de esto son las siguientes:
  • Las amplitudes parciales se reducen a $(n-3)!$ (hay otros conteos más en el artículo original de BCJ).
  • La existencia de la dualidad está demostrada para cualquier $n$ (sólo a nivel árbol) con argumentos principalmente provenientes de teoría de cuerdas pero también de teoría de campo (BCFW)
    • N. E. J. Bjerrum-Bohr, P. H. Damgaard, T. Sondergaard, and P. Vanhove, The momentum kernel of gauge and gravity theories, JHEP 1101, 001 (2011) [arXiv:1010.3933[hep-th]]
    • M. Kiermaier, Plática en Amplitudes 2010, Mayo 2010 en QMUL, Londres, Reino Unido.
  • La construcción explícita de numeradores que satisfacen la dualidad es (hasta ahora) por fuerza bruta.
  • ¿Formulación Lagrangiana? Como se mencionó, $\mathcal{L}_\text{YM}$ no da numeradores compatibles con la dualidad, pero hay posibilidad de deformar
    \begin{equation}\mathcal{L}_\text{YM}=-\frac{1}{4}F^{a\mu\nu}F^a_{\mu\nu}+\mathcal{L}^\prime_5+\mathcal{L}^\prime_6+\ldots\end{equation} con las deformaciones $\mathcal{L}^\prime_n$ involucrando $n$ campos, cada deformación idénticamente cero; disponible un procedimiento sistemático:
    • M. Tolotti, S. Weinzierl, Construction of an effective Yang-Mills Lagrangian with manifest BCJ duality, [arXiv:1306.2975 [hep-th]]

La conjetura BCJ
Naturalmente queda la pregunta de si la dualidad puede extenderse a nivel de bucles. La respuesta es sí, aunque a diferencia de la dualidad a nivel árbol, aquí la dualidad es una conjetura; de cualquier modo aparentemente tiene todas las de ganar. La conjetura BCJ fue hecha por los mismos autores (BCJ) de la dualidad color-cinemática en el artículo Perturbative Quantum Gravity as a Double Copy of Gauge Theory. Para empezar, se promueve la amplitud en términos de únicamente diagramas trivalentes (\ref{amptrival}) a
\begin{equation}\mathcal{A}_n^{(L)}=i^Lg^{n-2+2L}\sum_{i\in\Gamma_3}\int\prod_{\ell=1}^L\frac{d^Dp_\ell}{(2\pi)^D}\frac{1}{S_i}\frac{N_ic_i}{\prod_{\alpha_i}p^2_{\alpha_i}}\label{BCJamp}\end{equation} El principal argumento que hace parecer inevitable la generalización a bucles es el llamado método de unitariedad generalizada.

Ejemplo de la obtención de una amplitud en 4 puntos y 2 loops a través de el conjunto de cortes (amplitudes árbol)
topológicamente distintos del diagrama original.
Fuente: arXiv:1103.1869 [hep-th]

El tema es bastante amplio y una buena referencia es Basics of Generalized Unitarity (arXiv:1103.1869 [hep-th]) de Zvi Bern y Yu-tin Huang. La idea básica es que este método permite construir amplitudes de bucles a partir de productos de amplitudes de árbol puestos on-shell; algunas palabras clave para entrar al tema son el teorema óptico (en el contexto de QFT) y las reglas de Cutkosky (sospecho que la palabra cut, que aquí traduzco literalmente como corte se usa más bien en el sentido de Cut-kosky).

La principal evidencia a favor de BCJ está en teorías con hasta $\mathcal{N}=4$ supersimetrías en Yang-Mills (arXiv:1303.6605 [hep-th]) y gran parte de la investigación actual se realiza en otras teorías como (s)Yang-Mills con materia (fundamental y/o abeliana), materia Chern-Simons, etc.

La identidad de Jacobi y la generación de diagramas funciona de manera análoga a la de nivel árbol.


Color (propagador índice $d$ ): $f^{d1a}f^{a2b}f^{bcd}f^{c34}=f^{d1a}f^{a2b}f^{b3c}f^{c4d}-f^{d1a}f^{a2b}f^{b4c}f^{c3d}$
Cinemática: $N_{12(34);p}=N_{1234;p}-N_{1243;p}$
Fuente: arXiv:1510.03448 [hep-th]

El principal resultado de mi trabajo fue código en Mathematica que genera todos los diagramas a partir de todas las identidades de Jacobi alrededor de un propagador dado a nivel árbol dado el número $n$ partículas, e.g. para $n=4$


o casos más complicados, e.g. para $n=8$ alrededor de un propagador dado


o bien, para $n=11$ alrededor de un propagador dado


La idea básica para el funcionamiento del código es usar el comando Graph[] para dibujar los diagramas, especificando los mismos con una función análoga a las $f^{abc}$'s de la estructura de color. El código manipula estas funciones para aplicar las identidades de Jacobi y luego traza los diagramas con Graph[]. Un detalle fino es que las identidades no rastrean los signos particulares para cada diagrama, así que las identidades son puramente esquemáticas y los signos a lo más se pueden rastrear de la función que genera el diagrama comparado con el diagrama original.

Aunque la historia para árboles es interesante y ofrece varias complicaciones para trabajar, el interés del trabajo yacía realmente en nivel de bucles. Aunque yo no estudié realmente ni desarrollé el código con toda generalidad para bucles, mi código tuvo la fortuna de ser fácilmente extensible a bucles:


Estas identidades se pueden encontrar en Scattering Amplitudes in Gauge Theory and Gravity de Elvang y Huang, y se satisfacen en $\mathcal{N}=4$ super Yang-Mills. La idea es que en un futuro proyecto otro estudiante extienda mi código a nivel de bucles.

Una (entre otras) característica deseable sería la de desplegar todas las topologías posibles dados $n$ y, aún más, el número de bucles. A nivel árbol, por ejemplo, para $n=9$, el código debería ser capaz de desplegar algo como


La situación es un tanto más complicada (relacionada con el problema del isomorfismo de grafos) pero sería de suma utilidad si se pudiese implementar para bucles en un tiempo razonable.

La relación de doble copia
Un aspecto sorprendente de todo lo anterior, es la conexión que hay con gravedad (usualmente la bestia indomable de la física); para sentar ideas puede ayudar nuestro amigo Macaulay:


En la segunda diapositiva [7]=arXiv:hep-th/9904026. Esta explicación de Macaulay ya es un indicio de que (amplitudes en) gravedad debe poder ponerse en términos más simples de los que usualmente se ocupan. Igualmente, desde 1986 se tenía este tipo de relación "Gravedad = (Yang-Mills)2" con las relaciones KLT (detalle en esta entrada anterior), que fueron obtenidas en teoría de cuerdas bosónica pero que se reducen a la mencionada relación norma-gravedad a bajas energías (cuerdas → puntos).

Esta relación entre gravedad y norma se conoce como la relación de doble copia, y se puede reducir básicamente a que
\begin{align}
h_{\mu\nu}&\sim{A}_\mu\tilde{A}_\nu\\
V_\text{grav}(123)&={V}_\text{YM}(123)\tilde{V}_\text{YM}(123)\\
|\Phi\rangle_\text{grav}&=|\Phi\rangle_\text{YM}\otimes|\Phi\rangle_\text{YM}\\
\text{Numeradores BCJ}\,\Longrightarrow\,\mathcal{M}_n^{(L)}&=i^{L+1}\left(\frac{\kappa}{2}\right)^{n-2+2L}\sum_{i\in\Gamma_3}\int\prod_{\ell=1}^L\frac{d^Dp_\ell}{(2\pi)^D}\frac{1}{S_i}\frac{N_i\tilde{N}_i}{\prod_{\alpha_i}p^2_{\alpha_i}}
\end{align} en donde para la última ecuación, básicamente sólo se reemplaza el factor de color de la amplitud de norma (\ref{BCJamp}) con un numerador BCJ. Aún más, este numerador puede pertenecer a una teoría distinta de la del otro numerador:

Fuente: Presentación de A. Ochirov (General Relativity: from Geometry to Amplitudes,
Instituto Isaac Newton, Cambridge, 2016)

Para el caso de árboles, la relación de doble copia reproduce las relaciones KLT (obviamente asumiendo color-cinemática; arXiv:1004.0693 [hep-th]) y en general, la mayoría de evidencia, de manera análoga a color-cinemática, es para $\mc{N}=8$ super-gravedad.


Finalmente la mayor relevancia e interés que se pone en la relación de doble copia está en que puede arrojar luz sobre las distintas teorías de gravedad y en general puede ayudar a comprender mucho mejor cuál es la solución al rompecabezas de la gravedad cuántica.

Algunos resultados (recientes y no tan recientes) sobre el comportamiento UV en gravedad
Fuente: Plática de A. Ochirov (QCD Meets Gravity, Instituto Bhaumik, UCLA, 2016)

Bosonización: dualidad fermiones/bosones

En diciembre Joseph Polchinski publicó un artículo recopilatorio sobre dualidades llamado simplemente Dualities (al que luego agregó 'of Fields and Strings'):

Dualities of Fields and Strings
Joseph Polchinski

Duality, the equivalence between seemingly distinct quantum systems, is a curious property that has been known for at least three quarters of a century. In the past two decades it has played a central role in mapping out the structure of theoretical physics. I discuss the unexpected connections that have been revealed among quantum field theories and string theories.

El artículo está muy bien escrito, de manera sencilla y sucinta, y creo que es accesible, al menos a nivel conceptual, incluso a estudiantes de licenciatura. Luego de introducir el tema de dualidades, Polchinski bosqueja algunas dualidades QFT/QFT, entre las que se encuentra la de bosonización (antes, otra cuestión que llama la atención es la de la dualidad onda/partícula como dos límites clásicos de QFT), que es básicamente una dualidad entre una teoría de fermiones de Dirac y una teoría de bosones en 1+1 dimensiones. Ésta dualidad es sorprendente y me pareció sumamente interesante por lo sencilla y porque con mi poco conocimiento de QFT supuse que podría trabajar los detalles; además descubrí que es prácticamente tema estándar en el área de Materia Condensada y seguramente tiene bastantes avances o generalizaciones.

Polchinski se limita a presentar la dualidad: las relaciones entre las constantes de acoplamiento y la correspondencia entre los campos que se deben satisfacer para que las amplitudes sean idénticas. Para obtener el resultado, original de Sidney Coleman (1975), uno tiene varias opciones, como intentar trabajar como sugiere Polchinski: empezar con teorías sin masa y sin interacción, $\mc{L}_\text{F}=i\bar\psi\gamma^\mu\partial_\mu\psi$ y $\mc{L}_\text{B}=-\frac{1}{2}\partial_\mu\phi\partial^\mu\phi$, calcular las amplitudes de dispersión, obtener la correspondencia que las vuelve idénticas y luego deformar nuevamente las teorías a unas con interacción. Y esto es básicamente lo que hace Coleman en su artículo original, calculando funciones de Green en ambos casos:

Quantum sine-Gordon equation as the massive Thirring model
Sidney Coleman

The sine-Gordon equation is the theory of a massless scalar field in one space and one time dimension with interaction density proportional to $\cos\beta\phi$, where $\beta$ is a real parameter. I show that if $\beta^2$ exceeds $8\pi$, the energy density of the theory is unbounded below; if $\beta^2$ equals $4\pi$, the theory is equivalent to the zero-charge sector of the theory of a free massive Fermi field; for other values of $\beta$, the theory is equivalent to the zero-charge sector of the massive Thirring model. The sine-Gordon soliton is identified with the fundamental fermion of the Thirring model.

El artículo es relativamente extenso y confieso que no lo he seguido paso a paso, lo que creo que quizá convendría únicamente si uno quiere entrarle en serio al tema de bosonización.

De cualquier modo, buscando un poco más sobre bosonización, además de encontrar varios títulos de libros sobre el tema enfocados a Física de Partículas y a Materia Condensada, fortuitamente también encontré otro artículo sobre el tema:

Bosonization as Duality
C.P. Burgess, F. Quevedo

We show that bosonization in two dimensions can be derived as a special case of the duality transformations that have recently been used to good effect in string theory. This allows the construction of the bosonic counterpart of any fermionic theory simply by `following your nose' using the standard duality transformation rules. We work through the bosonization of the Dirac fermion, the massive and massless Thirring models, and a fermion on a cylindrical spacetime as illustrative examples.

El artículo comienza con el comentario

Precise rules for various versions of this equivalence have been known for some time now [1][2][3].The statement of these rules generally suffers from the drawback of not being constructive in character, being instead couched in terms of the equivalence of a given pair of bose and fermi theories¹. This is particularly true for nonabelian bosonization, where a simple, systematic, constructive and unified presentation of the bosonization rules is still missing [4]. Our purpose in this note is to provide such a derivation, for the abelian case.

donde abeliano se refiere a que el grupo de simetría de la teoría en cuestión es conmutativo; los mismos autores tratan en otro artículo el caso no-abeliano (también tratado años antes por Witten). Este artículo me pareció bastante mono (al menos de un vistazo) por la sencillez y generalidad. Los autores mencionan un procedimiento llamado dualización que para entonces ya había sido útil para relacionar 'vacíos' aparentemente no relacionados en teoría de cuerdas y lo describen así:

This duality is a trick for constructing the equivalent theory by embedding the model of interest within a larger gauge theory, which reduces to the original version once the gauge potential, $A_\mu$, is set to zero. This larger gauge theory is typically constructed simply by gauging a global symmetry of the original model [7] [8]. The original model is then written as the gauged theory subject to some constraint that removes the gauge potential, and this is usually done by introducing a dummy variable –a Lagrange multiplier field, $\Lambda$– whose functional integral requires the gauge field strength to vanish, $F_{\mu\nu}=0$. (...) If $\Lambda$, and then $A_\mu$, are integrated out –in this order– of the gauged version of the theory, then the original model is retrieved. The dual version of the theory, on the other hand, is obtained by performing the various functional integrals in a different order, in particular by integrating out the original field, as well as $A_\mu$. The Lagrange multiplier, $\Lambda$, then plays the role of the new, dual, field.

La idea en realidad es sencilla, y como mencionan, puede entenderse mejor sólo con el caso concreto del fermión no masivo (por alguna razón lo mencionan como libre) en la sección 2.1). El procedimiento es básicamente plantear la función de partición de los fermiones
\begin{equation}Z_\text{F}[J]=\int\mc{D}\psi\,\exp\left[i\int{d^2x}\left(\bar\psi\gamma^\mu\partial_\mu\psi+\sum_iJ_i\mc{O}_i\right)\right]\end{equation} con los $J_i(x)$ y $\mc{O}_i(\psi)$ campos y operadores, respectivamente (que en el caso más sencillo, como hacen en el artículo, pueden tomarse como constantes de acoplamiento y términos de interacción) y encajarla en una teoría de norma más amplia (básicamente 'normando' una simetría global de la teoría original) sujeta a ciertas constricciones
\begin{equation}Z_\text{gauge}[J]=\int\mc{D}\psi\,\mc{D}A_\mu\,\mc{D}\Lambda\,\exp\left[i\int{d^2x}\left(\mc{L}_\text{F}(\psi,J)+\mc{L}_\text{gauge}(A_\mu,\Lambda)\right)\right]\end{equation} que permita recuperar $Z_\text{F}[J]$ al integrar en $\Lambda$ y en $A_\mu$, i.e. tal que $Z_\text{F}[J]={Z}_\text{gauge}[J]\bigg|_{\Lambda,A_\mu}$. Finalmente esto permite obtener la teoría dual en $\Lambda$ (que como se muestra en el artículo, corresponde a una de bosones) si se integra $Z_\text{gauge}[J]$ en $\psi$ y en $A_\mu$,
\begin{equation}Z_\text{B}[J]\equiv{Z}_\text{gauge}[J]\bigg|_{\psi,A_\mu}=\int\mc{D}\Lambda\exp\left[i\int{d^2x}\,\mc{L}_\text{B}(\Lambda,J)\right]\end{equation} con lo que se obtiene también la correspondencia entre las teorías identificando los términos en $J_i$.

La idea en realidad es sencilla, la parte que resulta complicada para un neófito como yo es la de elegir la teoría de norma y la de hacer la integración, ya sea con fuerza bruta o devorándose los artículos que mencionan los autores. De cualquier modo la parte importante es si quiera saber en primer lugar que esta sorprendente dualidad existe, siendo que el carácter de ambas teorías es tan distinta, y luego entender cómo funciona y el alcance que tiene.

Finalmente, regresando al artículo de Polchinski, en realidad no era consciente de la idea general que plantea acerca de una dualidad como un par de límites de una teoría más fundamental, así que definitivamente me ha causado una impresión importante su artículo (o la parte que he leído seriamente hasta ahora) y en general lo recomiendo ampliamente.

If the doors of perception were cleansed every thing would appear to man as it is, Infinite.

― William Blake, The Marriage of Heaven and Hell


Un Hamiltoniano igual a cero

Hoy recordé esta cuestión de que en Relatividad Especial uno siempre puede parametrizar una línea de mundo casi con el parámetro que se le dé la gana. Lo siguiente casi seguramente nunca se hace en la licenciatura porque lo que hay detrás es un mundo bastante grande, explorado por vez primera (hasta donde sé) por Dirac, sin embargo es un cálculo que si bien es desconcertante, puede abrir el apetito bastante para comenzar a explorar este mundo por cuenta propia. Únicamente se requiere saber Mecánica Clásica en formalismos de Lagrange y Hamilton.

Comparto lo siguiente a manera de puzzle:
  1. Recuerda el Lagrangiano para una partícula de masa $m=1$ de posición $q$, sujeto a un potencial $V=V(q)$,
    \begin{equation}L=L(q,\dot{q})=\frac{1}{2}\dot{q}^2-V(q)\end{equation} de modo que la acción $S$ está dada por
    \begin{equation}S=\int_{t_1}^{t_2}{dt}\left[\frac{1}{2}\dot{q}^2-V(q)\right]\end{equation}
  2. Introduce un nuevo parámetro $\lambda$ tal que $t=t(\lambda)$, de modo que obtengas que
    \begin{equation}S=\int_{\lambda_1}^{\lambda_2}d\lambda\left[\frac{1}{2}\frac{\tilde{q}^2}{\tilde{t}}-V(q)\tilde{t}\right]\end{equation} donde ahora $\tilde{q}\equiv\frac{dq}{d\lambda}$.
  3. Identifica el nuevo Lagrangiano
    \begin{equation}\mathcal{L}=\mathcal{L}(q,\tilde{q},\tilde{t})\equiv\frac{1}{2}\frac{\tilde{q}^2}{\tilde{t}}-V(q)\tilde{t}\end{equation}
  4. Calcula el Hamiltoniano
    \begin{equation}\mathcal{H}\equiv\frac{\partial\mathcal{L}}{\partial\tilde{q}}\tilde{q}+\frac{\partial\mathcal{L}}{\partial\tilde{t}}\tilde{t}-\mathcal{L}\end{equation} y encuentra
    \begin{equation}\mathcal{H}=0\end{equation}
  5. Si es la primera vez que obtienes un Hamiltoniano igual a cero de una teoría (Lagrangiano) que obviamente es dinámica, éste eres tú:
Los que ya saben qué ocurre seguramente se siguen deleitando con este resultado; de cualquier modo si no sabes por qué $\mathcal{H}=0$ puedes leer esta entrada: Cuantización de sistemas singulares e invariancia ante reparametrizaciones (que sobre cuantización de sistemas singulares tiene poco) que escribí cuando investigaba sobre el tema en un Proyecto Terminal de la Licenciatura y que muestra además cómo recuperar las ecuaciones de Schrödinger y de Klein-Gordon (en el caso relativista) al cuantizar. Como dije, el tema es bastante extenso y se conecta directamente, entre otras, a las teorías de norma (o gauge), así que puede ser un buen paso en una interesante dirección ;-)

Cuantización de sistemas singulares e invariancia ante reparametrizaciones

Los conceptos necesarios para seguir esta entrada están discutidos con detalle aquí: Sistemas Hamiltonianos Singulares.

Partícula unidimensional parametrizada
El Lagrangiano de la partícula unidimensional de masa unitaria y de coordenada ${x=x(t)}$ sujeta a un potencial ${V=V(x)}$ es de la forma
\begin{equation}L(x,\dot{x})=\frac{1}{2}\dot{x}^2-V(x)\end{equation} que evidentemente no es singular, y la correspondiente acción está dada por
\begin{equation}S\equiv\int_{A}^{B}L\,dt=\int_A^B\left(\frac{1}{2}\dot{x}^2-V(x)\right)\,dt\end{equation} para la partícula fija en los extremos temporales ${A,B}$. Ahora considérese introducir un parámetro $\tau$ tal que ${x=x(\tau)}$ y ${t=t(\tau)}$ con ${\tau\in[\alpha,\beta]}$, entonces puede escribirse
\begin{align}S&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{d\tau}\right)^2}{\left(\frac{dt}{d\tau}\right)^2}-V(x)\right]\frac{dt}{d\tau}\,d\tau\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}-t^\prime\,V(x)\right]\,d\tau\label{dagger}\end{align} donde ${x^\prime\equiv{dx}/d\tau}$ y de manera análoga para ${t^\prime}$. Sin embargo parece que esta elección fue bastante particular, mejor considérese una reparametrización general ${\tau\to{f}={f}(\tau)}$ que solo por consistencia mantenga ${f(\alpha)=\alpha}$, ${f(\beta)=\beta}$ y ${f^\prime>0}$, de modo que (\ref{dagger}) se escribe
\begin{align}S&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{df}\right)^2}{\left(\frac{dt}{df}\right)}-\frac{dt}{df}\,V(x)\right]df\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{d\tau}\frac{d\tau}{df}\right)^2}{\left(\frac{dt}{d\tau}\frac{d\tau}{df}\right)^2}-\frac{dt}{d\tau}\frac{d\tau}{df}\,V(x)\right]\frac{df}{d\tau}d\tau\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{d\tau}\right)^2}{\left(\frac{dt}{d\tau}\right)^2}-\frac{dt}{d\tau}\,V(x)\right]\left(\frac{d\tau}{df}\right)\left(\frac{d\tau}{df}\right)^{-1}d\tau\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}-t^\prime\,V(x)\right]\,d\tau\end{align} y entonces esta acción es invariante ante reparametrizaciones.

Ahora bien, con el nuevo Lagrangiano en el parámetro $\tau$, se tiene que
\begin{equation}L=\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}-t^\prime{V}(x)\end{equation} y así, la matriz Hessiana
\begin{align}W\equiv\left(\frac{\partial^2L}{\partial\dot{q}^i\partial\dot{q}^j}\right)=\begin{pmatrix}\frac{1}{t^\prime}&-\frac{x^\prime}{t^{\prime\,2}}\\
-\frac{x^\prime}{t^{\prime\,2}}&\frac{x^{\prime\,2}}{t^{\prime\,3}}\end{pmatrix}\end{align} cuyo determinante evidentemente es nulo. Aquí se tiene entonces que la invariancia ante reparametrizaciones es una simetría local que introducirá nuevas restricciones en el sistema que originalmente no habían. Ésta es precisamente una característica de las teorías covariantes generales (o con covariancia general), en donde la idea es que las coordenadas son meros artificios para describir la teoría y no juegan un papel fundamental en la naturaleza.

Véase que se ha llegado aquí con el solo hecho de volver a $t$ una coordenada más y dejar al simple parámetro $\tau$ jugar el papel de $t$. Para pasar a la descripción Hamiltoniana, se tiene que
\begin{align}p_x&=\frac{\partial{L}}{\partial{x}^\prime}=\frac{x^\prime}{t^\prime}\\
p_t&=\frac{\partial{L}}{\partial{t}^\prime}=-\frac{1}{2}\frac{x^{\prime\,2}}{t^{\prime\,2}}-V(x)\end{align} y la restricción primaria es
\begin{equation}\phi_1=\frac{1}{2}p_x^2+p_t+V(x)\approx0\end{equation} de modo que para el Hamiltoniano Total,
\begin{align}\mc{H}_T&=q^{\prime\,i}p_i-L+u^1\phi_1\nonumber\\
&=x^{\prime}p_x+t^{\prime}p_t-\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}+t^\prime{V}(x)+u^1\phi_1\nonumber\\
&=u^1\phi_1\end{align} de donde se sigue que el Hamiltoniano Canónico es nulo, ${\mc{H}=0}$ (!).

Esto resultaría desconcertante si se desconociera el trabajo de Dirac. Aquí se tiene idénticamente ${\{\phi_1,\mc{H}_T\}=0}$ con la conservación de la restricción primaria, que además es de primera clase y por lo que no hay más restricciones y ${u^1}$ queda indeterminado. En este caso el generador de la transformación de norma para algún ${\epsilon=\epsilon(t)}$ arbitrario es
\begin{equation}G=\epsilon\phi_1\end{equation} de modo que las transformaciones de norma infinitesimales son
\begin{align}
\delta{x}&\approx\{x,G\}=\frac{\partial{G}}{p_x}=\epsilon{p}_x\\
\delta{t}&\approx\{t,G\}=\frac{\partial{G}}{\partial{p}_t}=\epsilon\\
\delta{p}_x&\approx\{p_x,G\}=-\frac{\partial{G}}{\partial{x}}=-\frac{dV}{dx}\\
\delta{p}_t&\approx\{p_t,G\}=-\frac{\partial{G}}{\partial{t}}=0
\end{align} Finalmente véase que al cuantizar, ya que
\begin{equation}\hat{\phi}_1\psi=0\end{equation} se sigue que
\begin{align}\hat{p}_t\psi=\left[-\frac{1}{2}\hat{p}_x^2-\hat{V}(x)\right]\psi\end{align} es decir,
\begin{align}i\hbar\frac{\p\psi}{\p{t}}=\left[-\frac{\hbar^2}{2}\frac{\p^2}{\p{x}^2}+\hat{V}(x)\right]\psi\end{align} que es la ecuación de Schrödinger unidimensional para una partícula de masa unitaria sujeta a un potencial ${V(x)}$.

Partícula libre unidimensional relativista
En este caso se considera de manera análoga en un parámetro $\tau$ el Lagrangiano
\begin{equation}L(t,t^\prime,x,x^\prime)=-\sqrt{t^{\prime\,2}-x^{\prime\,2}}\end{equation} que básicamente surge de que la acción de una partícula relativista viajando en una línea de mundo $\mc{C}$ es $S=-\int_\mc{C}ds$ (el signo negativo simplemente hace que la aproximación Newtoniana se recupere eligiendo a $t$ como parámetro) y que puede verificarse es singular mediante el determinante de la matriz Hessiana, además de mantener invariante la acción ante reparametrizaciones. Los momentos conjugados son
\begin{align}p_t&=\frac{\p{L}}{\p{t}^\prime}=-\frac{t^\prime}{\sqrt{t^{\prime\,2}-x^{\prime\,2}}}\\
p_x&=\frac{\p{L}}{\p{x}^\prime}=\frac{x^\prime}{\sqrt{t^{\prime\,2}-x^{\prime\,2}}}\end{align} y la restricción primaria puede proponerse como
\begin{equation}\phi\equiv\frac{1}{2}\left({p}_x^2-p_t^2+1\right)\approx0\end{equation} además, construyendo el Hamiltoniano Total es evidente que éste es proporcional a la restricción, de modo que el Hamiltoniano Canónico nuevamente es nulo y se sigue que la restricción primaria es de primera clase. Para algún ${\epsilon=\epsilon(t)}$ arbitrario, la función generadora es ${G=\epsilon\phi}$, de modo que las transformaciones de norma infinitesimales son
\begin{align}
\delta{t}&=-p_t\\
\delta{x}&=p_x\\
\delta{p_t}&=\delta{p}_x=0
\end{align} Finalmente de manera análoga al ejemplo anterior, al cuantizar, ${\hat{\phi}\psi=0}$ se traduce en
\begin{equation}\left(1+\hat{p}_x^2-\hat{p}_t^2\right)\psi=0\end{equation} es decir
\begin{equation}\left(\frac{\p^2}{\p{t}^2}-\frac{\p^2}{\p{x}^2}+\frac{1}{\hbar^2}\right)\psi=0\end{equation} o bien
\begin{equation}\left(\square+\frac{1}{\hbar^2}\right)\psi=0\end{equation} que es la ecuación de Klein-Gordon en unidades naturales (${c=1}$) para una partícula libre unidimensional y de masa unitaria. En [1] se discute a detalle el proceso de cuantización y cómo la recuperación de estas ecuaciones al cuantizar, junto con otras características, constituyen ejemplos de la consistencia del método de Dirac.

[1] Luis F. Urrutia, Introducción a la cuantización de sistemas singulares, Curso presentado en la VII Escuela de Verano en Física: La visión molecular de la materia.

Sistemas Hamiltonianos Singulares

Las teorías de norma (empleo norma como traducción de gauge) son sistemas con constricciones cuya dinámica se deriva de los llamados Lagrangianos singulares. En general un Lagrangiano singular posee simetrías locales de gran relevancia para la teoría de norma en cuestión; para esto se puede emplear tanto una formulación Lagrangiana como una formulación Hamiltoniana. La discusión sistemática de la formulación Hamiltoniana de teorías de norma se debe a Paul Dirac en los primeros dos capítulos de [2]. Tales teorías son de particular relevancia, dado que todas las interacciones de la naturaleza presuntamente son teorías de norma.

Una teoría de norma puede pensarse como aquella en que las variables dinámicas están especificadas con respecto a un marco de referencia cuya elección es arbitraria para todo tiempo, y tienen como propiedad característica que la solución general de las ecuaciones de movimiento contienen funciones arbitrarias dependientes del tiempo, i.e. variables no observables o variables físicamente irrelevantes, llamadas variables (grados de libertad) gauge o de norma.

En [1] se muestra que aunque la medida de Liouville (localmente una medida ${6n}$-dimensional de Lebesgue) se conserva, el volumen en el espacio fase es puramente un término de norma, por lo que resulta de importancia dedicar una sección al estudio de los sistemas dinámicos singulares e introducir algunos conceptos de las teorías de norma.

Formulaciones Lagrangiana y Hamiltoniana
Comenzando por la formulación Lagrangiana, las condiciones para que la acción de un sistema clásico sea estacionaria son las ecuaciones de Euler-Lagrange
\begin{equation}\frac{d}{dt}\frac{\partial{L}}{\partial\dot{q}^i}-\frac{\partial{L}}{\partial{q}^i}=0\label{1}\end{equation} para las coordenadas generalizadas ${q^i(i=1,\ldots,N)}$ y la Lagrangiana ${L=L(q,\dot{q})}$, de modo entonces que también se tiene ${\partial_{\dot{q}}L=\partial_{\dot{q}}L(q,\dot{q})}$, y así, por regla de la cadena, la ec. (\ref{1}) se escribe como
\begin{equation}\ddot{q}^{\tilde{\imath}}\frac{\partial^2L}{\partial\dot{q}^{\tilde{\imath}}\dot{q}^i}=\frac{\p{L}}{\partial{q}^i}-\dot{q}^{\tilde{\imath}}\frac{\partial^2L}{\partial{q}^{\tilde{\imath}}\partial\dot{q}^i}\end{equation} de donde se tiene que si la matriz Hessiana
\begin{equation}W\equiv\left(\frac{\partial^2L}{\partial\dot{q}^i\partial\dot{q}^{\tilde{\imath}}}\right)\end{equation} es invertible, entonces las aceleraciones ${\ddot{q}^{\tilde{\imath}}}$ están unívocamente determinadas por las posiciones y las velocidades en todo tiempo $t$, lo que se reduce a pedir que $\det(W)\neq0$.

Restricciones Primarias
El caso de interés en una teoría de norma es precisamente en el que $\det(W)=0$, y en ese caso se habla de un Lagrangiano $L$ singular. Esto es equivalente a que por definición del momento conjugado a ${q^i}$,
\begin{equation}p_i\equiv\frac{\partial{L}}{\partial\dot{q}^i}\label{2}\end{equation} no habrá invertibilidad en general de ${\dot{q}^i}$ en términos de ${q^i,\,p_i}$, de modo que existen ciertas restricciones o constricciones
\begin{equation}\phi_j(q,p)=0,\hspace{0.5in}j=1,\ldots,M\end{equation} para los momentos conjugados llamadas primarias (primary constraints en la terminología de Dirac) dado que no implican restricción en las coordenadas ni en las velocidades y que no se emplearon directamente las ecuaciones (\ref{1}) ni de Hamilton para obtenerlas, sino únicamente la definición del momento conjugado. Aquí ${M=N-R}$ con $R$ el rango de $W$.

Estas restricciones primarias definen una subvariedad ${\Gamma_P\subset\Gamma}$ suavemente encajada en el espacio fase $\Gamma$ naturalmente llamada la superficie de constricción primaria. Sobre las restricciones primarias deben establecerse ciertos criterios de regularidad; para el detalle sobre estas condiciones véase la §1.1.2 de [3].

Ecuaciones de Hamilton
Luego para pasar a la descripción Hamiltoniana a partir de la Lagrangiana, se introduce el Hamiltoniano canónico $\mathcal{H}$ como
\begin{equation}\mathcal{H}\equiv\dot{q}^ip_i-L\end{equation} que en los cursos básicos de mecánica suele hacerse énfasis en que éste es dependiente de coordenadas y momentos, no velocidades. Esto puede verse evaluando el cambio $\delta\mc{H}$ frente a variaciones arbitrarias e independientes de coordenadas y velocidades, i.e.
\begin{align}\delta\mc{H}&=\dot{q}^i\delta{p}_i+p_i\delta\dot{q}^i-\underbrace{\frac{\partial{L}}{\partial\dot{q}^i}}_{\equiv{p}_i}\delta\dot{q}^i-\frac{\p{L}}{\p{q}^i}\delta{q}^i\nonumber\\
&=\dot{q}^i\delta{p}_i-\frac{\p{L}}{\p{q}^i}\delta{q}^i\label{3}\end{align} donde $\delta{p}_i$ no es una variación independiente sino una combinación lineal de ${\delta{q}^i}$ y ${\delta\dot{q}^i}$ dado que $p=p(q,\dot{q})$. Esto significa entonces que ${\mc{H}=\mc{H}(p,q)}$, de modo que también se satisface
\begin{equation}\delta\mc{H}=\frac{\p\mc{H}}{\p{p}_i}\delta{p}_i+\frac{\p\mc{H}}{\p{q}^i}\delta{q}^i\end{equation} entonces igualando con (\ref{3}),
\begin{equation}\left(\frac{\p\mc{H}}{\p{p}_i}-\dot{q}^i\right)\delta{p}_i+\left(\frac{\p\mc{H}}{\p{q}^i}+\frac{\p{L}}{\p{q}^i}\right)\delta{q}^i=0\end{equation} donde evidentemente a partir de la definición (\ref{2}), ${\dot{p}=\p_{q}L}$, sin embargo recuérdese que para el caso de interés, $\delta{p}$ debe mantener las restricciones primarias.

En [3] (Teorema 1.2) o en [4] (Proposición 2, §3.3), de distinta forma, puede verificarse que entonces existen ciertos parámetros ${u^j}$ tales que
\begin{align}\dot{q}^i&=\frac{\p\mc{H}}{\p{p}_i}+u^j\frac{\p\phi_j}{\p{p}_i}\\
\dot{p}_i&=\frac{\p\mc{H}}{\p{q}^i}+u^j\frac{\p\phi_j}{\p{q}^i}\\
\phi_j&(q,p)=0\label{4}\end{align} que generaliza las ecuaciones de Hamilton cuando $\mc{H}$ está bien definido sobre ${\Gamma_P}$. Es relevante incluir la última ecuación y hacer énfasis en que se satisface luego de realizar las derivadas parciales en las ecuaciones anteriores. Los $M$ parámetros ${u^j}$ pueden interpretarse en general como parámetros indeterminados de Lagrange ([3]) o bien en [4] se emplean directamente como velocidades ${\dot{q}^j}$ indeterminadas.

De manera análoga al caso no singular, en términos de sistemas singulares la derivada temporal de cualquier función arbitraria ${f=f(q,p)}$ puede escribirse en términos del conocido paréntesis de Poisson
\begin{equation}\{A,B\}\equiv\frac{\p{A}}{\p{q}^i}\frac{\p{B}}{\p{p}_i}-\frac{\p{A}}{\p{p}_i}\frac{\p{B}}{\p{q}^i}\end{equation} como
\begin{equation}\dot{f}=\{f,\mc{H}\}+u^j\{f,\phi_j\}\label{5}\end{equation}

Restricciones Secundarias
Una de las consecuencias de las ecuaciones (\ref{4}), en términos de Dirac, son las llamadas restricciones secundarias, llamadas así precisamente por obtenerse de las ecuaciones de Hamilton, opuesto a las restricciones primarias. Evidentemente las restricciones primarias deben conservarse, por lo que
\begin{equation}\dot{\phi}_j=\{\phi_j,\mc{H}\}+u^{\tilde{\jmath}}\{\phi_j,\phi_{\tilde{\jmath}}\}=0\label{6}\end{equation} que en caso de no imponer restricciones en las ${u^j}$ y de que la relación de coordenadas y momentos sea independiente de las restricciones primarias ([3]), las relaciones (\ref{6}) se llamarán restricciones secundarias. Análogamente las condiciones secundarias al conservarse pueden implicar nuevas condiciones secundarias y así nuevamente.

Ecuaciones Débiles: Restricciones de Primera y Segunda Clase
Luego de las ecuaciones (\ref{4}) deben asumirse las restricciones primarias a las que está sujeto el sistema singular. Como definición, Dirac introduce el concepto de ecuación débil como sigue: ${f\approx{g}}$ significa que $f$ es débilmente igual a $g$ siempre que $f$ es igual a $g$ en ${\Gamma_P\subset\Gamma}$. En contraste, la ecuación ${f=g}$ puede ser referida como fuerte en tanto es cierta en todo $\Gamma$. La ecuación débil ${f\approx{g}}$ entonces es una notación pŕactica equivalente a escribir ([3])
\begin{equation}f\approx{g}\,\Longleftrightarrow\,f-g=c^j\phi_j\end{equation} para algún ${c^j=c^j(q,p)}$, o bien, aún más explícitamente, como el conjunto de ecuaciones ([4])
\begin{align}f&=g\\
\phi_j&=0\end{align} Una vez que se han extraido todas las constricciones independientes del sistema $\varphi_\ell\,(\ell=1,\ldots,M,\ldots,\tilde{M})$, primarias y secundarias, éstas pueden clasificarse en constricciones de primera clase y de segunda clase.

Las constricciones $\gamma_{c_1}$ serán llamadas de primera clase, si su paréntesis de Poisson con todas las constricciones se anula débilmente,
\begin{equation}\{\gamma_{c_1},\varphi_\ell\}\approx0,\hspace{0.2in}\forall\ell,\,c_1=1,\ldots,N_1\end{equation} al resto de constricciones se les llama de segunda clase y les denotaré con ${\chi_{c_2}\,(c_2=1,\ldots,N_2)}$, con ${\tilde{M}=N_1+N_2}$, que se asume son tales que no existe combinación lineal que sea de primera clase.

En general cualquier función ${f=f(q,p)}$ que satisfaga
\begin{equation}\{f,\varphi_\ell\}\approx0,\,\forall\ell\end{equation} se dirá de primera clase y la que no lo satisfaga, se dirá de segunda clase.

El Hamiltoniano Total
Ya que se han extraido todas las constricciones ${\varphi_\ell}$, entonces ya se pueden estudiar las restricciones sobre las ${u^j}$ que imponen las ecuaciones
\begin{equation}\{\varphi_\ell,\mc{H}\}+u^j\{\varphi_\ell,\phi_j\}\approx0\label{8}\end{equation} En [3] se encuentra que la solución general es de la forma
\begin{equation}u^j\approx{U}^j+v^a{V_a}^j\end{equation} donde $U^j$ es una solución particular de la ecuación inhomogénea, i.e.
\begin{equation}U^j\approx-\{\phi_j,\,\varphi_\ell\}^{-1}\{\varphi_\ell,\mc{H}\}\end{equation} y ${v^a{V_a}^j}$ es la solución más general (una combinación lineal con ${a=1,\ldots,A}$) de la ecuación homogénea asociada con coeficientes ${v^a}$ arbitrarios, i.e.
\begin{equation}v^a{V_a}^j\{\varphi_\ell,\,\phi_j\}\approx0\label{9}\end{equation} Así entonces, las ecuaciones (\ref{5}) pueden escribirse simplemente como
\begin{equation}\dot{f}\approx\{f,\mc{H}_T\}\label{10}\end{equation} donde se define el llamado Hamiltoniano Total ${\mc{H}_T}$ como
\begin{equation}\mc{H}_T\equiv\mc{H}+(U^j+v^a{V_a}^j)\phi_j\end{equation} es decir, definiendo
\begin{align}\mc{H}^\prime&\equiv\mc{H}+U^j\phi_j\\
\phi_a&\equiv{V_a}^j\phi_j\end{align} se tiene que
\begin{equation}\mc{H}_T=\mc{H}^\prime+v^a\phi_a\end{equation} que se sabe contiene $A$ funciones arbitrarias ${v^a}$ -que no son funciones a priori de las variables canónicas- y que hace (\ref{10}) equivalente a las ecuaciones de Euler-Lagrange (\ref{1}).

Transformaciones de Norma
Las constricciones de primera clase están íntimamente conectadas con los grados de libertad de norma. La presencia de las funciones arbitrarias ${v^a}$ en ${\mc{H}_T}$ es lo primero que señala que no todas las variables canónicas son observables; esto significa que aunque el estado físico de un sistema está dado una vez conocidas las variables canónicas, habrá más de un conjunto de funciones de las variables canónicas representando el mismo estado. Sin embargo, dado un conjunto inicial de variables canónicas, las ecuaciones de movimiento deben determinar completamente el estado físico del sistema en tiempos posteriores. Así entonces cualquier ambigüedad en el valor de las variables canónicas en un tiempo distinto a un tiempo con condiciones iniciales dadas debe ser una ambigüedad físicamente irrelevante. Una transformación que no altera el estado físico de un sistema se llama entonces transformación de norma.

Considérese una variable dinámica ${f=f(q,p)}$ con un valor inicial ${f_0}$ dado. El valor de $f$ en un tiempo $\delta{t}\ll1$ (conociendo las expresiones dadas por (\ref{10})) es
\begin{equation}f(\delta{t})=f_0+\left(\{f,\mc{H}^\prime\}+v^a\{f,\phi_a\}\right)\delta{t}\end{equation} Ahora bien, ya que los valores ${v^a}$ son arbitrarios, supóngase que para el mismo $f$ con valor inicial ${f_0}$, se elige un valor ${\tilde{v}^a}$; entonces la diferencia ${\Delta{f}}$ entre los valores de $f$ en un tiempo $\delta{t}$ será
\begin{equation}\Delta{f}(\delta{t})=\delta\varepsilon^a\{f,\phi_a\}\label{11}\end{equation} con $\delta\varepsilon^a\equiv(v^a-\tilde{v}^a)\delta{t}$, que precisamente dada la arbitrariedad de los ${v^a}$, debe ser físicamente irrelevante, i.e. $f$ describe el mismo estado al tiempo $\delta{t}$. Éstas son precisamente transformaciones de norma. La función generadora de esta transformación infinitesimal es ${\delta\varepsilon^a}$.

Nótese que de (\ref{8}),
\begin{align}\{\varphi_\ell,\mc{H}\}+u^j\{\varphi_\ell,\phi_j\}&=-\{\mc{H},\varphi_\ell\}-u^j\{\phi_j,\varphi_\ell\}\nonumber\\
&=-\{\mc{H}+u^j\phi_j,\,\varphi_\ell\}\nonumber\\
&=-\{\mc{H}^\prime+v^a{V_a}^j\phi_j,\,\varphi_\ell\}\nonumber\\
&=-\{\mc{H}^\prime,\,\varphi_\ell\}-v^a\{\phi_a,\,\varphi_\ell\}\approx0\end{align} y por (\ref{9}),
\begin{align}v^a{V_a}^j\{\varphi_\ell,\,\phi_j\}=-v^a\{\phi_a,\,\varphi_\ell\}\approx0\end{align} por lo que ${\phi_a}$ y por tanto también ${\mc{H}^\prime}$ y por tanto también ${\mc{H}_T}$ son de primera clase.

Esto significa entonces junto con (\ref{11}), que las restricciones primarias de primera clase generan transformaciones de norma.

En general, en [3] puede verse que el paréntesis de Poisson ${\{\phi_a,\phi_{\tilde{a}}\}}$ de cualesquiera dos restricciones primarias de primera clase y el paréntesis de Poisson ${\{\phi_a,\mc{H}^\prime\}}$ de cualquier restricción primaria de primera clase y el Hamiltoniano de primera clase, generan una transformación de norma. Estos paréntesis de Poisson serán a su vez de primera clase. Aunque parece bastante inofensivo, en [5] puede leerse que Dirac fue quien propuso que ${\{\phi_a,\mc{H}^\prime\}}$ sería también generador de transformaciones gauge y pasarían alrededor de cuarenta años antes de que esta propuesta se demostrara en [3].

Dirac postularía luego que toda restricción secundaria de primera clase también genera transformaciones gauge (conjetura de Dirac), sin embargo pueden generarse contraejemplos, y aunque nada impide que aparezcan restricciones secundarias de primera clase, típicamente únicamente se asume que todas las restricciones de primera clase generan transformaciones de norma ([3]).

El Hamiltoniano Extendido
En la sección del Hamiltoniano Total se consideran únicamente las restricciones primarias de primera clase al llegar al Hamiltoniano Total. Al considerar de manera análoga también las restricciones secundarias de primera clase, se obtiene el llamado Hamiltoniano Extendido ${\mc{H}_E}$, de modo que éste podrá contener tantas transformaciones de norma arbitrarias como restricciones de primera clase. De este modo entonces,
\begin{equation}\mc{H}_E\equiv\mc{H}^\prime+v^a\gamma_a\end{equation} es la forma del Hamiltoniano Extendido, que es una función de primera clase. La etiqueta de extendido se refiere al hecho de que ${\mc{H}_E}$ extiende --y no solo recupera, como ${\mc{H}_T}$-- el formalismo Lagrangiano al considerar todos los grados de libertad de norma posibles. Así entonces Hamiltoniano Extendido da la evolución temporal más general posible para cualquier sistema singular o con libertad de norma.

Paréntesis de Dirac
Considérense todas las restricciones de segunda clase $\chi_{\mc{C}_1}$ tales que no existe combinación lineal de ellas que sea de primer clase. Tomemos dos restricciones $\varphi_{_{1,2}}$ tales que
\begin{equation}\{\chi_{_1},\chi_{_2}\}=\mc{C}\end{equation} para alguna constante $\mc{C}$ y ahora supóngase que se emplea cuantización canónica de modo que
\begin{equation}[\hat{\chi}_{_1},\,\hat{\chi}_{_2}]=i\hbar\mc{C}\label{7}\end{equation} con el conmutador ${[\hat{A},\hat{B}]\equiv\hat{A}\hat{B}-\hat{B}\hat{A}}$. Clásicamente debe satisfacerse
\begin{equation}\chi_{_{1,2}}\approx0\end{equation} lo que no puede llevarse a ${\hat{\chi}_{_{1,2}}\psi=0}$, pues se tendría una contradicción con (\ref{7}).

El argumento de Dirac ([2]) es entonces simplemente ignorar estos grados de libertad y trabajar únicamente con los grados de libertad restantes con un paréntesis de Poisson modificado que respete las restricciones del sistema y lleve a una cuantización consistente.

Las restricciones de segunda clase no son generadores de transformaciones de norma; su existencia únicamente significa que que hay grados de libertad irrelevantes físicamente. Lo que se hace entonces es generalizar el paréntesis de Poisson al llamado paréntesis de Dirac, que contiene únicamente grados de libertad con relevancia física y con el que se puede llevar a cabo una cuantización consistente.

Considérense todas las constricciones de segunda clase $\chi$ (tales que no puede construirse una combinación lineal de éstas que sea de primer clase). Dirac demuestra ([2]) que la matriz de coeficientes
\begin{equation}C_{ab}\equiv\{\chi_a,\,\chi_b\}\end{equation} tiene determinante no nulo de modo que (en este caso) la inversa ${C^{ab}}$ existe ([2]), satisfaciendo
\begin{equation}C^{ab}C_{bc}={\delta^a}_b\end{equation} El paréntesis de Dirac entre dos funciones del espacio fase ${f,g}$ entonces se define como
\begin{equation}\{f,g\}^*\equiv\{f,g\}-\{f,\chi_a\}C^{ab}\{\chi_b,g\}\end{equation} Este nuevo paréntesis por supuesto debe satisfacer bilinealidad, antisimetría, ley del producto y la identidad de Jacobi justo como lo hace el paréntesis de Poisson; además obviamente debe reducirse al paréntesis de Poisson para sistemas no singulares.

Dos consecuencias importantes de el paréntesis de Dirac son las siguientes. Primero, las ecuaciones de movimiento (\ref{10}) pueden escribirse en términos del paréntesis de Dirac de manera equivalente,
\begin{equation}\{f,\mc{H}_T\}^*\approx\{f,\mc{H}_T\}\end{equation} ya que se sabe que ${\mc{H}_T}$ es de primera clase. Además el paréntesis de Dirac de cualquier variable dinámica $f$ con cualquier variable $\chi_{_\zeta}$ se anulará,
\begin{align}\{f,\chi\}^*&=\{f,\chi_\zeta\}-\{f,\chi_a\}C^{ab}\{\chi_b,\chi_\zeta\}\nonumber\\
&=\{f,\chi_\zeta\}-\{f,\chi_a\}{\delta^a}_\zeta\nonumber\\
&=0\end{align} esto significa entonces que puede tomarse ${\chi=0}$ en sentido fuerte. De este modo uno puede deshacerse de las restricciones de segunda clase y entonces proceder a una cuantización canónica de forma consistente únicamente con restricciones de primera clase.

Al emplear los paréntesis de Dirac e imponer fuertemente las constricciones de segunda clase sugiere emplear el proceso conocido como \emph{fijar la norma}, que consiste básicamente en escoger un punto representativo del sistema en cada órbita generada por las restricciones de primera clase ([6]).

Cuantización Estándar
En [6] se muestra de manera condensada el proceso de cuantización estándar, mismo que por completitud se presenta en este trabajo. Para cuantizar se considera el siguiente procedimiento:
i) Se introducen los paréntesis de Dirac, imponiendo fuertemente las constricciones de segunda clase.
ii) Se cuantiza con el principio de correspondencia
\begin{equation}[\hat{A},\hat{B}]=i\hbar\{A,B\}^*\end{equation} iii) Las restricciones de primera clase se promueven a operadores, pidiendo que aniquilen el estado cuántico del sistema ${|\psi\rangle}$, i.e.
\begin{equation}\hat\gamma|\psi\rangle=0\end{equation} de modo que el estado cuántico del sistema sea invariante de norma.
iv) Se construye el Hamiltoniano Total y la evolución del sistema cuántico está dada por
\begin{equation}i\hbar\frac{d|\psi\rangle}{dt}=\hat{\mc{H}}_T|\psi\rangle\end{equation}

[1] Alejandro Corichi & David Sloan, Inflationary Attractors and their Measures, arXiv: 1310.6399 (2013).
[2] Paul A. M. Dirac, Lectures on Quantum Mechanics, Dover Publications, 2001.
[3] Marc Henneaux & Claudio Teitelbom, Quantization of Gauge Systems, Princeton University Press, 1994.
[4] Heinz Rothe & Klaus Rothe, Classical and Quantum Dynamics of Constrained Hamiltonian Systems, World Scientific Publishing, 2010.
[5] Yong-Long Wang et al., The Dirac Conjecture and the Non-uniqueness of Lagrangian, arXiv: 1306.3580v5 (2013).
[6] Luis F. Urrutia, Introducción a la cuantización de sistemas singulares, Curso presentado en la VII Escuela de Verano en Física: La visión molecular de la materia.