Showing posts with label Notas. Show all posts
Showing posts with label Notas. Show all posts

El lema de Poincaré

Una forma exacta $\phi=d\varphi$ es siempre cerrada dado que $d^2=0$. El lema de Poincaré provee la situación en que el converso también es cierto diciendo que una p-forma cerrada $\phi$ en una región abierta $U$ simplemente-conexa de una variedad $M$ será también exacta. Esto es, siempre que $\phi\in\Omega^p(U)$ con $U\subset{M}$ simplemente-conexo y $d\phi=0$, existe una (p-1)-forma $\varphi$ tal que $\phi=d\varphi$.

Vale, intentaré elaborar un poco sobre la prueba de este resultado que he seguido en este documento para 1-formas y en el libro de Nakahara para p-formas. Al final traduciré algunas cosas a $\mathbb{R}^3$.

1-formas
Acá trataré con una 1-forma cerrada $\phi$ y superficies o 1-variedades $M$. Lo primero que uno piensa es en usar las palabras mágicas simplemente-conexo, pues es lo que hace válido el lema. Intuitivamente, simplemente-conexo significa que está hecho de una sola pieza (conexo) y no tiene hoyos; para formalizar, podemos definir la llamada homotopía de una curva cerrada simple (o que no se intersecta a sí misma; en adelante las llamaré circuitos) $\mc{C}:[a,b]\to{M}$ tal que $\mc{C}(a)=\mc{C}(b)\equiv{p}$ (en general con $\mc{C}^\prime(a)\neq\mc{C}^\prime(b)$) a un punto de la curva, también llamada nulhomotopía, como el mapeo
\begin{equation}h:[a,b]\times[0,1]\to{M}\end{equation} tal que para $u\in[a,b]$, $v\in[0,1]$,
\begin{align}h(u,0)&=\mc{C}(u)\\
h(u,1)&=h(a,v)=h(b,v)=p\end{align} que estrictamente es un 2-segmento (o 2-celda) de $M$ pero que puede pensarse como una colección de circuitos $\mc{C}_v(u)=h(u,v)$ para cada $v$, o mejor aún como una función continua que deforma $\mc{C}$ en el punto $p$ a través del parámetro $v$. Si tal mapeo existe, se dice que $\mc{C}$ es nulhomotópica u homotópica a una constante.

Ilustración en Wikipedia. Un ejemplo visualmente sencillo: $S^2$ es simplemente conexo (en dos dimensiones) porque es conexo y cualquier circuito es nulhomotópico.
Así pues, $M$ es simplemente-conexo si es conexo y cualquier circuito en $M$ es nulhomotópico. Nos interesaría entonces emplear el hecho de que la 1-forma cerrada $\phi$ está en una región $U$ simplemente-conexa de $M$. Considerando entonces un circuito $\mc{C}:[a,b]\to{U}$ y su nulhomotopía $h$, lo más inmediato es usar el teorema de Stokes (segunda igualdad),
\begin{equation}0=\int\limits_hd\phi=\int\limits_{\p{h}}\phi\label{stokes1}\end{equation} Aquí el calcular la frontera $\p{h}$ me resultó un tanto confuso; de cualquier modo lo entendí considerando el caso de un círculo en $\mathbb{R}^2$ con la nulhomotopía siendo un disco. Puedes verlo usando el siguiente botón o continuar si no lo consideras necesario.



Sean entonces $\alpha(u)=h(u,0)$, $\beta(v)=h(b,v)$, $\gamma(u)=h(u,1)$, $\delta(v)=h(a,v)$ los bordes de $h$, de modo que
\begin{equation}\p{h}=\alpha+\beta-\gamma-\delta\end{equation} y en particular nota que en una nulhomotopía, $\beta^\prime(v)=\gamma^\prime(u)=\delta^\prime(v)=0$, de modo que se tiene por (\ref{stokes1}) que
\begin{align}\int\limits_{\p{h}}\phi&=0\nonumber\\
&=\int\limits_\alpha\phi+\underbrace{\int\limits_\beta\phi-\int\limits_\gamma\phi-\int\limits_\delta\phi}_{=\int\limits_0^1\phi(\beta^\prime(v))\,dv-\int\limits_a^b\cdots\,=0}\nonumber\\
&=\int\limits_\alpha\phi=\int\limits_\mc{C}\phi\end{align}


es decir, obtenemos que la integral de una 1-forma cerrada $\phi$ a través de un circuito $\mc{C}$ en una región simplemente-conexa es cero,
\begin{equation}\oint\limits_\mc{C}\phi=0\end{equation} que no es más que decir que si tomamos dos puntos $p$ y $q$ y dos curvas que los unan, $\delta$ y $\eta$, de modo que $\mc{C}=\delta-\eta$,
\begin{equation}\int\limits_\delta\phi=\int\limits_\eta\phi\end{equation} i.e. la integral será independiente de los caminos $\delta$ y $\eta$. Usualmente también ésta se toma como una definición equivalente de una forma exacta, e.g. en cursos de termodinámica, donde se toma prácticamente como definición. Sabemos entonces que la integral sólo dependerá de $p$ y $q$; supongamos que fijamos $q$ y dejamos que $p$ sea cualquier punto en $U$, entonces podemos proponer una función $\varphi\in{C}^\infty(U)$ tal que
\begin{equation}\varphi(p)=\int\limits_\eta\phi\end{equation} Más generalmente, consideremos $\eta:[a,b]\to{U}$ y algún $t\in[a,b]$ de modo que tengamos en mente el segmento $\eta_t:[a,t]\to{U}$ y cualquier punto dinámico $\eta(t)$,
\begin{equation}\varphi\left(\eta(t)\right)=\int\limits_{\eta_t}\phi=\int_a^t\phi(\eta^\prime(u))\,du\label{poin1}\end{equation} Considerando $\eta(t)$ en coordenadas locales de modo que $d\varphi=\p_i\varphi\,dx^i$, sea entonces $f:U\to\mathbb{R}$ una función cualquiera de modo que $\frac{df(\eta(t))}{dt}=\frac{dx^i}{dt}\frac{\p{f}}{\p{x}^i}$, entonces $\eta^\prime(t)=\frac{dx^i(\eta(t))}{dt}\p_i$ en coordenadas locales, lo que nos permite calcular que
\begin{equation}d\varphi\left(\eta^\prime(t)\right)=\frac{\p\varphi}{\p{x}^i}\frac{dx^i}{dt}=\frac{d\varphi(\eta(t))}{dt}\end{equation} lo que entonces lleva por (\ref{poin1}) a que
\begin{equation}d\varphi(\eta^\prime(t))=\phi\left(\eta^\prime(t)\right)\end{equation} y $\eta^\prime(t)$ es un vector definido en cada punto de $\eta$ que a su vez es arbitraria siempre que su imagen y su último punto estén en la región simplemente conexa $U\subset{M}$, de modo entonces que en general
\begin{equation}d\varphi=\phi\end{equation} lo que prueba el lema para 1-formas.
Henri Poincaré dibujado por David Levine.
Fuente: www.nybooks.com/galleries/david-levine-illustrator

El lema de Poincaré naturalmente es válido para p-formas con $p\geq1$. El famoso libro de Nakahara, disponible en línea aquí, tiene una demostración sencilla que a lo más requiere la generalización de una nulhomotopía a un punto $p\in{U}$ como $H:U\times[0,1]\to{U}$ con $H(u,0)=u$ y $H(u,1)=p$ para $u\in{U}$ y la definición del pullback de una forma diferencial por una función. Seguramente también es posible generalizar los mismos pasos para p-formas que los que mostré para 1-formas, aunque probablemente sea más laborioso que la demostración de Nakahara; en general debe haber muchas formas y otras muy sencillas de probar el lema.

A fin de cuentas, de cualquier modo, el lema es prácticamente siempre, o lo que es lo mismo, es válido siempre localmente.

Traducción al cálculo vectorial en $\mathbb{R}^3$
Del lema de Poincaré surgen todas las propiedades lindas que se usan en termodinámica con derivadas parciales para las variables de estado; como sea, la situación es realmente más elaborada que esto, aunque a los físicos les sea poco útil esta formalidad.

En general todo espacio vectorial $V$ tiene un espacio dual $V^*$ en el sentido de que existen mapeos de $V$ en $\mathbb{R}$. En el caso de variedades, al menos siempre localmente, se puede proveer un isomorfismo (o difeomorfismo) entre ambos a través de la métrica. El caso de $\mathbb{R}^3$ es bastante lindo como motivación para aprender el lenguaje de las formas diferenciales, que si bien no cambian el contenido, hacen las cosas mucho más sencillas y elegantes. Un ejemplo es el electromagnetismo, que usualmente se formula usando cálculo vectorial, e.g. puedes consultar: Maxwell's equations in terms of differential forms (que en general también sirve para introducirse como físico a las formas diferenciales), y en general muchos temas en física matemática como las teorías de norma (GFT's) están formuladas en estos términos. Adelante sólo asumo primero tres dimensiones y luego paso a $\mathbb{R}^3$ (asumiendo coordenadas cartesianas).

La playera que se ha visto utilizan l@s jóvenes cool de hoy$$F=\frac{1}{2}F_{\mu\nu}dx^\mu\wedge{d}x^\nu$$
0-formas
Primero, en el caso de 0-formas o funciones $\varphi\in\Omega^0$, evidentemente el isomorfismo $\Omega^0\to\Omega^0=C^\infty$ es una identidad $\varphi\mapsto{\varphi}$.

1-formas
Para 1-formas $\phi\in\Omega^1$, se tiene localmente $\phi=\phi_idx^i$ y a través de una métrica, $g$ se obtiene
\begin{align}g^{-1}(\phi,\sigma)&=g^{ij}\phi_i\sigma_j\nonumber\\
&=g^{i\beta}\phi_i\sigma_\alpha\delta^\alpha_\beta\nonumber\\
&=g^{i\beta}\phi_i\p_\beta(\sigma_\alpha{d}x^\alpha)=\phi^i\p_i(\sigma)\end{align} esto es, $g^{-1}(\phi,\cdot)=g^{ij}\phi_i\p_j$, en general, $\phi\mapsto{g}^{-1}(\phi,\cdot)$. Ahora bien, considerando que $d:\Omega^p\to\Omega^{p+1}$, tenemos que $d\varphi\mapsto{g}^{ij}(\p_i\varphi)\p_j$ que en el caso del contradominio ${C}^\infty(\mathbb{R}^3,\mathbb{R}^3)$, con $g^{ij}=\delta^{ij}=\delta_{ij}$, se reduce a $d\varphi\mapsto\nabla\varphi$. Así, el lema de Poincaré en el cálculo vectorial Euclídeo se traduce en que campos conservativos son campos gradiente,
\begin{equation}\phi=d\varphi\longleftrightarrow\vec{\phi}=\nabla\varphi\end{equation} donde $\vec\phi={g}^{-1}(\phi,\cdot)$. La correspondencia mediante la métrica $g$ se llama el isomorfismo musical, que tiene tanto el isomorfismo $\sharp:\Omega^1\to{V}$ como su inversa $\flat:V\to\Omega^1$ (hasta donde sé, el nombre es simplemente por los símbolos de sostenido $\sharp$ y bemol $\flat$) y puede señalarse de manera más sencilla, e.g. en este caso el isomorfismo en términos de $\sharp$ es
\begin{equation}\phi\mapsto\phi^\sharp=g^{ij}\phi_i\p_j\end{equation}

2-formas
Para 2-formas $\omega\in\Omega^2$, localmente, $\omega=\omega_{ij}dx^i\wedge{d}x^j=\frac{\omega_{ij}}{2}(dx^i\otimes{d}x^j-dx^j\otimes{d}x^i)$. Ahora bien, aunque el isomorfismo musical puede extenderse en general para mandar $\bigotimes\limits^pT(M)$ en $\bigotimes\limits^pT^*(M)$ (que no es exactamente el espacio de p-formas) y viceversa, lo que nos interesa es mandar 2-formas en campos vectoriales o funciones. Si consideramos dos 1-formas $\alpha$ y $\beta$, localmente podemos formar la 2-forma
\begin{align}\alpha\wedge\beta&=\alpha_i\beta_j{d}x^i\wedge{d}x^j\nonumber\\
&=(\alpha_1\beta_2-\alpha_2\beta_1)dx^1\wedge{d}x^2+(\alpha_2\beta_3-\alpha_3\beta_2)dx^2\wedge{d}x^3+(\alpha_3\beta_1-\alpha_1\beta_3)dx^3\wedge{d}x^1\end{align} donde los coeficientes tienen exactamente la misma cara que los de un producto cruz de vectores 3-dimensional. El operador necesario en este caso es el dual (o estrella) de Hodge $\star:\Omega^p\to\Omega^{(n-p)}$, definido por
\begin{equation}\star(dx^{i_1}\wedge\cdots\wedge{d}x^{i_p})\equiv\frac{\sqrt{|g|}}{(n-p)!}{\epsilon^{i_1\cdots{i}_p}}_{j_1\cdots{j}_{n-p}}dx^{j_1}\wedge\cdots\wedge{d}x^{j_{n-p}}\end{equation} que entonces aquí mandará 2-formas en 1-formas a través de (asumo $\sqrt{|g|}=1$ en adelante)
\begin{equation}\star(dx^i\wedge{d}x^j)={\epsilon^{ij}}_kdx^k\end{equation} de modo que en tres dimensiones $\star(\alpha\wedge\beta)=\vec{\alpha}\times\vec{\beta}$ y entonces el isomorfismo $\Omega^2(\mathbb{R}^3)\to{C^\infty(\mathbb{R}^3,\mathbb{R}^3)}$ es (empleo $\{\mathrm{e}_i\}$ como la base de vectores)
\begin{equation}\omega\mapsto(\star\omega)^\sharp=\epsilon_{ijk}\omega_{ij}\mathrm{e}_k\end{equation} Si además $\omega$ es cerrada, también por lema de Poincaré $\omega=d\phi$ y así
\begin{equation}(\star\,d\phi)^\sharp=\epsilon_{ijk}\p_i\phi_j\mathrm{e}_k=\nabla\times\phi^\sharp\label{conm1}\end{equation} de modo que la versión equivalente del lema es $\vec{\omega}=\nabla\times\vec\phi$, i.e. la versión para campos rotacionales. Si nuevamente $\phi$ es cerrada y por el lema también exacta, se tiene la equivalencia de que los campos conservativos son también irrotacionales,
\begin{equation}\omega=d\phi=d^2\varphi=0\longleftrightarrow\vec\omega=\nabla\times\vec\phi=\nabla\times\nabla\varphi=0\end{equation}

3-formas
Finalmente la estrella de Hodge manda 3-formas $\psi\in\Omega^3$, localmente $\psi=\psi_{ijk}dx^i\wedge{d}x^j\wedge{d}x^k$ en 0-formas, entonces
\begin{equation}\psi\mapsto\star\psi=\epsilon^{ijk}\psi_{ijk}\end{equation} es un isomorfismo $\Omega^3\to\Omega^0=C^\infty$ inducido naturalmente. En este caso si $\psi=d\omega$, en $\mathbb{R}^3$,
\begin{equation}\star{d}\omega=\epsilon_{ijk}\p_k\omega_{ij}=\nabla\cdot(\star\omega)^\sharp\end{equation} de modo que el lema se traduce en $\star\psi=\nabla\cdot\vec\omega$; si aún a su vez $\omega=d\phi$, se tiene la equivalencia de que los campos rotacionales son libres de divergencia,
\begin{equation}\psi=d\omega=d^2\psi=0\longleftrightarrow\star\psi=\nabla\cdot\vec\omega=\nabla\cdot(\nabla\times\vec\phi)=0\end{equation} Nota de cualquier modo que también, en general para cualquier 1-forma $\zeta\in\Omega^1$ se puede formar
\begin{align}\star{d}\star\zeta&=\star{d}\left(\frac{1}{2}{\epsilon^{i}}_{jk}\zeta_idx^j\wedge{d}x^k\right)\nonumber\\
&=\star\left(\frac{1}{2}{\epsilon^{i}}_{jk}\p_\ell\zeta_i\,dx^\ell\wedge{d}x^j\wedge{d}x^k\right)\nonumber\\
&=\frac{1}{2}\epsilon^{\ell{j}k}{\epsilon^{i}}_{jk}\p_\ell\zeta_i=\delta^{\ell{i}}\p_\ell\zeta_i\stackrel{\mathbb{R}^3}{=}\nabla\cdot\zeta^\sharp\end{align} de manera que igualmente se puede construir $\star{d}\star{d}\varphi=\nabla\cdot\nabla\varphi$.

El complejo de De Rham
Esto usualmente se hace de manera inversa, es decir, pasando de las relaciones del cálculo vectorial a las de las formas diferenciales, de cualquier modo esta manera también es útil y asimismo sirve para notar la generalidad de las p-formas. El siguiente diagrama (formalmente llamado complejo de De Rham)
$$\matrix{ \Omega^0(\mathbb{R}^3) & \stackrel{d}{\longrightarrow} & \Omega^1(\mathbb{R}^3) & \stackrel{d}{\longrightarrow} & \Omega^2(\mathbb{R}^3) & \stackrel{d}{\longrightarrow} & \Omega^3(\mathbb{R}^3) \cr
\big\downarrow\small{\mathrm{Id}}& & \big\downarrow\small{\sharp} & & \big\downarrow\small{\sharp\circ\star} & & \big\downarrow\small{\star} \cr
C^\infty(\mathbb{R}^3) & \stackrel{\nabla}{\longrightarrow} & C^\infty(\mathbb{R}^3,\mathbb{R}^3) & \stackrel{\nabla\times}{\longrightarrow} & C^\infty(\mathbb{R}^3,\mathbb{R}^3) & \stackrel{\nabla\cdot}{\longrightarrow} & C^\infty(\mathbb{R}^3) \cr}$$ con
\begin{align}\mathrm{Id}(\varphi)&=\varphi\\
\sharp(\phi_idx^i)&=\phi_i\mathrm{e}_i\\
\sharp\circ\star(\omega_{ij}dx^i\wedge{dx}^j)&=\epsilon_{ijk}\omega_{ij}\mathrm{e}_k\\
\star(\psi_{ijk}dx^i\wedge{dx}^j\wedge{dx}^k)&=\epsilon^{ijk}\psi_{ijk}\end{align} encapsula de manera bastante concisa toda la información anterior. Como se vio, el diagrama conmuta, i.e. se llega al mismo lugar sin importar qué flechas se sigan.

Acotaciones sobre geometría clásica en "Teoría de cuerdas en variedades Calabi-Yau"

Esta entrada se refiere a las notas String Theory on Calabi-Yau Manifolds de Brian Greene en la sección 2, Some Classical Geometry. Las notas son bastante digeribles para los estudiantes interesados, y en particular esta sección, para los que no han estudiado geometría diferencial o desconocen el lenguaje de las formas diferenciales. Acá muestro algunas acotaciones que me ha sido necesario hacer para leer esta parte de las notas y que en general pueden resultar útiles en otros contextos.

(...) a function $h:\mathbb{C}^{n/2}\to\mathbb{C}^{n/2}$ is holomorphic if $h(z_1,\overline{z}_1,\ldots,z_{n/2},\overline{z}_{n/2})$ is actually independent of all the $\overline{z}_j$
(p. 15)
Se tiene $z\equiv{x+iy}$ y sean $\text{Re}[h]\equiv{u}(x,y),\,\text{Im}[h]\equiv{v}(x,y)$. De las ecuaciones de Cauchy-Riemann,
\begin{align}u_x&=v_y\\u_y&=-v_x\end{align} se sigue que
\begin{equation}u_x+iv_x=v_y-iu_y\end{equation} de modo que también,
\begin{equation}h_x+ih_y=0\end{equation} y ya que $\overline{z}=x-iy$, por regla de la cadena,
\begin{align}h_x&=\overline{z}_xh_\overline{z}=h_\overline{z}\\h_y&=\overline{z}_yh_\overline{z}=-ih_\overline{z}\end{align} y finalmente,
\begin{equation}h_\overline{z}=0\end{equation} como se esperaba.

(...) $X$ and $Y$ are diffeomorphic but not biholomorphic
(p. 18)
La idea es clara pero la ecuación (2.5) debería leerse algo así como
\begin{equation}z=y_1+iy_2=x_1+ix_2=\frac{1}{2}(\omega+\overline{\omega})+(\omega-\overline{\omega})=\frac{3}{2}\omega-\frac{1}{2}\overline{\omega}\end{equation} de modo que $z$ no es una función holomorfa en $\omega$.

The antisymmetry involved in exterior differentiation ensures that $d(d\alpha)=0$ for any form $\alpha$
(p. 22)
Esto es evidente de la definición de la derivada exterior aplicada dos veces,
\begin{equation}d(d\alpha)\equiv{d}^2\alpha=\p_{jk}\alpha_{i_1\ldots{i}_p}\,dx^j\wedge{d}x^k\wedge{d}x^{i_1}\wedge\ldots\wedge{d}x^{i_p}\end{equation} ya que j,k pueden intercambiarse, pero también $dx^j\wedge{d}x^k=-dx^k\wedge{d}x^j$. Algo lindo de este resultado es que en $\mathbb{R}^3$ es equivalente a los resultados $\nabla\times(\nabla{f})=0$ y $\nabla\cdot(\nabla\times{v})=0$, i.e. en general el diagrama
$$\matrix{ \Omega^0 & \stackrel{d}{\longrightarrow} & \Omega^1 & \stackrel{d}{\longrightarrow} & \Omega^2 & \stackrel{d}{\longrightarrow} & \Omega^3 \cr
\big\uparrow\small{r}& & \big\uparrow\small{s} & & \big\uparrow\small{t} & & \big\uparrow\small{u} \cr
\Omega^0 & \stackrel{\nabla}{\longrightarrow} & V & \stackrel{\nabla\times}{\longrightarrow} & V & \stackrel{\nabla\cdot}{\longrightarrow} & \Omega^0 \cr}$$ conmuta (empleo $\Omega^q$ como el espacio de $q$-formas en la variedad $X$; $V$ son campos vectoriales, $r,s,t,u$ son isomorfismos y que el diagrama conmute significa, por ejemplo, que $s\circ\nabla=d\circ{r}$ o que $d\circ{s}\circ\nabla=t\circ\nabla\times\circ\nabla$, etc...).

In local coordinates, the fact that $dJ=0$ for a Kähler manifold implies
$$dJ=(\p+\overline\p)i{g}_{i\bar\jmath}dz^i\wedge{d}\overline{z}^\overline{\jmath}$$ This implies that $$\frac{\p{g}_{i\overline{\jmath}}}{\p{z}^\ell}=\frac{\p{g}_{\ell\overline{\jmath}}}{\p{z}^i}$$(p. 24)
Se tiene que
\begin{align}dJ=i\left(\p_\ell{g}_{i\overline\jmath}\,dz^\ell\wedge{d}z^i\wedge{d}\overline{z}^{\overline\jmath}+\p_\overline{\ell}g_{i\overline\jmath}\,{d}\overline{z}^{\overline{\ell}}\wedge{d}z^i\wedge{d}\overline{z}^{\overline\jmath}\right)=0\end{align} que tiene sumandos con partes (2-holomorfa,1-antiholomorfa) y viceversa, de modo que deben anularse independientemente. Descomponiendo los objetos $\p_\mu{g}_{\nu\overline{\sigma}}$ y $\p_\overline{\mu}{g}_{\nu\overline{\sigma}}$ en partes simétrica y antisimétrica en los pares de índices del mismo tipo, sólo la parte antisimétrica no se anula idénticamente junto con la (r,s)-forma correspondiente al expandir los índices, entonces,
\begin{align}dJ=\frac{i}{2}\left[(\p_\ell{g}_{i\overline\jmath}-\p_i{g}_{\ell\overline\jmath})\,dz^\ell\wedge{d}z^i\wedge{d}\overline{z}^{\overline\jmath}+(\p_\overline{\ell}g_{i\overline\jmath}-\p_\overline{\jmath}g_{i\overline{\ell}})\,{d}\overline{z}^{\overline{\ell}}\wedge{d}z^i\wedge{d}\overline{z}^{\overline\jmath}\right]=0\end{align} de modo que se sigue finalmente que
\begin{align}\p_\ell{g}_{i\overline\jmath}&=\p_i{g}_{\ell\overline\jmath}\\
\p_\overline{\ell}g_{i\overline\jmath}&=\p_\overline{\jmath}g_{i\overline{\ell}}\end{align} como se esperaba.

...it is not hard to show that $\gamma$ vanishes...
(p.27)
Vale, ciertamente no es difícil, pero se requiere algo más que $\Delta\omega^\prime=0$. Sea $\alpha$ una $p$-forma cualquiera, entonces tomando en cuenta que el producto interior $\langle\cdot,\cdot\rangle$ es positivo definido,
\begin{align}\langle\Delta\alpha,\alpha\rangle&=\langle{d^\dagger}d\alpha+dd^\dagger\alpha,\alpha\rangle\nonumber\\
&=\langle{d^\dagger}d\alpha,\alpha\rangle+\langle{d}d^\dagger\alpha,\alpha\rangle\nonumber\\
&=\langle{d}\alpha,d\alpha\rangle+\langle{d^\dagger}\alpha,d^\dagger\alpha\rangle\geq0\end{align} entonces si $\alpha$ es armónica, la igualdad se cumple y así también $d\alpha=d^\dagger\alpha=0$. De aquí se sigue que si
\begin{equation}\omega=d\beta+d^\dagger\gamma+\omega^\prime\end{equation} es cerrada y $\omega^\prime$ es armónica,
\begin{equation}d\omega=dd^\dagger\gamma=0\end{equation} y ya que también, en general para cualquier $\alpha$,
\begin{equation}\langle{d}d^\dagger\alpha,\alpha\rangle=\langle{d}^\dagger\alpha,d^\dagger\alpha\rangle\geq0\end{equation} se tiene finalmente que $d^\dagger\gamma=0$, que es realmente lo que se necesita mostrar.

...it is straightforward to show that all of the Laplacians built from $d$, $\overline\p$ and $\p$, namely $\Delta$, $\Delta_\overline{\p}$ and $\Delta_\p$ are related by $$\Delta=2\Delta_\overline{\p}=2\Delta_\p$$ (p.27)
En este caso, a diferencia del anterior, además de también requerir más, aparentemente no es realmente tan simple. El famoso Geometry, Topology and Physics de Mikio Nakahara se limita a decir "The proof requires some technicalities and we simply refer to Schwartz (1986) and Goldberg (1962)".

Yo me limitaré a la misma salida: Kähler identities.

Finalmente las propiedades
\begin{align}h^{r,s}_X&=h^{m-r,m-s}_X\\[0.1in]
h^{r,s}_X&=h^{s,r}_X\\[0.1in]
H^p_d(X)&=\bigoplus_{r+s=p}H^{r,s}_{\overline\p}(X)\end{align} también se discuten en el libro de Nakahara (Greene no lo menciona, pero $m\equiv\text{dim}_\mathbb{C}{X}$). Al menos las dos últimas requieren $\Delta\propto\Delta_\overline{\p}=\Delta_\p$.

It is not hard to show that the vanishing of the $U(1)$ part of the connection, effectively its trace, which ensures that the holonomy lies in $SU(d)$, is tantamount to having a Ricci-flat metric.
(p. 31)
El álgebra de Lie, $\mathfrak{u}(d)$, del grupo unitario, $U(d)$, consiste en las matrices antisimétricas complejas (o antihermitianas) $d\times{d}$, con el corchete de Lie dado por el conmutador. Así entonces se puede introducir una (1,1)-forma de curvatura
\begin{equation}\Omega_{\overline{k}\ell}\equiv{R}_{\overline{k}\ell{i}\overline\jmath}dz^i\wedge{d}\overline{z}^{\overline\jmath}\end{equation} que en efecto satisface
\begin{align}\Omega_{\overline{k}\ell}&=\overline{{R}_{k\overline{\ell\imath}j}d\overline{z}^\overline{\imath}\wedge{dz}^j}\nonumber\\
&=-\overline{{R}_{\overline{\ell}k\overline{\imath}j}d\overline{z}^\overline{\imath}\wedge{dz}^j}\nonumber\\
&=-\overline{{R}_{\overline{\ell}kj\overline{\imath}}dz^j\wedge{d}\overline{z}^\overline{\imath}}\nonumber\\
&=-\overline{\Omega_{\bar{\ell}k}}\end{align} De aquí entonces, ya que $\mathfrak{u}(d)\simeq\mathfrak{su}(d)\oplus\mathfrak{u}(1)$, i.e. $\Omega_{\overline{k}\ell}$ puede descomponerse en una parte con traza nula en $\mathfrak{su}(d)$ más su traza en $\mathfrak{u}(1)$, de modo que el que la traza cumpla
\begin{equation}{\Omega^\ell}_\ell=R_{i\overline\jmath}dz^i\wedge{d}\overline{z}^\overline\jmath=\p_i{\Gamma^\overline{k}}_{\overline{\jmath{k}}}dz^i\wedge{d}\overline{z}^\overline\jmath=0\end{equation} equivale a que tener una métrica Ricci-plana y a que el grupo de holonomía esté contenido en $SU(d)$.

Ésta es la idea sencilla, basada en Calabi-Yau Manifolds: A Bestiary For Physicists. En The N=2 wonderland: From Calabi-Yau Manifolds To Topological Field Theories se puede encontrar otro tratamiento que justifica un tanto más la introducción de la forma de curvatura.

Thus, a quintic hypersurface in $\mathbb{C}P^4$ es a Calabi-Yau manifold with complex dimension 3.
(p. 33)
Esta parte de las notas es a la que refiero aquí.
En general desde la discusión de los espacios $\mathbb{C}P^n$, para los no-iniciados (como yo) es necesario consultar otras fuentes en extenso.

Atractores Cosmológicos

En la UAM no existe tal cosa como la titulación por tesis a nivel licenciatura (que yo sepa), sin embargo existe algo análogo llamado Proyecto Terminal en donde uno básicamente tiene que desarrollar un tema en el que esté interesado y enfrentarse a las dificultades que implica la investigación científica.

Soy de la idea de que sería algo verdaderamente bueno el que hubiera acceso libre al trabajo generado en estos proyectos, al menos por parte de la misma comunidad; hay compañeros que parecen estudiar cosas bastante interesantes y generar contenido que puede resultar útil, e.g. código fuente, además de proporcionar algo así como una guía para quien apenas está en vías de decidir qué camino tomar. Aunque hay algo parecido, parece estar desactualizado, además de estar poco promovido y -a mi parecer- resultar poco atractivo. Como sea, lo siguiente es mi trabajo del primer proyecto (de dos), que cubre temas que no son vistos regularmente en la licenciatura (dos de ellos están escritos aquí: Sistemas Hamiltonianos Singulares y El modelo FLRW) y que afortunadamente entra en armonía con las noticias recientes acerca de inflación cosmológica.

Resumen
La naturaleza de las soluciones de tipo atractor en cosmología inflacionaria ha sido controversial, ya que este aparente comportamiento en sistemas cosmológicos con campo escalar y potencial inflacionario contradiría el teorema de Liouville, que afirma que el volumen de cualquier región dada en el espacio fase permanece invariante. En este trabajo se presentan algunos de los elementos físicos y matemáticos básicos necesarios para entender el concepto de atractores en modelos cosmológicos con campo escalar, así como para poder abordar algunos resultados recientes en el tema, como son [1] y [2]. Los principales temas tratados son: i) Sistemas Hamiltonianos Singulares, ii) El modelo de FLRW, iii) Las ecuaciones de Einstein acopladas a un campo escalar y iv) Inflación, Medidas y Atractores. Este trabajo cubre la primera parte de lo que se planea como dos proyectos terminales que se cubrirán en los dos trimestres consecutivos 14-I y 14-P. Por facilidad y plausibilidad se cita eventualmente código escrito para el software Wolfram Mathematica 8 al realizar diversos cálculos.
El enlace: Atractores Cosmológicos I

El modelo de Friedmann-Lemaître-Robertson-Walker

La esencia de la relatividad general es que el espaciotiempo es una variedad cuatrodimensional dotada de una métrica ${g_{\alpha\beta}}$ de signatura de Lorentz (-+++) relacionada con la densidad de materia vía las ecuaciones de Einstein ${G_{\alpha\beta}=8\pi{G}T_{\alpha\beta}}$. Una cuestión vital de la relatividad general es conocer qué solución a las ecuaciones de Einstein corresponde a nuestro universo, o al menos a un modelo idealizado de nuestro universo.

El principio cosmológico declara que en gran escala el universo es isótropo y homogéneo. La principal evidencia para considerar este principio es la estabilidad de la temperatura de la radiación cósmica de fondo o radiación de fondo de microondas (CMB por sus siglas en inglés: cosmic microwave background) medida por el explorador COBE y la sonda WMAP. La forma de obtener el modelo de Friedmann-Lemaître-Robertson-Walker o simplemente FLRW, es precisamente aplicar las simetrías de homogeneidad e isotropía a las ecuaciones de Einstein. En seguida se investiga entonces la estructura del espaciotiempo bajo estas condiciones.

Homogeneidad e Isotropía
Otro principio que germinó desde el tiempo de Copérnico es el que dice que no ocupamos (los humanos) una posición privilegiada en nuestro universo, y que si nos moviéramos a alguna otra región del mismo, las características básicas de los alrededores parecerían ser las mismas. Asimismo suele asumirse que no importa en qué dirección miremos, las observaciones a gran escala serán básicamente las mismas. Esto constituye el llamado principio de Copérnico.


Estas ideas son de algún modo hipótesis que se hacen sobre la estructura del universo y corresponden al concepto de homogeneidad e isotropía, respectivamente. Como se menciona en la introducción, estos principios han recibido apoyo por distintas observaciones, lo que las hace un buen candidato de estudio.

Un espaciotiempo ${(\mathscr{M},g)}$ se dice homogéneo si existe una foliación ${\sigma_t}$ de hipersuperficies tipo espacio en un parámetro $t$ tal que para cada $t$ y cualesquiera puntos ${p,q\in\sigma_t}$ existe una isometría $\phi$ tal que ${\phi(p)=q}$. Esto significa que en cualquier instante de tiempo todo punto del espacio debe verse como cualquier otro.

El espaciotiempo ${(\mathscr{M},g)}$ será isótropo si existe una foliación $\alpha$ de curvas congruentes tipo tiempo con vector tangente $u$ tales que para cualquier ${p\in\alpha}$ y cualesquiera vectores tangente unitarios tipo espacio ${v,w\in{T}_p(\mathscr{M})}$ existe una isometría $\varphi$ tal que ${\varphi(p)=p}$, ${\varphi^*(u)=u}$ y ${\varphi^*(v)=w}$. Esto significa que en cualquier punto es imposible construir vectores espaciales preferidos.

Las hipersuperficies homogéneas ${\sigma_t}$ son ortogonales a cada vector $u$, es decir, a las líneas de mundo de los observadores isotrópicos. Véase que isotropía para todos los observadores implica homogeneidad para todos los observadores. Es posible construir universos homogéneos y anisotrópicos pero no universos inhomognéneos e isotrópicos. Un universo isótropo implica que no hay un centro para el universo. Esto es relevante al considerar el origen del universo o Big Bang, pues debido a la isotropía, no hay un punto privilegiado o centro en el cual éste haya ocurrido.

Por supuesto el universo no es exactamente homogéneo; hay irregularidades locales como las estrellas y las galaxias, al referirse a que lo es en gran escala, uno se refiere en un orden de millones de años luz. El principio de Copérnico entonces puede traducirse en que a gran escala el universo es esféricamente simétrico en cada punto.

La métrica FLRW
En 1944 Arthur Geoffrey Walker mostraría que una simetría esférica exacta alrededor de cada punto implicaría que el universo es espacialmente homogéneo y que admitiría un grupo de seis parámetros de isometrías cuyas superficies de transitividad son 3-superficies de curvatura constante ([1]). Tal espacio es el llamado de Friedmann-Lemaître-Robertson-Walker o FLRW (algunas personas suelen llamarlo simplemente con un nombre o dos; lo más conveniente parece ser llamarlo simplemente FLRW). Lo que se quiere entonces es determinar las geometrías de las hipersuperficies ${\sigma_t}$ para todo valor $\kappa$ de curvatura. Uno sólo debe preocuparse por curvatura positiva, nula y negativa, que puede describirse por múltiplos de ${\kappa=-1,0,1}$.

Para los respectivos $\kappa$ se tiene una 3-esfera, un 3-plano y un 3-hiperboloide, cuyas métricas (elementos de línea), en coordenadas esféricas, cartesianas e hiperbólicas, respectivamente, son
\begin{equation}d\sigma^2=\begin{cases}d\psi^2+\sin^2\psi\left(d\theta^2+\sin^2\theta\,d\phi^2\right),&\text{si}\,\kappa=1,\,\psi\in[0,2\pi)\\
dx^2+dy^2+dz^2,&\text{si}\,\kappa=0\\
d\zeta^2+\sinh^2\zeta\left(d\theta^2+\sin^2\theta\,d\phi^2\right),&\text{si}\,\kappa=-1,\,\zeta\in[0,\infty)\end{cases}\end{equation} o bien, en términos de los ángulos polar $\theta$ y azimutal $\phi$,
\begin{equation}d\sigma^2=d\psi^2+\left(d\theta^2+\sin^2\theta\,d\phi^2\right)\begin{cases}\sin^2\psi,&\text{si}\,\kappa=1,\,\psi\in[0,2\pi)\\
\psi^2,&\text{si}\,\kappa=0,\,\psi\in[0,\infty)\\
\sinh^2\psi,&\text{si}\,\kappa=-1,\,\psi\in[0,\infty)\end{cases}\end{equation} que puede escribirse de manera sucinta en términos de la curvatura $\kappa$ como ([2])
\begin{equation}ds^2=\frac{dr^2}{1-\kappa{r}^2}+r^2\left(d\theta^2+\sin^2\theta\,d\phi^2\right)\label{1}\end{equation} con los cambios de variable ${r=\sin\psi,\,\psi,\,\sinh\psi}$ para ${\kappa=1,0,-1}$, respectivamente, únicamente restringida en el primer caso con $|r|<1$. En los casos del 3-plano y el 3-hiperboloide, los hiperespacios serán difeomorfos (un difeomorfismo es un equivalente de un isomorfismo pero en variedades diferenciables) a ${\mathbb{R}^3}$ mientras que para las 3-esferas, éstas serán difeomorfas a ${\mathcal{S}^3}$. En el primer caso los espacios son infinitos y las posibilidades para el universo son llamadas universos abiertos, mientras que en el segundo los espacios son compactos, que son finitos y sin frontera, y naturalmente los universos son llamados universos cerrados. De esta manera, al saber que estas soluciones son buenos candidatos para modelar aproximadamente nuestro universo, se abre la pregunta acerca de si el universo es abierto o cerrado.

De aquí entonces para construir la métrica FLRW, se llevan las coordenadas de cada ${\sigma_t}$ a cada una de las otras hipersuperficies por medio de cada observador isótropo (se asignan coordenadas fijas a cada observador) y se dota de un reloj a cada observador isótropo, i.e. se etiqueta cada hipersuperficie por un tiempo propio $\tau$ (también llamado tiempo cósmico), de modo que todo evento en el universo está dado por $\tau$ y las coordenadas espaciales. De este modo entonces la métrica FLRW es
\begin{equation}ds^2=-d\tau^2+a^2(\tau)d\sigma^2\end{equation} donde el factor $a$ es llamado factor de escala (determina la escala total de la métrica espacial) y puede depender de $\tau$.

Las ecuaciones de Friedmann
La métrica entonces es conocida y se puede conocer fácilmente el tensor de energía-momento dada la propiedad de isotropía del universo FLRW, entonces las ecuaciones de Einstein
\begin{equation}G_{\mu\nu}\equiv{R}_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=8\pi{G}T_{\mu\nu}\end{equation} serán útiles para determinar la evolución dinámica espacial del universo, i.e. el factor de escala ${a(\tau)}$.

La distribución de materia en este caso debe ser también homogénea e isótropa, de modo que el tensor de energía-momento puede modelarse por un fluido perfecto, i.e. un fluido que está completamente especificado por la densidad de energía propia (i.e. en un marco de reposo) $\rho$ y una presión isotrópica propia $p$, i.e.
\begin{equation}T_{\mu\nu}=(p+\rho)u_\mu{u}_\nu+pg_{\mu\nu}\end{equation} donde ${u_\alpha}$ es la 4-velocidad del fluido. Por isotropía, el fluido debe estar en reposo en las coordenadas comóviles (las coordenadas propias de cada punto del fluido), entonces
\begin{equation}u^\mu=(1,\vec{0})\end{equation} y el tensor de energía-momento es de la forma
\begin{equation}T_{\mu\nu}=\begin{pmatrix}\rho&\vec{0}^\mathrm{\,T}\\
\vec{0}&g_{ij}p\end{pmatrix}\label{4}\end{equation} Para calcular las componentes $G_{\alpha\beta}$ lo más sencillo es recurrir a la computadora, siempre que se entienda qué es lo que se está haciendo. Aquí emplearé nuevamente Mathematica. El siguiente código tiene la ventaja de que funcionará para cualquier métrica. Recuérdese que para los símbolos de Christoffel,
\begin{equation}{\Gamma^\rho}_{\mu\nu}=\frac{1}{2}g^{\rho\sigma}\left(\p_{\mu}g_{\sigma\nu}+\p_{\nu}g_{\sigma\mu}-\p_{\sigma}g_{\mu\nu}\right)\end{equation} lo que en Mathematica puede escribirse como una función para la métrica y que trabaje con las coordenadas apropiadas


Luego para el tensor de Riemann, a partir de
\begin{equation}{R^\rho}_{\sigma\mu\nu}=\p_\mu{\Gamma^\rho}_{\sigma\nu}-\p_\nu{\Gamma^\rho}_{\sigma\mu}
+{\Gamma^\rho}_{\mu\alpha}{\Gamma^\alpha}_{\sigma\nu}-{\Gamma^\rho}_{\nu\alpha}{\Gamma^\alpha}_{\sigma\mu}\end{equation} de manera análoga,


Y así también, para el tensor de Ricci, sabiendo que
\begin{equation}R_{\mu\nu}={R^\alpha}_{\mu\alpha\nu}\end{equation} de manera análoga,


y finalmente para el escalar de Ricci, ya que
\begin{equation}R={R^\alpha}_\alpha=g^{\alpha\beta}R_{\alpha\beta}\end{equation} de manera análoga


y de este modo se puede calcular fácilmente el tensor ${G_{\alpha\beta}}$. Empleando entonces la métrica FLRW general del elemento (\ref{1}),
\begin{equation}g_{\alpha\beta}=\text{diag}\left(-1,\frac{a^2}{1-\kappa{r}^2},a^2r^2,a^2r^2\sin^2\theta\right)\end{equation} en las coordenadas ${(t,r,\theta,\phi)}$, lo que en Mathematica puede escribirse como


De aquí entonces simplemente puede definirse el tensor de Einstein y evaluarse con la métrica y las coordenadas


de modo que se obtiene que
\begin{align}
G_{00}&=3\frac{\kappa+\dot{a}^2}{a^2}\\
G_{11}&=-\frac{\kappa+\dot{a}^2+2a\ddot{a}}{1-\kappa{r}^2}\\
G_{22}&=-r^2\left(\kappa+\dot{a}^2+2a\ddot{a}\right)\\
G_{33}&=-r^2\sin^2\theta\left(\kappa+\dot{a}^2+2a\ddot{a}\right)
\end{align} con todas las demás componentes nulas. De aquí es evidente que
\begin{align}
{G^0}_0&=g^{0\alpha}G_{\alpha0}=-3\frac{\kappa+\dot{a}^2}{a^2}\\
{G^i}_j\delta^j_i&=g^{i\alpha}G_{\alpha{i}}\delta^j_i=-\frac{1}{a^2}\left(\kappa+\dot{a}^2+2a\ddot{a}\right)
\end{align} y además de (\ref{4}),
\begin{equation}{T^\mu}_\nu=\text{diag}(-\rho,p,p,p)\end{equation} de modo que resulta conveniente (de forma equivalente, simplemente es más evidente) escribir las ecuaciones de movimiento de Einstein como
\begin{equation}{G^\mu}_\nu=8\pi{G}{T^\mu}_\nu\end{equation} y las ecuaciones de Einstein se reducen a
\begin{align}
\left(\frac{\dot{a}}{a}\right)^2+\frac{\kappa}{a^2}&=\frac{8\pi{G}}{3}\rho\label{2}\\
2\frac{\ddot{a}}{a}+\left(\frac{\dot{a}}{a}\right)^2+\frac{\kappa}{a^2}&=-8\pi{G}p
\end{align} que a su vez pueden combinarse para producir la ecuación independiente de la curvatura
\begin{equation}\frac{\ddot{a}}{a}=-\frac{4\pi{G}}{3}(\rho+3p)\label{3}\end{equation} A (\ref{2}) junto con (\ref{3}) suele llamársele (y en adelante así se hará aquí) las ecuaciones de Friedmann, o algunos autores le llaman ecuación de Friedmann a (\ref{2}) y a (\ref{3}) ecuación de aceleración.

Recuérdese ahora la interpretación de $a$ como un factor que determina la escala total de la métrica espacial. Un resultado impresionante que se sigue de (\ref{3}), es que el universo no es estático dados ${\rho,p>0}$ para la materia ordinaria. Esto significa que el universo está expandiéndose si ${\dot{a}>0}$ o contrayéndose si ${\dot{a}<0}$ y de modo tal que $a$ en el pasado sea más pequeña hasta que en algún momento ${a=0}$ en donde las componentes del tensor de curvatura divergen y se tiene una singularidad. De esto último se sigue la interpretación del Big Bang, misma que es vigente, sin embargo desde hace algunos años se sabe que el universo de hecho se está expandiendo y no contrayendo ([3]).

Es bien conocida la anécdota de que Einstein se incomodó con el resultado de un universo que no es estático e introdujo la constante cosmológica $\Lambda$, misma que luego llamaría su más grande metida de pata. La idea se deshecharía hasta las observaciones hechas en [3]. Las ecuaciones de Einstein con la modificación $\Lambda$ pueden escribirse como
\begin{equation}G_{\mu\nu}+\Lambda{g}_{\mu\nu}=8\pi{G}T_{\mu\nu}\label{5}\end{equation} de donde se siguen soluciones análogas con el término $\Lambda$, lo que puede cambiar el carácter de (\ref{3}). La constante cosmológica seguido se interpreta como una presión negativa (aunque esto disgusta a más de uno, incluyendo cosmólogos) y de hecho puede incluirse por medio de transformaciones de $\rho$ y $p$, por lo que en adelante salvo que se mencione explícitamente, omitiré el carácter positivo de $p$ y $\rho$ y mantendré el tratamiento general.

Véase luego que (\ref{2}) puede escribirse como,
\begin{equation}\rho{a}^3=\frac{3a}{8\pi{G}}\left(\dot{a}^2+\kappa\right)\end{equation} cuya derivada es
\begin{equation}\dot{\rho}a^3+3a^2\dot{a}\rho=\frac{3\dot{a}}{8\pi{G}}\left(\dot{a}^2+\kappa+2a\ddot{a}\right)\end{equation} y también por (\ref{3}) se tiene que
\begin{equation}-3a^2\dot{a}p=\frac{3\dot{a}}{8\pi{G}}\left(\dot{a}^2+\kappa+2a\ddot{a}\right)\end{equation} y entonces se sigue que
\begin{equation}\dot{\rho}+3\frac{\dot{a}}{a}(\rho+p)=0\label{6}\end{equation} que es la misma ecuación que puede obtenerse por conservación de energía-momento, i.e. resolviendo
\begin{align}\nabla_\mu{T}^{\mu\nu}=\p_\mu{T}^{\mu\nu}+T^{\alpha\nu}\Gamma^{\mu}_{\alpha\mu}=0\end{align} que nuevamente empleando el código escrito en Mathematica puede calcularse fácilmente.

Dos soluciones particulares
En la escala cósmica que aquí se ha referido como gran escala, las galaxias pueden idealizarse como granitos de polvo cuyas velocidades aleatorias son tan pequeñas que la presión de este polvo es despreciable, de modo que
\begin{equation}p=0\end{equation} Sin embargo, además de materia no relativista, el universo contiene radiación electromagnética que ejerce una presión no nula
\begin{equation}p=\frac{\rho}{3}\end{equation} con $\rho$ la densidad de energía (véase e.g. [4]).

Por la ecuación de conservación de energía-momento (\ref{6}), se sigue que para el caso de polvo ${p=0}$,
\begin{equation}\underbrace{\dot{\rho}a^3+3\rho\dot{a}a^2}_{\frac{d}{dt}(\rho{a}^3)}=0\end{equation} es decir
\begin{equation}\rho{a}^3=\text{cte}\end{equation} mientras que para el caso de radiación ${p=\rho/3}$, se sigue de manera análoga, que
\begin{equation}\rho{a}^4=\text{cte}\end{equation} Con esto entonces para el caso de polvo, la ecuación de Friedmann (\ref{2}) se escribe
\begin{equation}\dot{a}^2+\kappa-\frac{\mc{C}_1}{a}=0\label{7}\end{equation} con ${\mc{C}_1\equiv8\pi\rho{a}^3/3}$ una constante. De manera análoga para el caso de radiación se tiene \begin{equation}\dot{a}^2+\kappa-\frac{\mc{C}_2}{a^2}=0\label{8}\end{equation} con ${\mc{C}_2\equiv8\pi\rho{a}^4/3}$ constante.

Consideremos primero el caso plano ${\kappa=0}$. Para el caso de polvo se tiene
\begin{equation}\left(\frac{da}{d\tau}\right)^2=\frac{\mc{C}_1}{a}\end{equation} cuya solución con ${a(0)=0}$ es
\begin{equation}a=\left(\frac{3}{2}\sqrt{\mc{C}_1}\,\tau\right)^{2/3}\end{equation} mientras que para el caso de radiación, de manera análoga, la solución a la respectiva ecuación es

Factor de escala ${a(\tau)}$ para ${\kappa=0}$

Para el caso esférico ${\kappa=1}$, se tiene, en el caso de polvo ${p=0}$, la ec. de Friedmann,
\begin{equation}\left(\frac{da}{d\tau}\right)^2=\frac{\mc{C}_1}{a}-1\end{equation} es decir,
\begin{equation}\frac{da}{\sqrt{\frac{\mc{C}_1}{a}-1}}=d\tau\end{equation} que puede resolverse introduciendo el tiempo conforme $\eta$ (intento de traducción de conformal time)
\begin{equation}d\eta\equiv\frac{d\tau}{a}\end{equation} cuya interpretación a un tiempo ${t_0}$ es la cantidad de tiempo que le tomaría a un fotón viajar desde nuestra localización hasta la distancia más lejana observable si en ese instante dejara de expandirse el universo en ${t_0}$. Así, se tiene que
\begin{align}
\int{d\eta}&=\int\frac{da}{\sqrt{\mc{C}_1a-a^2}}
\end{align} cuya solución con ${a(\eta=0)=0}$ es
\begin{equation}\eta=\arcsin\left(\frac{2a-\mc{C}_1}{\mc{C}_1}\right)+\frac{1}{2}\pi\end{equation} es decir
\begin{equation}a=\frac{\mc{C}_1}{2}\left(1-\cos\eta\right)\end{equation} y ya que también ${a\,d\eta=d\tau}$, se sigue que con ${\eta(\tau=0)=0}$,
\begin{equation}\tau=\frac{\mc{C}_1}{2}\left(\eta-\sin\eta\right)\end{equation} de modo que se tiene la solución en términos del parámetro de tiempo conforme $\eta$ y puede graficarse con una curva paramétrica. Para el caso de radiación ${p=\rho/3}$, de manera análoga se tienen las soluciones
\begin{align}
a&=\sqrt{\mc{C}_2}\sin\eta\\
\tau&=\sqrt{\mc{C}_2}(1-\cos\eta)
\end{align}

Factor de escala ${a(\tau)}$ para ${\kappa=1}$

Finalmente en el caso hiperbólico ${\kappa=-1}$, de manera análoga se encuentra la solución en términos del parámetro $\eta$, para el caso de polvo ${p=0}$,
\begin{align}
a&=\frac{\mc{C}_1}{2}(\cosh\eta-1)\\
\tau&=\frac{\mc{C}_1}{2}(\sinh\eta-\eta)
\end{align} y para el caso de radiación ${p=\rho/3}$,
\begin{align}
a&=\mc{C}_2\sinh\eta\\
\tau&=\mc{C}_2(\cosh\eta-1)
\end{align}

Factor de escala para k=-1

En conjunto se tiene el siguiente gráfico para ${a(\tau)}$,

Factor de escala ${a(\tau)}$ para polvo y radiación para cada ${\kappa}$

en donde se puede ver cualitativamente el comportamiento de las soluciones para cada $\kappa$. Resalta el hecho de que en ${\kappa=0}$ existen tiempos ${\tau\neq0}$ para los cuales la rapidez de expansión ${\dot{a}}$ cambia de signo y lleva a otro $\tau$ para el cual el factor de escala se anula, llevando al llamado Big Crunch, mientras que para ${\kappa=0,-1}$ el universo sigue expandiéndose para todo $\tau$. De (\ref{7}) y de (\ref{8}), puede graficarse el comportamiento del valor absoluto de la velocidad, que en el caso de ${\kappa=1}$, se tiene

Rapidez de expansión ${|\dot{a}(\tau)|}$ para polvo y radiación para ${\kappa=1}$

mientras que para ${\kappa=0,-1}$,

Rapidez de expansión |\dot{a}|} para polvo y radiación para k=0,-1, donde las curvas punteadas corresponden a k=-1

donde puede verse que $\displaystyle{\lim_{\tau\to\infty}|\dot{a}|=0}$ para ${\kappa=0}$, mientras que $\displaystyle{\lim_{\tau\to\infty}|\dot{a}|=1}$ para ${\kappa=-1}$.

El universo de Friedmann sigue siendo de los mejores candidatos para modelar el universo en el que vivimos, y sin embargo quedan cuestiones que tomar en cuenta como la constante cosmológica, y otras más que entender, como la materia oscura para poder tener un panorama mucho más completo. Para un universo de Friedmann, en general, dada una ecuación de estado termodinámico ${p=p(\rho)}$ (que podría incluir a la constante cosmológica) y las ecuaciones de Friedmann, queda completamente determinada la evolución del universo.

Parámetro de Hubble $H$
La tasa de expansión del universo está caracterizada por el llamado parámetro de Hubble, definido como
\begin{equation}H=\frac{\dot{a}}{a}\end{equation} en honor a Edwin Hubble. Alrededor del año 1920, Hubble descubrió una relación lineal entre las distancias de las galaxias y su corrimiento al rojo debido a su alejamiento relativo, llamado {velocidad de recesión}. Esta relación velocidad-distancia, seguido llamada la ley de Hubble, se expresa como
\begin{equation}\vec{v}=H\vec{r}\end{equation} con $\vec{v}$ la velocidad de recesión y $\vec{r}=a\vec{x}$ la distancia a una galaxia dada, con $\vec{x}$ la coordenada comóvil. Recientemente ([6]) se ha medido el valor de $H$, encontrándose un valor positivo, implicando que en efecto el universo se está expandiendo. El valor de $H$ en el tiempo presente es llamado constante de Hubble y se denota como ${H_0}$.

Parámetro de densidad $\Omega$
La ecuación de Friedmann (\ref{2}) puede escribirse con el parámetro de Hubble como
\begin{equation}H^2=\frac{8\pi{G}}{3}\rho-\frac{\kappa}{a^2}\end{equation} A partir de esta ecuación, se define la densidad crítica ${\rho_c}$ como aquella que vuelve nula la curvatura, i.e.
\begin{equation}\rho_c\equiv\frac{3H^2}{8\pi{G}}\end{equation} de aquí entonces se define el parámetro de densidad $\Omega$ como
\begin{equation}\Omega\equiv\frac{\rho}{\rho_c}\end{equation} y de este modo se reescribe la ecuación de Friedmann como
\begin{equation}H^2=\frac{8\pi{G}}{3}\rho_c\Omega-\frac{\kappa}{a^2}=H^2\Omega-\frac{\kappa}{a^2}\end{equation} y entonces se sigue que
\begin{equation}\Omega=1+\frac{\kappa}{a^2{H}^2}\end{equation} y de este modo si ${0<\Omega<1}$, se tiene curvatura negativa y un universo abierto, si ${\Omega=1}$, la curvatura es nula, el universo es plano y abierto y finalmente si ${\Omega>1}$ la curvatura es positiva y se tiene un universo cerrado.

Tómese en cuenta que se deben considerar los distintos tipos de materia para un valor total de $\Omega$. Recientemente se ha encontrado un valor aproximado de 1 para $\Omega$ total ([6]), por lo que se piensa que actualmente el universo es aproximadamente plano.

Parámetro de desaceleración $q$
El llamado parámetro de desaceleración es una manera de cuantificar la rapidez de la razón de expansión del universo y se define como
\begin{equation}q\equiv-\frac{a\ddot{a}}{\dot{a}^2}\end{equation} Puede verse que esta cantidad surge de la siguiente manera. Considérese una expansión del factor de escala en serie de Taylor alrededor de un tiempo ${t}$,
\begin{equation}a(\tau)=a(t)+\dot{a}(t)(\tau-t)+\frac{1}{2}\ddot{a}(t)(\tau-t)^2+\ldots\end{equation} y dividiendo sobre ${a(t)}$,
\begin{equation}\frac{a(\tau)}{a(t)}=1+H(\tau-t)+\frac{1}{2}qH^2(\tau-t)^2+\ldots\end{equation} donde $H$ es el parámetro de Hubble introducido anteriormente.

Constante Cosmológica $\Lambda$
Un hecho característico de la relatividad general es que relaciona vía las ecuaciones de Einstein el tensor de energía-momento con el campo gravitacional. En gravitación, a diferencia de la física que no incorpora la gravedad, los valores puntuales de la energía importan, no sólo las diferencias de energía de uno a otro estado, lo que abre la posibilidad de introducir una energía de vacío, i.e. una densidad de energía característica del espacio vacío ([5]).

Para construir el tensor de energía-momento del vacío, lo primero que se pediría es que sea un invariante de Lorentz, de modo que no tenga direcciones privilegiadas. La forma de que esto ocurra es que ${T_{\mu\nu}}$ sea proporcional a la métrica,
\begin{equation}T_{\mu\nu}^{(\text{vac})}\equiv-\rho_{\text{vac}}{g}_{\mu\nu}\end{equation} donde mañosamente se ha escrito la densidad de energía ${-\rho_{\text{vac}}}$ (constante), dado que al comparar con (\ref{4}), puede verse que tenemos que el vacío es un fluido perfecto tal que la presión es igual a la densidad de energía con signo opuesto,
\begin{equation}p_{\text{vac}}=-\rho_{\text{vac}}\end{equation} De aquí entonces al considerar el tensor de energía-momento del vacío, las ecuaciones de Einstein se escriben
\begin{equation}G_{\mu\nu}=8\pi{G}\left(T_{\mu\nu}-\rho_{\text{vac}}g_{\mu\nu}\right)\end{equation} que comparando con la ecuación que incluye la histórica metida de pata $\Lambda$ de Einstein (\ref{5}), se sigue que
\begin{equation}\Lambda\equiv8\pi{G}\rho_{\text{vac}}\end{equation} de modo que los términos constante cosmológica y densidad de energía del vacío son intercambiables. En mecánica cuántica, siendo una teoría sin gravedad, surge este tipo de densidad de energía del vacío como la llamada energía de punto cero, que existe aunque no haya partículas presentes. Aunque a veces se trata a la constante cosmológica como nula, como se ha mencionado, ésta es una de las mejores candidatas para representar a la energía oscura y/o la actual expansión acelerada del universo.

[1] Stephen Hawking & George Ellis,The Large Scale Structure of Space-Time, Cambridge University Press, 1975.
[2] José A. Vázquez, Sistemas dinámicos en cosmologías para campo escalar, Tesis de maestría, CINVESTAV, 2007.
[3] Adam G. Riess et. al., Observational Evidence from Supernovae for an Accelerating Universe and a Cosmological Constant, arXiv:astro-ph/9805201 (1998).
[4] Leopoldo García-Colín, Introducción a la Termodinámica Clásica, Trillas, 4a ed., 2008.
[5] Sean M. Carroll, Spacetime and Geometry: An Introduction to General Relativity, Addison Wesley, 2004.
[6] Planck Collaboration, Planck 2013 results. XVI. Cosmological parameters, arXiv:1303.5076 [astro-ph.CO] (2013).

Cuantización de sistemas singulares e invariancia ante reparametrizaciones

Los conceptos necesarios para seguir esta entrada están discutidos con detalle aquí: Sistemas Hamiltonianos Singulares.

Partícula unidimensional parametrizada
El Lagrangiano de la partícula unidimensional de masa unitaria y de coordenada ${x=x(t)}$ sujeta a un potencial ${V=V(x)}$ es de la forma
\begin{equation}L(x,\dot{x})=\frac{1}{2}\dot{x}^2-V(x)\end{equation} que evidentemente no es singular, y la correspondiente acción está dada por
\begin{equation}S\equiv\int_{A}^{B}L\,dt=\int_A^B\left(\frac{1}{2}\dot{x}^2-V(x)\right)\,dt\end{equation} para la partícula fija en los extremos temporales ${A,B}$. Ahora considérese introducir un parámetro $\tau$ tal que ${x=x(\tau)}$ y ${t=t(\tau)}$ con ${\tau\in[\alpha,\beta]}$, entonces puede escribirse
\begin{align}S&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{d\tau}\right)^2}{\left(\frac{dt}{d\tau}\right)^2}-V(x)\right]\frac{dt}{d\tau}\,d\tau\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}-t^\prime\,V(x)\right]\,d\tau\label{dagger}\end{align} donde ${x^\prime\equiv{dx}/d\tau}$ y de manera análoga para ${t^\prime}$. Sin embargo parece que esta elección fue bastante particular, mejor considérese una reparametrización general ${\tau\to{f}={f}(\tau)}$ que solo por consistencia mantenga ${f(\alpha)=\alpha}$, ${f(\beta)=\beta}$ y ${f^\prime>0}$, de modo que (\ref{dagger}) se escribe
\begin{align}S&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{df}\right)^2}{\left(\frac{dt}{df}\right)}-\frac{dt}{df}\,V(x)\right]df\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{d\tau}\frac{d\tau}{df}\right)^2}{\left(\frac{dt}{d\tau}\frac{d\tau}{df}\right)^2}-\frac{dt}{d\tau}\frac{d\tau}{df}\,V(x)\right]\frac{df}{d\tau}d\tau\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{\left(\frac{dx}{d\tau}\right)^2}{\left(\frac{dt}{d\tau}\right)^2}-\frac{dt}{d\tau}\,V(x)\right]\left(\frac{d\tau}{df}\right)\left(\frac{d\tau}{df}\right)^{-1}d\tau\nonumber\\
&=\int_\alpha^\beta\left[\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}-t^\prime\,V(x)\right]\,d\tau\end{align} y entonces esta acción es invariante ante reparametrizaciones.

Ahora bien, con el nuevo Lagrangiano en el parámetro $\tau$, se tiene que
\begin{equation}L=\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}-t^\prime{V}(x)\end{equation} y así, la matriz Hessiana
\begin{align}W\equiv\left(\frac{\partial^2L}{\partial\dot{q}^i\partial\dot{q}^j}\right)=\begin{pmatrix}\frac{1}{t^\prime}&-\frac{x^\prime}{t^{\prime\,2}}\\
-\frac{x^\prime}{t^{\prime\,2}}&\frac{x^{\prime\,2}}{t^{\prime\,3}}\end{pmatrix}\end{align} cuyo determinante evidentemente es nulo. Aquí se tiene entonces que la invariancia ante reparametrizaciones es una simetría local que introducirá nuevas restricciones en el sistema que originalmente no habían. Ésta es precisamente una característica de las teorías covariantes generales (o con covariancia general), en donde la idea es que las coordenadas son meros artificios para describir la teoría y no juegan un papel fundamental en la naturaleza.

Véase que se ha llegado aquí con el solo hecho de volver a $t$ una coordenada más y dejar al simple parámetro $\tau$ jugar el papel de $t$. Para pasar a la descripción Hamiltoniana, se tiene que
\begin{align}p_x&=\frac{\partial{L}}{\partial{x}^\prime}=\frac{x^\prime}{t^\prime}\\
p_t&=\frac{\partial{L}}{\partial{t}^\prime}=-\frac{1}{2}\frac{x^{\prime\,2}}{t^{\prime\,2}}-V(x)\end{align} y la restricción primaria es
\begin{equation}\phi_1=\frac{1}{2}p_x^2+p_t+V(x)\approx0\end{equation} de modo que para el Hamiltoniano Total,
\begin{align}\mc{H}_T&=q^{\prime\,i}p_i-L+u^1\phi_1\nonumber\\
&=x^{\prime}p_x+t^{\prime}p_t-\frac{1}{2}\frac{x^{\prime\,2}}{t^\prime}+t^\prime{V}(x)+u^1\phi_1\nonumber\\
&=u^1\phi_1\end{align} de donde se sigue que el Hamiltoniano Canónico es nulo, ${\mc{H}=0}$ (!).

Esto resultaría desconcertante si se desconociera el trabajo de Dirac. Aquí se tiene idénticamente ${\{\phi_1,\mc{H}_T\}=0}$ con la conservación de la restricción primaria, que además es de primera clase y por lo que no hay más restricciones y ${u^1}$ queda indeterminado. En este caso el generador de la transformación de norma para algún ${\epsilon=\epsilon(t)}$ arbitrario es
\begin{equation}G=\epsilon\phi_1\end{equation} de modo que las transformaciones de norma infinitesimales son
\begin{align}
\delta{x}&\approx\{x,G\}=\frac{\partial{G}}{p_x}=\epsilon{p}_x\\
\delta{t}&\approx\{t,G\}=\frac{\partial{G}}{\partial{p}_t}=\epsilon\\
\delta{p}_x&\approx\{p_x,G\}=-\frac{\partial{G}}{\partial{x}}=-\frac{dV}{dx}\\
\delta{p}_t&\approx\{p_t,G\}=-\frac{\partial{G}}{\partial{t}}=0
\end{align} Finalmente véase que al cuantizar, ya que
\begin{equation}\hat{\phi}_1\psi=0\end{equation} se sigue que
\begin{align}\hat{p}_t\psi=\left[-\frac{1}{2}\hat{p}_x^2-\hat{V}(x)\right]\psi\end{align} es decir,
\begin{align}i\hbar\frac{\p\psi}{\p{t}}=\left[-\frac{\hbar^2}{2}\frac{\p^2}{\p{x}^2}+\hat{V}(x)\right]\psi\end{align} que es la ecuación de Schrödinger unidimensional para una partícula de masa unitaria sujeta a un potencial ${V(x)}$.

Partícula libre unidimensional relativista
En este caso se considera de manera análoga en un parámetro $\tau$ el Lagrangiano
\begin{equation}L(t,t^\prime,x,x^\prime)=-\sqrt{t^{\prime\,2}-x^{\prime\,2}}\end{equation} que básicamente surge de que la acción de una partícula relativista viajando en una línea de mundo $\mc{C}$ es $S=-\int_\mc{C}ds$ (el signo negativo simplemente hace que la aproximación Newtoniana se recupere eligiendo a $t$ como parámetro) y que puede verificarse es singular mediante el determinante de la matriz Hessiana, además de mantener invariante la acción ante reparametrizaciones. Los momentos conjugados son
\begin{align}p_t&=\frac{\p{L}}{\p{t}^\prime}=-\frac{t^\prime}{\sqrt{t^{\prime\,2}-x^{\prime\,2}}}\\
p_x&=\frac{\p{L}}{\p{x}^\prime}=\frac{x^\prime}{\sqrt{t^{\prime\,2}-x^{\prime\,2}}}\end{align} y la restricción primaria puede proponerse como
\begin{equation}\phi\equiv\frac{1}{2}\left({p}_x^2-p_t^2+1\right)\approx0\end{equation} además, construyendo el Hamiltoniano Total es evidente que éste es proporcional a la restricción, de modo que el Hamiltoniano Canónico nuevamente es nulo y se sigue que la restricción primaria es de primera clase. Para algún ${\epsilon=\epsilon(t)}$ arbitrario, la función generadora es ${G=\epsilon\phi}$, de modo que las transformaciones de norma infinitesimales son
\begin{align}
\delta{t}&=-p_t\\
\delta{x}&=p_x\\
\delta{p_t}&=\delta{p}_x=0
\end{align} Finalmente de manera análoga al ejemplo anterior, al cuantizar, ${\hat{\phi}\psi=0}$ se traduce en
\begin{equation}\left(1+\hat{p}_x^2-\hat{p}_t^2\right)\psi=0\end{equation} es decir
\begin{equation}\left(\frac{\p^2}{\p{t}^2}-\frac{\p^2}{\p{x}^2}+\frac{1}{\hbar^2}\right)\psi=0\end{equation} o bien
\begin{equation}\left(\square+\frac{1}{\hbar^2}\right)\psi=0\end{equation} que es la ecuación de Klein-Gordon en unidades naturales (${c=1}$) para una partícula libre unidimensional y de masa unitaria. En [1] se discute a detalle el proceso de cuantización y cómo la recuperación de estas ecuaciones al cuantizar, junto con otras características, constituyen ejemplos de la consistencia del método de Dirac.

[1] Luis F. Urrutia, Introducción a la cuantización de sistemas singulares, Curso presentado en la VII Escuela de Verano en Física: La visión molecular de la materia.

Sistemas Hamiltonianos Singulares

Las teorías de norma (empleo norma como traducción de gauge) son sistemas con constricciones cuya dinámica se deriva de los llamados Lagrangianos singulares. En general un Lagrangiano singular posee simetrías locales de gran relevancia para la teoría de norma en cuestión; para esto se puede emplear tanto una formulación Lagrangiana como una formulación Hamiltoniana. La discusión sistemática de la formulación Hamiltoniana de teorías de norma se debe a Paul Dirac en los primeros dos capítulos de [2]. Tales teorías son de particular relevancia, dado que todas las interacciones de la naturaleza presuntamente son teorías de norma.

Una teoría de norma puede pensarse como aquella en que las variables dinámicas están especificadas con respecto a un marco de referencia cuya elección es arbitraria para todo tiempo, y tienen como propiedad característica que la solución general de las ecuaciones de movimiento contienen funciones arbitrarias dependientes del tiempo, i.e. variables no observables o variables físicamente irrelevantes, llamadas variables (grados de libertad) gauge o de norma.

En [1] se muestra que aunque la medida de Liouville (localmente una medida ${6n}$-dimensional de Lebesgue) se conserva, el volumen en el espacio fase es puramente un término de norma, por lo que resulta de importancia dedicar una sección al estudio de los sistemas dinámicos singulares e introducir algunos conceptos de las teorías de norma.

Formulaciones Lagrangiana y Hamiltoniana
Comenzando por la formulación Lagrangiana, las condiciones para que la acción de un sistema clásico sea estacionaria son las ecuaciones de Euler-Lagrange
\begin{equation}\frac{d}{dt}\frac{\partial{L}}{\partial\dot{q}^i}-\frac{\partial{L}}{\partial{q}^i}=0\label{1}\end{equation} para las coordenadas generalizadas ${q^i(i=1,\ldots,N)}$ y la Lagrangiana ${L=L(q,\dot{q})}$, de modo entonces que también se tiene ${\partial_{\dot{q}}L=\partial_{\dot{q}}L(q,\dot{q})}$, y así, por regla de la cadena, la ec. (\ref{1}) se escribe como
\begin{equation}\ddot{q}^{\tilde{\imath}}\frac{\partial^2L}{\partial\dot{q}^{\tilde{\imath}}\dot{q}^i}=\frac{\p{L}}{\partial{q}^i}-\dot{q}^{\tilde{\imath}}\frac{\partial^2L}{\partial{q}^{\tilde{\imath}}\partial\dot{q}^i}\end{equation} de donde se tiene que si la matriz Hessiana
\begin{equation}W\equiv\left(\frac{\partial^2L}{\partial\dot{q}^i\partial\dot{q}^{\tilde{\imath}}}\right)\end{equation} es invertible, entonces las aceleraciones ${\ddot{q}^{\tilde{\imath}}}$ están unívocamente determinadas por las posiciones y las velocidades en todo tiempo $t$, lo que se reduce a pedir que $\det(W)\neq0$.

Restricciones Primarias
El caso de interés en una teoría de norma es precisamente en el que $\det(W)=0$, y en ese caso se habla de un Lagrangiano $L$ singular. Esto es equivalente a que por definición del momento conjugado a ${q^i}$,
\begin{equation}p_i\equiv\frac{\partial{L}}{\partial\dot{q}^i}\label{2}\end{equation} no habrá invertibilidad en general de ${\dot{q}^i}$ en términos de ${q^i,\,p_i}$, de modo que existen ciertas restricciones o constricciones
\begin{equation}\phi_j(q,p)=0,\hspace{0.5in}j=1,\ldots,M\end{equation} para los momentos conjugados llamadas primarias (primary constraints en la terminología de Dirac) dado que no implican restricción en las coordenadas ni en las velocidades y que no se emplearon directamente las ecuaciones (\ref{1}) ni de Hamilton para obtenerlas, sino únicamente la definición del momento conjugado. Aquí ${M=N-R}$ con $R$ el rango de $W$.

Estas restricciones primarias definen una subvariedad ${\Gamma_P\subset\Gamma}$ suavemente encajada en el espacio fase $\Gamma$ naturalmente llamada la superficie de constricción primaria. Sobre las restricciones primarias deben establecerse ciertos criterios de regularidad; para el detalle sobre estas condiciones véase la §1.1.2 de [3].

Ecuaciones de Hamilton
Luego para pasar a la descripción Hamiltoniana a partir de la Lagrangiana, se introduce el Hamiltoniano canónico $\mathcal{H}$ como
\begin{equation}\mathcal{H}\equiv\dot{q}^ip_i-L\end{equation} que en los cursos básicos de mecánica suele hacerse énfasis en que éste es dependiente de coordenadas y momentos, no velocidades. Esto puede verse evaluando el cambio $\delta\mc{H}$ frente a variaciones arbitrarias e independientes de coordenadas y velocidades, i.e.
\begin{align}\delta\mc{H}&=\dot{q}^i\delta{p}_i+p_i\delta\dot{q}^i-\underbrace{\frac{\partial{L}}{\partial\dot{q}^i}}_{\equiv{p}_i}\delta\dot{q}^i-\frac{\p{L}}{\p{q}^i}\delta{q}^i\nonumber\\
&=\dot{q}^i\delta{p}_i-\frac{\p{L}}{\p{q}^i}\delta{q}^i\label{3}\end{align} donde $\delta{p}_i$ no es una variación independiente sino una combinación lineal de ${\delta{q}^i}$ y ${\delta\dot{q}^i}$ dado que $p=p(q,\dot{q})$. Esto significa entonces que ${\mc{H}=\mc{H}(p,q)}$, de modo que también se satisface
\begin{equation}\delta\mc{H}=\frac{\p\mc{H}}{\p{p}_i}\delta{p}_i+\frac{\p\mc{H}}{\p{q}^i}\delta{q}^i\end{equation} entonces igualando con (\ref{3}),
\begin{equation}\left(\frac{\p\mc{H}}{\p{p}_i}-\dot{q}^i\right)\delta{p}_i+\left(\frac{\p\mc{H}}{\p{q}^i}+\frac{\p{L}}{\p{q}^i}\right)\delta{q}^i=0\end{equation} donde evidentemente a partir de la definición (\ref{2}), ${\dot{p}=\p_{q}L}$, sin embargo recuérdese que para el caso de interés, $\delta{p}$ debe mantener las restricciones primarias.

En [3] (Teorema 1.2) o en [4] (Proposición 2, §3.3), de distinta forma, puede verificarse que entonces existen ciertos parámetros ${u^j}$ tales que
\begin{align}\dot{q}^i&=\frac{\p\mc{H}}{\p{p}_i}+u^j\frac{\p\phi_j}{\p{p}_i}\\
\dot{p}_i&=\frac{\p\mc{H}}{\p{q}^i}+u^j\frac{\p\phi_j}{\p{q}^i}\\
\phi_j&(q,p)=0\label{4}\end{align} que generaliza las ecuaciones de Hamilton cuando $\mc{H}$ está bien definido sobre ${\Gamma_P}$. Es relevante incluir la última ecuación y hacer énfasis en que se satisface luego de realizar las derivadas parciales en las ecuaciones anteriores. Los $M$ parámetros ${u^j}$ pueden interpretarse en general como parámetros indeterminados de Lagrange ([3]) o bien en [4] se emplean directamente como velocidades ${\dot{q}^j}$ indeterminadas.

De manera análoga al caso no singular, en términos de sistemas singulares la derivada temporal de cualquier función arbitraria ${f=f(q,p)}$ puede escribirse en términos del conocido paréntesis de Poisson
\begin{equation}\{A,B\}\equiv\frac{\p{A}}{\p{q}^i}\frac{\p{B}}{\p{p}_i}-\frac{\p{A}}{\p{p}_i}\frac{\p{B}}{\p{q}^i}\end{equation} como
\begin{equation}\dot{f}=\{f,\mc{H}\}+u^j\{f,\phi_j\}\label{5}\end{equation}

Restricciones Secundarias
Una de las consecuencias de las ecuaciones (\ref{4}), en términos de Dirac, son las llamadas restricciones secundarias, llamadas así precisamente por obtenerse de las ecuaciones de Hamilton, opuesto a las restricciones primarias. Evidentemente las restricciones primarias deben conservarse, por lo que
\begin{equation}\dot{\phi}_j=\{\phi_j,\mc{H}\}+u^{\tilde{\jmath}}\{\phi_j,\phi_{\tilde{\jmath}}\}=0\label{6}\end{equation} que en caso de no imponer restricciones en las ${u^j}$ y de que la relación de coordenadas y momentos sea independiente de las restricciones primarias ([3]), las relaciones (\ref{6}) se llamarán restricciones secundarias. Análogamente las condiciones secundarias al conservarse pueden implicar nuevas condiciones secundarias y así nuevamente.

Ecuaciones Débiles: Restricciones de Primera y Segunda Clase
Luego de las ecuaciones (\ref{4}) deben asumirse las restricciones primarias a las que está sujeto el sistema singular. Como definición, Dirac introduce el concepto de ecuación débil como sigue: ${f\approx{g}}$ significa que $f$ es débilmente igual a $g$ siempre que $f$ es igual a $g$ en ${\Gamma_P\subset\Gamma}$. En contraste, la ecuación ${f=g}$ puede ser referida como fuerte en tanto es cierta en todo $\Gamma$. La ecuación débil ${f\approx{g}}$ entonces es una notación pŕactica equivalente a escribir ([3])
\begin{equation}f\approx{g}\,\Longleftrightarrow\,f-g=c^j\phi_j\end{equation} para algún ${c^j=c^j(q,p)}$, o bien, aún más explícitamente, como el conjunto de ecuaciones ([4])
\begin{align}f&=g\\
\phi_j&=0\end{align} Una vez que se han extraido todas las constricciones independientes del sistema $\varphi_\ell\,(\ell=1,\ldots,M,\ldots,\tilde{M})$, primarias y secundarias, éstas pueden clasificarse en constricciones de primera clase y de segunda clase.

Las constricciones $\gamma_{c_1}$ serán llamadas de primera clase, si su paréntesis de Poisson con todas las constricciones se anula débilmente,
\begin{equation}\{\gamma_{c_1},\varphi_\ell\}\approx0,\hspace{0.2in}\forall\ell,\,c_1=1,\ldots,N_1\end{equation} al resto de constricciones se les llama de segunda clase y les denotaré con ${\chi_{c_2}\,(c_2=1,\ldots,N_2)}$, con ${\tilde{M}=N_1+N_2}$, que se asume son tales que no existe combinación lineal que sea de primera clase.

En general cualquier función ${f=f(q,p)}$ que satisfaga
\begin{equation}\{f,\varphi_\ell\}\approx0,\,\forall\ell\end{equation} se dirá de primera clase y la que no lo satisfaga, se dirá de segunda clase.

El Hamiltoniano Total
Ya que se han extraido todas las constricciones ${\varphi_\ell}$, entonces ya se pueden estudiar las restricciones sobre las ${u^j}$ que imponen las ecuaciones
\begin{equation}\{\varphi_\ell,\mc{H}\}+u^j\{\varphi_\ell,\phi_j\}\approx0\label{8}\end{equation} En [3] se encuentra que la solución general es de la forma
\begin{equation}u^j\approx{U}^j+v^a{V_a}^j\end{equation} donde $U^j$ es una solución particular de la ecuación inhomogénea, i.e.
\begin{equation}U^j\approx-\{\phi_j,\,\varphi_\ell\}^{-1}\{\varphi_\ell,\mc{H}\}\end{equation} y ${v^a{V_a}^j}$ es la solución más general (una combinación lineal con ${a=1,\ldots,A}$) de la ecuación homogénea asociada con coeficientes ${v^a}$ arbitrarios, i.e.
\begin{equation}v^a{V_a}^j\{\varphi_\ell,\,\phi_j\}\approx0\label{9}\end{equation} Así entonces, las ecuaciones (\ref{5}) pueden escribirse simplemente como
\begin{equation}\dot{f}\approx\{f,\mc{H}_T\}\label{10}\end{equation} donde se define el llamado Hamiltoniano Total ${\mc{H}_T}$ como
\begin{equation}\mc{H}_T\equiv\mc{H}+(U^j+v^a{V_a}^j)\phi_j\end{equation} es decir, definiendo
\begin{align}\mc{H}^\prime&\equiv\mc{H}+U^j\phi_j\\
\phi_a&\equiv{V_a}^j\phi_j\end{align} se tiene que
\begin{equation}\mc{H}_T=\mc{H}^\prime+v^a\phi_a\end{equation} que se sabe contiene $A$ funciones arbitrarias ${v^a}$ -que no son funciones a priori de las variables canónicas- y que hace (\ref{10}) equivalente a las ecuaciones de Euler-Lagrange (\ref{1}).

Transformaciones de Norma
Las constricciones de primera clase están íntimamente conectadas con los grados de libertad de norma. La presencia de las funciones arbitrarias ${v^a}$ en ${\mc{H}_T}$ es lo primero que señala que no todas las variables canónicas son observables; esto significa que aunque el estado físico de un sistema está dado una vez conocidas las variables canónicas, habrá más de un conjunto de funciones de las variables canónicas representando el mismo estado. Sin embargo, dado un conjunto inicial de variables canónicas, las ecuaciones de movimiento deben determinar completamente el estado físico del sistema en tiempos posteriores. Así entonces cualquier ambigüedad en el valor de las variables canónicas en un tiempo distinto a un tiempo con condiciones iniciales dadas debe ser una ambigüedad físicamente irrelevante. Una transformación que no altera el estado físico de un sistema se llama entonces transformación de norma.

Considérese una variable dinámica ${f=f(q,p)}$ con un valor inicial ${f_0}$ dado. El valor de $f$ en un tiempo $\delta{t}\ll1$ (conociendo las expresiones dadas por (\ref{10})) es
\begin{equation}f(\delta{t})=f_0+\left(\{f,\mc{H}^\prime\}+v^a\{f,\phi_a\}\right)\delta{t}\end{equation} Ahora bien, ya que los valores ${v^a}$ son arbitrarios, supóngase que para el mismo $f$ con valor inicial ${f_0}$, se elige un valor ${\tilde{v}^a}$; entonces la diferencia ${\Delta{f}}$ entre los valores de $f$ en un tiempo $\delta{t}$ será
\begin{equation}\Delta{f}(\delta{t})=\delta\varepsilon^a\{f,\phi_a\}\label{11}\end{equation} con $\delta\varepsilon^a\equiv(v^a-\tilde{v}^a)\delta{t}$, que precisamente dada la arbitrariedad de los ${v^a}$, debe ser físicamente irrelevante, i.e. $f$ describe el mismo estado al tiempo $\delta{t}$. Éstas son precisamente transformaciones de norma. La función generadora de esta transformación infinitesimal es ${\delta\varepsilon^a}$.

Nótese que de (\ref{8}),
\begin{align}\{\varphi_\ell,\mc{H}\}+u^j\{\varphi_\ell,\phi_j\}&=-\{\mc{H},\varphi_\ell\}-u^j\{\phi_j,\varphi_\ell\}\nonumber\\
&=-\{\mc{H}+u^j\phi_j,\,\varphi_\ell\}\nonumber\\
&=-\{\mc{H}^\prime+v^a{V_a}^j\phi_j,\,\varphi_\ell\}\nonumber\\
&=-\{\mc{H}^\prime,\,\varphi_\ell\}-v^a\{\phi_a,\,\varphi_\ell\}\approx0\end{align} y por (\ref{9}),
\begin{align}v^a{V_a}^j\{\varphi_\ell,\,\phi_j\}=-v^a\{\phi_a,\,\varphi_\ell\}\approx0\end{align} por lo que ${\phi_a}$ y por tanto también ${\mc{H}^\prime}$ y por tanto también ${\mc{H}_T}$ son de primera clase.

Esto significa entonces junto con (\ref{11}), que las restricciones primarias de primera clase generan transformaciones de norma.

En general, en [3] puede verse que el paréntesis de Poisson ${\{\phi_a,\phi_{\tilde{a}}\}}$ de cualesquiera dos restricciones primarias de primera clase y el paréntesis de Poisson ${\{\phi_a,\mc{H}^\prime\}}$ de cualquier restricción primaria de primera clase y el Hamiltoniano de primera clase, generan una transformación de norma. Estos paréntesis de Poisson serán a su vez de primera clase. Aunque parece bastante inofensivo, en [5] puede leerse que Dirac fue quien propuso que ${\{\phi_a,\mc{H}^\prime\}}$ sería también generador de transformaciones gauge y pasarían alrededor de cuarenta años antes de que esta propuesta se demostrara en [3].

Dirac postularía luego que toda restricción secundaria de primera clase también genera transformaciones gauge (conjetura de Dirac), sin embargo pueden generarse contraejemplos, y aunque nada impide que aparezcan restricciones secundarias de primera clase, típicamente únicamente se asume que todas las restricciones de primera clase generan transformaciones de norma ([3]).

El Hamiltoniano Extendido
En la sección del Hamiltoniano Total se consideran únicamente las restricciones primarias de primera clase al llegar al Hamiltoniano Total. Al considerar de manera análoga también las restricciones secundarias de primera clase, se obtiene el llamado Hamiltoniano Extendido ${\mc{H}_E}$, de modo que éste podrá contener tantas transformaciones de norma arbitrarias como restricciones de primera clase. De este modo entonces,
\begin{equation}\mc{H}_E\equiv\mc{H}^\prime+v^a\gamma_a\end{equation} es la forma del Hamiltoniano Extendido, que es una función de primera clase. La etiqueta de extendido se refiere al hecho de que ${\mc{H}_E}$ extiende --y no solo recupera, como ${\mc{H}_T}$-- el formalismo Lagrangiano al considerar todos los grados de libertad de norma posibles. Así entonces Hamiltoniano Extendido da la evolución temporal más general posible para cualquier sistema singular o con libertad de norma.

Paréntesis de Dirac
Considérense todas las restricciones de segunda clase $\chi_{\mc{C}_1}$ tales que no existe combinación lineal de ellas que sea de primer clase. Tomemos dos restricciones $\varphi_{_{1,2}}$ tales que
\begin{equation}\{\chi_{_1},\chi_{_2}\}=\mc{C}\end{equation} para alguna constante $\mc{C}$ y ahora supóngase que se emplea cuantización canónica de modo que
\begin{equation}[\hat{\chi}_{_1},\,\hat{\chi}_{_2}]=i\hbar\mc{C}\label{7}\end{equation} con el conmutador ${[\hat{A},\hat{B}]\equiv\hat{A}\hat{B}-\hat{B}\hat{A}}$. Clásicamente debe satisfacerse
\begin{equation}\chi_{_{1,2}}\approx0\end{equation} lo que no puede llevarse a ${\hat{\chi}_{_{1,2}}\psi=0}$, pues se tendría una contradicción con (\ref{7}).

El argumento de Dirac ([2]) es entonces simplemente ignorar estos grados de libertad y trabajar únicamente con los grados de libertad restantes con un paréntesis de Poisson modificado que respete las restricciones del sistema y lleve a una cuantización consistente.

Las restricciones de segunda clase no son generadores de transformaciones de norma; su existencia únicamente significa que que hay grados de libertad irrelevantes físicamente. Lo que se hace entonces es generalizar el paréntesis de Poisson al llamado paréntesis de Dirac, que contiene únicamente grados de libertad con relevancia física y con el que se puede llevar a cabo una cuantización consistente.

Considérense todas las constricciones de segunda clase $\chi$ (tales que no puede construirse una combinación lineal de éstas que sea de primer clase). Dirac demuestra ([2]) que la matriz de coeficientes
\begin{equation}C_{ab}\equiv\{\chi_a,\,\chi_b\}\end{equation} tiene determinante no nulo de modo que (en este caso) la inversa ${C^{ab}}$ existe ([2]), satisfaciendo
\begin{equation}C^{ab}C_{bc}={\delta^a}_b\end{equation} El paréntesis de Dirac entre dos funciones del espacio fase ${f,g}$ entonces se define como
\begin{equation}\{f,g\}^*\equiv\{f,g\}-\{f,\chi_a\}C^{ab}\{\chi_b,g\}\end{equation} Este nuevo paréntesis por supuesto debe satisfacer bilinealidad, antisimetría, ley del producto y la identidad de Jacobi justo como lo hace el paréntesis de Poisson; además obviamente debe reducirse al paréntesis de Poisson para sistemas no singulares.

Dos consecuencias importantes de el paréntesis de Dirac son las siguientes. Primero, las ecuaciones de movimiento (\ref{10}) pueden escribirse en términos del paréntesis de Dirac de manera equivalente,
\begin{equation}\{f,\mc{H}_T\}^*\approx\{f,\mc{H}_T\}\end{equation} ya que se sabe que ${\mc{H}_T}$ es de primera clase. Además el paréntesis de Dirac de cualquier variable dinámica $f$ con cualquier variable $\chi_{_\zeta}$ se anulará,
\begin{align}\{f,\chi\}^*&=\{f,\chi_\zeta\}-\{f,\chi_a\}C^{ab}\{\chi_b,\chi_\zeta\}\nonumber\\
&=\{f,\chi_\zeta\}-\{f,\chi_a\}{\delta^a}_\zeta\nonumber\\
&=0\end{align} esto significa entonces que puede tomarse ${\chi=0}$ en sentido fuerte. De este modo uno puede deshacerse de las restricciones de segunda clase y entonces proceder a una cuantización canónica de forma consistente únicamente con restricciones de primera clase.

Al emplear los paréntesis de Dirac e imponer fuertemente las constricciones de segunda clase sugiere emplear el proceso conocido como \emph{fijar la norma}, que consiste básicamente en escoger un punto representativo del sistema en cada órbita generada por las restricciones de primera clase ([6]).

Cuantización Estándar
En [6] se muestra de manera condensada el proceso de cuantización estándar, mismo que por completitud se presenta en este trabajo. Para cuantizar se considera el siguiente procedimiento:
i) Se introducen los paréntesis de Dirac, imponiendo fuertemente las constricciones de segunda clase.
ii) Se cuantiza con el principio de correspondencia
\begin{equation}[\hat{A},\hat{B}]=i\hbar\{A,B\}^*\end{equation} iii) Las restricciones de primera clase se promueven a operadores, pidiendo que aniquilen el estado cuántico del sistema ${|\psi\rangle}$, i.e.
\begin{equation}\hat\gamma|\psi\rangle=0\end{equation} de modo que el estado cuántico del sistema sea invariante de norma.
iv) Se construye el Hamiltoniano Total y la evolución del sistema cuántico está dada por
\begin{equation}i\hbar\frac{d|\psi\rangle}{dt}=\hat{\mc{H}}_T|\psi\rangle\end{equation}

[1] Alejandro Corichi & David Sloan, Inflationary Attractors and their Measures, arXiv: 1310.6399 (2013).
[2] Paul A. M. Dirac, Lectures on Quantum Mechanics, Dover Publications, 2001.
[3] Marc Henneaux & Claudio Teitelbom, Quantization of Gauge Systems, Princeton University Press, 1994.
[4] Heinz Rothe & Klaus Rothe, Classical and Quantum Dynamics of Constrained Hamiltonian Systems, World Scientific Publishing, 2010.
[5] Yong-Long Wang et al., The Dirac Conjecture and the Non-uniqueness of Lagrangian, arXiv: 1306.3580v5 (2013).
[6] Luis F. Urrutia, Introducción a la cuantización de sistemas singulares, Curso presentado en la VII Escuela de Verano en Física: La visión molecular de la materia.

Ecuaciones cuántico-relativistas

El aplicar la mecánica cuántica incorporando la relatividad especial es de relevancia e.g. en física de altas energías y en física de partículas. Aunque la teoría tiene sus limitaciones, de ella surgen predicciones relevantes como la de la antimateria. Teorías más generales son e.g. la teoría cuántica de campos relativista, que surge precisamente del hecho de que partículas individuales pueden ser creadas o destruidas en unión con sus antipartículas; o aún más, la gravedad cuántica, que presuntamente incorporará la relatividad general, i.e. la gravedad o curvatura espaciotemporal.

Básicamente al modificar la ecuación de Schrödinger para hacerla consistente con la relatividad especial, se obtiene la llamada ecuación de Klein-Gordon, mientras que si además se incorpora la información del espín para partículas de espín 1/2, se obtiene la ecuación de Dirac. La ecuación más relevante es por supuesto la de Dirac, pues además pueden obtenerse ecuaciones para valores más altos de espín ([1]). Obtengo en seguida ambas ecuaciones y algunas propiedades de las mismas. Emplearé en adelante la signatura (-+++) para la métrica de Minkowski.

Recuérdese que la ecuación de Schrödinger puede obtenerse a partir de la expresión de la energía
\begin{equation}E=\B{p}^2/2m+V\end{equation} sustituyendo ${E\to\hat{E}\equiv{i}\hbar\frac{\partial}{\partial{t}}}$ y ${p\to\hat{p}\equiv\frac{\hbar}{i}\nabla}$, i.e.
\begin{align}i\hbar\frac{\partial\psi}{\partial{t}}&=-\frac{1}{2m}\left(\frac{\hbar}{i}\nabla\right)^2\psi+V\psi=-\frac{\hbar^2}{2m}\nabla^2\psi+V\psi\end{align} De la definición del 4-momento, $\hat{E}$ y $\hat{p}$ forman las componentes del cuadrivector ${\hat{p}^\mu\equiv{i}\hbar(\partial_0,-\partial_j)}$, por lo que el procedimiento análogo seguirá siendo válido en la descripción relativista. En este caso entonces, empleemos la relación de energía-momento, de modo que
\begin{align}\left(i\hbar\partial_0\right)^2\psi&=m^2\psi+\left(-i\hbar\partial_j\right)^2\psi\end{align} es decir
\begin{equation}-\partial_{00}\psi+\partial_{jj}\psi=\eta^{\mu\alpha}\partial_\alpha\partial_\mu\psi=\partial^\mu\partial_\mu\psi=\frac{m^2}{\hbar^2}\psi\end{equation} y ya que ${\hat{p}^\mu\hat{p}_\mu=-\hbar^2\partial^\mu\partial_\mu}$, esto puede escribirse también como
\begin{equation}\hat{p}^\mu\hat{p}_\mu\psi+m^2\psi=0\label{1.1}\end{equation} o bien, empleando el operador d'Alembertiano (que yo defino aquí como ${\square^2\equiv\p^\alpha\p_\alpha=\nabla^2-\p_t^2}$, acorde a la signatura elegida),
\begin{equation}\left(\square^2-\mathcal{M}^2\right)\psi=0\label{1.2}\end{equation} donde ${\mathcal{M}\equiv\frac{m}{\hbar}}$. Ésta es la ecuación de Klein-Gordon para la partícula libre.

Por su sencillez, y la sencillez para obtenerla, muchos autores la obtuvieron antes, siendo Schrödinger incluso el primero y obteniéndola antes que la versión clásica ([1]), aunque Oskar Klein and Walter Gordon dieran después la descripción cualitativa correcta de la ecuación que lleva sus apellidos.

Ahora bien, considérese la ecuación de K-G para el conjugado de $\psi$,
\begin{equation}\left(\square^2-\mathcal{M}^2\right)\psi^*=0\end{equation} multiplicando ésta y (\ref{1.2}) por $\psi$ y por ${\psi^*}$, respectivamente,
\begin{align}\psi^*\left(\square^2-\mathcal{M}^2\right)\psi&=0\\\psi\left(\square^2-\mathcal{M}^2\right)\psi^*&=0\end{align} y así, restando término a término ambas ecuaciones,
\begin{align}\psi^*\square^2\psi-\psi\square^2\psi^*=\psi^*\partial^\mu\partial_\mu\psi-\psi\partial^\mu\partial_\mu\psi^*=0\label{1.3}\end{align} entonces sabiendo que en general para dos funciones de onda $\phi$ y $\varphi$,
\begin{align}\partial_\mu\left(\phi\partial^\mu\varphi\right)=\phi\partial_\mu\partial^\mu\varphi+\partial_\mu\phi\partial^\mu\varphi\end{align} se sigue que (por igualdad de parciales cruzadas)
\begin{align}\partial_\mu&\left[\psi^*\partial^\mu\psi-\psi\partial^\mu\psi^*\right]\nonumber\\&=\psi^*\partial^\mu\partial_\mu\psi-\psi\partial^\mu\partial_\mu\psi^*+\partial_\mu\psi^*\partial^\mu\psi-\partial_\mu\psi\partial^\mu\psi^*\nonumber\\&=\psi^*\square^2\psi-\psi\square^2\psi^*+\partial_\mu\psi^*\partial^\mu\psi-\partial_\mu\psi\partial^\mu\psi^*\nonumber\\&=\psi^*\square^2\psi-\psi\square^2\psi^*+\eta^{\mu\alpha}\left[\partial_\mu\psi^*\partial_\alpha\psi-\partial_\mu\psi\partial_\alpha\psi^*\right]\nonumber\\&=\underbrace{\psi^*\square^2\psi-\psi\square^2\psi^*}_{\text{por}\,(\ref{1.3})}=0\end{align} de modo que, si en analogía con la teoría clásica, definimos
\begin{equation}j^\mu\equiv\mathcal{C}\left(\psi^*\partial^\mu\psi-\psi\partial^\mu\psi^*\right)\end{equation} como el cuadrivector de corriente con $\mathcal{C}$ una constante que puede determinarse tomando el límite del caso clásico, se sigue que
\begin{equation}\partial_\mu{j}^\mu=0\end{equation} que es la ecuación de continuidad, conocida en notación tridimensional como
\begin{equation}\frac{\p\rho}{\p{t}}+\nabla\cdot\B{j}=0\end{equation} que por supuesto debe satisfacer la ec. de K-G dada la interpretación de $\psi$ como amplitud de probabilidad; de aquí se identifica
\begin{align}\rho=\mathcal{C}\left(\psi^*\partial_0\psi-\psi\partial_0\psi^*\right)\end{align} y nótese que dependiendo de la función de onda, $\rho$ podrá ser positiva o negativa, contrario a lo que ocurre con la versión clásica; esto representa un problema serio dada la interpretación de la función de onda como amplitud de probabilidad, pues el que la densidad $\rho$, clásicamente interpretada como densidad de probabilidad, permita valores negativos, implica que se podrían tener probabilidades negativas; se dice que este problema incluso fue el principal motivo por el cual Schrödinger pasaría a tratar la versión no relativista ([1]). Por ello $\rho$ no se interpreta ya como una densidad de probabilidad, aunque suele interpretarse como densidad de carga, como se verá a continuación ([1]).

Propongamos el ansatz para la ecuación K-G para partícula libre,
\begin{equation}\psi=A\mathrm{e}^{ik_\mu{x}^\mu/\hbar}\label{1.4}\end{equation} donde ${k^\mu=(\hbar\omega,\B{p})}$ de manera análoga a la ecuación conocida ${\B{P}=\hbar(\omega,\B{k})}$, entonces se tiene que
\begin{align}\left(\square^2-\mathcal{M}^2\right)\psi&=A\left(\partial_\mu\partial^\mu\mathrm{e}^{i{k}_\mu{x}^\mu/\hbar}-\mathcal{M}^2\mathrm{e}^{i{k}_\mu{x}^\mu/\hbar}\right)\nonumber\\&=A\left(i\frac{k_\mu}{\hbar}\partial_\mu\mathrm{e}^{-i{k}_\mu{x}^\mu/\hbar}-\mathcal{M}^2\mathrm{e}^{i{k}_\mu{x}^\mu/\hbar}\right)\nonumber\\&=A\left(i\frac{k_\mu}{\hbar}\eta_{\mu\alpha}\partial^\alpha\mathrm{e}^{i{k}_\mu{x}^\mu/\hbar}-\mathcal{M}^2\mathrm{e}^{ik_\mu{x}^\mu/\hbar}\right)\nonumber\\&=-A\left(\hbar^{-2}k_\mu\eta_{\mu\alpha}{k}_\alpha+\mathcal{M}^2\right)\mathrm{e}^{ik_\mu{x}^\mu/\hbar}\nonumber\\&=-A\left(\hbar^{-2}k_\mu\eta_{\mu\alpha}\eta_{\alpha\mu}{k}^\mu+\mathcal{M}^2\right)\mathrm{e}^{ik_\mu{x}^\mu/\hbar}\nonumber\\&=-A\left(\hbar^{-2}k_\mu{k}^\mu+\mathcal{M}^2\right)\mathrm{e}^{ik_\mu{x}^\mu/\hbar}=0\end{align} y por tanto (\ref{1.4}) es solución de la ecuación de K-G si
\begin{align}k_\mu{k}^\mu=-m^2\,\Longrightarrow\,\pm\hbar\omega=\pm\sqrt{\B{p}^2+m^2}\end{align} Por supuesto ${k^\mu}$ está construida como 4-momento, donde ${\hbar\omega}$ es energía; de ello se sigue que las soluciones a la ecuación K-G permiten tanto estados positivos de energía como estados negativos. Esto significa entonces que para las soluciones
\begin{equation}\psi_\pm=A_\pm\mathrm{e}^{\mp{i}\omega{t}+i\B{p}\cdot\B{x}/\hbar}\end{equation} se tendrán densidades
\begin{equation}\rho_\pm=\mp2\mathcal{C}i\omega|A|^2\end{equation} y considerando que ${\mathcal{C}=i\hbar{q}/2m}$, de modo que la densidad de carga no relativista coincida con ${\rho=q|\psi|^2}$ para partículas de magnitud de carga $q$, se sigue que
\begin{equation}\rho_\pm=\pm\frac{\hbar\omega{q}}{m}|A|^2\end{equation} de modo entonces que en este caso las soluciones de energía positiva corresponden a partículas con carga positiva y las de energía negativa a partículas con carga negativa; i.e. la ecuación de Klein-Gordon contiene simultáneamente soluciones para partículas y sus antipartículas. A esta noción de antimateria se le da mayor sentido con la ecuación de Dirac; no se ha justificado aún el que se permitan estados con energías negativas.

Ahora bien, uno puede generalizar la ecuación de K-G para partículas en un campo electromagnético externo vía acoplamiento minimal, ${\hat{p}^\mu\to\hat{p}^\mu-qA^\mu}$, de modo que la ec. de K-G (\ref{1.1)) se escribe como
\begin{equation}\left(i\hbar\partial^\mu+qA^\mu\right)\left(i\hbar\partial_\mu+qA_\mu\right)\psi+m^2\psi=0\end{equation} de aquí pueden considerarse distintas formas para el potencial como los pozos de potencial, de donde aparecen situaciones interesantes como la llamada paradoja de Klein. El lector puede complementar esta información con [1], en donde se muestra el caso atómico, que lleva a un resultado que difiere del experimental por un factor de ${1/3}$. En seguida se muestra entonces el caso en que se toma en cuenta el espín del electrón, generalizando un tanto más la ecuación de Klein-Gordon.

Al formular la ecuación de Klein Gordon nos topamos con algunas inconveniencias, como el signo indefinido de la densidad $\rho$, los estados que permiten energías negativas y el que se ignore (o que no aparezca) la propiedad intrínseca del espín. El trabajo de Paul Dirac atacó estas cuestiones introduciendo nuevas nociones como la antimateria, vista experimentalmente años más tarde, y el llamado mar de Dirac, que de hecho resulta ser innecesario en e.g. teoría cuántica de campos ([1]). La ecuación de Dirac suele considerarse como uno de los triunfos más grandes de la física teórica, y por supuesto el alcance de toda la teoría que surge de esta ecuación es mucho mayor al que cubre esta pequeña entrada de blog.

Lo primero que puede notarse es que la ecuación de K-G no es del mismo tipo que el de la ec. de Schrödinger al involucrar una segunda derivada temporal; el signo indefinido de la densidad $\rho$ surge precisamente de este hecho. Puede evitarse esta segunda derivada a su vez manteniendo invariancia de Lorentz, proponiendo que es posible linearizar la relación de energía-momento ([1]), de modo que ${\exists\,\vec{\alpha},\beta}$ tales que
\begin{equation}\hat{E}=\vec\alpha\cdot\hat{\B{p}}+\beta{m}\end{equation} es decir, que para una función de onda $\psi$, en notación clásica,
\begin{equation}i\hbar\frac{\partial\psi}{\partial{t}}=-i\hbar\vec\alpha\cdot\nabla\psi+\beta{m}\psi\label{1.5}\end{equation} donde las cantidades $\vec\alpha$ y $\beta$ se determinan de modo que de mantenga la invariancia ante transformaciones de Lorentz. En [1] puede seguirse que la ec. de Dirac más simple es la que tiene asociadas matrices de rango 4 correspondientes a espín ${1/2}$ (fermiones; en la época de Dirac sólo se consideraban electrones y protones), i.e. la teoría genera por sí misma el espín. Finalmente respecto al problema de energías negativas, puede verse [1] que la ec. (\ref{1.5}) también posee soluciones de energía negativa, y es entonces cuando Dirac introduce la noción de antimateria. Para resolver el problema, Dirac propuso que todos los estados de energía negativa están ocupados por electrones, constituyendo el llamado mar de Dirac, de modo que los electrones no pueden ocupar esos estados por principio de exclusión. Los huecos en el mar de Dirac entonces se identifican como los antielectrones, o en general como las antipartículas. Ésta es la idea general del trabajo de Dirac, que además de abrir una enorme ventana hacia nueva física, de algún modo también lo hacía con las matemáticas al proveer un caso de álgebras de Clifford --ignorando Dirac el trabajo de William Clifford-- e iniciando el formalismo del cálculo espinorial, que va más allá del cálculo vector-tensorial. Se recomienda la referencia [2] para más información en general.

[1] Peña, Luis de la. Introducción a la Mecánica Cuántica, Fondo de Cultura Económica, UNAM, 3a edición, 2006.
[2] Penrose, Roger. El camino a la realidad, Debate, 2007.