Showing posts with label Función de partición. Show all posts
Showing posts with label Función de partición. Show all posts

Bosonización: dualidad fermiones/bosones

En diciembre Joseph Polchinski publicó un artículo recopilatorio sobre dualidades llamado simplemente Dualities (al que luego agregó 'of Fields and Strings'):

Dualities of Fields and Strings
Joseph Polchinski

Duality, the equivalence between seemingly distinct quantum systems, is a curious property that has been known for at least three quarters of a century. In the past two decades it has played a central role in mapping out the structure of theoretical physics. I discuss the unexpected connections that have been revealed among quantum field theories and string theories.

El artículo está muy bien escrito, de manera sencilla y sucinta, y creo que es accesible, al menos a nivel conceptual, incluso a estudiantes de licenciatura. Luego de introducir el tema de dualidades, Polchinski bosqueja algunas dualidades QFT/QFT, entre las que se encuentra la de bosonización (antes, otra cuestión que llama la atención es la de la dualidad onda/partícula como dos límites clásicos de QFT), que es básicamente una dualidad entre una teoría de fermiones de Dirac y una teoría de bosones en 1+1 dimensiones. Ésta dualidad es sorprendente y me pareció sumamente interesante por lo sencilla y porque con mi poco conocimiento de QFT supuse que podría trabajar los detalles; además descubrí que es prácticamente tema estándar en el área de Materia Condensada y seguramente tiene bastantes avances o generalizaciones.

Polchinski se limita a presentar la dualidad: las relaciones entre las constantes de acoplamiento y la correspondencia entre los campos que se deben satisfacer para que las amplitudes sean idénticas. Para obtener el resultado, original de Sidney Coleman (1975), uno tiene varias opciones, como intentar trabajar como sugiere Polchinski: empezar con teorías sin masa y sin interacción, $\mc{L}_\text{F}=i\bar\psi\gamma^\mu\partial_\mu\psi$ y $\mc{L}_\text{B}=-\frac{1}{2}\partial_\mu\phi\partial^\mu\phi$, calcular las amplitudes de dispersión, obtener la correspondencia que las vuelve idénticas y luego deformar nuevamente las teorías a unas con interacción. Y esto es básicamente lo que hace Coleman en su artículo original, calculando funciones de Green en ambos casos:

Quantum sine-Gordon equation as the massive Thirring model
Sidney Coleman

The sine-Gordon equation is the theory of a massless scalar field in one space and one time dimension with interaction density proportional to $\cos\beta\phi$, where $\beta$ is a real parameter. I show that if $\beta^2$ exceeds $8\pi$, the energy density of the theory is unbounded below; if $\beta^2$ equals $4\pi$, the theory is equivalent to the zero-charge sector of the theory of a free massive Fermi field; for other values of $\beta$, the theory is equivalent to the zero-charge sector of the massive Thirring model. The sine-Gordon soliton is identified with the fundamental fermion of the Thirring model.

El artículo es relativamente extenso y confieso que no lo he seguido paso a paso, lo que creo que quizá convendría únicamente si uno quiere entrarle en serio al tema de bosonización.

De cualquier modo, buscando un poco más sobre bosonización, además de encontrar varios títulos de libros sobre el tema enfocados a Física de Partículas y a Materia Condensada, fortuitamente también encontré otro artículo sobre el tema:

Bosonization as Duality
C.P. Burgess, F. Quevedo

We show that bosonization in two dimensions can be derived as a special case of the duality transformations that have recently been used to good effect in string theory. This allows the construction of the bosonic counterpart of any fermionic theory simply by `following your nose' using the standard duality transformation rules. We work through the bosonization of the Dirac fermion, the massive and massless Thirring models, and a fermion on a cylindrical spacetime as illustrative examples.

El artículo comienza con el comentario

Precise rules for various versions of this equivalence have been known for some time now [1][2][3].The statement of these rules generally suffers from the drawback of not being constructive in character, being instead couched in terms of the equivalence of a given pair of bose and fermi theories¹. This is particularly true for nonabelian bosonization, where a simple, systematic, constructive and unified presentation of the bosonization rules is still missing [4]. Our purpose in this note is to provide such a derivation, for the abelian case.

donde abeliano se refiere a que el grupo de simetría de la teoría en cuestión es conmutativo; los mismos autores tratan en otro artículo el caso no-abeliano (también tratado años antes por Witten). Este artículo me pareció bastante mono (al menos de un vistazo) por la sencillez y generalidad. Los autores mencionan un procedimiento llamado dualización que para entonces ya había sido útil para relacionar 'vacíos' aparentemente no relacionados en teoría de cuerdas y lo describen así:

This duality is a trick for constructing the equivalent theory by embedding the model of interest within a larger gauge theory, which reduces to the original version once the gauge potential, $A_\mu$, is set to zero. This larger gauge theory is typically constructed simply by gauging a global symmetry of the original model [7] [8]. The original model is then written as the gauged theory subject to some constraint that removes the gauge potential, and this is usually done by introducing a dummy variable –a Lagrange multiplier field, $\Lambda$– whose functional integral requires the gauge field strength to vanish, $F_{\mu\nu}=0$. (...) If $\Lambda$, and then $A_\mu$, are integrated out –in this order– of the gauged version of the theory, then the original model is retrieved. The dual version of the theory, on the other hand, is obtained by performing the various functional integrals in a different order, in particular by integrating out the original field, as well as $A_\mu$. The Lagrange multiplier, $\Lambda$, then plays the role of the new, dual, field.

La idea en realidad es sencilla, y como mencionan, puede entenderse mejor sólo con el caso concreto del fermión no masivo (por alguna razón lo mencionan como libre) en la sección 2.1). El procedimiento es básicamente plantear la función de partición de los fermiones
\begin{equation}Z_\text{F}[J]=\int\mc{D}\psi\,\exp\left[i\int{d^2x}\left(\bar\psi\gamma^\mu\partial_\mu\psi+\sum_iJ_i\mc{O}_i\right)\right]\end{equation} con los $J_i(x)$ y $\mc{O}_i(\psi)$ campos y operadores, respectivamente (que en el caso más sencillo, como hacen en el artículo, pueden tomarse como constantes de acoplamiento y términos de interacción) y encajarla en una teoría de norma más amplia (básicamente 'normando' una simetría global de la teoría original) sujeta a ciertas constricciones
\begin{equation}Z_\text{gauge}[J]=\int\mc{D}\psi\,\mc{D}A_\mu\,\mc{D}\Lambda\,\exp\left[i\int{d^2x}\left(\mc{L}_\text{F}(\psi,J)+\mc{L}_\text{gauge}(A_\mu,\Lambda)\right)\right]\end{equation} que permita recuperar $Z_\text{F}[J]$ al integrar en $\Lambda$ y en $A_\mu$, i.e. tal que $Z_\text{F}[J]={Z}_\text{gauge}[J]\bigg|_{\Lambda,A_\mu}$. Finalmente esto permite obtener la teoría dual en $\Lambda$ (que como se muestra en el artículo, corresponde a una de bosones) si se integra $Z_\text{gauge}[J]$ en $\psi$ y en $A_\mu$,
\begin{equation}Z_\text{B}[J]\equiv{Z}_\text{gauge}[J]\bigg|_{\psi,A_\mu}=\int\mc{D}\Lambda\exp\left[i\int{d^2x}\,\mc{L}_\text{B}(\Lambda,J)\right]\end{equation} con lo que se obtiene también la correspondencia entre las teorías identificando los términos en $J_i$.

La idea en realidad es sencilla, la parte que resulta complicada para un neófito como yo es la de elegir la teoría de norma y la de hacer la integración, ya sea con fuerza bruta o devorándose los artículos que mencionan los autores. De cualquier modo la parte importante es si quiera saber en primer lugar que esta sorprendente dualidad existe, siendo que el carácter de ambas teorías es tan distinta, y luego entender cómo funciona y el alcance que tiene.

Finalmente, regresando al artículo de Polchinski, en realidad no era consciente de la idea general que plantea acerca de una dualidad como un par de límites de una teoría más fundamental, así que definitivamente me ha causado una impresión importante su artículo (o la parte que he leído seriamente hasta ahora) y en general lo recomiendo ampliamente.

If the doors of perception were cleansed every thing would appear to man as it is, Infinite.

― William Blake, The Marriage of Heaven and Hell


Agujeros Negros en AdS

He estado ausente algún tiempo intentando terminar la licenciatura, y como mostré en la entrada anterior, he estado trabajando en la geometría (clásica) del espacio de Anti-de Sitter. Ahora quiero compartir algunos comentarios sobre Agujeros Negros en AdS, basándome en este ensayo de Peng Zhao.

El caso más sencillo es (A)dS-Schwarzschild, y la idea es que partiendo de una métrica esféricamente simétrica en forma de Schwarzschild,
\begin{equation}ds^2=-f(r)\,dt^2+f^{-1}(r)\,dr^2+r^2d\Omega^2\end{equation} uno puede tomar $f$ tal que cerca del origen se tenga un espacio de Schwarzschild y asintóticamente se tenga (A)dS (para una obtención más metódica de esta métrica véase e.g. la p.823 de las notas de M. Blau). Las métricas de AdS y de Schwarzschild, respectivamente, pueden escribirse como
\begin{align}ds_\text{AdS}^2&=-\left(1+\frac{r^2}{\alpha^2}\right)\,dt^2+\left(1+\frac{r^2}{\alpha^2}\right)^{-1}dr^2+r^2d\Omega^2\\
ds_\text{Sch}^2&=-\left(1-\frac{r_s}{r}\right)\,dt^2+\left(1-\frac{r_s}{r}\right)^{-1}dr^2+r^2d\Omega^2\end{align} donde $\alpha$ es una constante positiva (el radio de AdS) y $r_s$ es el radio de Schwarzschild. De aquí, se define entonces la métrica de AdS-Schwarzschild como
\begin{equation}ds^2=-\left(1+\frac{r^2}{\alpha^2}-\frac{r_s}{r}\right)\,dt^2+\left(1+\frac{r^2}{\alpha^2}-\frac{r_s}{r}\right)^{-1}dr^2+r^2d\Omega^2\end{equation} que en efecto se comporta como un agujero negro de Schwarzschild para $r$ pequeña y como AdS para $r$ grande. Lo propio puede hacerse empleando de Sitter.

***(Actualización)
La primera cuestión es a AdS se le puede asociar una energía finita y por tanto el análogo a una pared de potencial infinita en su infinito asintótico. Por teorema de Noether, en AdS la energía es una carga conservada, $E=-P_\mu{V}^\mu$ (el signo negativo es simplemente por consistencia, de cualquier modo siempre se le puede cargar a $E$ que es constante); en este caso nos interesa la energía $E_\text{loc}$ medida por un observador local (es decir, que localmente está en un sistema plano) estático, en donde tendríamos simplemente que $P=(E,\vec{0})$ y $V=(1,\vec{0})$. Lo que nos interesa es encontrar esta relación para este observador en el sistema global de coordenadas de AdS (esféricas). Considérense los vectores transformados $p$ y $v$. Primero empleemos la condición de normalización $v^\mu{v}_\mu=-1$ y el hecho de que el observador es estático también en el sistema global de AdS, i.e. $v=(v^t,\vec{0})$, esto implica que $v^t=1/\sqrt{-g_{tt}}$, entonces en este sistema coordenado,
\begin{equation}E_\text{loc}=-p_\mu{v}^\mu=-g_{\mu\nu}p^\mu{v}^\nu=\sqrt{-g_{tt}}p^t\end{equation} Ahora bien, en el sistema del observador local estático simplemente $p^t=m\dot{t}$ con $m$ la masa de la partícula (el observador), que podemos llevar a la forma en coordenadas de AdS sabiendo que $P^t=g_{tt}\dot{t}=-E$ en AdS, de modo que $p^t=-mE/g_{tt}\equiv-{E}_0/g_{tt}$ y así,
\begin{equation}E_\text{loc}(r)=\frac{E_0}{\sqrt{-g_{tt}(r)}}\label{1}\end{equation} de donde se lee que la energía medida por un observador local en algún punto $r$ tiene un corrimiento al rojo (debido al campo gravitacional) respecto a la energía $E_0$. En el ensayo de Zhao se escribe $E_0$ como $E_\infty$, sin embargo la notación se antoja un poco desafortunada, ya que ésta es la energía total medida por un observador local estático en $r=0$; la notación probablemente proviene de la interpretación de ser la energía medida por un observador alejado infinitamente del campo gravitacional del espacio, lo que resulta útil e.g. en Schwarzschild, donde $E$ en efecto es la energía (por unidad de masa) medida por un observador local estático en $r\to\infty$, aquí de hecho $E_\text{loc}\to0$ cuando $r\to\infty$, contrario a Schwarzschild, en donde $E_\text{loc}\to{mE}$ cuando $r\to\infty$ y $E_\text{loc}\to\infty$ cuando $r\to{r}_s$, esto hace la gran diferencia para ver a AdS como una caja. Nótese también que los vectores de momento y de velocidad (i.e. el vector de Killing transformado) se recuperan para el caso local en AdS con $r=0$ y en Schwarzschild con $r\to\infty$. Como se ve adelante, pueden construirse estados térmicos en AdS identificando periódicamente una coordenada de tiempo imaginaria con periodo $\beta_0=T^{-1}$. Esto significa entonces que (\ref{1}) puede escribirse también como $T_\text{loc}=\frac{T}{\sqrt{-g_{tt}}}$ y que la energía total de la radiación térmica en AdS es finita sin necesidad de encerrarla en una caja.
***

Luego entonces, tomando $r=r_+$ el horizonte de eventos de AdS-Schwarzschild, i.e. la raíz más grande de
\begin{equation}V(r)\equiv1-\frac{r_s}{r}+\frac{r^2}{\alpha^2}\end{equation} se fija el valor de $r_s$ a
\begin{equation}V(r_+)=0\,\Longrightarrow\,r_s=\frac{r_+(\alpha^2+r_+^2)}{\alpha^2}\end{equation} y entonces en efecto al ver la métrica cerca del horizonte, i.e. con $r=r_++\epsilon^2$ con $|\epsilon|\ll1$, para el orden dominante en $\epsilon$,
\begin{equation}V(r_++\epsilon^2)\approx\frac{\alpha^2+3r_+^2}{\alpha^2r_+}\epsilon^2\end{equation} y haciendo una rotación de Wick, $\tau=it$, se sigue para la métrica AdS-Schwarzschild,
\begin{equation}ds^2=\frac{4\alpha^2r_+}{\alpha^2+3r_+^2}\left[d\epsilon^2+\left(\frac{\alpha^2+3r_+^2}{2\alpha^2r_+}\right)^2\epsilon^2d\tau^2\right]+(r_++\epsilon^2)^2d\Omega^2\end{equation} Aquí puede resultar poco claro cómo ver que necesariamente $\tau$ es periódica. El punto es entender lo que significa que se tenga una singularidad cónica. La idea es básicamente que si $\tau$ tiene un cierto periodo $\beta_0$, el espacio se cubrirá completamente, lo que no sucederá necesariamente con cualquier otro valor; la analogía que utiliza Zhao es la de las coordenadas polares $ds^2=dr^2+r^2d\theta^2$, donde $\theta$ debe tener un periodo de $2\pi$ para corresponder a la métrica del plano, de otro modo se tiene un hueco del tipo de una rebanada de pastel, lo que lleva a algo así como un pico de un cono, lo que es la singularidad cónica.
En este caso es particularmente fácil verificar cuál es el periodo $\beta_0$ de $\tau$, dado que el término entre corchetes de la métrica AdS-Schwarzschild cerca del horizonte es análoga a la del plano en coordenadas polares. Se debe satisfacer entonces que
\begin{equation}\frac{\alpha^2+3r_+^2}{2\alpha^2r_+}\int_0^{\beta_0}d\tau\int_0^{r_+}\epsilon\,{d}\epsilon=\pi{r}_+^2\,\Longrightarrow\,\beta_0=\frac{4\pi\alpha^2r_+}{\alpha^2+3r_+^2}\end{equation}
En adelante la cosa es bastante clara, al menos antes de llegar a la parte de AdS/CFT, y el resultado $T=\beta^{-1}$ creo que es bastante majo, pues entonces la temperatura del agujero negro puede obtenerse únicamente con argumentos geométricos, sin invocar directamente la gravedad de superficie. Sólo hay detalles cuando se menciona la distribución canónica, aunque al final igual lo que se calcula es $S=\beta\langle{E}\rangle+\ln{Z}$. La intención es llegar a la dualidad fluido/gravedad, pero de eso tal vez escriba después  ;-)

Fluctuaciones de energía en el ensamble canónico

La consistencia entre los formalismos microcanónico y canónico en el límite termodinámico, suele ser demostrada luego de estudiar la dispersión de los valores de energía de un sistema en el ensamble canónico (el ensamble microcanónico considera sistemas aislados, en los que la energía está restringida a un intervalo muy pequeño). Esto es, luego de analizar las fluctuaciones de energía en el ensamble canónico.

Consideremos que el hamiltoniano es simplemente la energía, ${\mathcal{H}=E}$. La forma común de obtener una expresión sencilla para las fluctuaciones de energía, es notar que éstas están dadas por
$$\left\langle\left(\Delta{E}\right)^2\right\rangle\equiv\left\langle{E^2}\right\rangle-\left\langle{E}\right\rangle^2=-\frac{\partial^2\ln{z}}{\partial\beta^2}=-\frac{\partial{U}}{\partial\beta}$$ donde z es la función de partición y ${\beta\equiv(\mathrm{k}T)^{-1}}$ en este caso, además se ha empleado la definición
$$U\equiv\langle{E}\rangle=-\frac{\partial\ln{z}}{\partial\beta}$$ (demuestra la última igualdad). La razón de que esto sea cierto es sencilla, ya que con la distribución canónica en el espacio fase $\Gamma$,
$$\langle{\mathcal{H}}\rangle=\frac{\displaystyle{\int{\mathcal{H}\,\mathrm{e}^{-\beta{\mathcal{H}}}}\,\mathrm{d}\Gamma}}{\displaystyle{\int{\mathrm{e}^{-\beta{\mathcal{H}}}}\,\mathrm{d}\Gamma}}$$ (calcula la derivada parcial y compruébalo). Hace poco, un problema de examen se me ha complicado bastante por no notar lo que he dicho antes en tan pocas líneas. Estás ya cansado de todo el periodo curricular; aún te falta esta prueba y te piden demostrar que
$$\left\langle{(\Delta{E})^3}\right\rangle=\mathrm{k}^2\left\{T^4\left(\frac{\partial{C_v}}{\partial{T}}\right)_V+2T^3C_v\right\}$$ Bueno pues lo que hay que hacer es prácticamente lo anterior, primero identifíquese
\begin{align*}\left\langle{E^2}\right\rangle-U^2&=\left\langle{E^2}\right\rangle-2U^2+U^2\\[0.1in]&=\left\langle{E^2-2EU+U^2}\right\rangle\\[0.1in]&=\left\langle{(E-U)^2}\right\rangle\\[0.1in]&\equiv\left\langle\left(\Delta{E}\right)^2\right\rangle\end{align*} lo que significa entonces que
$$\left\langle{(\Delta{E})^3}\right\rangle=\left\langle{E^3}\right\rangle-3\left\langle{E^2}\right\rangle{U}+2U^3$$ y curiosamente te tropiezas con que
\begin{align*}\frac{\partial^2U}{\partial\beta^2}&=\frac{\int{E}^3\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}{\int{\mathrm{e}}^{-\beta{E}}\,\mathrm{d}\Gamma}-3\frac{\int{E}^2\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}{\int\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}\cdot\frac{\int{E}\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}{\int\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}+2\left[\frac{\int{E}\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}{\int\mathrm{e}^{-\beta{E}}\,\mathrm{d}\Gamma}\right]^3\\[0.1in]&=\left\langle{E^3}\right\rangle-3\left\langle{E^2}\right\rangle\,U+2U^3\end{align*} (compruébalo) lo que lleva a completar la demostración haciendo la termodinámica correspondiente.

Es interesante esta relación, que probablemente pueda generalizarse más, aunque lo desconozco. Nota también la elección del signo para la definición de ${\Delta{E}}$; si has seguido hasta acá la entrada, da un argumento que justifique tal elección.