Introdução à Mecânica Quântica

Jaime E. Villate.
Universidade do Porto, Portugal, 2026.

1. Introdução

Pêndulo de Wilberforce

Um sistema mecânico é caraterizado por variáveis que variam em função do tempo. Analisando essa variação temporal das variáveis determinam-se as forças que atuam no sistema e, de forma inversa, uma vez conhecidas essas forças consegue-se prever como será a evolução dessas variáveis em função do tempo, quando os valores iniciais dessas variáveis sejam outros. Neste capítulo apresentam-se alguns elementos importantes para o desenvolvimento da teoria da mecânica quântica. Começaremos com um sumário de mecânica clássica, seguido de alguns conceitos matemáticos.

1.1. Síntese de mecânica analítica

A mecânica clássica é uma área muito extensa, desenvolvida a partir do século XVII, com o trabalho de Galileu, Newton e muitos outros. Nos séculos XVII e XIX foram propostas abordagens mais gerais e abstratas, designadas de mecânica analítica. A Mecânica Quântica estende alguns dos conceitos da mecânica analítica; como tal, para compreender os postulados básicos da Mecânica Quântica é necessário conhecer os conceitos de mecânica analítica que vamos abordar nas secções seguintes.

1.1.1. Movimento no espaço de fase

Na mecânica clássica, o movimento de uma partícula determina-se a partir da segunda lei de Newton: a força resultante sobre um corpo é igual à variação da sua quantidade de movimento, p\vec{p}, em ordem ao tempo:

F=dpdt\displaystyle \vec{F}=\dfrac{\mathrm{d}\,\vec{p}}{\mathrm{d}\,t}
(1.1)

Se a massa do corpo é constante, a derivada da sua quantidade de movimento é igual à sua massa vezes a sua aceleração. No século XVII, Kepler determinou as acelerações dos planetas nas suas órbitas em torno do Sol. Newton, baseado nos resultados de Kepler, determinou a expressão da força gravítica do Sol sobre qualquer objeto em qualquer posição do sistema solar e mostrou que tem a mesma forma da força que a Terra exerce nos corpos na sua "esfera de influência" (vizinhança da Terra onde a atração do Sol é praticamente igual em todos os pontos mas a atração da Terra varia significativamente) e estudou como seria o movimento de qualquer corpo sob a ação de uma força gravítica.

Conhecida a expressão de uma força F\vec{F}, a equação (1.1) permite determinar o movimento de um corpo sob a ação dessa força. Consideremos o caso em que o corpo só pode deslocar-se ao longo de uma curva. A posição do corpo ao longo da curva é dada por um comprimento de arco ss ao longo da curva. A cada instante tt, o estado do corpo é dado pela sua posição, ss, e a sua quantidade de movimento pp. Podemos representar os diferentes estados, em diferentes instantes, como pontos num plano com coordenadas ss e pp, designado por espaço de fase (figura 1.1).

Figura 1.1: Espaço de fase de um corpo em movimento numa dimensão.

Em cada instante tt, o estado corresponde a um ponto P no espaço de fase, com coordenadas:

P=(s,p)\displaystyle \mathrm{P }=(s,p)
(1.2)

A figura 1.1 mostra o estado P0\mathrm{P }_0 num instante t0t_0, e o estado P1\mathrm{P }_1 num instante posterior t1t_1. O estado só pode mudar de forma contínua no espaço de fase; como tal, existe uma curva contínua entre P0\mathrm{P }_0 e P1\mathrm{P }_1, designada por curva de evolução, que inclui todos os estados no intervalo de tempo entre t0t_0 e t1t_1. A cada instante, a derivada das coordenadas do estado P definem um vetor u\vec{u}, tangente à curva de evolução, designado por velocidade de fase:

u=dPdt=(dsdt,dpdt)\displaystyle \vec{u}=\dfrac{\mathrm{d}\,\mathrm{P }}{\mathrm{d}\,t}=\left(\dfrac{\mathrm{d}\,s}{\mathrm{d}\,t}, \dfrac{\mathrm{d}\,p}{\mathrm{d}\,t}\right)
(1.3)

A figura 1.2 mostra a velocidade de fase u0\vec{u}_0 no instante t0t_0, e a velocidade de fase u\vec{u} num instante intermédio entre t0t_0 e t1t_1.

Figura 1.2: Velocidade de fase de um corpo em movimento numa dimensão.

A derivada da posição ss em ordem ao tempo é a velocidade, vv, igual à sua quantidade de movimento, pp, dividida pela sua massa, mm. E de acordo com a segunda lei de Newton (1.1), a derivada da quantidade de movimento é a força resultante FF. Como tal, as componentes da velocidade de fase são:

u=(pm,F)\displaystyle \vec{u}=\left(\dfrac{p}{m}, F\right)
(1.4)

Basta então conhecer a expressão de FF, que, em geral, é uma função que depende do tempo tt, da posição ss e da quantidade de movimento pp, para determinar a velocidade de fase em qualquer ponto do espaço de fase. A partir de um estado inicial (s0s_0, pop_o), a descrição do movimento do corpo obtém-se integrando a expressão da velocidade de fase, desde t0t_0 até um tempo tt posterior:

(s(t),p(t))=(s0,p0)+t0tudt\displaystyle (s(t), p(t))=(s_0,p_0) + \int_{t_0}^t \vec{u}\,\mathrm{d } t
(1.5)

Observe-se que dois estados diferentes, nunca podem evoluir para o mesmo estado. Se assim fosse, as duas curvas de evolução, diferentes, encontravam-se num ponto comum, onde teríamos então duas direções tangentes á duas curvas e, como tal, duas velocidades de fase diferentes no mesmo ponto, que é impossível; em cada ponto a velocidade de fase está definida de forma única pela expressão (1.4).

O retrato de fase de um sistema mostra algumas curvas de evolução no espaço de fase. Por exemplo, a figura 1.3 mostra um sistema com quatro curvas de evolução que se aproximam do ponto P0\mathrm{P }_0. Se o estado inicial do sistema estiver num dos pontos P1\mathrm{P }_1, P2\mathrm{P }_2, P3\mathrm{P }_3 ou P4\mathrm{P }_4, após algum tempo o estado estará muito próximo do ponto P0\mathrm{P }_0. No entanto, as curvas de evolução aproximam-se assimptoticamente desse ponto, sem chegar exatamente a ele. A velocidade de fase no ponto P0\mathrm{P }_0 é nula, e esse ponto está isolado: nenhuma curva de evolução passa por ele. Se num instante o sistema estiver no estado P0\mathrm{P }_0, permanecerá sempre nesse mesmo estado, sem evoluir. Um ponto como P0\mathrm{P }_0, onde a velocidade de fase é nula, é designado por ponto de equilíbrio.

Figura 1.3: Ponto de equilíbrio, P0\mathrm{P }_0 e quatro curvas de evolução que se aproximam assimptoticamente desse estado.

O retrato de fase de um sistema pode ser traçado calculando a velocidade de fase em alguns pontos, e identificando os pontos onde a velocidade de fase é nula (pontos de equilíbrio). Um retrato de fase permite saber como evoluirá o sistema em diferentes regiões do espaço de fase, sem ter de resolver a equação (1.5). Uma curva de evolução que regressa ao ponto inicial representa um movimento oscilatório, em que os valores da posição e da velocidade repetem-se periodicamente. Na secção seguinte veremos um exemplo muito importante.

1.1.2. O oscilador harmónico simples

A figura 1.4 mostra um cilindro de massa mm pendurado de uma mola com constante elástica kk. Se a massa se desloca na vertical, sem oscilar, o movimento é ao longo de uma reta vertical, e basta uma variável, a altura yy do cilindro, para determinar a sua posição em qualquer instante..

Figura 1.4: Massa pendurada de uma mola elástica.

Há duas forças a atuar no objeto: o seu peso mgmg, para baixo, e a força da mola, dada pela lei de Hooke e apontando para a posição em que a mola não está alongada. Se a altura yy for medida de baixo para cima, com origem no ponto onde a mola não está alongada, a força resultante sobre o objeto é,

F=mgky\displaystyle F = -m\,g -k\,y
(1.6)

as componentes da velocidade e fase são então,

u=(dydt,dpdt)=(pm,mgky)\displaystyle \vec{u}=\left(\dfrac{\mathrm{d}\,y}{\mathrm{d}\,t},\dfrac{\mathrm{d}\,p}{\mathrm{d}\,t}\right)=\left(\dfrac{p}{m}, -m\,g -k\,y\right)
(1.7)

Existe um ponto de equilíbrio no espaço de fase, onde a velocidade de fase é nula:

Pe=(ye,pe)=(mgk,0)\displaystyle \mathrm{P }_\mathrm{e }=(y_\mathrm{e },p_\mathrm{e })=\left(-\dfrac{mg}{k},0\right)
(1.8)

que corresponde ao ponto onde a mola desceu mg/kmg/k unidades, pela ação do peso, e ficou em repouso. É útil mudar a variável yy para uma nova variável ss, de forma a que o ponto de equilíbrio fique na origem do espaço de fase, e a expressão da velocidade de fase fique mais simples. A mudança de variável que usaremos é:

y=smkmgk\displaystyle y=\dfrac{s}{\sqrt{mk}}-\dfrac{mg}{k}
(1.9)

Com essa mudança de variável a velocidade de fase passa a ser:

u=(dsdt,dpdt)=km(p,s)\displaystyle \vec{u}=\left(\dfrac{\mathrm{d}\,s}{\mathrm{d}\,t},\dfrac{\mathrm{d}\,p}{\mathrm{d}\,t}\right)=\sqrt{\dfrac{k}{m}}(p,-s)
(1.10)

com módulo igual à distância até à origem do espaço de fase, s2+p2\sqrt{s^2+p^2}, vezes a frequência angular:

ω=km\displaystyle \omega = \sqrt{\dfrac{k}{m}}
(1.11)

e perpendicular ao segmento desde a origem até o ponto P=(s,p)\mathrm{P }=(s,p) no espaço de fase.

Figura 1.5: Retrato de fase do oscilador harmónico simples.

A figura 1.5 é o retrato de fase do oscilador harmónico, que mostra as possíveis curvas de evolução. Todos os possíveis movimentos são circumferências no espaço de fase, percorridas com velocidade u\vec{u} de módulo constante, igual a ω\omega.

Arbitrando t=0t=0 no instante em que o estado passa pelo semieixo positivo ss, em s0s_0, o ângulo que o estado faz com esse semieixo, em t>0t>0, é θ=ωt\theta=\omega\,t, e a posição ss é,

s(t)=s0cos(ωt)\displaystyle s(t)=s_0\cos(\omega\,t)
(1.12)

Substituindo na equação (1.9), a altura do cilindro, em função do tempo, é:

y(t)=ye+Acos(ωt)\displaystyle y(t)=y_\mathrm{e }+A\,\cos(\omega\,t)
(1.13)

onde a amplitude AA do movimento é uma constante, s0/mks_0/\sqrt{mk}, que depende da posição inicial, e o movimento é oscilatório com frequência:

f=ω2π=12πkm\displaystyle f=\dfrac{\omega}{2\,\mathrm{\pi}}=\dfrac{1}{2\,\mathrm{\pi}}\sqrt{\dfrac{k}{m}}
(1.14)

1.1.3. Função hamiltoniana

Nos sistemas em que a força resultante depende apenas da posição e é conservativa, existe uma função energia potencial. No caso do movimento em uma dimensão, se a força resultante depende apenas da posição ss, é conservativa e a energia potencial UU é uma primitiva da força:

U(s)=F(s)ds\displaystyle U(s)=-\int F(s)\,\mathrm{d } s
(1.15)

Define-se a função hamiltoniana,

H(s,p)=p22m+U(s)\displaystyle H(s,p)=\dfrac{p^2}{2m}+U(s)
(1.16)

e as duas componentes da velocidade de fase, são obtidas a partir das derivadas da função hamiltoniana:

dsdt=Hpdpdt=Hs\displaystyle \dfrac{\mathrm{d}\,s}{\mathrm{d}\,t}=\dfrac{\partial H}{\partial p}\qquad \dfrac{\mathrm{d}\,p}{\mathrm{d}\,t}=-\dfrac{\partial H}{\partial s}
(1.17)

No caso geral, um sistema com variáveis de estado ss e pp é designado por sistema hamiltoniano, se existe uma função hamiltoniana H(s,p)H(s,p) que permite calcular as expressões das derivadas temporais de ss e pp a partir das derivadas parciais de HH, de acordo com as equações de Hamilton (1.17).

No caso do oscilador harmónico simples da secção anterior, a energia potencial associada à força (1.6) é,

U(y)=mgy+12ky2\displaystyle U(y)=mgy+\dfrac{1}{2}ky^2
(1.18)

e a função hamiltoniana é,

H(y,p)=p22m+mgy+12ky2\displaystyle H(y,p)=\dfrac{p^2}{2m}+mgy+\dfrac{1}{2}ky^2
(1.19)

e as duas equações de Hamilton são:

dydt=Hp=pmdpdt=Hy=mgky\displaystyle \dfrac{\mathrm{d}\,y}{\mathrm{d}\,t}=\dfrac{\partial H}{\partial p}=\dfrac{p}{m}\qquad \dfrac{\mathrm{d}\,p}{\mathrm{d}\,t}=-\dfrac{\partial H}{\partial y}=-m\,g-k\,y
(1.20)

1.1.4. Parênteses de Poisson

Num sistema com variáveis de estado (ss, pp), definem-se os parênteses de Poisson de duas funções F(s,p)F(s,p) e G(s,p)G(s,p) igual à expressão,

{F,G}=FsGpFpGs\displaystyle \{F,G\}=\dfrac{\partial F}{\partial s}\dfrac{\partial G}{\partial p}-\dfrac{\partial F}{\partial p}\dfrac{\partial G}{\partial s}
(1.21)

Algumas propriedades importantes dos parênteses de Poisson são as seguintes:

  1. Anticomutatividade: {F,G}={G,F}\{F,G\}=-\{G,F\}
  2. Linearidade: {aF+bG,J}=a{F,J}+b{G,J}\{aF+bG,J\}=a\{F,J\}+b\{G,J\}
  3. Regra da cadeia: {FG,J}=F{G,J}+{F,J}G\{FG,J\}=F\{G,J\}+\{F,J\}G
  4. Identidade de Jacobi: {F,{G,J}}+{G,{J,F}}+{J,{F,G}}=0\{F,\{G,J\}\}+\{G,\{J,F\}\}+\{J,\{F,G\}\}=0

A anticomutatividade implica que os parênteses de qualquer função com si própria são nulos: {F,F}=0\{F,F\}=0. A derivada em ordem ao tempo de qualquer função do estado, F(s,p)F(s,p) pode ser calculada pela regra da cadeia:

dFdt=Fsdsdt+Fpdpdt\displaystyle \dfrac{\mathrm{d}\,F}{\mathrm{d}\,t}=\dfrac{\partial F}{\partial s}\dfrac{\mathrm{d}\,s}{\mathrm{d}\,t}+\dfrac{\partial F}{\partial p}\dfrac{\mathrm{d}\,p}{\mathrm{d}\,t}
(1.22)

e, se o sistema é hamiltoniano, usando as equações de Hamilton temos,

dFdt=FsHpFpHs\displaystyle \dfrac{\mathrm{d}\,F}{\mathrm{d}\,t}=\dfrac{\partial F}{\partial s}\dfrac{\partial H}{\partial p}-\dfrac{\partial F}{\partial p}\dfrac{\partial H}{\partial s}
(1.23)

conclui-se que a derivada temporal da função é igual aos parênteses de Poisson da função com a função hamiltoniana:

dFdt={F,H}\displaystyle \dfrac{\mathrm{d}\,F}{\mathrm{d}\,t}=\{F,H\}
(1.24)

Isto é, a evolução temporal de qualquer função do estado é dada pelos parênteses de Poisson da função com a função hamiltoniana. As equações de Hamilton são dois casos particulares da equação geral (1.24), quando ff for igual a uma das variáveis de estado.

No caso mais geral, o estado de um sistema é dado por nn variáveis de posição: s1s_1, s2s_2,…, sns_n e nn quantidades de movimento associadas a essas variáveis de posição: p1p_1, p2p_2,…, pnp_n. As funções de estado dependem dessas 2n2n variáveis, e os parênteses de Poisson entre duas variáveis de estado são:

{F,G}=i=1n(FsiGpiFpiGsi)\displaystyle \{F,G\}=\sum_{i=1}^n\left(\dfrac{\partial F}{\partial s_i}\dfrac{\partial G}{\partial p_i}-\dfrac{\partial F}{\partial p_i}\dfrac{\partial G}{\partial s_i}\right)
(1.25)

A função hamiltoniana é também uma função das 2n2n variáveis de estado, e a derivada temporal de qualquer função de estado é igual aos parênteses de Poisson da função com a função hamiltoniana.

1.2. Números complexos

A forma retangular dum número complexo zz é

z=x+iy\displaystyle z = x + \mathrm{i }\,y
(1.26)

onde xx (parte real) e yy (parte imaginária) são dois números reais, no campo dos números reais, i=1\mathrm{i }=\sqrt{-1}, e o produto iy\mathrm{i }\,y representa um número imaginário. A figura 1.6 mostra o chamado plano complexo, que é um plano onde cada ponto corresponde a um número complexo zz; as suas partes real e imaginária são as projeções xx e yy em dois eixos perpendiculares, designados de Re (eixo real) e Im (eixo imaginário).

Figura 1.6: Número complexo z=x+iyz=x+\mathrm{i }\,y representado no plano complexo.

Definem-se o módulo |z||z| e o argumento φ\varphi do número complexo zz:

|z|=x2+y2φ=Arctan(x,y)\displaystyle |z| = \sqrt{x^2 + y^2} \qquad \varphi = \mathop\mathrm{Arctan}(x,y)
(1.27)

onde Arctan(x,y)\mathop\mathrm{Arctan}(x,y) é a função tangente inversa nos 4 quadrantes, definida por,

Arctan(x,y)={arctan(yx)+πx<0,y0arctan(yx)x0arctan(yx)πx<0,y<0\displaystyle \mathop\mathrm{Arctan}(x,y) = \begin{cases} \arctan\left(\dfrac{y}{x}\right)+\mathrm{\pi} & x<0, y\geq 0\\ \arctan\left(\dfrac{y}{x}\right) & x\geq 0 \\ \arctan\left(\dfrac{y}{x}\right)-\mathrm{\pi} & x<0, y< 0 \end{cases}
(1.28)

onde Arctan\mathop\mathrm{Arctan} é a função definida em (1.28) e o argumento está no intervalo π<φπ-\mathrm{\pi}<\varphi\leq\mathrm{\pi}.

No plano complexo, |z||z| é a distância desde o ponto onde se encontra zz, até à origem e φ\varphi é o ângulo que o segmento desde zz até à origem faz com o semieixo Re positivo (ver figura 1.6).

O número complexo zz pode então ser escrito também na chamada forma polar,

z=|z|(cosφ+isinφ)\displaystyle z = |z|\left(\cos\varphi + \mathrm{i }\,\sin\varphi\right)
(1.29)

A função complexa entre parêntesis na equação (1.29) costuma ser designada cis(φ)\mathrm{cis}(\varphi), ou ainda, eiφ\mathrm{e }^{\mathrm{i}\,\varphi}, por ter propriedades semelhantes à função exponencial real ex\mathrm{e }^x. Para mostrar mais facilmente algumas operações entre números complexos, escreveremos a forma polar usando a função exponencial: A expressão eiφ=(cosφ+isinφ)\mathrm{e }^{\mathrm{i }\,\varphi}=\left(\cos\varphi + \mathrm{i }\,\sin\varphi\right) é designada de fórmula de Euler.

z=|z|eiφ\displaystyle z = |z|\mathrm{e }^{\mathrm{i }\,\varphi}
(1.30)

A soma de dois números complexos, z1=x1+iy1z_1=x_1+\mathrm{i }\,y_1 e z2=x2+iy2z_2=x_2+\mathrm{i }\,y_2, é outro número complexo, z1+z2z_1+z_2, com partes real e imaginária iguais à soma das respetivas partes dos dois números:

z1+z2=(x1+x2)+i(y1+y2)\displaystyle z_1+z_2 = \left(x_1+x_2\right) + \mathrm{i }\left(y_1+y_2\right)
(1.31)

esta é a mesma forma da soma de dois vetores no plano xyxy, em função das suas componentes. Como tal, a soma de números complexos segue a mesma regra do paralelogramo, no plano complexo, do que a soma de vetores, como mostra a figura 1.7. E a soma de números complexos tem as mesmas propriedades da soma de vetores.

Figura 1.7: Adição de números complexos no plano complexo.

Em contraste com os vetores, no caso dos números complexos é possível definir um produto que dá como resultado outro número complexo e tem as mesmas propriedades do produto entre números reais (comutatividade, associatividade, distributividade, etc.). O produto entre dois números complexos, z1=x1+iy1z_1=x_1+\mathrm{i }\,y_1 e z2=x2+iy2z_2=x_2+\mathrm{i }\,y_2, é outro número complexo, z1z2z_1z_2, que pode ser obtido usando a sua propriedade distributiva e o facto de que i2=1\mathrm{i }^2=-1:

z1z2=(x1+iy1)(x2+iy2)\displaystyle z_1z_2 = \left(x_1+\mathrm{i }\,y_1\right)\left(x_2+\mathrm{i }\,y_2\right)
=x1x2+i2y1y2+ix1y2+ix2y1\qquad\displaystyle = x_1x_2 + \mathrm{i }^2y_1y_2 + \mathrm{i }\,x_1y_2 + \mathrm{i }\,x_2y_1
=(x1x2y1y2)+i(x1y2+x2y1)\qquad\displaystyle = \left(x_1x_2 - y_1y_2\right) + \mathrm{i }\left(x_1y_2 + x_2y_1\right)
(1.32)

Produto este que tem uma expressão mais simples em termos das componentes polares dos números complexos:

z1z2=|z1||z2|ei(φ1+φ2)\displaystyle z_1z_2 = |z_1|\,|z_2|\mathrm{e }^{\mathrm{i }(\varphi_1+\varphi_2)}
(1.33)

Ou seja, o produto z1z2z_1z_2 tem módulo igual ao produto dos módulos de z1z_1 e z2z_2 e argumento igual à soma dos argumentos de z1z_1 e z2z_2. E a divisão é feita dividindo os módulos e subtraindo os argumentos:

z1z2=|z1||z2|ei(φ1φ2)\displaystyle \dfrac{z_1}{z_2} = \dfrac{|z_1|}{|z_2|}\,\mathrm{e }^{\mathrm{i }(\varphi_1-\varphi_2)}
(1.34)

Define-se o conjugado, zz^\star, do número zz, mantendo o módulo igual mas trocando o sinal do argumento:

z=|z|eiφ=xiy\displaystyle z^\star = |z|\mathrm{e }^{-\mathrm{i }\,\varphi} = x - \mathrm{i }\,y
(1.35)

A conjugação de números complexos tem as seguintes propriedades:

  1. O conjugado do conjugado é igual ao número inicial:
    (z)=z\displaystyle \left(z^\star\right)^\star=z
    (1.36)
  2. O produto de um número complexo com o seu conjugado é igual ao seu módulo ao quadrado:
    zz=zz=|z|2\displaystyle zz^\star = z^\star z = |z|^2
    (1.37)
  3. Se o conjugado de um número complexo for igual a si próprio, é equivalente a dizer que o número é real (parte imaginária nula):
    z=zz é real\displaystyle z^\star=z \qquad\Longleftrightarrow\qquad z \text{ é real}
    (1.38)
  4. O conjugado da soma de dois números complexos é igual à soma dos conjugados dos números:
    (z1+z2)=z1+z2\displaystyle (z_1+z_2)^\star=z_1^\star+z_2^\star
    (1.39)
  5. O conjugado do produto de dois números complexos é igual ao produto dos conjugados dos números:
    (z1z2)=z1z2\displaystyle (z_1z_2)^\star=z_1^\star z_2^\star
    (1.40)

1.3. Teoria das probabilidades

Uma experiência é dita aleatória, se não conseguirmos prever o valor obtido para certas variáveis, de forma que o resultado poderá ser diferente para várias repetições da mesma experiência. Um exemplo é o lançamento de uma moeda ou de um dado; a cada lançamento não conseguimos prever se o resultado da moeda será cara ou coroa, ou qual dos seis números ficará na fase superior do lado.

Tal vez se soubéssemos com precisão os valores de alguns parámetros, tais como posição e velocidade inicial do dado, velocidade, temperatura e pressão em todos os pontos do ar na trajetória do dado, etc., seria possível prever o resultado. Mas são muitas variáveis que podem afetar o resultado e um pequeno erro na medição de algumas dessas variáveis pode conduzir a uma previsão errada. No caso da mecânica quântica veremos que existem experiências realmente aleatórias, em que acreditamos que é impossível prever o resultado exato.

Se os possíveis resultados da experiência aleatória forem {a1,a2,,an}\{a_1,a_2,\ldots,a_n\}. Se a experiência for repetida um número elevado de vezes, NN, a probabilidade P(ai)P(a_i) de que o resultado aia_i seja obtido é igual ao número de vezes que o resultado foi aia_i, dividido pelo número de repetições NN. Como tal, a soma das probabilidades de todos os possíveis resultados é igual a 1:

i=1nP(ai)=P(a1)+P(a2)++P(an)=1\displaystyle \sum_{i=1}^n P(a_i)=P(a_1)+P(a_2)+\cdots+P(a_n)=1
(1.41)

No caso do lançamento do dado, os possíveis resultados são {1,2,3,4,5,6}\{1, 2, 3, 4, 5, 6\} e a probabilidade de cada um desse resultados é 1/61/6.

O conjunto de possíveis resultados pode ser um conjunto contínuo; por exemplo, uma variável xx que pode ter qualquer valor entre x1x_1 e x2x_2. Nesse caso há uma função contínua P(x)P(x) tal que a probabilidade do resultado estar num pequeno intervalo entre aa e bb (com aa e bb entre x1x_1 e x2x_2) é igual a,

P(a<x<b)=abP(x)dx\displaystyle P(a<x<b)=\int_{a}^{b}P(x)\mathrm{d } x
(1.42)

E o integral de P(x)P(x) no intervalo de possíveis valores é igual a 1:

x1x2P(x)dx=1\displaystyle \int_{x_1}^{x_2}P(x)\mathrm{d } x=1
(1.43)

Se uma função ff associa um valor f(ai)f(a_i) a cada possível resultado aia_i, a probabilidade da função ter o valor f(ai)f(a_i) é igual a P(ai)P(a_i). O valor médio da função, ou valor esperado, é obtido somando os possíveis valores de ff vezes as respetivas probabilidades:

f=i=1nf(ai)P(ai)\displaystyle \langle f\rangle=\sum_{i=1}^n f(a_i)\,P(a_i)
(1.44)

Para determinar que tão dispersos estão os possíveis valores de f(ai)f(a_i) e relação ao valor esperado f\langle f\rangle, define-se a variança da função ff, igual ao valor esperado do desvio quadrático em relação ao valor esperado:

(Δf)2=(ff)2=i=1n(f(ai)f)2P(ai)\displaystyle (\mathrm{\Delta} f)^2=\langle (f-\langle f\rangle)^2\rangle =\sum_{i=1}^n \left(f(a_i)-\langle f\rangle\right)^2\,P(a_i)
(1.45)

e o desvio padrão é a raiz quadrada da variança:

Δf=(ff)2\displaystyle \mathrm{\Delta} f=\sqrt{\langle (f-\langle f\rangle)^2\rangle}
(1.46)

Exercícios

1.1 Demonstre a identidade de Jacobi para parênteses de Poisson.

Resolução. Desenvolvendo o primeiro termo na identidade de Jacobi temos:

{F,{G,J}}=Fs{G,J}pFp{G,J}s\displaystyle \{ F,\{ G,J\}\}=\dfrac{\partial F}{\partial s}\dfrac{\partial \{ G,J \}}{\partial p}-\dfrac{\partial F}{\partial p}\dfrac{\partial \{ G,J\}}{\partial s}
=Fspp(GsJpGpJs)\qquad\displaystyle =\dfrac{\partial F}{\partial s}\dfrac{\partial \phantom{p}}{\partial p}\left(\dfrac{\partial G}{\partial s}\dfrac{\partial J}{\partial p}-\dfrac{\partial G}{\partial p}\dfrac{\partial J}{\partial s}\right)Fpss(GsJpGpJs)-\dfrac{\partial F}{\partial p}\dfrac{\partial \phantom{s}}{\partial s}\left(\dfrac{\partial G}{\partial s}\dfrac{\partial J}{\partial p}-\dfrac{\partial G}{\partial p}\dfrac{\partial J}{\partial s}\right)

e calculando as derivadas dos produtos obtêm-se oito termos:

{F,{G,J}}=Fs(2GpsJp+Gs2Jp2\displaystyle \{F,\{G,J\}\}=\dfrac{\partial F}{\partial s}\left(\dfrac{\partial^2G}{\partial p\partial s}\dfrac{\partial J}{\partial p}+\dfrac{\partial G}{\partial s}\dfrac{\partial^2J}{\partial p^2}\right.2Gp2JsGp2Jps)\left.-\dfrac{\partial^2G}{\partial p^2}\dfrac{\partial J}{\partial s}-\dfrac{\partial G}{\partial p}\dfrac{\partial^2J}{\partial p\partial s}\right)
Fp(2Gs2Jp+Gs2Jsp\qquad\displaystyle -\dfrac{\partial F}{\partial p}\left(\dfrac{\partial^2G}{\partial s^2}\dfrac{\partial J}{\partial p}+\dfrac{\partial G}{\partial s}\dfrac{\partial^2J}{\partial s\partial p}\right.2GspJsGp2Js2)\left.-\dfrac{\partial^2G}{\partial s\partial p}\dfrac{\partial J}{\partial s}-\dfrac{\partial G}{\partial p}\dfrac{\partial^2J}{\partial s^2}\right)
(1.47)

O segundo e terceiro termos na identidade de Jacobi obtêm-se permutando as funções FF, GG e JJ, de forma cíclica no resultado anterior:

{G,{J,F}}=Gs(2JpsFp+Js2Fp2\displaystyle \{G,\{J,F\}\}=\dfrac{\partial G}{\partial s}\left(\dfrac{\partial^2J}{\partial p\partial s}\dfrac{\partial F}{\partial p}+\dfrac{\partial J}{\partial s}\dfrac{\partial^2F}{\partial p^2}\right.2Jp2FsJp2Fps)\left.-\dfrac{\partial^2J}{\partial p^2}\dfrac{\partial F}{\partial s}-\dfrac{\partial J}{\partial p}\dfrac{\partial^2F}{\partial p\partial s}\right)
Gp(2Js2Fp+Js2Fsp\qquad\displaystyle -\dfrac{\partial G}{\partial p}\left(\dfrac{\partial^2J}{\partial s^2}\dfrac{\partial F}{\partial p}+\dfrac{\partial J}{\partial s}\dfrac{\partial^2F}{\partial s\partial p}\right.2JspFsJp2Fs2)\left.-\dfrac{\partial^2J}{\partial s\partial p}\dfrac{\partial F}{\partial s}-\dfrac{\partial J}{\partial p}\dfrac{\partial^2F}{\partial s^2}\right)
(1.48)
{J,{F,G}}=Js(2FpsGp+Fs2Gp2\displaystyle \{J,\{F,G\}\}=\dfrac{\partial J}{\partial s}\left(\dfrac{\partial^2F}{\partial p\partial s}\dfrac{\partial G}{\partial p}+\dfrac{\partial F}{\partial s}\dfrac{\partial^2G}{\partial p^2}\right.2Fp2GsFp2Gps)\left.-\dfrac{\partial^2F}{\partial p^2}\dfrac{\partial G}{\partial s}-\dfrac{\partial F}{\partial p}\dfrac{\partial^2G}{\partial p\partial s}\right)
Jp(2Fs2Gp+Fs2Gsp\qquad\displaystyle -\dfrac{\partial J}{\partial p}\left(\dfrac{\partial^2F}{\partial s^2}\dfrac{\partial G}{\partial p}+\dfrac{\partial F}{\partial s}\dfrac{\partial^2G}{\partial s\partial p}\right.2FspGsFp2Gs2)\left.-\dfrac{\partial^2F}{\partial s\partial p}\dfrac{\partial G}{\partial s}-\dfrac{\partial F}{\partial p}\dfrac{\partial^2G}{\partial s^2}\right)
(1.49)

Observando os oito termos em cada uma das expressões (1.47), (1.48) e (1.49), observa-se que os termos 1 e 6 anulam-se entre as equações (1.47) e (1.49), e entre (1.49) e (1.48); os termos 2 e 3 anulam-se entre (1.47) e (1.48), e entre (1.48) e (1.49); os termos 4 e 7 anulam-se entre (1.47) e (1.48), e entre (1.49) e (1.47); e, finalmente, os termos 5 e 8 anulam-se entre (1.47) e (1.49), e entre (1.48) e (1.47).

1.2 O momento angular L\vec{L} de um corpo é o produto vetorial entre o seu vetor posição e a sua quantidade de movimento:

L=r×p\displaystyle \vec{L}=\vec{r}\times\vec{p}

Calcule os três parênteses de Poisson:

{Lx,Ly}{Ly,Lz}{Lz,Lx}\displaystyle \{L_x,L_y\}\qquad\{L_y,L_z\}\qquad\{L_z,L_x\}

Resolução. Há seis variáveis de estado, as três coordenadas cartesianas, xx, yy e zz, e as três componentes da quantidade de movimento, pxp_x, pyp_y e pzp_z.

O produto vetorial entre r=xı^+yȷ^+zk^\vec{r}=x\hat{\imath}+y\hat{\jmath}+z\hat{k} e p=pxı^+pyȷ^+pzk^\vec{p}=p_x\hat{\imath}+p_y\hat{\jmath}+p_z\hat{k} conduz às componentes do momento angular:

Lx=ypzzpyLy=zpxxpz\displaystyle L_x=y\,p_z-z\,p_y\qquad L_y=z\,p_x-x\,p_zLz=xpyypx\qquad L_z=x\,p_y-y\,p_x
(1.50)

Os parênteses entre LxL_x e LyL_y são iguais a:

{Lx,Ly}=LxxLypxLxpxLyx+LxyLypy\displaystyle \{L_x,L_y\}=\dfrac{\partial L_x}{\partial x}\dfrac{\partial L_y}{\partial p_x}-\dfrac{\partial L_x}{\partial p_x}\dfrac{\partial L_y}{\partial x}+\dfrac{\partial L_x}{\partial y}\dfrac{\partial L_y}{\partial p_y}
LxpyLyy+LxzLypzLxpzLyz\qquad\displaystyle -\dfrac{\partial L_x}{\partial p_y}\dfrac{\partial L_y}{\partial y}+\dfrac{\partial L_x}{\partial z}\dfrac{\partial L_y}{\partial p_z}-\dfrac{\partial L_x}{\partial p_z}\dfrac{\partial L_y}{\partial z}

e derivando as expressões (1.50) obtém-se:

{Lx,Ly}=0×z0×(pz)+pz×0\displaystyle \{L_x,L_y\}=0\times z-0\times(-p_z)+p_z\times 0(z)×0+(py)(x)ypx-(-z)\times 0+(-p_y)(-x)-y\,p_x
=xpyypx=Lz\qquad\displaystyle =x\,p_y-y\,p_x=L_z

De forma análoga,

{Ly,Lz}=LyxLzpxLypxLzx+LyyLzpy\displaystyle \{L_y,L_z\}=\dfrac{\partial L_y}{\partial x}\dfrac{\partial L_z}{\partial p_x}-\dfrac{\partial L_y}{\partial p_x}\dfrac{\partial L_z}{\partial x}+\dfrac{\partial L_y}{\partial y}\dfrac{\partial L_z}{\partial p_y}
LypyLzy+LyzLzpzLypzLzz\qquad\displaystyle -\dfrac{\partial L_y}{\partial p_y}\dfrac{\partial L_z}{\partial y}+\dfrac{\partial L_y}{\partial z}\dfrac{\partial L_z}{\partial p_z}-\dfrac{\partial L_y}{\partial p_z}\dfrac{\partial L_z}{\partial z}

e a partir de (1.50) unicamente os dois primeiros termos são diferentes de zero e são iguais a:

{Ly,Lz}=(pz)(y)zpy=Lx\displaystyle \{L_y,L_z\}=(-p_z)(-y)-z\,p_y=L_x

Finalmente,

{Lz,Lx}=LzxLxpxLzpxLxx+LzyLxpy\displaystyle \{L_z,L_x\}=\dfrac{\partial L_z}{\partial x}\dfrac{\partial L_x}{\partial p_x}-\dfrac{\partial L_z}{\partial p_x}\dfrac{\partial L_x}{\partial x}+\dfrac{\partial L_z}{\partial y}\dfrac{\partial L_x}{\partial p_y}
LzpyLxy+LzzLxpzLzpzLxz\qquad\displaystyle -\dfrac{\partial L_z}{\partial p_y}\dfrac{\partial L_x}{\partial y}+\dfrac{\partial L_z}{\partial z}\dfrac{\partial L_x}{\partial p_z}-\dfrac{\partial L_z}{\partial p_z}\dfrac{\partial L_x}{\partial z}

em que unicamente os terceiro e quarto termos são diferentes de zero e conduzem a:

{Lz,Lx}=(px)(z)xpz=Ly\displaystyle \{L_z,L_x\}=(-p_x)(-z)-x\,p_z=L_y

1.3 Simplifique a seguinte expressão, encontrando as partes real e imaginária do resultado:

[(23i)+(1+7i)](32i)2+3i\displaystyle \dfrac{\left[(2-3\,\mathrm{i })+(-1+7\,\mathrm{i })\right](3-2\,\mathrm{i })}{2+3\,\mathrm{i }}

Resolução. Começamos por realizar a soma entre os parênteses retos, e a seguir o produto no numerador:

(23i)+(1+7i)=1+4i\displaystyle (2-3\,\mathrm{i })+(-1+7\,\mathrm{i })=1+4\,\mathrm{i }
(1+4i)(32i)=11+10i\displaystyle (1+4\,\mathrm{i })(3-2\,\mathrm{i })=11+10\,\mathrm{i }

Para dividir o numerador pelo denominador, podemos multiplicar o numerador e o denominador pelo conjugado complexo do denominador, para ficarmos com um número real no denominador:

11+10i2+3i=(11+10i)(23i)(2+3i)(23i)=5213i4+9\displaystyle \dfrac{11+10\,\mathrm{i }}{2+3\,\mathrm{i }}=\dfrac{(11+10\,\mathrm{i })(2-3\,\mathrm{i })}{(2+3\,\mathrm{i })(2-3\,\mathrm{i })} =\dfrac{52-13\,\mathrm{i }}{4+9}=4i=4-\mathrm{i }

1.4 Num jogo de cartas, o jogador A baralha as 52 cartas e o jogador B escolhe uma carta qualquer. Se a carta escolhida for um número par, o jogador B paga 3 euros ao jogador A, se for um número ímpar, o jogador A paga 1 euro ao jogador B, e se a carta for um ás o jogador A paga 10 euros ao jogador B. A carta escolhida é reposta no baralho e o jogo repete-se. Qual dos dois jogadores tem maior probabilidade de ganhar mais dinheiro após várias repetições do jogo e qual o valor médio que ganhará após várias jogadas?

Resolução. Em cada grupo de 13 cartas há um ás, 5 cartas com número par (2, 4, 6, 8 e 10), e 4 cartas com número ímpar (3, 5, 7 e 9). Como tal, as probabilidades de o jogador B retirar um ás, um número par ou um número ímpar são:

P(a)=113P(p)=513P(i)=413\displaystyle P(\mathrm{a })=\dfrac{1}{13}\qquad P(\mathrm{p })=\dfrac{5}{13}\qquad P(\mathrm{i })=\dfrac{4}{13}

e o que o jogador B ganha/perde se a carta escolhida for um ás, número par, ou número ímpar é:

G(a)=10G(p)=3G(i)=1\displaystyle G(\mathrm{a })=10\qquad G(\mathrm{p })=-3\qquad G(\mathrm{i })=1

O valor esperado do ganho do jogador B, cada vez que escolhe uma carta, é então:

G=G(a)P(a)+G(p)P(p)+G(i)P(i)\displaystyle \langle G\rangle=G(\mathrm{a })\,P(\mathrm{a })+G(\mathrm{p })\,P(\mathrm{p })+G(\mathrm{i })\,P(\mathrm{i })
=10131513+413=113\qquad\displaystyle =\dfrac{10}{13}-\dfrac{15}{13}+\dfrac{4}{13}=-\dfrac{1}{13}

Ou seja, quem tem maior probabilidade de ganhar é o jogador A, e em média ganha 1/13 euros a cada jogada. Após várias jogadas, terá ganho em média o número de jogadas divididas por 13, em euros.

1.5 Num teste com 20 perguntas de escolha múltipla, cada pergunta tem 5 possíveis respostas. A cotação é de um valor por cada resposta correta e zero valores se a pergunta não for respondida ou respondida de forma errada. Se os estudantes respondem todas as perguntas, selecionando de forma aleatória a resposta das perguntas que não sabem responder: (a) Entre que valores espera-se que esteja a nota dos estudantes? (b) Quantos valores deveriam ser descontados por cada resposta errada, para que a nota esperada estivesse compreendida entre 0 e 20?

Resolução. (a) A nota máxima, de um estudante que sabe responder a todas as perguntas, é 20. A nota mínima, de um estudante que responde todas as perguntas de forma aleatória, sera o número de respostas corretas, que em média será 1/5 do número total de perguntas. Como tal, a nota esperada dos estudantes estará entre 4 e 20 valores.

(b) Para que a nota esperada esteja entre 0 e 20 valores, há que garantir que o valor esperado da cotação de cada pergunta seja igual a zero, para que as perguntas respondidas de forma aleatória tenham um valor total nulo. Como nas 5 possíveis respostas há uma correta, com cotação de 1 valor, as restantes 4 respostas erradas deverão ter uma cotação total de 1-1 valor. Cada resposta errada deverá descontar 0.250.25 valores.