Transcript
Page 1: Estado Solido, Ashcroft, Traduzido

This is page iPrinter: Opaque this

Contents

1 Teoria de Drude para os Metais 31.1 Hipóteses Básicas do Modelo de Drude . . . . . . . . . . . . 41.2 Condutividade Elétrica DC de um Metal . . . . . . . . . . . 71.3 Efeito Hall e Magnetorresistência . . . . . . . . . . . . . . . 121.4 Condutividade Elétrica AC de um Metal . . . . . . . . . . . 151.5 Condutividade Térmica de um Metal . . . . . . . . . . . . . 201.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2 Teoria de Sommerfeld de Metais 292.1 Propriedades do Estado Fundamental do Gás de Elétrons . 312.2 Propriedades Térmicas do Gás de Elétron Livre: A Dis-

tribuição de Fermi-Dirac . . . . . . . . . . . . . . . . . . . . 382.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações

da Distribuição de Fermi-Dirac . . . . . . . . . . . . . . . . 412.4 Teoria de Sommerfeld da Condução em Metais . . . . . . . 482.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3 Redes Cristalinas 573.1 Rede de Bravais . . . . . . . . . . . . . . . . . . . . . . . . . 583.2 Redes Infinitas e Cristais Finitos . . . . . . . . . . . . . . . 593.3 Mais Ilustrações e Exemplos Importantes . . . . . . . . . . 603.4 Convenções . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.5 Número de Coordenação . . . . . . . . . . . . . . . . . . . . 623.6 Célula Unitária Primitiva . . . . . . . . . . . . . . . . . . . 62

Page 2: Estado Solido, Ashcroft, Traduzido

ii Contents

3.6.1 Célula Unitária; Célula Unitária Convencional . . . 633.6.2 Células Primitivas de Wigner-Seitz . . . . . . . . . . 63

3.7 Estrutura Cristalina; Rede com uma Base . . . . . . . . . . 643.8 Alguns Exemplos Importantes de Estruturas Cristalinas e

Redes com Base . . . . . . . . . . . . . . . . . . . . . . . . . 653.8.1 Estrutura do Diamante . . . . . . . . . . . . . . . . 653.8.2 Estrutura Hexagonal com Agrupamento Compacto . 653.8.3 Outras Possibilidades de Empacotamento Compacto 663.8.4 Estrutura do Cloreto de Sódio . . . . . . . . . . . . 673.8.5 Estrutura do Cloreto de Césio . . . . . . . . . . . . . 673.8.6 Estrutura do Sulfeto de Zinco (Zincblende) . . . . . 67

3.9 Outros Aspectos das Redes Cristalinas . . . . . . . . . . . . 673.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4 Rede Recíproca 714.1 Definição de Rede Recíproca . . . . . . . . . . . . . . . . . 714.2 Rede Recíproca é uma Rede de Bravais . . . . . . . . . . . 724.3 Recíproca da Rede Recíproca . . . . . . . . . . . . . . . . . 734.4 Exemplos Importantes . . . . . . . . . . . . . . . . . . . . . 744.5 Volume da Célula Primitiva da Rede Recíproca . . . . . . . 744.6 Primeira Zona de Brillouin . . . . . . . . . . . . . . . . . . 754.7 Planos de Rede . . . . . . . . . . . . . . . . . . . . . . . . . 754.8 Índices de Miller dos Planos de Rede . . . . . . . . . . . . . 764.9 Algumas Convenções para Direções Específicas . . . . . . . 784.10 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5 Determinação de Estruturas Cristalinas por Difração deRaio-X 815.1 Formulação de Bragg da Difração de Raio-X por um Cristal 825.2 Formulação de von Laue da Difração de Raio-X por um Cristal 835.3 Equivalência das Formulações de Bragg e von Laue . . . . . 845.4 Geometrias Experimentais Sugeridas pela Condição de Laue 865.5 Construção de Ewald . . . . . . . . . . . . . . . . . . . . . . 865.6 Difração por uma Rede Monoatômica com Base; Fator de

Estrutura Geométrico . . . . . . . . . . . . . . . . . . . . . 885.6.1 Rede Cúbica de Corpo Centrado Considerada como

Cúbica Simples com Base . . . . . . . . . . . . . . . 895.6.2 Rede Monoatômica do Diamente . . . . . . . . . . . 90

5.7 Difração por um Cristal Poliatômico; Fator de Forma Atômico 915.8 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

6 Classificação das Redes de Bravais e Estruturas Cristalinas 956.1 Classificação das Redes de Bravais . . . . . . . . . . . . . . 966.2 Os Sete Sistemas Cristalinos . . . . . . . . . . . . . . . . . . 976.3 As Quatorze Redes de Bravais . . . . . . . . . . . . . . . . . 98

Page 3: Estado Solido, Ashcroft, Traduzido

Contents iii

6.4 Enumeração dos Sete Sistemas Cristalinos e Quatorze RedesDe Bravais . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

6.5 Grupos Puntuais e Grupos Espaciais Cristalográficos . . . . 1016.6 Nomenclatura dos Grupos Puntuais . . . . . . . . . . . . . 103

6.6.1 Notação de Schöenflies para Grupos Puntuais Crista-lográficos Não-Cúbicos . . . . . . . . . . . . . . . . . 103

6.6.2 Notação Internacional para Grupos Puntuais Crista-lográficos Não-Cúbicos . . . . . . . . . . . . . . . . . 104

6.6.3 Nomenclatura para os Grupos Puntuais Cristalográ-ficos Cúbicos . . . . . . . . . . . . . . . . . . . . . . 105

6.7 Os 230 Grupos Espaciais . . . . . . . . . . . . . . . . . . . . 1056.8 Exemplos entre os Elementos . . . . . . . . . . . . . . . . . 1076.9 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

7 Níveis Eletrônicos num Potencial Periódico: PropriedadesGerais 1117.1 O Potencial Periódico . . . . . . . . . . . . . . . . . . . . . 1127.2 Teorema de Bloch . . . . . . . . . . . . . . . . . . . . . . . 113

7.2.1 Primeira Demonstração do Teorema de Bloch . . . . 1147.2.2 Condições de Contorno de Born-von Karman . . . . 1157.2.3 Segunda Demonstração do Teorema de Bloch . . . . 117

7.3 Observações Gerais sobre o Teorema de Bloch . . . . . . . . 1207.4 Superfície de Fermi . . . . . . . . . . . . . . . . . . . . . . . 1237.5 Densidade de Níveis . . . . . . . . . . . . . . . . . . . . . . 1257.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

8 Elétrons num Potencial Periódico Fraco 1338.1 Aproximação Geral da Equação de Schrödinger quando o

Potencial é Fraco . . . . . . . . . . . . . . . . . . . . . . . . 1348.1.1 Níveis de Energia Próximos de um Único Plano de

Bragg . . . . . . . . . . . . . . . . . . . . . . . . . . 1388.1.2 Bandas de Energia em uma Dimensão . . . . . . . . 141

8.2 Curvas Energia-Vetor de Onda em Três Dimensões . . . . . 1428.3 O Gap de Energia . . . . . . . . . . . . . . . . . . . . . . . 1428.4 Zonas de Brillouin . . . . . . . . . . . . . . . . . . . . . . . 1438.5 Fator de Estrutura Geométrico em Redes Monoatômicas com

Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1458.6 Importância do Acoplamento Spin-Órbita em Pontos de Alta

Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1468.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

9 Método das Ligações Fortes 1519.1 Formulação Geral . . . . . . . . . . . . . . . . . . . . . . . . 152

9.1.1 Aplicação a uma banda-s originária de um único nívelatômico-s . . . . . . . . . . . . . . . . . . . . . . . . 156

Page 4: Estado Solido, Ashcroft, Traduzido

Contents 1

9.2 Observações Gerais sobre o Método de Ligações fortes . . . 1589.3 Funções de Wannier . . . . . . . . . . . . . . . . . . . . . . 1629.4 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

Page 5: Estado Solido, Ashcroft, Traduzido

2 Contents

Page 6: Estado Solido, Ashcroft, Traduzido

This is page 3Printer: Opaque this

1Teoria de Drude para os Metais

Os metais ocupam uma posição muito especial no estudo dos sólidos, ex-ibindo uma variedade de propriedades que outros sólidos (tais como, oquartzo, enxofre ou sal comum) não possuem.São excelentes condutores de calor e eletricidade, são dúcteis e maleáveis,

apresentam brilho, etc. O desafio de encontrar explicações para essas car-actísticas foi o ponto de partida para o desenvolvimento da teoria modernados sólidos.Embora a maioria dos sólidos comumente encontrados sejam não-metálicos,

os metais continuam exercendo um papel importante na teoria dos sólidosdesde o século XIX até os dias atuais. De fato, o estado metálico provou serum dos estados mais fundamentais da matéria. Os elementos, por exem-plo, definitivamente favorecem o estado metálico: mais de dois terços sãometais. Mesmo para entender os não-metais, devemos também entender osmetais, pois ao explicar porque o cobre é um bom condutor, começa-se aaprender porque o sal comum não o é.Durante os últimos cem anos, os físicos tentam construir modelos sim-

ples do estado metálico que expliquem, qualitativa e quantitativamenteas propriedades metálicas características. Nesta busca, tem-se conseguidorepetidamente muitos sucessos acompanhados de fracassos aparentementeirremediáveis. Mesmo os modelos mais antigos, embora errados em algunsaspectos, são de grande valia para os físicos atuais de estado sólido, quandousados adequadamente.

Page 7: Estado Solido, Ashcroft, Traduzido

4 1. Teoria de Drude para os Metais

Neste capítulo, examinaremos a teoria da condução metálica introduzidapor P. Drude1 na virada do século. Os sucessos do modelo de Drude foramconsideráveis, e ainda hoje é usado como um modo prático e rápido deformar idéias e estimativas aproximadas de propriedades, cuja compreen-são mais precisa requer análise de considerável complexidade. As falhasdo modelo de Drude para explicar alguns resultados experimentais e o au-mento do quebra-cabeça conceitual definiram os problemas que a teoriados metais teria de atacar naqueles próximos vinte e cinco anos. Essesproblemas foram resolvidos somente com a rica e sutil estrutura da teoriaquântica dos sólidos.

1.1 Hipóteses Básicas do Modelo de Drude

A descoberta do elétron por J. J. Thomson em 1897 teve um impactoimediato nas teorias sôbre a estrutura da matéria, e sugeriu um mecanismoóbvio para a condução em metais. Três anos após a descoberta de Thomson,Drude construiu sua teoria de conduç ão elétrica e térmica, aplicando ateoria cinética dos gases ao metal, considerado como um gás de elétrons.Na sua forma mais simples, a teoria cinética trata as moléculas de um gás

como esferas sólidas idênticas, que se movem em linha reta até colidiremcom uma outra.2 Admite-se que o tempo de duração de uma única colisãoseja desprezível, e, se considera que nenhuma outra força atue entre aspartículas, com exceção das forças que agem momentaneamente durantecada colisão.Embora esteja presente somente um tipo partícula, num metal deve haver

pelo menos dois tipos, pois os elétrons são carregados negativamente, mas ometal é eletricamente neutro. Drude considrerou que a carga positiva com-pensadora estaja associada a partículas muito mais pesadas que ele con-siderou serem imóveis. Naquele tempo, porém, não existia nenhuma noçãoprecisa da origem tanto das partículas leves, os elétrons móveis, como daspartículas mais pesadas, partículas carregadas positivamente. A soluçãopara este problema é um dos principais feitos da teoria quântica modernados sólidos. Nesta discussão do modelo de Drude, porém, admitiremos sim-plesmente (e em muitos metais esta suposição pode ser justificada ) que,quando os átomos de um elemento metálico são reunidos para formar ummetal, os elétrons de valência são desprendidos dos átomos e vagam livre-mente pelo metal, enquanto que os íons metálicos permanecem intatos efazem o papel das partículas positivas imóveis na teoria de Drude. Estemodelo está esquematizado na Figura 1.1. Um único átomo isolado de um

1Annalen der Physik, 1, 566 e 3, 369 (1900).2Ou com as paredes do recipiente que os contém, uma possibilidade geralmente ig-

norada na discussão de metais, a menos que se esteja interessado em fios muito finos,lâminas delgadas, ou em efeitos de superfície.

Page 8: Estado Solido, Ashcroft, Traduzido

1.1 Hipóteses Básicas do Modelo de Drude 5

elemento metálico tem um núcleo de carga eZa, onde Za é o número atômicoe é o valor da carga eletrônica3: e = 4, 80 × 10−10 unidades eletrostáticas(esu)= 1, 60× 10−19 C. Em volta do núcleo, orbitam Za elétrons de cargatotal −eZa. Alguns destes elétrons, Z, são os fracamente ligados elétronsde valência. Os Za − Z elétrons restantes estão fortemente ligados ao nú-cleo, têm pouca importância nas reações químicas, e são conhecido comoos elétrons de caroço. Quando estes átomos isolados condensam para for-mar um metal, os elétrons de caroço permanecem ligados ao núcleo paraformar o íon metálico, mas os elétrons de valência podem vagar longe deseus átomos de origem. No contexto metálico esses elétrons são conhecidoscomo elétrons de condução.4

Drude aplicou a teoria cinética a este ”gás” de elétrons de conduçãode massa m, que (ao contrário das moléculas de um gás normal) move-secontra um fundo de íons imóveis pesados. A densidade do gás de elétronspode ser calculado como segue:Um elemento metálico contém 0, 6022 × 1024 átomos por mol (número

de Avogadro) e ρm/A moles por cm3, onde ρm é a densidade de massa (em

gramas por centímetro cúbico) e A é a massa atômica do elemento. Comocada átomo contribui com Z elétrons, o número de elétrons por centímetrocúbico, n = N/V, é

n = 0, 6022× 1024 Z ρmA

, (1.1)

A Tabela 1.1 mostra a densidade de elétrons de condução para algunsmetais selecionados. Elas são tipicamente da ordem de 1022 elétrons decondução por centímetro cúbico, variando de 0, 91× 1022 para o césio até24, 7× 1022 para o berílio.5Também está relacionada na Tabela 1.1 uma medida da densidade eletrônica

largamente usada, rs, definida como o raio de uma esfera cujo volume é igualao volume ocupado por cada elétron de condução. Assim

V

N=1

n=4πr3s3; rs =

µ3

4πn

¶1/3. (1.2)

A Tabela 1.1 lista rs tanto em Angstrons (10−8 cm) como em unidadesdo raio de Bohr a0 = ~2/me2 = 0, 529 × 10−8 cm; este último compri-mento, sendo a medida do raio de um átomo de hidrogênio no seu estadofundamental, é usado frequentemente como uma escala para medidas de

3Sempre tomaremos e como sendo um número positivo.4Como no modelo de Drude, quando os elétrons de caroço têm um papel passivo e os

íons agem como uma entidade inerte indivisível, às vezes nos referimos aos elétrons decondução simplesmente como ”os elétrons”, reservando-se o termo completo para quandoa distinção entre elétrons de condução e elétrons de caroço precisar ser enfatizada.

5Estes são os limites para os elementos metálicos sob condições normais. Densidadesmais altas podem ser obtidas pela aplicação de pressão (que tende a favorecer o estadometálico). Densidades mais baixas são encontradas em compostos.

Page 9: Estado Solido, Ashcroft, Traduzido

6 1. Teoria de Drude para os Metais

distâncias atômicas. Note que rs/a0 está entre 2 e 3 na maioria dos casos,embora varie entre 3 e 6 nos metais alcalinos (podendo chegar a 10 emalguns compostos metálicos).Essas densidades são tipicamente mil vezes maiores do que aquelas de

um gás clássico ideal à temperatura e pressão normais. Apesar disto eapesar das fortes interações eletromagnéticas elétron-elétron e elétron-íon,o modelo de Drude trata corajosamente o gás de elétron metálico densopelos métodos da teoria cinética de um gás neutro diluído, com pequenasmodificações. As hipóteses básicas são estas:1. Entre colisões despreza-se a interação de um determinado elétron tantocom o outro elétron, quanto com o íon. Assim, na ausência de campos eletro-magéticos aplicados externamente, considera-se que cada elétron se movauniformemente em linha direta. Na presença de campos aplicados externa-mente, considera-se que cada elétron se mova da forma determinada pelasleis do movimento de Newton na presença desses campos externos, masdesprezando-se os campos adicionais complicados produzidos pelos outroselétrons e pelos íons.6 A não inclusão das interações elétron-elétron en-tre as colisões é conhecida como aproximação de elétron independente. Acorrespondente não inclusão das interações elétron-íon é conhecida comoaproximação de elétron livre. Encontraremos nos capítulos subseqüentesque embora a aproximação de elétron independente seja, em muitos contex-tos surpreendentemente boa, a aproximação de elétron livre deve ser aban-donada se se quiser mesmo ter a uma compreensão qualitativa de muitosdos comportamentos metálicos.2. As colisões no modelo de Drude, como na teoria cinética, são eventosinstantâneos que alteram bruscamente a velocidade de um elétron. Drudeos atribuiu aos choques dos elétrons com os íons impenetráveis (ao invésde atribuir às colisões elétron-elétron, o análogo do mecanismo de colisãopredominante num gás ordinário). Veremos mais tarde que o espalhamentoelétron-elétron realmente é um dos menos importantes dos vários mecanis-mos de espalhamento num metal, exceto sob condições não usuais. Porém,a descrição mecânica simples (Figura 1.2) de um elétron que se move de íonpara íon está muito longe de ser a descrição correta.7 Felizmente, isto não éimportante para muitos propósitos: um entendimento qualitativo (e à vezesquantitativo) da condução metálica podem ser obtidos considerando-se sim-

6Na verdade, a interação elétron-íon não é ignorada completamente, pois o modelode Drude considera implicitamente que os elétrons são limitados ao interior do metal.Evidentemente este aprisionamento é provocado pela atração dos íons positivamente car-regados. Efeitos grosseiros da interação elétron-íon e elétron-elétron tais como estes sãolevados em conta, somando-se aos campos externos um campo interno adequadamentedefinido, que representa o efeito médio das interações elétron-electon e elétron-íon.

7Por algum tempo, as pessoas ficaram envolvidas com um problema difícil, emborairrelevante, relacionado com um elétron atingindo um íon em cada colisão. Deste modo,uma interpretação literal da Figura 1.2 deve ser evitada a qualquer custo.

Page 10: Estado Solido, Ashcroft, Traduzido

1.2 Condutividade Elétrica DC de um Metal 7

plesmente que há algum mecanismo de espalhamento, sem se questionar oque realmente poderia ser esse mecanismo. Recorrendo-se, em nossa análise,só a alguns poucos efeitos gerais dos processos de colisão, podemos evitarde nos comprometermos com uma idéia específica de como o espalhamentodos elétron de fato acontece. Estas características gerais são descritas nasduas seguinte hipóteses.3. Admitiremos que um elétron experimenta uma colisão (i.e., sofre umamudança brusca na sua velocidade) com uma probabilidade τ por unidadetempo. Com isto, queremos dizer que a probabilidade de um elétron sofreruma colisão em qualquer intervalo de tempo infinitesimal dt é dt/τ . Otempo τ é conhecido de muitas maneira, tais como tempo de relaxação,tempo de colisão ou tempo livre médio, e tem um papel fundamental nateoria de condução metálica. Segue-se desta suposição, que um elétron es-colhido ao acaso num determinado momento, em média, se move duranteum tempo τ antes de sua próxima colisão, e se moveu, em média, duranteum tempo τ desde sua última colisão.8 Nas aplicações mais simples do mod-elo de Drude, o tempo de colisão é cinsiderado ser independente da posiçãoe da velocidade de um elétron. Veremos mais adiante que isto parece seruma suposição surpreendentemente boa para muitas (mas, não para todas)aplicações.4. Admitimos que os elétrons atingem o equilíbrio térmico com o meiovizinho apenas através das colisões.9 Admite-se que estas colisões mantêmo equilíbrio termodinâmico local de um modo particularmente simples: ime-diatamente após cada colisão um elétron emerge com uma velocidade quenão está relacionada com sua velocidade imediatamente antes a colisão,mas dirigida aleatoriamente e com um valor apropriado à temperatura queprevalece no local onde aconteceu a colisão. Assim, quanto mais quente fora região na qual acontece uma colisão, maior será a velocidade do elétronque emergirá da colisão.No restante deste capítulo ilustraremos estas noções através de suas apli-

cações mais importantes, observando até que ponto elas têm sucesso ou nãodescrevem os fenômenos observados.

1.2 Condutividade Elétrica DC de um Metal

De acordo com a lei de Ohm, o fluxo de corrente num fio é proporcional àdiferença de potencial ao longo do fio: V = IR, onde R, a resistência dofio, depende de suas dimensões, mas é independente do valor corrente ou

8Veja Problema 1.9Dada a aproximação de elétron livre e independente, este é o único mecanismo

possível que resta.

Page 11: Estado Solido, Ashcroft, Traduzido

8 1. Teoria de Drude para os Metais

da diferença de potencial. O modelo de Drude leva em conta este compor-tamento, e fornece uma estimativa para o valor da resistência.Geralmente, elimina-se a dependência de R com as dimensões do fio,

introduzindo-se uma quantidade que depende somente do metal do qual éfeito o fio. A resistividade ρ é definida como sendo a constante de propor-cionalidade entre o campo elétrico E num ponto do metal e a densidade decorrente j que ele induz:10

E =ρj (1.3)

A densidade de corrente j é um vetor, paralelo ao fluxo de carga, cujamagnitude é a quantidade de carga por unidade de tempo que cruza umaunidade de área perpendicular ao fluxo. Então, se uma corrente uniformefluir através de um fio de comprimento L e área da secção transversal A,adensidade de corrente será dada por j = I/A. Como a diferença de potencialao longo do fio será dada por V = EL, a Eq.(1.3) dá V = IρL/A, e entãoR = ρL/A.Se n elétrons por unidade de volume movem-se todos com velocidade v,

então a densidade de corrente que eles dão origem será paralela a v. Alémdisso, num intervalo tempo dt os elétrons percorrerão uma distância vdt nadireção de v, tal que n (vdt)A elétrons cruzarão uma áreaA perpendicular àdireção do fluxo. Como cada elétron transporta uma caraga −e, a carga queatravessa A num intervalo de tempo dt será −nevAdt, e então, a densidadede corrente é

j = −nev (1.4)

Em qualquer ponto num metal, os elétron estão sempre se movendo emvárias direções com uma variedade de energias térmicas. A densidade decorrente resultante é então determinada por (1.4), onde v é a velocidadeeletrônica média. Na ausência de campo elétrico, existe a mesma probabil-idade dos elétrons se moverem em qualquer direção, de modo que a médiav se anula, e como era de se esperar, não existe nenhuma densidade decorrente resultante. Na presença de um campo E, porém, haverá uma ve-locidade eletrônica média dirigida no sentido oposto ao campo (sendo acarga eletrônica negativa), a qual podemos calcular da seguinte maneira:Considere um elétron típico no instante zero. Seja t o tempo decorrido

desde sua última colisão. Sua velocidade no instante zero será sua veloci-dade v0 imediatamente após aquela colisão mais a velocidade adicional−eEt/m que ele adquiriu subseqüentemente. Como admitimos que umelétron emerge de uma colisão em direção aleatória, não haverá nenhumacontribuição de v0 para a velocidade eletrônica média, que deve ser dadaentão completamente pela média de v1. Porém, a média de t é o tempo de

10Em geral, E e j não são paralelos. Define-se então o tensor de resistividade.

Page 12: Estado Solido, Ashcroft, Traduzido

1.2 Condutividade Elétrica DC de um Metal 9

relaxação τ . Portanto

vméd = −eEτm; j =

µne2τ

m

¶E (1.5)

Este resultado normalmente é determinado em termos do inverso da re-sistividade, a condutividade σ = 1/ρ:

j = σE; σ =

µne2τ

m

¶(1.6)

Isto estabelece a dependência linear de j em E e dá uma estimativa dacondutividade σ em termos de quantidades que são todas conhecidas comexceção do tempo de relaxação τ . Podemos usar então (1.6) e os valoresexperimentas das resistividade estimar o valor do tempo de relaxação:

τ =m

ρne2(1.7)

A Tabela 1.2 dá as resistividade de vários metais representativos a váriastemperaturas. Note a forte dependência com a temperatura. À temperaturaambiente a resistividade é aproximadamente linear em T , mas decai brus-camente quando temperaturas baixas são alcançadas. As resistividades àtemperatura ambiente são tipicamente da ordem de microohm centímetro(µohm-cm) ou, em unidades atômicas, da ordem de 10−18 statohm.11 Seρµ é a resistividade em microhm centímetros, então um modo convenientede expressar o tempo de relaxação dado por (1.7) é:

τ =

µ0, 22

ρµ

¶µrsa0

¶3× 10−14 s (1.8)

Os tempos de relaxação obtidos da Eq. (1.8) e as resistividades na Tabela1.2, são mostrados na Tabela 1.3. Note que a temperaturas ambientes τ étipicamente da ordem de 10−14 a 10−15s. Para considerar se este é umnúmero razoável é mais instrutivo observar o caminho livre médio, ` = v0τ ,onde v0 é a velocidade média eletrônica. O comprimento ` mede a distância

11Para converter resistividades de microhm centímetros para statohm centímetros noteque uma resistividade de 1 µΩ-cm produz um campo elétrico de 10−6 V/cm na presençade uma corrente de 1 A/cm3. Desde que 1 A é 3 × 109 esu/s, e 1 V é 1

300statV, uma

resistividade de 1 µΩ produz um campo de 1 statV/cm quando a densidade de correnteé 300 × 106 × 3 × 109 esu-cm−2-s−1. O statohm-centímetro é a unidade eletrostáticade resistividade, e então dá 1 statV/cm com uma densidade de corrente de apenas 1esu-cm−2-s−1. Assim 1 µΩ-cm é equivalentes a 1

9× 10−17 statΩ-cm. Para se evitar

usar o statohm-centímetro, pode-se calcular (1.7) tomando-se ρ em ohm metros, m emquilogramas, n em elétrons por metro cúbico e e em Coulombs. (Nota : As fórmulas maisimportantes, constantes, e fatores de conversão dos Capítulos 1 e 2 são resumidas noApêndice A.)

Page 13: Estado Solido, Ashcroft, Traduzido

10 1. Teoria de Drude para os Metais

média que um elétron percorre entre duas colisões. No tempo de Drude eranatural estimar v0,usando a lei de equipartição clássica da energia 1

2mv20 =

32kBT. Usando a massa eletrônica conhecida, encontra-se que v0 é da ordemde 107cm/s à temperatura ambiente, e, consequentemente, um caminholivre médio de 1 e 10 Å. Uma vez que esta distância é comparável aoespaçamento interatômico, o resultado é bastante consistente com a visãooriginal de Drude de que as colisões são devido aos elétrons chocando-secom os íons grandes e pesados.Porém, veremos no Capítulo 2 que esta estimativa clássica de v0 é uma

ordem de grandeza menor a temperaturas ambientes. Além disso, para tem-peraturas mais baixas na Tabela 1.3, τ é uma ordem de grandeza maior queà temperatura ambiente, enquanto (como veremos no Capítulo 2) v0 é real-mente independente da temperatura. Isto pode elevar o caminho livre mé-dio a baixas temperaturas para 103 ou mais angstroms, aproximadamentemil vezes o espaçamento entre íons. Atualmente, trabalhando-se a temper-aturas suficientemente baixas, com amostras cuidadosamente preparadas,podem ser alcançados caminhos livres médios da ordem de centímetros (i.e.,108 espaçamentos de interatômicos). Esta é uma forte evidência de que oque os elétrons fazem não é simplesmente chocarem-se com os íons, comoDrude supôs.Felizmente, porém, podemos continuar calculando com o modelo de Drude

sem qualquer entendimento preciso da causa das colisões. Na ausência deuma teoria do tempo de colisão torna-se importante encontrar predições domodelo de Drude que sejam independentes do valor do tempo de relaxaçãoτ . Como acontece, existem várias tais quantidades independentes de τ que,mesmo hoje em dia são de interesse fundamental, pois em muitos aspectoso tratamento quantitativo preciso do tempo de relaxação continua sendo oelo mais fraco nos tratamentos modernos da condutividade metálica. Comoresultado, quantidades independentes de τ são altamente valiosas, pois elasàs vezes dão informações consideravelmente mais confiáveis.Dois casos de interesse particular são o cálculo da condutividade elétrica,

quando um campo magnético estático espacialmente uniforme está pre-sente, e quando o campo elétrico é espacialmente uniforme mas dependentedo tempo. Ambos os casos simplesmente são com pela observação seguinte:é espacialmente uniforme mas tempo-dependente. Ambos os casos são maisfacilmente tratados lançando-se mão das seguintes observações:A qualquer instante t a velocidade eletrônica média v é justamente

p(t)/m, onde p é momento total por elétron. Conseqüentemente, a den-sidade de corrente é

j = −nep(t)m

(1.9)

Dado que o momento por elétron é p(t) no instante t, vamos calcular omomento por elétron p(t + dt), após um intervalo de tempo infinitesimaldt. Um elétron escolhido ao acaso a tempo num instante t terá uma colisãoantes do tempo t+ dt com probabilidade dt/τ , e então permanecerá até o

Page 14: Estado Solido, Ashcroft, Traduzido

1.2 Condutividade Elétrica DC de um Metal 11

tempo t+dt sem sofrer uma colisão com probabilidade 1−dt/τ . Se não sofrenenhuma colisão, porém, ele simplesmente evolui sob a influência da forçaf (t) (devido aos campos elétrico e magnético espacialmente uniformes) eentão adquirirá um momento adicional. f(t)dt + O(dt)2.12 A contribuiçãode todos esses elétrons que não colidem entre t e t+dt para o momento porelétron no instante t+dt é a fração (1−dt/τ) de todos os elétrons que elesconstituem, vezes o seu momento médio por elétron, p(t) + f (t) +O(dt)2.Assim, desprezando por enquanto a contribuição para p(t + dt) desses

elétrons que sofrem uma colisão no tempo entre t e t+ dt, temos13

p(t+ dt) =

µ1− dt

τ

¶£p(t) + f (t) dt+O(dt)2

¤= p(t)−

µdt

τ

¶p(t) + f(t)dt+O(dt)2 (1.10)

A correção para (1.10) devido a esses elétrons que tiveram uma colisãono intervalo de t a t+dt é apenas da ordem de (dt)2. Para ver isto, primeiroobserve que tais elétrons constituem uma fração dt/τ do número total deelétrons. Além disso, como a velocidade eletrônica (e o momento) é dirigidaaleatoriamente imediatamente após uma colisão, cada um desses elétronscontribuirá para momento médio p (t+ dt) apenas com o valor do momentoadquirido da força f(t) após a última colisão. Esse momento é adquiridodurante um tempo não maior do que dt, e é então da ordem f(t) dt . Assima correção para (1.10 é da ordem de (dt/τ) f (t) dt, e não afeta o termosde ordem linear em dt. Podemos escrever então:

p(t+ dt)− p(t) = −µdt

τ

¶p(t) + f(t)dt+O(dt)2 (1.11)

onde consideramos a contribuição de todos os elétrons para p(t + dt).Dividindo-se isto por dt e tomando-se o limite quando dt→ 0, encontramos

dp(t)

dt= −p (t)

τ+ f(t) (1.12)

Isto simplesmente especifica que o efeito das colisões de elétrons individuaisé introduzir um termo de amortecimento na equação de movimento para omomento por elétron.Agora aplicamos (1.12) para vários casos de interesse.

12O(dt)2 significa um termo da ordem de (dt)2.13 Se a força não é a mesma para todos os elétrons, (1.10) continuará valendo, desde

que se interprete f como a força média por elétron.

Page 15: Estado Solido, Ashcroft, Traduzido

12 1. Teoria de Drude para os Metais

1.3 Efeito Hall e Magnetorresistência

Em 1879 E. H. Hall tentou determinar se a força sofrida por um fio trans-portando corrente num campo magnético era exercida sobre todo o fio ouapenas sobre (o que chamaríamos agora) os elétrons móveis no fio. Ele sus-peitou ser este último, e sua experiência foi baseada no argumento de que”se a corrente de eletricidade num condutor fixo é atraída por um imã, acorrente deveria ser desviada para um lado do fio, e portanto a resistênciamedida deveria aumentar”.14 Seus esforços para descobrir esta resistênciaextra fracassaram,15 mas Hall não considerou isto conclusivo: ”O imã podetender a desviar a corrente sem contudo fazê-lo. É evidente que neste casoexistiria um estado de força no condutor, a pressão da eletricidade, porassim dizer, para um lado do fio”. Este estado de força deveria aparecercomo uma voltagem transversal (conhecida hoje como a voltagem Hall),que Hall pôde observar.A experiência de Hall é descrita na Figura 1.3. Um campo elétrico Ex é

aplicado a um fio que se estende na direção-x e uma densidade de correntejx flui no fio. Além desse campo, um campo magnéticoH aponta na direçãopositiva do eixo-z. Como resultado, a força de Lorents16

−ecv×H (1.13)

atua para desviar os elétrons na direção negativa do eixo-y (a velocidade dearraste de um elétron é oposta ao fluxo de corrente). Porém os electrons nãopodem se mover para muito longe na direção-y sem antes baterem contraas bordas do fio. Como eles se acumulam ali, aparece um campo elétrico nadireção-y que se opõe a seu movimento e a mais acumulação de elétrons. Noequilíbrio, este campo transversal (ou campo Hall) Ey equilibrará a forçade Lorentz forçam, e corrente só fluirá na direção-x.Há duas quantidades de interesse. Uma é a relação entre campo ao longo

do fio Ex e a densidade de corrente jx,

ρ (H) =Exjx

(1.14)

Esta é a magnetorresistência,17 que Hall encontrou ser independente docampo. A outra é o valor do campo transversal Ey. Considerando que estecampo equilibra a força de Lorentz, podemos esperá-lo ser proporcional

14Am. J. Math. 2, 287 (1879).15O aumento na resistência (conhecido como magnetorresistência) acontece, como ver-

emos nos Capítulos 12 e 13. Porém, o modelo de Drude prediz o resultado nulo de Hall.16Quando lidamos com materiais não-magnéticos (ou fracamente magnéticos), sempre

chamaremos o campo de H, pois a diferença entre B e H é extremamente pequena.17Mais precisamente, esta é a magnetorresistência transversal. Existe, também, uma

magnetorresistência longitudinal, medida com o campo magnético paralelo à corrente.

Page 16: Estado Solido, Ashcroft, Traduzido

1.3 Efeito Hall e Magnetorresistência 13

tanto ao campo aplicado H quanto à corrente jx ao longo do fio. Define-seportanto uma quantidade conhecida como coeficiente Hall por

RH =EyjxH

(1.15)

Note que, como o campo de Hall está na direção negativa do eixo-y(Figura 1.3), RH deveria ser negativo. Se, por outro lado, os portadores decarga fossem positivos, então o sinal da sua componente-x da velocidadeseria invertido, e a força de Lorentz ficaria então inalterada. Em conseqüên-cia disso, o campo de Hall seria oposto à direção que tem para portadoresnegativamente carregados. Isto é de grande importância, porque significaque uma medida do campo Hall determina o sinal dos portadores de carga.Os dados originais de Hall concordaram com o sinal da carga eletrônicamais tarde determinado por Thomson. Um dos aspectos notáveis do efeitoHall, porém. é que em alguns metais o coeficiente Hall é positivo e sugereque os portadores têm uma carga oposta àquela do elétron. Este é outromistério cuja solução teve que esperar pela teoria quântica dos sólidos.Neste capítulo, consideraremos só a análise simples do modelo de Drudeque, embora seja incapaz de descrever os coeficientes Hall positivos, estáfreqüentemente em boa concordância com a experiência.Para calcular o coeficiente de Hall e a magnetorresistência primeiro de-

terminamos as densidades de corrente jx e jy na presença de um campoelétrico com componentes arbitrárias Ex e Ey, e na presença de um campode rnagnetic H ao longo do eixo-z. A força (independente da posição) queatua sobre cada elétron é f = −e (E+ v×H/c), e portanto a Eq. (1.12)para o momento por elétron torna-se18

dp

dt= −e

³E+

p

mc×H

´− p

τ(1.16)

No estado estacionário a corrente é independente do tempo, e então pxe py satisfarão

0 = −eEx − ωcpy − pxτ

(1.17)

0 = −eEy − ωcpx − pyτ

onde

ωc =eH

mc(1.18)

18Note que a força de Lorentz não é a mesma para cada elétron, uma vez que eladepende da velocidade eletrônica v. Então a força f em (1.12) será tomada como a forçamédia por elertron (veja nota de rodapé 13). Porém, como a força depende do elétronsobre o qual ela atua apenas por um termo linear na velocidade do elétron, a força médiaé simplesmente obtida substituindo-se aquela velocidade pela velocidade média, p/m.

Page 17: Estado Solido, Ashcroft, Traduzido

14 1. Teoria de Drude para os Metais

Multiplicamos estas equações por −neτ/m e introduzimos as componentesda densidade de corrente por (1.4) para encontrar

σ0Ex = ωcτjy + jx

σ0Ey = −ωcτjx + jy (1.19)

onde σ é a condutividade DC do modelo de Drude na ausência de umcampo magnético, dado por (1.6).O campo de Hall Ey é determinado pela condição de que não há nenhuma

corrente jy transversal. Fazendo jy igual a zero na segunda equação de(1.19), encontra-se que

Ey = −µωcτ

σ0

¶jx = −

µH

nec

¶jx (1.20)

Portanto, o coeficiente Hall (1.15) é

RH = − 1

nec(1.21)

Este é um resultado muito marcante, porque afirma que o coeficiente Hallnão depende de nenhum parâmetro do metal menos a densidade de porta-dores. Considerando que já calculamos n admitindo-se que os elétrons devalências atômica se tornam os elétrons de condução metálica, uma medidada constante de Hall fornece um teste direto da validade desta suposição.Ao tentarmos obter a densidade de elétron n a partir da medida dos coefi-

cientes Hall, nos deparamos com o problema que, ao contrário da prediçãode (1.21), esses coeficientes geralmente dependem do campo magnético.Além disso, eles dependem da temperatura e do cuidado com que a amostrafoi preparada. Este resultado é um tanto inesperado, já que o tempo de re-laxação τ , que pode depender fortemente da temperature e das condiçõesda amostra, não aparece em (1.21). Porém, a temperaturas muito baixasem amostras muito puras, cuidadosamente preparadas a campos muito al-tos, as medidas das constantes de Hall parecem se aproximar de um valorlimite. As teorias mais elaboradas dos Capítulos 12 e 13 predizem que paramuitos (mas não todos) metais este valor limite é justamente o resultadosimples de Drude (1.21).Na Tabela 1.4, estão relacionados alguns coeficientes Hall a campos altos

e moderados. Note a ocorrência de casos nos quais RH é realmente positivoe corresponde aparentemente aos portadores com uma carga positiva. Umexemplo importante da observada dependência com o campo, e totalmenteinexplicada através da teoria de Drude, é mostrado na Figura 1.4.O resultado de Drude confirma a observação de Hall que a resistência

não depende do campo, pois quando jy = 0 (como é o caso no estado esta-cionário, quando o campo de Hall foi estabelecido), a primeira equação de

Page 18: Estado Solido, Ashcroft, Traduzido

1.4 Condutividade Elétrica AC de um Metal 15

(1.19) reduz-se a jx = σ0Ex, que é o resulatado esperado para a condu-tividade em campo magnético nulo. Porém, experiências mais cuidadosasnuma variedade de metais revelaram que há uma dependência da resistênciacom o campo magnético, que pode ser bastante dramática em alguns casos.Aqui, novamente a teoria quântica dos sólidos é necessária para explicarporque o resultado de Drude se aplica em alguns metais e calcular os desviosverdadeiramente extraordinários destes resultados em outros metais.Antes de encerrarmos o assunto dos fenômenos DC num campo mag-

nético uniforme, observamos para aplicações futuras, que a quantidade ωcτé uma importante medida adimensional da força de um campo magnético.Quando ωcτ é pequeno, a Eq. (1.19) dá j aproximadamente paralelo a E,como acontece na ausência de um campo magnético. Porém, j em geralforma um ângulo φ (conhecido como ângulo de Hall) com E, onde (1.19)dá tgφ = ωcτ . A quantidade ωc, conhecida como freqüência de cíclotron, ésimplesmente a freqüência angular de rotação19 do elétron livre no campomagnético H. Assim ωcτ será pequeno se os elétrons completarem só umapequena parte de uma rotção entre colisões, e grande, se eles completaremmuitas rotações. Alternativamente, quando ωcτ é pequeno o campo mag-nético deforma muito pouco as órbitas eletrônicas, mas quando ωcτ é com-parável à unidade ou maior, o efeito do campo magnético sobre as órbitaseletrônicas é muito drástico. Uma avaliação numérica útil da freqüência deciclotron é

νc¡109 Hz

¢= 2, 80×H (kG), ωc = 2πνc (1.22)

1.4 Condutividade Elétrica AC de um Metal

Para calcular a corrente induzida num metal por um campo elétrico depen-dente do tempo, vamos escrever o campo na forma:

E (t) = Re¡E(ω)e−iωt

¢(1.23)

A equação de movimento (1.12) para o momento por elétron, torna-se

dp

dt= −p

τ− eE (1.24)

Procuramos uma solução do regime estacionário da forma

p (t) = Re¡p (ω) e−iωt

¢(1.25)

19Num campo magnético uniforme a órbita de um elétron é uma espiral ao longodo campo cuja projeção no plano perpendicular ao campo é um círculo. A freqüênciaangular ωc é determinada pela condição que a aceleração centrípeta ω2cr é fornecida pelaforça de Lorentz (e/c) (ωcr)H.

Page 19: Estado Solido, Ashcroft, Traduzido

16 1. Teoria de Drude para os Metais

Substituindo-se as quantidades complexas p e E em (1.24), que deve sersatisfeita tanto pela parte real, quanto pela parte imaginária de qualquersolução complexa, encontra-se que p (ω) deve satisfazer

−iωp (ω) = −p (ω)τ− eE (ω) (1.26)

Uma vez que j = −nep/m, a densidade de corrente éj (t) = Re

¡j (ω) e−iωt

¢,

j (ω) = −nep (ω)m

=

¡ne2/m

¢E (ω)

(1/τ)− iω (1.27)

Usualmente, escreve-se este resultado como

j (ω) = σ (ω)E (ω) (1.28)

onde σ (ω) , conhecida como condutividade dependente da frequência (ouAC), é dada por

σ (ω) =σ0

1− iωτ , σ0 =ne2τ

m(1.29)

Note que isto se reduz exatamente ao resultado de Drude DC (1.6) parafrequência nula.A aplicação mais importante deste resultado é para a propagação de

radiação eletromagnética num metal. Poderia parecer que as suposiçõesque fizemos para derivar (1.29) a tornaria inaplicável para este caso, pois(a) o campo E numa onda eletromagnética é acompanhado por um campomagnético perpendicular H da mesma magnitude,20 que nós não incluímosem (1.24), e (b) os campos numa onda eletromagnética variam tanto noespaço como tempo, enquanto que a Eq. (1.12) foi derivada supondo-seuma força espacialmente uniforme.A primeira complicação sempre pode ser ignorada. Ela conduz a um

termo adicional −ep/mc ×H em (1.24), que é menor que o termo em Epor um fator v/c, onde v é o módulo da velocidade eletrônica média. Mas,mesmo numa corrente tão grande quanto 1 A/mm2, v = j/ne é somenteda ordem de 0, 1 cm/s. Conseqüentemente, o termo no campo magnéticoé tipicamente 10−10 do termo no campo elétrico e pode ser corretamenteignorado por completoO segundo ponto levanta questões mais sérias. A Eq. (1.12) foi derivada

supondo-se que a qualquer instante a mesma força atua sobre cada elétron,o que não é o caso se o campo elétrico varia no espaço. Note, porém, que adensidade de corrente no ponto r é completamente determinada pelo resul-tado da ação do campo elétrico sobre cada elétron em r desde sua última

20Um das características mais atraentes das unidades do sistema CGS.

Page 20: Estado Solido, Ashcroft, Traduzido

1.4 Condutividade Elétrica AC de um Metal 17

colisão. Esta última colisão, na maioria esmagadora das vezes, acontecenão mais do que alguns caminhos livres médios distante de r. Então, se ocampo não varia apreciavelmente sobre distâncias comparável ao caminholivre médio eletrônico, podemos calcular corretamente j (r, t), a densidadede corrente no ponto r, tomando-se o campo em todos lugares em espaçocomo dado por seu valor E (r, t) no ponto r. O resultado,

j (r,ω) = σ (ω) E (r,ω) (1.30)

é então válido sempre que o comprimento de onda λ do campo é grandecomparado ao caminho livre médio eletrônico `. Isto é normalmente satis-feito num metal pela da luz visível (da qual o comprimento de onda é daordem de 103 a 104 Å). Quando não é satisfeito, tem-se que recorrer àsdenominadas teorias não-locais, de maior complexidade.Supondo, então, que o comprimento de onda é grande comparado ao cam-

inho livre médio, podemos proceder como segue: na presença de uma den-sidade de corrente especificada j, podemos escrever as equações de Maxwellcomo21

∇ ·E = 0; ∇ ·H = 0; ∇×E = −1c

∂H

∂t

∇×H =4π

cj+

1

c

∂E

∂t(1.31)

Vamos olhar para uma solução com dependência temporal e−iωt, notandoque, num metal, podemos escrever j em termos de E via (1.28). Encon-tramos, então,

∇× (∇×E) = −∇2E = iω

c∇×H =

c

µ4πσ

cE− iω

cE

¶(1.32)

ou

−∇2E = ω2

c2

µ1 +

4πiσ

ω

¶E (1.33)

Esta equação tem a forma uma equação de onda usual,

−∇2E = ω2

c2² (ω)E (1.34)

com uma constante dielétrica complexa dada por

² (ω) = 1 +4πiσ

ω(1.35)

21Estamos considerando aqui uma onda eletromagnética, na qual a densidade de cargainduzida ρ se anula. Abaixo examinamos a possibilidade de oscilações na densidade decarga.

Page 21: Estado Solido, Ashcroft, Traduzido

18 1. Teoria de Drude para os Metais

Se estamos em freqüências altas bastante para satisfazer

ωτ À 1 (1.36)

seja satisfeita, então em primeira aproximação as Eqs. (1.35) e (1.29) nosdão

² (ω) = 1− ω2pω2

(1.37)

onde ωp, conhecida como frequência de plasma, é dada por

ω2p =4πne2

m(1.38)

Quando ² é real e negativo (ω < ωp) as soluções de (1.34) decaem expo-nencialmente no espaço; i.e., nenhuma radiação pode se propagar. Porém,quando ² é positivo (ω > ωp) a solução da Eq. (1.34) torna-se oscilatória,podendo a radiação se propagar, e o metal deveria se tornar transpar-ente. Esta conclusão, evidentemente, só é válida se a nossa suposição dealtas frequências (1.36) for satisfeita para valores da frequência próximosde ω = ωp. Se expressarmos τ em termos da resistividade através da Eq.(1.8), então podemos usar a expressão (1.38) da frequência de plasma paramostrar que

ωpτ = 1, 6× 102µrsa0

¶3/2µ1

ρµ

¶(1.39)

Como a resistividade em microhom-centímetro, ρµ, é da ordem ou menorque a unidade ou menos, e como rs/a0 está no intervalo entre 2 e 6,a condição para frequências altas (1.36) será satisfeita na frequência deplasma.De fato, para os metais alcalinos, observa-se que estes se tornam transpar-

entes na região do ultravioleta. Numericamente, a Eq. (1.38) dá a frequênciaa partir da qual o material se tornaria transparente, isto é,

νp =ωp2π

= 11, 4×µrsa0

¶−3/2× 1015Hz (1.40)

ou

λp =c

νp= 0, 26

µrsa0

¶3/2× 103Å (1.41)

Na Tabela 1.5, mostramos os comprimentos de onda de corte calculadosa partir (1.41), juntamente com os valores de corte medidos. Existe umaboa concordância entre os valores teóricos e experimentais. Como veremos,a constante dielétrica real de um metal é muito mais complicada do queaquela obtida em (1.37) e é pura sorte que os metais alcalinos notavelmenteexibam este comportamento de Drude. Em outros metais, diferentes con-tribuições à constante dielétrica competem fortemente com o ”termo deDrude” (1.37).

Page 22: Estado Solido, Ashcroft, Traduzido

1.4 Condutividade Elétrica AC de um Metal 19

A segunda conseguência importante de (1.37) é que o gás de elétronspode suportar oscilações na densidade de carga. Com isto nos referimosa uma perturbação na qual a densidade de carga22 tem uma dependênciatemporal oscilatória e−iωt. Da equação da continuidade

∇ · j = −∂ρ∂t, ∇ · j (ω) = iωρ (ω) (1.42)

e, da lei de Gauss,∇ ·E (ω) = 4πρ (ω) (1.43)

encontramos, em vista da Eq. (1.30), que

iωρ (ω) = 4πσ (ω) ρ (ω) (1.44)

Esta equação tem uma solução desde que

1 +4πσ (ω)

ω= 0 (1.45)

que é exatamente a condição que encontramos acima para o início da propa-gação da radiação. No presente contexto, ela aparece como a condição quea frequência deve satisfazer para haja propagação da onda de densidade decarga.A natureza desta onda de densidade de carga, conhecida como oscilação

de plasma ou plasmon pode ser entendida através de um modelo muitosimples.23 Imagine que o gás de elétrons como um todo seja deslocado poruma distância d em relação ao fundo positivos de íons fixos (Figura 1.5).24

A carga superficial resultante dá origem a um campo elétrico de módulo4πσ, onde σ é a carga por unidade de área25 em ambas as extremidadesdo bloco. Consequentemente o gás de elétrons como um todo obedecerá àequação de movimento

Nmd = −Ne |4πσ| = −Ne (4πnde) = −4πne2Nd (1.46)

que leva a oscilação na frequência de plasma.

22Não devemos confundir a densidade de carga ρ com a condutividade, também, geral-mente representada por ρ. Esta distinção ficará clara no contexto, quando nos referirmosa elas.23Como o campo de um plano uniforme de carga é independente da distância do plano,

este argumento grosseiro que coloca toda densidade de carga sobre duas superfíciesopostas, não é tão grosseiro quanto parece à primeira vista.24Obervamos anteriormente que o modelo de Drude leva em conta a interação elétron-

íon, admitindo que a atração dos íons carregados positivamente confina os elétrons nointerior do metal. Neste modelo simples de uma oscilação de plasma é precisamente estaatração que fornece a força restauradora.25Não devemos confundir a densidade de carga σ com a condutividade, também, geral-

mente representada por σ.

Page 23: Estado Solido, Ashcroft, Traduzido

20 1. Teoria de Drude para os Metais

Foram feitas algumas observações diretas de plasmons. Talvez a maisimportante seja a observação das perdas de energia em múltiplos de ~ωp,quando os elétrons são lançados contra filmes metálicos finos.26 Contudo,deve-se sempre ter em mente a possibilidade de excitação desses plasmonsno fluxo de outros processos eletrônicos.

1.5 Condutividade Térmica de um Metal

O sucesso mais impressionante do modelo de Drude, na época em que foiproposto, foi a explicação da lei empírica de Wiedemann e Franz (1853). Alei de Wiedemann-Franz afirma que a razão entre as condutividades térmicae elétrica, κ/σ,de um gande número de metais é diretamente proporcionalà temperatura, onde a constante de proporcionalidade, grosso modo, é amesma para todos os metais. Esta excepcional regularidade pode ser vistana Tabela 1.6, onde mostramos a condutividade térmica medida experi-mentalmente para vários metais a 273 K e 373 K, juntamente com a razãoκ/σ (conhecida como número de Lorentz) para as duas temperaturas.Neste caso, o modelo de Drude considera que a corrente térmica no metal

seja transportada pelos elétrons de condução. Esta hipótese é baseada naobservação empírica de que os metais são melhores condutores de calor doque os isolantes. Então, a condução térmica pelos íons27 (presentes tantonos metais como nos isolantes) é muito menos importante do que a con-dução térmica pelos elétrons de condução (presentes somente nos metais).Para definir e estimar a condutividade térmica, considere uma barra

metálica, cuja temperatura varia pouco a pouco ao longo de seu compri-mento. Se não existir nenhuma fonte ou sorvedor de calor nas extrimidadesda barra para manter o gradiente de temperatura, então, a extremidademais aquecida se resfria, enquanto que a extremidade mais fria se aquece,isto é, a energia térmica flui no sentido oposto ao do gradiente de temper-atura. Fornecendo-se calor à extremidade mais aquecida a uma taxa maiordo que a que ele flui para a outra extremidade, podemos produzir um estadoestacionário no qual estejam presentes tanto um gradiente de temperatura,como um fluxo uniforme de calor. Definimos a densidade de corrente tér-mica jq como um vetor paralelo ao fluxo de calor, cujo módulo é a energiatérmica por unidade de tempo que atravessa um área unitária perpendicu-

26C. J. Pourcel and J. B. Swan, Phys. Rev. 115, 869 (1959).27Embora os íons metálicos não possam vagar livremente pelo metal, existe uma

maneira pela qual eles podem transportar energia térmica (mas não corrente elétrica):os íons podem ter pequenas vibrações em torno de suas posições médias, dando origemà transmissão de energia térmica na forma de propagação de ondas elásticas através darede de íons. Veja Capítulo 25.

Page 24: Estado Solido, Ashcroft, Traduzido

1.5 Condutividade Térmica de um Metal 21

lar ao fluxo.28 Para pequenos gradientes de temperatura, observa-se que acorrente térmica é proporcional a ∇T (lei de Fourier):

jq = −κ∇T (1.47)

A constante de proporcionalidade κ é conhecida como condutividade tér-mica, e é sempre positiva, uma vez que o fluxo de calor é sempre oposto àdireção do gradiente de temperatura.Como um exemplo concreto, vamos examinar um caso onde a variação

da temperatura é uniforme na direção positiva do eixo-x. No estado esta-cionário, a corrente térmica flui na direção-x e tem uma magnitude jq =−κ dT/dx. Para calcularmos a corrente térmica, observamos que (hipótese4, página 1.1) após cada colisão um elétron emerge com uma velocidadeapropriada à temperatura local; quanto maior for a temperatura do local dacolisão, maior será a energia com que o elétron emergirá dessa colisão. Con-sequentemente, mesmo quando a velocidade eletrônica média num pontose anular (diferente do caso do fluxo elétrico) os elétrons que atingem oponto, vindos da região de temperatura mais alta terá energia maiores doque aqueles oriundos da região de temperatura mais baixa, dando origema um fluxo térmico resultante dirigido para o lado de temperatura maisbaixa (Figura 1.6).Para obtermos uma estimativa quantitativa, usando esta idéia, vamos

considerar inicialmente um modelo “unidimensional” bastante simplificado,no qual os elétrons podem se mover apenas na direção-x,tal que num pontox,metade dos elétrons vêm do lado de maior temperatura e a outra metade,do de baixa temperatura. Se ε (T ) for a energia térmica por elétron nummetal em equilíbrio térmico à temperatura T,então um elétron, cuja últimacolisão ocorreu ponto x0, terá, em média, uma energia térmica ε (T [x0]) .Os elétrons que chegam a x pelo lado da alta temperatura, em média,tiveram a sua última colisão em x− vτ , e então transportarão uma energiatérmica por elétron de valor igual ε (T [x− vτ ]). Suas contribuições para adensidade de corrente térmica em x serão então o número desses elétronspor volume de unidade, n/2, vezes sua velocidade, v, vezes esta energia, ou(n/2) v ε (T [x+ vτ ])Ao atingirem o ponto x,os elétrons vindos do lado de alta temperatura

sofreram a última colisão, em média, na posição x− vτ , e, portanto, trans-portam uma energia térmica por elétron de valor igual a ε (T [x− vτ ]) . Acontribuição desses elétrons à densidade de corrente térmica no ponto xserá o número de tais elétrons por unidade de volume, n/2, vezes a veloci-dade, v, vezes esta energia, ou seja, (n/2) vε (T [x− vτ ]) . Por outro lado,os elétrons que chegam ao ponto x pelo lado de menor temperatura, con-tribuirão para a corrente com o valor de (n/2) v ε (T [x+ vτ ]) , uma vez que

28Note a analogia com a definição de densidade de corrente elétrica j, assim como aanalogia entre as leis de Ohm e Fourier.

Page 25: Estado Solido, Ashcroft, Traduzido

22 1. Teoria de Drude para os Metais

eles vêm da direção-x positiva e se movem no sentido negativo do eixo-x.Fazendo-se a soma, obtém-se

jq =1

2nv ε (T [x− vτ ])− ε (T [x+ vτ ]) (1.48)

Supondo-se que a variação na temperatura sobre um caminho livre médio(` = vτ) seja muito pequena,29 podemos expandir essas expressões emtorno do ponto x,encontrando

jq = nv2τ∂ε

∂T

µ−∂T∂x

¶(1.49)

Para generalizar este resultado para o caso tridimensional, precisamosapenas substituir v pela componente vx da velocidade eletrônica v, e fazera média sobre todas as direções. Como30 hv2xi = hv2yi = hv2zi = 1

3v2, e

ndε/dT = (N/V ) dε/dT = (dE/dT ) /V = cv, o calor específico eletrônico,temos

jq =1

3v2τcv (−∇T ) (1.50)

ouκ =

1

3v2τcv =

1

3v`vcv, (1.51)

onde v2 é a velocidade quadrática média dos elétrons.Enfatizamos a aspereza deste argumento. Falamos muito fluentemente

sobre a energia térmica por elétron transportada por um grupo particu-lar de elétrons, uma quantidade que se poderia ficar em dificuldades paradefinir com precisão. Também fomos bastante descuidados ao substituirmosquantidades, em várias fases do cálculo, por suas médias térmicas. Por ex-emplo, se poderia alegar que se a energia térmica por elétron depende dadireção de onde vêm os elétrons, assim será sua velocidade média, pois estatambém depende da temperatura no lugar de sua última colisão. Notare-mos abaixo que este último lapso é cancelado por, também, outra omissão,e no Capítulo 13 encontraremos, por um argumento mais rigoroso, que o re-sultado (1.51) é bem próximo (e, em circunstâncias especiais, exatamente)do resulatdo correto.Dado a estimativa (1.51), podemos derivar outro resultado independente

dos mistérios embutidos no tempo de relaxação τ , dividindo-se a condu-tividade térmica pela condutividade elétrica (1.6):

κ

σ=

13cvmv

2

ne2(1.52)

29A variação da temperatura num comprimento ` é `/L vezes a variação da temper-atura no comprimento L da amostra.30No equilíbrio, a distribuição de velocidades é isotrópica. Correções devidas ao gra-

diente de temperatura são extremamente pequenas.

Page 26: Estado Solido, Ashcroft, Traduzido

1.5 Condutividade Térmica de um Metal 23

Era natural para Drude aplicar as leis clássicas dos gases ideais, calcu-lando o calor específico electrônico e a velocidade quadrática média. Assim,cosiderou cv como sendo 3

2nkB e12mv

2 como 32kBT, onde kB é a constante

de Boltzmann, 1, 38× 10−16 erg/K. Isto conduz ao resultado

κ

σ=3

2

µkBe

¶2T (1.53)

O lado direito de (1.53) é proporcional a T e só depende das constantesuniversais kB e e, em completa concordância com a lei de Wiedemann eFranz. A Eq. (1.53) dá um número de Lorenz31

κ

σT=3

2

µkBe

¶2= 1, 24××10−13 (erg/esu-K) 2

= 1, 11××10−8 W-Ω/K2(1.54)

que é aproximadamente metade do valor típico mostrado na Tabela 1.6.Em seu cálculo original da condutividade elétrica, Drude encontrou er-roneamente metade do resultado correto (1.6), como resultado do que eleencontrou κ/σT = 2, 22 × 10−8W-Ω/K2 em extraordinária concordânciacom o resultado experimental.Este sucesso, embora inteiramente casual, foi tão impressionante ao ponto

de estimular novas investigações com o modelo. Isto porém, era muitoenignático, uma vez que nenhuma contribuição eletrônica ao calor especí-fico ao menos remotamente comparável ao valor 32kBT nunca era observada.Mesmo à temperatura ambiente não parecia haver nenhuma contribuiçãoeletrônica ao calor específico medido experimentalmente. No Capítulo 2,mostraremos que as leis dos gases clássicos ideais não podem ser aplicadasao gás de elétrons num metal. O sucesso de Drude, à parte o fator 2 enganosseus, é uma consequência de dois erros da ordem de 100 que se cancelam: àtemperatura ambiente, a contribuição eletrônica correta ao calor específicoé da ordem de 100 vezes menor do que a previsão clássica, enquanto que avelocidade média eletrônica é 100 vezes maiorNo Capítulo 2, examinaremos a teoria correta das propriedades de equi-

líbrio do gás de elétrons livres e retornaremos a uma melhor análise dacondutividade térmica de um metal no Capítulo 13. Porém, antes de con-cluirmos o assunto sobre transporte térmico, devemos corrigir uma simpli-ficação introduzida em nossa análise que torna obscuro um fenômeno físicoimportante:Calculamos a condutividade térmica, ignorando todas as manifestações

do gradiente de temperatura, com exceção do fato que a energia térmicatransportada por um grupo de elétrons depende da temperatura no lugar

31Uma vez que (J/C)2 = (W/A)2 =W-Ω, as unidades práticas em que os números deLorentz são representados são chamados, às vezes, de W-Ω/K2 ao invés de (J/C-K)2.

Page 27: Estado Solido, Ashcroft, Traduzido

24 1. Teoria de Drude para os Metais

da sua última colisão. Mas se elétrons emergem de uma colisão com energiasmaiores quando a temperatura é mais alta eles também terão velocidadesmaiores. Pareceria então que nós permitiríamos que a velocidade eletrônicav assim como sua contribuição para a energia térmica dependesse do lugarda última colisão. Como se mostra tal termo adicional só altera o resultadopor um fator da ordem da unidade, mas nós estávamos de fato muito cer-tos ao ignorarmos tal correção. É verdade que imediatamente depois que ogradiente de temperatura é aplicado haverá um velocidade eletrônica mé-dia não nula dirigida para a região de baixa temperatura.Considerando queos elétrons são carregados, porém, esta velocidade resultará numa correnteelétrica. Mas as medidas de condutividades térmicas são executadas sobcondições de circuito aberto, no qual nenhuma corrente elétrica pode fluir.Então a corrente elétrica só pode continuar até que se acumule bastantecarga na superfície da amostra para formar um campo elétrico retardadorque se opõe à acumulação adicional de carga, e conseqüentemente, can-cela exatamente o efeito do gradiente de temperatura sobre a velocidademédia eletrônica.32 Quando o estado estacionário é atingido não haveránenhum fluxo corrente elétrica, e estávamos então corretos admitindo quea velocidade eletrônica média se anulava num ponto.Desta maneira, somos conduzidos a considerar outro efeito físico: um

gradiente de temperatura numa barra longa e delgada deveria ser acom-panhado por um campo elétrico dirigido no sentido oposto ao do gradientede temperatura. A existência de tal um campo, conhecido como campotermoelétrico, era conhecida por algum tempo (o efeito Seebeck). O campoé escrito convencionalmente como

E = Q∇T (1.55)

e a constante de proporcionalidade é conhecida como termopotência. Paraestimar a termopotência, devemos observar que em nosso modelo “unidi-mensional” a velocidade eletrônica média num ponto x devido ao gradientede temperatura é:

vQ =1

2[v (x− vτ)− v (x+ vτ)] = −v dv

dx

= −v ddx

µv2

2

¶(1.56)

Podemos novamente generalizar para três dimensões33 fazendo-se v2 → v2xe notando-se que hv2xi = hv2yi = hv2zi = 1

3v2, tal que

vQ = −τ6

dv2

dT(∇T ) (1.57)

32Veja discussão análoga da origem do campo Hall na página .33Cf. a discussão que nos levou da Eq. (1.49) para a Eq. (1.50).

Page 28: Estado Solido, Ashcroft, Traduzido

1.6 Problemas 25

A velocidade média devido ao campo elétrico é34

vE = −eEτm

(1.58)

Para se ter vQ + vE = 0,devemos fazer

Q = −µ1

3e

¶d

dT

mv2

2= − cv

3ne. (1.59)

Este resultado é também independente do tempo de relaxação. Drudeobteve-o por outra aplicação inadequada da mecânica clássica, fazendo cvigual a 3nkB/2, para encontrar que

Q = − k2e= −0, 43× 10−4 V/K (1.60)

Valores de termopotências metálicas medidos à temperatura ambiente sãoda ordem de microvolts por Kelvin, um fator de 100 vezes menor. Esteé o mesmo erro de 100, que apareceu duas vezes na derivação da lei deWiedemann-Franz, só que agora não há compensação, o que mostra semambiguidades a inadequação da mecânica estatística clássica em descrevero gás de eléron metálico.Com o uso da mecânica estatística quântica, remove-se esta discrepância.

Porém, em alguns metais, o sinal da termopotência - a direção do campotermoelétrico - é oposto àquele predito pelo modelo de Drude. Isto é tão mis-terioso quanto a discrepância no sinal do coeficiente Hall. A teoria quânticados sólidos também pode explicar a inversão de sinal na termopotência, masa sensação de triunfo, neste caso, deve ser um pouco moderado, pois aindaestá faltando uma teoria realmente quantitativa do campo termoelétrico.Veremos em disscussões futuras algumas das peculiaridades deste fenômenoque o fazem particularmente difícil de calcular com precisão.Estes últimos exemplos deixaram claro que não podemos ir muito longe

com uma teoria de elétrons livres sem o uso apropriado da estatística quân-tica. Este será o assunto do Capítulo 2.

1.6 Problemas

1. Distribuição de Poisson

No modelo de Drude, a probabilidade de que um elétron sofra umacolisão num intervalo de tempo infinitesimal dt é dt/τ .

34Veja discussão na página .

Page 29: Estado Solido, Ashcroft, Traduzido

26 1. Teoria de Drude para os Metais

(a) Mostre que, para um elétron escolhido aleatoriamente num dadoinstante, a probabilidade de não ter sofrido nenhuma colisão du-rante os t segundos anteriores, é e−t/τ . Mostre que a probabil-idade para que este elétron não sofra nenhuma colisão duranteos próximos t segundos, é a mesma.

(b) Mostre que a probabilidade para que o intervalo de tempo en-tre duas colisões sucessivas do elétron esteja entre t e t + dt é(dt/τ) e−t/τ .

(c) Mostre, como conseqüência de (a), que em qualquer instanteo tempo médio, calculado sobre todos os elétrons, decorrido apartir da última colisão (ou até a próxima colisão) é τ .

(d) Mostre, como conseqüência de (b), que o tempo médio entrecolisões sucessivas de um elétron é τ .

(e) O ítem (c) implica que, em qualquer instante, o tempo T entrea última colisão e a próxima é 2τ , calculada a média sobre todosos elétrons . Explique por que este resultado não é incompatívelcom aquele obtido no ítem (d). (Uma explicação rigorosa deve-ria incluir uma derivação da distribuição de probabilidade paraT .) O erro ao apreciar esta sutileza, levou Drude a estimar acondutividade elétrica como sendo a metade do valor de (1.6).Ele não cometeu o mesmo engano na condutividade térmica, daía origem do fator de dois que aparece em seu cálculo do númerode Lorenz (veja página 23).

2. Aquecimento Joule

Considere um metal à temperatura uniforme num campo elétrico uni-forme e estático E. Um elétron sofre uma colisão, e então, depois deum tempo t, uma segunda colisão. No modelo de Drude, a energianão é conservada durante as colisões, pois a velocidade média de umelétron que sai de uma colisão não depende da energia que ele haviaadquirido do campo durante o intervalo de tempo que precedeu acolisão (hipótese 4, página 7).

(a) Mostre que a energia média que os elétrons perdem para os íonsna segunda de duas colisões seperadas por um intervalo de tempot, é (eEt)2 /2m. (A média é tomada sobre todas as direções nasquais o elétron é lançado após a primeira colisão)

(b) Mostre, usando o resultado do Problema 1(b), que a perda médiade energia para os íons por elétron por colisão é (eEτ)2 /2m, e,então, que a perda média por centímetro cúbico por segundo é¡ne2τ/m

¢E2 = σE2. Mostre que a perda de potência num fio

de comprimento L e de área de seção transversal A é I2R,ondeI é a corrente que flui e R, a resistência do fio.

Page 30: Estado Solido, Ashcroft, Traduzido

1.6 Problemas 27

3. Efeito Thomson

Suponha que, além do campo elétrico no Problema 2, aplica-se nometal um gradiente uniforme de temperatura ∇T . Uma vez queo elétron sai de uma colisão com uma energia que é determinadapela temperatura local, a perda de energia nas colisões dependerá davariação do valor desse gradiente e da quantidade de energia que oselétrons adquirem do campo elétrico entre as colisões. Consequente-mente, a perda de potência conterá um termo proporcional a E ·∇T(que é facilmente isolado dos outros termos, pois é um termo de se-gunda ordem na perda de energia, que troca de sinal, quando o sinalde E é invertido). Mostre que esta contribuição é dada, no modelode Drude, pelo termo da ordem de (neτ/m) (dε/dT ) (E ·∇T ) , ondeε é a energia média térmica por elétron. (Calcule a perda de energiapor um dado elétron colidindo no ponto r, após ter sofrido a últimacolisão no ponto r−d. Considerando que o tempo de relaxação τ sejafixo (isto é, independente da energia), d pode ser encontrado comofunção do campo e do gradiente de temperatura, até primeira ordem,por argumentos cinemáticos simples, que é suficiente para se obter aperda de energia até segunda ordem.)

4. Ondas de Helicon

Suponha que uma metal seja colocado num campo magnético uni-forme H dirigido ao longo do eixo-z. Seja e−iωt um campo AC apli-cado perpendicularmente a H.

(a) Se o campo elétrico for polarizado circularmente (Ey = ±iEx) ,mostre que a Eq. (1.28) deve ser generalizada para

jx =

µσ0

1− i (ω ∓ ωc) τ

¶Ex, jy = ±ijx, jz = 0 (1.61)

(b) Mostre que, usando (1.61), as equações de Maxwell (1.31) têmsolução

Ex = E0ei(kz−ωt), Ey = ±iEx, Ez = 0 (1.62)

com k2c2 =∈ ω2, onde

∈ (ω) = 1− ω2pω

µ1

ω ∓ ωc + i/τ

¶(1.63)

(c) Faça um esboço de ∈ (ω) para ω > 0 (escolhendo a polarizaçãoEy = iEx) e demonstre que existem soluções para k2c2 =∈ ω2

com k arbitrário para frequências ω > ωp e ω < ωc. (Considereválida a condição ωcτ À 1 para campos elevados, e observe que,mesmo para centenas de kilogauss, ωp/ωc À 1.)

Page 31: Estado Solido, Ashcroft, Traduzido

28 1. Teoria de Drude para os Metais

(d) Mostre que, quando ω ¿ ωc, a relação entre k e ω para a soluçãode baixa frequência é

ω = ωc

µk2c2

ω2p

¶(1.64)

Esta onda de baixa frequência, conhecida como helicon, já foiobservada em muitos metais.35 Estime a frequência do heliconpara um comprimento de onda de 1 cm e um campo magnéticoaplicado de 10 kG, para densidades metálicas.

5. Plasmons Superficiais

Uma onda eletromagnética que pode ser propagar na superfície de ummetal complica a observação de plasmons ordinários (bulk). Considereo metal contido no semi-espaço z > 0 e o vácuo, no semi-espaço z < 0.Admita que a densidade de carga elétrica ρ, que aparece nas equaçõesde Maxwell, se anule tanto dentro, quanto fora do metal. (Isto nãoimpede uma concentração de densidade superficial de carga no planoz = 0.) O plasmon superficial é uma solução das equações de Maxwellda forma:

Ex = Aeiqx e−Kz, Ey = 0, Ez = B eiqx e−Kz, z > 0;

Ex = C eiqx eK

0z, Ey = 0, Ez = B eiqx eK

0z, z > 0;

q,K,K0 real, K,K0 positivo

(1.65)

(a) Usando as condições de contorno usuais (Ek contínuo e (∈ E)⊥contínuo) e os resultados de Drude (1.35) e (1.29), encontre trêsequações relacionando q,K e K0 em função de ω.

(b) Supondo ωτ À 1, plote q2c2 em função de ω2.

(c) No limite quando qc À ω, mostre que existe uma solução comfrequência ω = ωp/

√2. Mostre, por inspeção de K e K0, que

a onda está confinada na superfície. Descreva sua polarização.Esta onda é conhecida como plasmon superficial.

35R. Bowers et al., Phys. Rev. Letters 7, 339 (1961).

Page 32: Estado Solido, Ashcroft, Traduzido

This is page 29Printer: Opaque this

2Teoria de Sommerfeld de Metais

Na época de Drude, e por muitos anos depois, parecia razoável supor quea distribuição de velocidade eletrônica, como aquela de um gás clássicoordinário de densidade n = N/V , fosse dada no equilíbrio à temperatura Tpela distribuição de Maxwell-Boltzmann. Tal distribuição nos dá o númerode elétrons por unidade de volume com velocidades no intervalo1 dv emtorno de v como fB (v) dv, onde

fB (v) = n

µm

2πkBT

¶3/2e−mv

2/2kBT (2.1)

Dissemos no Capítulo 1 que, juntamente com o modelo de Drude, estafunção de distribuição leva a uma boa concordância na ordem de grandezacom a lei de Wiedemann-Franz, mas também prediz uma contribuição parao calor específico de um metal de 32kBT por elétron que não era observada.

2

Este paradoxo, que pôs em dúvida o modelo de Drude durante um quartode um século, só foi resolvido pelo advento da teoria quântica e o recon-hecimento de que, para elétrons,3 o princípio de exclusão Pauli requer a

1Usamos a notação vetorial padrão. Assim, v representa o módulo do vetor v;umavelocidade está no intervalo dv em torno de v se sua i -ésima componente estiver entrevi e vi + dvi, para i = x, y, z; usamos também dv para representar o volume da regiãodo espaço das velocidades, no intervalo dv em torno de v: dv = dvxdvydvz .

2Porque, como veremos, a contribuição eletrônica correta é da ordem de 100 vezesmenor à temperatura ambiente, do que aquela prevista no modelo clássico, tornando-seainda menor à medida que a temperatura diminui.

3E para todas as partículas obedecendo a estatística de Fermi-Dirac.

Page 33: Estado Solido, Ashcroft, Traduzido

30 2. Teoria de Sommerfeld de Metais

substituição da distribuição de Maxwell-Boltzmann (2.1) pela distribuiçãode Fermi-Dirac:

fB (v) =(m/~)3

4π31

exp£¡12mv

2 − kBT0¢/kBT

¤+ 1

(2.2)

Aqui ~ é a constante de Planck dividida por 2π, e T0 é uma temperaturadeterminada pela condição de normalização4

n =

Zdv f (v) (2.3)

e é tipicamente dezenas de milhares de graus. Para temperaturas de inter-esse (isto é, menores do que 103 K) as distribuições de Maxwell-Boltzmanne Fermi-Dirac são bastante diferentes para densidades eletrônicas típicasde metal (Figura 2.1)Neste capítulo, descreveremos a teoria baseada na distribuição de Fermi-

Dirac (2.2) e examinamos as consequências da estatística de Fermi-Diracpara o gás de elétrons em metais.Logo depois da descoberta de que o princípio de exclusão de Pauli era

necessário para tratar estados eletrônicos ligados de átomos, Sommerfeldaplicou esse mesmo princípio ao gás de elétrons livres em metais e assimresolveu a anomalia térmica mais visível do modelo anterior de Drude. Namaioria das aplicações, o modelo de Sommerfeld nada mais é do que o gásde elétron clássico de Drude com a única modificação de que a distribuiçãode velocidade eletrônica é a distribuição quântica de Fermi-Dirac, ao in-vés da distribuição clássica de Mawell-Boltzmann. Para justificar o uso dadistribuiç ão de Fermi-Dirac em conexão com a teoria clássica, devemosanalisar a teoria quântica do gás de elétrons.5

Por simplicidade, examinaremos o estado fundamental (i.e., T = 0) dogás de elétron antes de estudá-lo a temperaturas diferentes de zero. Comoveremos, as propriedades do estado fundamental em si são de grande in-teresse: mostraremos que a temperatura ambiente para o gás de elétron adensidades metálicas é, na verdade, uma temperatura ainda muito baixae para muitos propósitos indistinguível de T = 0. Assim, mesmo à tem-peratura ambiente, muitas das propriedades eletrônicas de um metal (masnem todas) quase não diferem de seus valores a T = 0.

4Note que as constantes na distribuição de Maxwell-Boltzmann (2.1) já foi escolhida,satisfazendo a condição (2.3). A Eq. (2.2) é obtida abaixo; veja Eq. (2.89). No Problema3d o pré-fator que aparece na Eq. (2.2) é colocado numa forma que facilite a comparaçãodireta com a Eq. (2.1).

5Neste capítulo, o termo ”gás de elétron” significa um gás de elétrons livre e inde-pendente (veja página 6), a menos que se considere explicitamente as correções devidoàs interações elétron-elétron ou elétron-íon.

Page 34: Estado Solido, Ashcroft, Traduzido

2.1 Propriedades do Estado Fundamental do Gás de Elétrons 31

2.1 Propriedades do Estado Fundamental do Gásde Elétrons

Vamos calcular as propriedades do estado fundamental de N elétrons con-finados a um volume V. Uma vez que os elétrons não interagem entre si(aproximação de elétron independente) podemos determinar o estado fun-damental do sistema de N elétrons, determinando-se inicialmente os níveisde energia de um único elétron no volume V, e, em seguida, preenchendo-seestes níveis de uma maneira consistente com o princípio de exclusão dePauli, que permite, no máximo, que um elétron ocupe qualquer um dessesníveis.6

Um único elétron pode ser descrito por uma função de onda ψ (r) e aespecificação de qual das duas possíveis orientações possui seu spin. Seo elétron não sofre nenhuma interação, a função de onda associada como nível de energia ε satisfaz a equação de Schrödinger independente dotempo:

− ~2

2m

µ∂2

∂x2+

∂2

∂y2+

∂2

∂z2

¶ψ (r) = − ~

2

2m∇2ψ (r) = εψ (r) (2.4)

Representaremos o confinamento do elétron (pela atração dos íons) aovolume V, através da condição de contorno sobre a Eq. (2.4). A escolha dacondição de contorno, sempre que se está se tratando de problemas que nãoestão relacionados explicitamente com os efeitos da superfície metálica, éa uma condição importante que temos à nossa disposição e pode ser de-terminada por conveniência matemática, pois, se o metal é suficientementevolumoso, deveríamos esperar que suas propriedades de volume (bulk) nãosejam afetadas pela configuração detalhada de sua superfície. Com este es-pírito, primeiro selecionamos a forma do metal que seja adequada à nossaconveniência analítica. A escolha usual é um cubo de lado L = V 1/3.O próximo passo é a escolha de uma condição de contorno para a equação

de Scrödinger (2.4), refletindo o fato de que os elétrons estejam confinadosneste cubo. Faremos esta escolha, certos de que isso não afetará as pro-priedades de bulk que serão calculadas. Uma das possibilidades é imporque a função de onda ψ (r) se anule para r sobre a superfície do cubo. Isto,porém, é às vezes insatisfatório, pois leva a soluções de ondas estacionáriasda Eq. (2.4), enquanto que o transporte de carga e energia pelos elétrons é,de longe, mais convenientemente discutido em termos de ondas itinerantes.Uma escolha mais satisfatória é enfatizar a insignificância da superfície,dispondo dela completamente. Isto pode ser feito, imaginando-se cada facedo cubo unindo-se à face oposta, de forma que um elétron que chega àsuperfície não seja por ela refletido, mas deixa o metal, reentrando simul-

6Deste ponto em diante, reservaremos o termo ”estado” para nos referirmos ao estadodo sistema de N elétrons e o termo ”nível”, para o estado de um elétron.

Page 35: Estado Solido, Ashcroft, Traduzido

32 2. Teoria de Sommerfeld de Metais

taneamente num ponto correspondente sobre a superfície oposta. Assim, seo nosso metal fosse unidimensional, poderíamos simplesmente substituir alinha de 0 a L, à qual o elétron estivesse confinado, por um círculo de cir-cunferência L. Em três dimensões, a incorporação geométrica da condiçãode contorno, na qual os três pares de faces opostas no cubo estejam unidas,torna-se topologicamente impossível de se construir no espaço tridimen-sional. Entretanto, a forma analítica da condição de contorno é facilmentegeneralizada. Em uma dimensão, o modelo circular de um metal resulta nacondição de contorno ψ (x+ L) = ψ (x) ,e a generalização ao cubo tridi-mensional é, evidentemente,

ψ (x, y, z + L) = ψ (x, y, z)

ψ (x, y + L, z) = ψ (x, y, z) (2.5)

ψ (x+ L, y, z) = ψ (x, y, z)

A Eq. (2.5) é conhecida como condição de contorno de Born-von Karman(ou condição de contorno periódica). A encontraremos freqüentemente (àsvezes numa forma ligeiramente generalizada7).Resolveremos a Eq. (2.4) sujeita à condição de contorno (2.5). Verifica-se

por diferenciação direta que a solução, ignorando-se a condição de contorno,é

ψk (r) =1√Veik·r (2.6)

com energia

ε (k) =~2k2

2m(2.7)

onde k é qualquer vetor independente da posição. Escolhemos a constantede normalização em (2.6) tal que a probabilidade de se encontrar o elétronem qualquer posição dentro do volume V seja igual a um, isto é:

1 =

Zdr |ψ (r)|2 (2.8)

Para entendermos o significado do vetor k, notamos que o nível ψk (r) éum autoestado do operador momento,

p =~i

∂r=~i∇,

µpx =

~i

∂x, etc.

¶, (2.9)

com autovalor p = ~k, pois

~i

∂reik·r = ~k eik·r (2.10)

7Mais tarde, será mais conveniente não usarmos um cubo, mas um paralelepípedode arestas não necessariamente iguais ou perpendiculares. Para enquanto, usamos umcubo para evitarmos complexidades geométricas desnecessárias, mas é um bom exercícioverificar que todos os resultados desta seção permanecem válidos para o paralelepípedo.

Page 36: Estado Solido, Ashcroft, Traduzido

2.1 Propriedades do Estado Fundamental do Gás de Elétrons 33

Como para uma partícula num autoestado de um operador tem um valordefinido do correspondente observável dado pelo autovalor, um elétron nonível ψk (r) tem um momento definido proporcianal a k:

p = ~k (2.11)

e uma velocidade v = p/m de

v =~km

(2.12)

Em vista disso, a energia (2.7) pode ser escrita na forma clássica usual:

ε =p2

2m=1

2mv2 (2.13)

Podemos interpretar k como um vetor de onda. A onda plana eik·r éconstante em qualquer plano perpendicular a k (desde que tais planos se-jam definidos pela equação k · r = constante) e é periódica numa direçãoparalela a k,com comprimento de onda

λ =2π

k(2.14)

conhecido como comprimento de onda de de Broglie.Agora aplicamos a condição de contorno (2.5). Isto impõe a k a condição

de que somente certos valores discretos sejam permitidos, pois a Eq. (2.5)só será satisfeita pela função de onda geral (2.6) somente se

eikxL = eikyL = eikzL = 1 (2.15)

Como ez = 1 somente se z = 2πin, onde n é um inteiro8, as componentesdo vetor de onda k devem ser da forma:

kx =2πnxL

, ky =2πnyL

, kz =2πnzL

, nx, ny, nz inteiros (2.16)

Então num espaço tridimensional com eixos cartesianos kx, ky e kz (con-hecido como espaço-k) os vetores de onda permitidos são aqueles cujascoordenadas ao longo dos três eixos são dados por múltiplos inteiros de2π/L. Isto está ilustrado na Figura 2.2 (em duas dimensões).Geralmente, a única utilização prática que se faz da condição de quanti-

zação (2.16) é a seguinte: às vezes precisa-se saber quantos valores permi-tidos de k estão contidos numa região do espaço-k que é muito grande emcomparação com 2π/L,e que portanto contém um número muito grande

8Sempre usamos a palavra ”inteiro” com o significado de inteiros positivos, zero ounegativos.

Page 37: Estado Solido, Ashcroft, Traduzido

34 2. Teoria de Sommerfeld de Metais

de pontos permitidos. Se a região for muito grande,9 então uma excelenteaproximação para se calcular o número de pontos permitidos é justamenteo volume do espaço-k contido nessa região, dividido pelo volume ocupadopor cada valor de k na rede dos valores permitidos de k. Este último vol-ume (veja Figura 2.2) é igual a (2π/L)3 . Concluímos, portanto, que, umaregião do espaço-k de volume Ω, conterá

Ω

(2π/L)3 =

ΩV

8π3(2.17)

valores permitidos de k, ou, equivalentemente, que o número de valores dek permitidos por unidade de volume do espaço-k (também conhecido comodensidade de níveis no espaço-k) é igual a

V

8π3(2.18)

Na prática, lidaremos com regiões do espaço-k tão grandes (∼ 1022 pontos)e regulares (tipicamente esferas) que, para todos os efeitos, as Eqs. (2.17) e(2.18) podem ser consideradas exatas. Brevemente, começaremos a aplicaressas importantes fórmulas de contagem.Como consideramos que os elétrons são não-interagentes, podemos con-

struir o estado fundamental de N -elétrons, colocando-se elétrons nos níveispermitidos de um-elétron que acabamos de determinar. O princípio de ex-clusão de Pauli tem um papel fundamental nesta construção (assim comoacontece com os estados atômicos de muitos elétrons): podemos colocar nomáximo um elétron em cada nível de um-elétron. Os níveis de um-elétronsão especificados pelos vetores de onda k e pela projeção do spin do elétronsobre um eixo arbitrário, que pode ter apenas um dos dois valores: +~/2 ou−~/2. Portanto, associados com cada vetor de onda k permitido existemdois níveis eletrônicos, um para cada direção do spin do elétron.Então, ao construirmos o estado fundamental de N -elétrons, começamos

colocando dois elétrons no nível de um-elétron com vetor de onda k = 0, quetem a menor energia de um-elétron possível, ε = 0. Continuamos, então,adicionando elétrons, preenchendo-se sucessivamente os níveis de energiamais baixa de um-elétron que ainda não estejam ocupados. Como a energiade um nível de um-elétron é diretamente proporcional ao quadrado de seuvetor de onda (veja (2.7)), então, quando N for muito grande a regiãoocupada será praticamente uma esfera.10 O raio dessa esfera é chamado dekF (F de Fermi), e seu volume Ω é igual a 4πk3F /3. De acordo com a Eq.

9E de forma não muito irregular; somente uma fração desprezível dos pontos deveriaestar dentro dos limites de O(2π/L) da superfície.10 Se a superfície não fosse esférica, não seria o estado fundamental, pois então constru-

iríamos um estado de energia mais baixa, movendo-se os elétrons de níveis mais distantesde k = 0 para níveis não-ocupados mais próximos da origem.

Page 38: Estado Solido, Ashcroft, Traduzido

2.1 Propriedades do Estado Fundamental do Gás de Elétrons 35

(2.17), o número de valores de k permitidos no interior da esfera éµ4πk3F3

¶µV

8π3

¶=k3F6π2

V (2.19)

Como cada valor de k permitido corresponde a dois níveis de um-elétron(um para cada valor do spin), para acomodarmos os N elétrons devemoster

N = 2 · k3F

6π2V =

k3F3π2

V (2.20)

Então, se temosN elétrons num volume V (i.e., uma densidade eletrônican = N/V ), o estado fundamental do sitema de N -elétrons é formado,preenchendo-se todos os níveis de uma-partícula com k menor do que kF ,deixando-se vazios todos aqueles níveis com k maior do que kF , onde kF édado pela condição:

n =k3F3π2

(2.21)

Este estado fundamental de elétron livre e independente é descrito poralgumas terminologias bastante triviais:A esfera de raio kF (vetor de onda de Fermi) contendo os níveis de um-

elétron ocupados é chamada de esfera de Fermi.A superfície da esfera de Fermi, que separa os níveis ocupados daqueles

não-ocupados é chamada de superfície de Fermi. (Veremos, a partir doCapítulo 8, que a superfície de Fermi é uma das construções fundamentaisna teoria moderna dos metais; em geral não é esférica.)O momento ~kF = pF dos níveis de um-elétron ocupados de mais alta

energia é conhecido como momento de Fermi; sua energia, εF =.~2k2F /2mé a energia de Fermi; e sua velocidade, vF = ~kF /m é a velocidade deFermi. O papel da velocidade de Fermi na teoria dos metais é comparávelao da velocidade térmica, v = (3kBT/m)

1/2 , no gás clássico.Todas essas quantidades podem ser calculadas em termos da densidade

dos elétrons de condução, via Eq. (2.21). Para estimá-las numericamente àsvezes é mais conveniente expressá-las em termos do parâmetro adimensionalrs/a0 (veja 6), que varia entre 2 a 6 para elementos metálicos. Juntas, asEqs. (1.2) e (2.21), nos dão:

kF =(9π/4)1/3

rs=1, 92

rs(2.22)

ou

kF =3, 63

rs/a0Å−1 (2.23)

Como o vetor de onda de Fermi é da ordem do inverso de Angstrons, ocomprimento de onda de de Broglie dos elétrons mais energéticos é daordem de Angstrons.

Page 39: Estado Solido, Ashcroft, Traduzido

36 2. Teoria de Sommerfeld de Metais

A velocidade de Fermi é

vF =

µ~m

¶kF =

4, 20

rs/a0× 108cm/s (2.24)

Esta é uma velocidade relativamente grande (da ordem de 1 por cento davelocidade da luz!). Do ponto de vista da mecânica estatística clássica esteresultado é surpreendente, pois, estamos descrevendo o estado fundamental(T = 0) e todas as partículas num gás clássico têm velocidades nulas a T =0. Mesmo à temperatura ambiente, a velocidade térmica (i.e., a velocidademédia) para uma partícula clássica com a mesma massa do elétron é apenasda ordem de 107cm/s.A energia de Fermi é convenientemente escrita na forma (como a0 =

~2/me2)

εF =~2k2F2m

=

µe2

2a0

¶(kF a0)

2 . (2.25)

Aqui, e2/2a0,conhecido como Rydberg (Ry), é a energia de ligação do es-tado fundamental do átomo de hidrogênio, 13, 6 eV.11 O Rydberg é umaunidade conveniente para medir energias atômicas, assim como o raio deBohr o é para as distâncias atômicas. Como kFa0 é da ordem da unidade,a Eq. (2.25) demonstra que a energia de Fermi tem a magnitude de umaenergia típica de ligação atômica . Usando (2.23) e a0 = 0, 529× 10−8cm,encontramos a forma numérica explícita:

εF =50, 1 eV

(rs/a0)2 , (2.26)

indicando um intervalos de energias de Fermi para as densidades metálicasentre 1, 5 e 15 eV.A Tabela 2.1 mostra as energias de Fermi, velocidades e vetores de onda

para metais, cujas densidades de elétrons de condução são dadas na Tabela1.1.Para calcular a energia do estado fundamental de N -elétrons no volume

V devemos somar as energias de todos os níveis de um-elétron que estejamdentro da esfera de Fermi12

E = 2Xk<kF

~2

2mk2 (2.27)

Em geral, ao somarmos qualquer função F (k) bem comportada sobre todosos valores permitidos de k, procede-se da seguinte maneira:

11No sentido exato, o rydberg é a energia de ligação na aproximação da massa dopróton infinita. Um elétron-volt é a energia adquirida por um elétron ao cruzar umpotencial de 1 volt; 1 eV = 1, 602× 10−12erg = 1, 602× 10−19Joule.12O fator 2 é devido aos dois níveis de spin permitidos para cada k.

Page 40: Estado Solido, Ashcroft, Traduzido

2.1 Propriedades do Estado Fundamental do Gás de Elétrons 37

Uma vez que o volume do espaço-k por valor permitido de k é ∆k =8π3/V (veja Eq. (2.18)) é conveniente escreverX

k

F (k) =V

8π3

Xk

F (k) ∆k (2.28)

para que, no limite quando ∆k → 0 (i.e., V → ∞), a soma PF (k) ∆kaproxime-se da integral

Rdk F (k) , com a condição de que F (k) não varie

apreciavelmente13 sobre distâncias no espaço-k da ordem de 2π/L. Podemosportanto rearranjar (2.28) e escrever

V →∞lim 1VkPF (k) =

R dk

8π3F (k) (2.29)

Ao aplicarmos a Eq. (2.29) a sistemas macroscopicamente grandes, masfinitos, sempre se considera que (1/V )

Pk F (k) difere muito pouco do

seu limite para volume infinito (por exemplo, considera-se que a energiaeletrônica por unidade de volume num cubo de cobre de arestas de 1 cm éa mesma que num cubo de 2 cm de arestas).Usando-se a Eq. (2.29) para calcular (2.27), encontramos que a densidade

de energia do gás de elétrons é

E

V=

1

4π3

Zk<kF

dk~2k2

2m=1

π2~2k5F10m

. (2.30)

Para se obter a energia por elétron, E/N, no estado fundamental, devemosdividir este resultado por N/V = n = k3F /3π

2, o que nos dá

E

N=3

10

~2k2Fm

=3

5εF . (2.31)

Podemos também escrever este resultado como

E

N=3

5kBTF , (2.32)

onde TF , a temperatura de Fermi, é

TF =εFkB

=58, 2

(rs/a0)2 × 104 K. (2.33)

Note que, ao contrário deste resultado, a energia por elétron num gás clás-

sico ideal,3

2kBT, se anula quando T = 0, e atinge um valor tão grande

quanto ao da Eq. (2.32), somente para T = 25TF ≈ 104 K.

13O caso mais famoso em que esta condição não é satisfeita é a condensação de umgás de Bose ideal. Nas aplicações em metais, este problema nunca aparece.

Page 41: Estado Solido, Ashcroft, Traduzido

38 2. Teoria de Sommerfeld de Metais

Dado a energia do estado fundamental E, pode-se calcular a pressãoexercida pelo gás de elétrons, através da relação P = − (∂E/∂V )N . ComoE = 3

5NεF e εF é proporcional a k2F ,que depende de V somente através do

fator n2/3 = (N/V )2/3 ,segue-se que14

P =2

3

E

V(2.34)

Pode-se também calcular a compressibilidade, K, ou seu inverso B =1/K, o módulo volumétrico, definido por

B =1

K= −V ∂P

∂V(2.35)

Como E é proporcional a V −2/3, a Eq. (2.34) mostra que P varia comoV −5/3 e, portanto,

B =5

3P =

10

9

E

V=2

3nεF (2.36)

ou

B =

µ6, 13

rs/a0

¶5× 1010 dyn/cm2 (2.37)

Na Tabela 2.2, comparamos os valores dos módulos volumétricos deelétrons livres (2.37) calculados de rs/a0, com os módulos volumétricosmedidos para vários metais. A concordância para os metais alcalinos maispesados é casualmente boa, mas mesmo quando a Eq. (2.37) dá valoresdistantes daqueles medidos experimentalmente, como no caso dos metaisnobres, ainda assim o resultado está dentro da ordem de grandeza correta(embora esse valores variem de três vezes para mais a três vezes para menos,pela tabela). É absurdo esperar que, apenas a pressão do gás de elétronslivres, deveria determinar completamente a resistência de um metal à com-pressão, mas a Tabela 2.2 demonstra que esta pressão é pelo menos tãoimportante quanto qualquer outro efeito..

2.2 Propriedades Térmicas do Gás de ElétronLivre: A Distribuição de Fermi-Dirac

Quando a temperatura é diferente de zero, é necessário examinar os estadosexcitados do sistema de N -elétrons, assim como seu estado fundamental,pois de acordo com os princípios básicos da mecânica estatística, se umsistema de N -elétrons está em equilíbrio térmico à temperatura T, entãosuas propriedades podem ser calculadas, tomando-se médias sobre todos

14A temperaturas diferentes de zero, a pressão e a densidade de energia continuamobedecendo a esta relação. Veja Eq. (2.101).

Page 42: Estado Solido, Ashcroft, Traduzido

2.2 Propriedades Térmicas do Gás de Elétron Livre: A Distribuição de Fermi-Dirac 39

os estados estacionários de N -partículas, atribuindo-se a cada estado deenergia E um peso PN (E) proporcional a e−E/kBT :

PN (E) =e−E/kBTPe−EN

α /kBT(2.38)

(Aqui ENα é a energia do α-ésimo estado estacionário do sistema de N -elétrons, a soma sendo sobre todos esses estados.)O denominador de (2.38) é conhecido como função de partição, e é rela-

cionada com a energia livre de Helmholtz, F = U−TS (onde U é a energiainterna e S,a entropia) porX

e−ENα /kBT = e−FN/kBT (2.39)

Podemos portanto escrever (2.38) na forma mais compacta:

PN (E) = e−(E−FN )/kBT (2.40)

Devido ao princípio de exclusão, para constuirmos um estado de N -elétrons devemos preencher N diferentes níveis de um-elétron. Então, cadaestado estacionário de N -elétrons pode ser especificado, relacionando-sequais dos N níveis de um-elétron estão ocupados naquele estado. Umaquantidade muito útil para se conhecer é fNi , a probabilidade de haverum elétron num determinado nível i, quando o sistema de N -elétrons estáem equilíbrio térmico.15 Esta probabilidade é simplesmente a soma dasprobabilidades independentes de se encontrar o sistema de N -elétrons emqualquer um daqueles estados de N -elétrons nos quais o i-ésimo nível estáocupado:

fNi =PPN

¡ENα

¢ (somatório sobre todos os estados αde N -elétrons nos quais existe umelétron no nível i de um-elétron).

(2.41)

Podemos calcular fNi , usando-se as três seguintes observações:1. Como a probabilidade de um elétron estar no nível i é igual a ummenosa probabilidade de nenhum elétron estar nesse nível (sendo estas as duasúnicas possibilidades permitidas pelo princípio de exclusão), poderíamosescrever igualmente bem a Eq. (2.41) como

fNi = 1−PPN¡ENγ

¢ (somatório sobre todos os estados γ deN -elétrons nos quais não existe nenhumelétron no nível i de um-elétron).

(2.42)

15No caso de interesse, i é especificado pelo vetor de onda do elétron k e pela projeçãos do spin do elétron sobre algum eixo.

Page 43: Estado Solido, Ashcroft, Traduzido

40 2. Teoria de Sommerfeld de Metais

2. Tomando-se qualquer estado de (N + 1)-elétrons no qual exista umelétron no nível i de um-elétron, podemos construir um estado de N -elétrons no qual o nível i esteja vazio, removendo-se simplesmente os elétronsdo i-ésimo nível, deixando-se inalterada a ocupação dos demais níveis. As-sim, qualquer estado de N -elétrons onde não exista elétron no nível i podeser construído a partir de um estado de (N+1)-elétrons com um elétron nonível i.16 Evidentemente, as energias de qualquer estado de N -elétrons e ocorrespondente estado de (N + 1)-elétrons diferem exatamente pelo valorde εi, a energia do único nível de um-elétron, cuja ocupação é diferentenos dois estados. Então, o conjunto das energias de todos os estados de N -elétrons com o nível i vazio é o mesmo que o conjunto das energias de todosos estados de (N + 1)-elétrons com o nível i ocupado, desde que todas asenergias deste último conjunto sejam subtraídas do valor de εi. Podemos,portanto, reescrever (2.42) na forma

fNi = 1−PPN¡EN+1α − εi

¢ (somatório sobre todos os estados αde (N + 1)-elétrons nos quais existeum elétron no nível i de um-elétron.)

(2.43)Mas, a Eq. (2.40) permite-nos escrever o termo na soma como

PN¡EN+1α − εi

¢= e(εi−µ)/kBT PN+1

¡EN+1α

¢, (2.44)

onde µ,conhecido como potencial químico, é dado, à temperatura T , por

µ = FN+1 − FN (2.45)

Substituindo-se esta expressão na Eq. (2.43), encontramos:

fNi = 1− e(εi−µ)/kBT PPN+1¡EN+1α

¢ (somatório sobre todos os estados αde (N + 1)-elétrons nos quais existeum elétron no nível i de um-elétron).

(2.46)Comparando-se o somatório em (2.46) com aquele em (2.41), encontra-seque (2.46) simplesmente assegura que

fNi = 1− e(εi−µ)/kBT fN+1i (2.47)

3. A Eq. (2.47) dá a relação exata entre as probabilidades do nível i deum-elétron estar ocupado tanto num sistema de N -elétrons quanto numde (N + 1)-elétrons, à temperatura T. Quando N é muito grande (esta-mos interessados em N da ordem de 1022) é um absurdo imaginar que, aoadicionarmos mais um elétron, alteraríamos apreciavelmente esta probabil-idade para mais que uns pouquíssimos níveis de um-elétron.17 Portanto,

16 Isto é, aquele obtido, ocupando-se todos aqueles niveis ocupados no estado de N-elétron mais o i-ésimo nível.17Para um nível típico, variando-se N por um, altera-se a probabilidade de ocupação

por um valor da ordem de 1/N . Veja Problema 4.

Page 44: Estado Solido, Ashcroft, Traduzido

2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 41

podemos substituir fN+1i por fNi em (2.47), o que a torna possível resolvê-la para fNi :

fNi =1

e(εi−µ)/kBT + 1(2.48)

Nas fórmulas a seguir eliminaremos a referência explícita à dependênciade fi com N,que é, em qualquer evento, levada em conta através do po-tencial químico µ; veja (2.45). O valor de N pode sempre ser calculado apartir de fi, observando-se que fi é o número médio de elétrons no nível ide um-elétron.18 Como o número total de elétrons N é igual à soma sobretodos os níveis do número médio em cada nível,

N =Xi

fi =Xi

1

e(εi−µ)/kBT + 1, (2.49)

que determina N como função da temperatura T e do potencial químico µ.Em muitas aplicações, todavia, são dados a temperatura e N (ou melhora densidade, n = N/V ). Em tais casos, a Eq. (2.49) pode ser usada paradeterminar o potencial químico µ em função de N e T, permitindo-o sereliminado das fórmulas subsequentes em favor da temperatura e da den-sidade. Porém, o potencial químico é de grande interesse termodinâmicona sua própria concepção. Algumas de suas propriedades mais importantessão sumarizadas no Apêndice B.19

2.3 Propriedades Térmicas do Gás de ElétronLivre: Aplicações da Distribuição deFermi-Dirac

Num gás de elétron livre e independente, os níveis de um-eléton são especi-ficados pelo vetor de onda k e pelo número quântico de spin s,com energiasque são independentes de s (na ausência de um campo magnético) e dadaspor (2.27); i.e.,

ε (k) =~2k2

2m(2.50)

18Prova : Um nível pode conter 0 ou 1 elétron (mais do que um é proibido pelo princípiode exclusão de Pauli). O número médio de elétrons é portanto 1 vezes a probabilidade de1 elétron mais 0 vezes a probabilidade de 0 elétron. Então, o número médio de elétronsno nível é numericamente igual à probabilidade desse nível estar ocupado. Note que istonão seria verdadeiro se fossem permitidas ocupações múltiplas do nível.19O potencial químico tem um papel fundamental, quando a distribuição (2.48) é

obtida no ensemble gran-canônico. Veja por exemplo, F. Reif, Statistical and ThermalPhysics, McGraw-Hill, New York, 1965, pág. 350. Nossa derivação um tanto não orto-doxa, que também pode ser encontrada no Reif, usa apenas o ensemble canônico.

Page 45: Estado Solido, Ashcroft, Traduzido

42 2. Teoria de Sommerfeld de Metais

Primeiro verificamos que a função de distribuição (2.49) é consistentecom as propriedades do estado fundamental (T = 0) derivadas acima. Noestado fundamental, os níveis são ocupados com ε (k) ≤ εF , tal que a funçãode distribuição para o estado fundamental deve ser:

fks = 1, ε (k) < εF

= 0, ε (k) > εF (2.51)

Por outro lado, quando T → 0,a forma limite da distribuição de Fermi-Dirac (2.48) é

limT→0

fks = 1, ε (k) < µ

= 0, ε (k) > µ (2.52)

Para que esses resultados sejam consistentes é necessário que

limT→0

µ = εF (2.53)

Veremos brevemente que para metais o potencial químico permaneceigual à energia de Fermi a um alto grau de precisão, de todo o modo atéa temperatura ambiente. Como resultado, as pessoas freqüentemente nãofazem nenhuma distinção entre as duas quantidades quando estão lidandocom metais. Porém, isto pode ser perigosamente engananoso. Em cálcu-los precisos é essencial manter-nos informados sobre até que ponto µ, opotencial químico, difere de seu valor de temperatura zero, εF .A aplicação mais importante da estatística de Fermi-Dirac é para o cál-

culo da contribuição eletrônica ao calor específico a volume constante deum metal,

cv =T

V

µ∂S

∂T

¶V

=

µ∂u

∂T

¶V

, u =U

V(2.54)

Na aproximação de elétron independente, a energia interna U é igual àsoma, sobre todos os níveis de um-elétron, de ε (k) vezes o número médiode elétrons no nível:20

U = 2Xk

ε (k) f (ε (k)) (2.55)

Introduzimos a função de Fermi f (ε) para enfatizar que fk depende de ksomente através da energia eletrônica ε (k):

f (ε) =1

e(ε−µ)/kBT + 1(2.56)

20Como de costume, o fator 2 reflete o fato de que cada nível-k pode conter doiselétrons com orientações de spin contrárias.

Page 46: Estado Solido, Ashcroft, Traduzido

2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 43

Dividindo-se ambos os membros de (2.55) pelo volume V, então (2.29)permite-nos escrever a densidade de energia u = U/V como

u =

Zdk

4π3ε (k) f (ε (k)) (2.57)

Se dividirmos também ambos os membros de (2.55) por V, então podemoscomplementar a Eq. (2.57) com uma equação para a densidade eletrônican = N/V,e usá-la para eliminar o potencial químico:

n =

Zdk

4π3f (ε (k)) (2.58)

No cálculo de integrais tais como as das Eqs. (2.57) e (2.58) da formaZdk

4π3F (ε (k)) (2.59)

deve-se às vezes explorar o fato de que o integrando depende de k, somenteatravés da energia eletrônica ε = ~2k2/2m, calculando-se a integral emcoordenadas esféricas e mudando-se da variável k para ε:Z

dk

4π3F (ε (k)) =

Z ∞0

k2 dk

π2F (ε (k)) =

Z ∞−∞

dε g (ε) F (ε) (2.60)

Aqui

g (ε) =m

~2π2

r2mε

~2, ε > 0

= 0, ε > 0(2.61)

Como a integral (2.59) é um cálculo de (1/V )Pks f (ε (k)) , a forma de

(2.60) mostra que

g (ε) dε =

µ1

V

¶× [o número de níveis de um-elétron no

intervalo de energia entre ε e ε+ dε](2.62)

Por esta razão, g (ε) é conhecida como densidade de níveis por unidadede volume (ou simplesmente, como densidade de níveis). Uma maneiradimensionalmente mais transparente de escrever g é

g (ε) =3

2

n

εF

µε

εF

¶1/2, ε > 0

= 0, ε > 0

(2.63)

onde εF e kF são definidos pelas equações (2.21) e (2.25) para temperaturazero. Uma quantidade particularmente importante sob o ponto de vista

Page 47: Estado Solido, Ashcroft, Traduzido

44 2. Teoria de Sommerfeld de Metais

numérico é a densidade de níveis na energia de Fermi, que (2.61) e (2.63)dão em duas formas equivalentes:

g (εF ) =mkF~2π2

(2.64)

ou

g (εF ) =3

2

n

εF(2.65)

Usando esta notação, reescrevemos (2.57) e (2.58) como:

u =

Zdε g (ε) ε f (ε) (2.66)

e

n =

Zdε g (ε) f (ε) (2.67)

Fazemos isto tanto por simplicidade de notação, como porque nesta formaa aproximação de elétron livre aparece somente através do cálculo partic-ular (2.61) ou (2.63) da densidade de níveis g. Podemos definir uma densi-dade de níveis, via (2.62), em termos dos quais (2.66) e (2.67) permanecemválidas para qualquer sistema de elétrons não-interagentes (ou seja, inde-pendente).21 Com isso, estamos preparados para aplicar, mais tarde, osresultados deduzidos de (2.67) e (2.67) para modelos consideravelmentemais sofisticados de elétrons independentes em metais.Em geral, as integrais (2.66) e (2.67) tem uma estrutura muito complexa.

Existe, porém, uma expansão sistemática simples que explora o fato de que,para quase todas as temperaturas de interesse em metais, T é ainda muitomenor do que a temperatura de Fermi (??). Na Figura 2.3, mostramos ográfico da função de Fermi f (ε) a T = 0 e à temperatura ambiente, paradensidades metálicas típicas (kBT/µ ≈ 0, 01). Evidentemente, f difere desua forma à temperatura zero apenas numa pequena região em torno deµ de largura igual a poucos kBT. Então, a maneira na qual as integraisda forma

R +∞−∞ H (ε) f (ε) dε diferem de seus valores à temperatura zero,R εF

−∞H (ε) f (ε) dε, será inteiramente determinada pela forma de H ( ε)próximo de ε = µ. SeH ( ε) não varia rapidamente numa faixa de energia daordem de kBT em torno de µ, a dependência da integral com a temperaturaseria dada, com bastante precisão pela substituição deH ( ε) pelos primeirostermos de sua expansão de Taylor em torno de ε = µ:

H ( ε) =∞Xn=0

dn

dεnH (ε)|ε=µ

(ε = µ)n

n!(2.68)

21Veja Capítulo 8.

Page 48: Estado Solido, Ashcroft, Traduzido

2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 45

Este procedimento é desenvolvido no Apêndice C. O resultado é umasérie da forma:

Z +∞

−∞H (ε) f (ε) dε =

Z µ

−∞H (ε) dε+

∞Xn=1

(kBT )2nand2n−1

dε2n−1H (ε)|ε=µ

(2.69)que é conhecida como expansão de Sommerfeld.22 Os an são constantes adi-mensionais da ordem da unidade. As funções H que normalmente encon-tramos, apresentam as maiores variações numa escala de energia da ordemde µ, e geralmente (d/dε)n H (ε)|ε=µ é da ordem de H (µ) /µn.Quando istofor o caso, os termos sucessivos na expansão de Sommerfeld são cada vezmenores por um fator da O (kBT/µ)

2 que é da O¡10−4

¢à temperatura

ambiente. Consequentemente, num cálculo real somente o primeiro e (oca-sionalmente) o segundo termos são mantidos na soma em (2.69). A formaexplícita desses termos é (Apêndice C):

R∞−∞H (ε) f (ε) dε

=R µ−∞H (ε) dε+

π2

6(kBT )

2H 0 (µ) +

7π4

360(kBT )

4H 000 (µ) +O

µkBT

µ

¶6(2.70)

Para calcular o calor específico de um metal a temperaturas baixas com-paradas com TF usamos a expansão de Sommerfeld (2.70) para as densi-dades de energia e de número eletrônicos (Eqs. (2.66) e (2.67)):

u =R µ0ε g (ε) dε+

π2

6(kBT )

2 [µg0 (µ) + g (µ)] +O¡T 4¢(2.71)

n =R µ0g (ε) dε+

π2

6(kBT )

2 g0 (µ) +O¡T 4¢

(2.72)

A Eq. (2.72), como veremos em detalhes, implica que µ difere de seu valorem T = 0, εF , por termos da ordem de T 2. Então, podemos escrever corre-tamente, até a ordem de T 2,

Z µ

0

H (ε) dε =

Z εF

0

H (ε) dε+ (µ− εF )H (εF ) (2.73)

22A expansão nem sempre é exata, mas é altamente confiável, a menos que H (ε)tenha uma singularidade muito próxima de ε = µ. Se, por exemplo, H for singularem ε = 0 (como é o caso para a densidade de níveis de elétrons livres (2.63), então aexpansão desprezará termos da ordem de exp (−µ/kBT ) , que são tipicamente da ordemde e−100 ≈ 10−63. Veja também Problema 1.

Page 49: Estado Solido, Ashcroft, Traduzido

46 2. Teoria de Sommerfeld de Metais

Se aplicarmos esta expansão às integrais (2.71) e (2.72), e substituirmos µpor ε nos termos já da ordem de T 2 nessas equações, encontramos

u =R εF0

ε g (ε) dε+ εF

½(µ− εF ) g (εF ) +

π2

6(kBT )

2g0 (εF )

¾+π2

6(kBT )

2g (εF ) +O

¡T 4¢ (2.74)

n =R εF0g (ε) dε+

½(µ− εF ) g (εF ) +

π2

6(kBT )

2g0 (µ)

¾(2.75)

Os primeiros termos independentes da temperatura do lado direito de(2.74) e (2.75) são exatamente os valores de u e n no estado fundamental.Como estamos calculando o calor específico a densidade constante, n éindependente da temperatura, e (2.75) reduz-se a

0 = (µ− εF ) g (εF ) +π2

6(kBT )

2 g0 (µ) (2.76)

que determina o desvio do potencial químico em relação a εF :

µ = εF − π2

6(kBT )

2 g0 (µ)g (εF )

(2.77)

Uma vez que g (ε) varia como ε1/2 para um gás de elétrons livres (veja Eq.(2.63)) isto dá

µ = εF

"1− 1

3

µnkBT

2εF

¶2#, (2.78)

que é, como havíamos afirmado acima, uma variação da ordem de T 2 etipicamente em torno de apenas 0, 01 por cento, mesmo à temperaturaambiente.A equação (2.76) torna nulo o termo entre chaves na Eq. (2.74), sim-

plificando assim a forma da densidade de energia térmica para densidadeeletrônica constante:

u = u0 +π2

6(kBT )

2 g (εF ) (2.79)

onde u0 é a densidade de energia no estado fundamental. O calor específicodo gás de elétrons é portanto

cv =

µ∂u

∂T

¶n

=π2

3k2B T g (εF ) (2.80)

ou, para elétrons livres (veja (2.65)),

cv =π2

2

µkBT

εF

¶nkB (2.81)

Page 50: Estado Solido, Ashcroft, Traduzido

2.3 Propriedades Térmicas do Gás de Elétron Livre: Aplicações da Distribuição de Fermi-Dirac 47

Comparando-se isto com o resultado clássico para um gás ideal, cv =3nkB/2, vemos que o efeito da estatística de Fermi-Dirac é diminuir ocalor específico por um fator

¡π2/3

¢(kBT/εF ) , que é proporcional à tem-

peratura, e mesmo à temperatura ambiente é somente da ordem de 10−2.Isto explica a ausência de qualquer contribuição observável dos graus deliberdade eletrônicos ao calor específico de um metal a temperatura ambi-ente.Sem levar em conta o valor numérico preciso do coeficiente, podemos en-

tender este comportamento do calor específico diretamente da dependênciada função de Fermi com a temperatura. O aumento da energia dos elétrons,quando elevamos a temperatura a partir de T = 0 é devido inteiramente àexcitação de alguns elétrons com energias dentro de uma faixa de O (kBT )abaixo de εF (região com sombreado escuro da Figura 2.4) para uma faixade energia de O (kBT ) acima de εF (região com sombreado mais claro daFigura 2.4) O número de elétrons por unidade de volume que são excitadosé o produto da largura da faixa de energia, kBT, pela densidade de níveispor unidade de volume g (εF ) . Além disso, a energia de excitação é da or-dem de kBT, e então a densidade de energia térmica total é da ordem deg (εF ) (kBT )

2 acima da energia do estado fundamental. Isto difere do re-sultado exato (2.79) por um fator de π2/6, mas dá uma idéia física simples,e é útil para uma estimativa grosseira.A predição de um calor específico variando linearmente com a temper-

atura é uma das mais importantes consequências da estatística de Fermi-Dirac, e além disso ainda fornece um teste simples da teoria do gás deelétrons num metal, contanto que se possa estar seguros de que graus deliberdade diferentes do eletrônico não fazem contribuições comparáveis ouaté maiores que estes. Como acontece, os graus de liberdade iônicos dom-inam completamente o calor específico a temperaturas altas. Porém, bemabaixo da temperatura ambiente sua contribuição decresce com o cuboda temperatura (Capítulo 23) e a temperaturas muito baixas tornam-semenores do que a contribuição eletrônica, que só decresce linearmente comT . Com o objetivo de separar essas duas contribuições tornou-se de praxetraçarmos o gráfico de cv/T contra T 2, pois se as contribuições eletrônicase iônicas juntas comportam-se, a baixas temperaturas, como

cv = γT +AT 3 (2.82)

então

cvT= γ +AT 2 (2.83)

Assim, podemos encontrar γ extrapolando-se a curva cv/T linearmente atéT 2 = 0,e notando onde ela intercepta o eixo cv/T. Medidas de calores

Page 51: Estado Solido, Ashcroft, Traduzido

48 2. Teoria de Sommerfeld de Metais

específicos metálicos apresentam um termo linear que se torna comparávelao termo cúbico para poucos graus Kelvin.23

Dados do calor específico são usualmente apresentados em Joule (ou calo-ria) por mol por grau Kelvin. Como um mol de elétrons livres num metalcontém ZNA elétrons de condução (onde Z é a valência e NA é o número deAvogadro) e ocupa um volume ZNA/n, devemos multiplicar a capacidadetérmica por unidade de volume, cv, por ZNA/n para obter a capacidadetérmica por mol, C :

C =π2

3ZR

kBT g (εF )

n(2.84)

onde R = kBNA = 8, 314 J/mol = 1, 99 cal/mol. Usando a densidade deníveis de elétrons livres (2.65) e o cálculo (2.33) de εF /kB, encontramosuma contribuição dos elétrons livres à capacidade térmica por mol de C =γT,onde

γ =1

2π2R

Z

TF= 0, 169Z

µrsa0

¶2× 10−4 cal-mol−1-K−2 (2.85)

Algumas medidas de γ são mostradas na Tabela 2.3, juntamente com osvalores para elétrons livres derivados de (2.85) e dos valores de rs/a0 naTabela 1.1. Note que os metais alcalinos continuam sendo razoavelmentebem descritos pela teoria de elétrons livres, assim como os metais nobres(Cu, Ag, Au). Porém, observe também a grande discrepância no Fe e Mn(os valores experimentais são dez vezes os valores teóricos), assim comoaquelas no Bi e Sb (experimental da ordem de 0, 1 vezes a teoria). Essesgrandes desvios são agora qualitativamente entendidos sobre fundamentosbastante gerais e retornaremos a eles no Capítulo 15.

2.4 Teoria de Sommerfeld da Condução em Metais

Para encontrar a distribuição de velocidades para elétrons em metais, con-sidere uma pequena região24 do espaço-k em torno de um ponto k, devolume dk. Permitindo-se a dupla degenerescência do spin, o número de

23Uma vez que a densidade constante é difícil de se realizar experimental, geralmentemede-se o calor específico a pressão constane, cp. Porém, podemos mostrar (Problema2) que para um gás de elétron livre metálico à temperatura ambiente ou mais baixa,cp/cv = 1+O (kBT/εF )

2 . Assim, a temperaturas onde a contribuição ao calor específicotorna-se observável (a uns poucos graus Kelvin) os dois calores específicos diferem poruma pequena quantidade.24Pequena, no sentido de que a função de Fermi e outras funções de interesse variem

muito pouco dentro do elemento de volume; mas, grande o bastante para que este volumecontenha muitos níveis de um-elétron.

Page 52: Estado Solido, Ashcroft, Traduzido

2.4 Teoria de Sommerfeld da Condução em Metais 49

níveis de um-elétron neste elemento de volume é (veja (2.18))µV

4π3

¶dk (2.86)

A probabilidade de que cada nível seja ocupado é f (ε (k)) , e, portanto, onúmero total de elétrons no elemento de volume do espaço-k é

V

4π3f (ε (k)) dk, ε (k) =

~2k2

2m(2.87)

Como a velocidade de um elétron livre com vetor de onda k é v = ~k/m(Eq. (2.12)), o número de elétrons num elemento de volume dv, em tornode v, é o mesmo que num elemento de volume dk = (m/~)3 dv em tornode k = mv/~. Consequentemente, o número total de elétrons por unidadede volume do espaço real num elemento de volume do espaço da velocidadedv em torno de v é

f (v) dv (2.88)

onde

f (v) =(m/~)3

4π31

exp£¡12mv

2 − µ¢ /kBT ¤+ 1 (2.89)

Sommerfeld reexaminou o modelo de Drude, substituindo a distribuiçãode velocidades clássica de Maxwell-Boltzmann (2.1) pela distribuição deFermi-Dirac (2.89). A utilização de uma distribuição de velocidade, con-struída a partir de argumentos quantum-mecânicos, na teoria clássica, queé obtida a partir de argumentos muito diferentes, precisa ser justificada. 25

Pode-se descrever o movimento de um elétron classicamente somente se forpossível especificar sua posição e momento com a precisão necessária, semviolar o princípio da incerteza.26

Um elétron típico num metal tem um momento da ordem de ~kF , talque a incerteza em seu momento, ∆p,deve ser pequena comparada com~kF para que se tenha uma boa descrição clássica. Como, de (2.22), kF ∼1/rs,então a incerteza na posição deve satisfazer

∆x ∼ ~∆p

>>1

kF∼ rs (2.90)

25Uma justificação analítica detalhada é razoavelmente complicada para construir,da mesma maneira que é uma questão bastante sutil se especificar com generalidade eprecisão, quando a teoria quântica pode ser substituída por seu limite clássico. Porém,as bases físicas são simples.26Também há uma limitação um pouco mais especializada sobre o uso da mecânica

clássica descrevendo elétrons de condução. A energia de movimento de um elétron noplano perpendicular ao campo magnético uniforme aplicado é quantizado em múltiplosde ~ωc (Capítulo 14). Até mesmo para campos tão grande quanto 104 Gauss, esta éenergia muito pequena, mas em amostras apropriadamente preparadas a temperaturasde alguns graus Kelvin, estes efeitos quânticos tornam-se observáveis, e são, de fato, degrande importância prática.

Page 53: Estado Solido, Ashcroft, Traduzido

50 2. Teoria de Sommerfeld de Metais

onde, de (1.2), rs é da ordem da distância média entre elétrons - i.e., deAngstrons. Assim, torna-se impossível usar a descrição clássica se tivermosque considerar elétrons localizados dentro dos limites das distâncias atômi-cas (também da ordem de Angstrons). Porém, os elétrons de condução nummetal não são ligados a íons particulares, mas podem vagar livremente pelovolume do metal. Numa amostra macroscópica, para todos os propósitos,não é necessário especificar a posição de um elétron com uma precisão de10−8cm. O modelo de Drude presume o conhecimento da posição de umelétron fundamentalmente apenas nos dois seguintes contextos:

1. Quando são aplicados campos eletromagnéticos ou gradientes de tem-peratura variando espacialmente, deve-se poder especificar a posiçãode um elétron sobre uma escala pequena comparada com a distânciaλ, sobre a qual os campos ou gradientes de temperatura variam. Paraa maioria das aplicações, os campos ou gradientes de temperaturaaplicados não variam apreciavelmente sobre a escala de Angstroms, ea precisão necessária para definir a posição do elétron não conduz auma incerteza inaceitavelmente grande em seu momento. Por exem-plo, o campo elétrico associado com a luz visível só varia apreciavel-mente sobre uma distância da ordem 103 Å. Porém, se comprimentode onda é muito menor que este (por exemplo, raios-X), tem-se queusar a mecânica quântica para descrever o movimento eletrônico in-duzido pelo campo.

2. Existe também uma suposição implícita no modelo de Drude de quese pode localizar um elétron dentro dos limites de substancialmentemenos que um caminho livre médio `, e então se deveria suspeitardos argumentos clássicos, quando ocorrem caminhos livres médiosmuito menores do que dezenas de Angstroms. Felizmente, como ver-emos abaixo, os caminhos livres médios em metais são da ordem de100 Å à temperatura ambiente e tornam-se ainda maiores, quando atemperatura diminui.

Existe então um grande número de fenômenos em que o comportamentode um elétron metálico é bem descrito pela mecânica clássica. Todavia,não é assim tão óbvio que o comportamento de N tais elétrons possamser descritos dessa maneira. Como o princípio de exclusão de Pauli afetaprofundamente a estatística de N eletrons, por que não teria efeitos simi-larmente drásticos sobre sua dinâmica? Que esta preocupação não procede,segue-se de um teorema elementar que apresentamos sem prova, uma vezque esta prova, embora simples, possui uma notação muito pesada:Considere um sistema de N elétrons, cujas interações entre eles são ig-

noradas, e que estão sujeitos a campo eletromagnético arbitrário, variandotanto no espaço quanto no tempo. Seja o estado de N -elétrons no instante 0formado pela ocupação de um determinado grupo de níveis de um-elétron,ψ1 (0) , ...,ψN (0) . Seja ψj (t) o nível ψj (0) , que evoluiria no tempo t sob a

Page 54: Estado Solido, Ashcroft, Traduzido

2.4 Teoria de Sommerfeld da Condução em Metais 51

influência do campo eletromagnético se existisse apenas um único elétronpresente, que estivesse no estado ψj (0) no tempo zero. Então, a formacorreta do estado de N -elétrons no instante t será aquele formado pelaocupação do conjunto de N níveis de um-elétron ψ1 (t) , ...,ψN (t) .Assim, o comportamento dinâmico de um sistema de N elétrons não-

interagentes é completamente determinado, considerando-se N problemasindependentes de um-elétron. Em particular, se a aproximação clássica forválida para cada um desses problemas de um-elétron, ela também seráválida para o sistema de N -elétrons como um todo.27

A utilização da estatística de Fermi-Dirac afeta somente aquelas prediçõesdo modelo de Drude que requerem o conhecimento da distribuição da ve-locidade eletrônica para seus cálculos. Se a taxa 1/τ , na qual os elétronssofrem colisões, não depender de sua energia, então somente as estimativasdo caminho médio livre eletrônico e os cálculos da condutividade térmicae termopotência serão afetados pela mudança da função de distribuição deequilíbrio.

Caminho Livre Médio Usando vF (Eq. (2.24)) como uma medida davelocidade eletrônica típica, podemos calcular o caminho livre médio ` =vF τ da Eq. (1.8) como segue:

` =(rs/a0)

2

ρµ× 92 Å (2.91)

Uma vez que a resistividade em microhom centímetros, ρµ,tipicamenteestá entre 1 a 100 à temperatura ambiente, e como rs/a0 está entre 2a 6, podemos encontrar caminhos livres médios da ordem de centenas deAngstrons mesmo à temperatura ambiente.28

Condutividade Térmica Podemos ainda estimar a condutividade tér-mica pela Eq. (1.51):

κ =1

3v2τcv (2.92)

O calor específico correto é menor do que aquele usado por Drude porum fator da ordem de kBT/εF ; a estimativa correta de v2 não é a veloci-dade média térmica quadrática clássica, kBT/m, mas sim v2F = 2εF /m,

27Note que isto implica que se qualquer configuração clássica for consistente com oprincípio de exclusão de Pauli em t = 0 (i.e., existindo menos que um elétron de cadaspin por unidade de volume, em qualquer região do espaço dos momentos de volumedp = (2π~)3 /V ) esta permanecerá consistente com o princípio de exclusão em todos ostempos futuros. Este resultado pode também ser provado por um raciocínio puramenteclássico como um corolário direto do teorema de Liouville. Veja Capítulo 12.28Talvez seja da mesma maneira também que Drude calculou `, usando a velocidade

térmica clássica muito menor, ou ele poderia ter ficado muito confuso com tais caminhoslivres médios longos a ponto de abandonar outras investigações.

Page 55: Estado Solido, Ashcroft, Traduzido

52 2. Teoria de Sommerfeld de Metais

que é maior do que o valor clássico por um fator da ordem de εF /kBT.Substituindo-se esses valores em (2.92) e eliminando-se o tempo de relax-ação através da Eq. (1.6), encontra-se

κ

σT=

π2

3

µkBe

¶2= 2, 44× 10−8W-Ω/K2 (2.93)

Este resultado é bastante próximo do excelente valor obtido casualmentepor Drude, graças a duas correções compensadoras da ordem de kBT/εF ,e está em excelente concordância com os dados experimentais da Tabela1.6. Como veremos (Capítulo 13) este valor do número de Lorentz é muitomelhor do que poderia sugerir a derivação muito grosseira de (2.93).

Termopotência A sobreestimativa de Drude da termopotência, é tam-bém, resolvida com a aplicação da estatística de Fermi-Dirac. Substituindo-se o calor específico da Eq.(2.81) na Eq. (1.59), encontramos

Q = −π2

6

kBe

µkBT

εF

¶= −1, 42

µkBT

εF

¶× 10−4V/K (2.94)

que é menor do que o estimado por Drude (Eq. (1.60)) por OµkBT

εF

¶∼

0, 01 à temperatura ambiente.

Outras Propriedades Como a forma da distribuição da velocidadeeletrônica não entra no cálculo da condutividades DC ou AC, do efeitoHall ou da magnetorresistência, as estimativas dadas no Capítulo 1 contin-uam a mesma tanto com a estatística de Maxwell-Boltzamann como a deFermi-Dirac.Isto não é o caso, porém, se usamos um tempo de relaxação dependente

da energia. Se, por exemplo, se pensasse que os elétrons colidissem comcentros espalhadores fixos, então, seria natural considerar o caminho livremédio independente da energia, e então um tempo de relaxação igual aτ = `/v ∼ `/ε1/2. Pouco tempo depois que Drude apresentou o modelode gás de elétrons para um metal, H. A. Lorentz mostrou, usando a dis-tribuição de velocidade clássica de Maxwell-Boltzmann, que um tempo derelaxação dependente da energia implicaria na dependência das condutivi-dades DC e AC com a temperatura, assim como uma magnetoresistêncianão nula e o coeficiente de Hall dependente da temperatura. Como agora jápodemos esperar da inadequabilidade da distribuição de velocidade clássica,nenhuma dessas correções melhoraram a discrepância do modelo de Drudeem relação às observações feitas sobre os metais.29 Além disso, veremos(Capítulo 13) que, quando usamos a correta distribuição de Fermi-Dirac

29O modelo de Lorentz, porém, é muito importante na descrição de semicondutores(Capítulo 29).

Page 56: Estado Solido, Ashcroft, Traduzido

2.5 Problemas 53

a introdução da dependência da energia para o tempo de relaxação temefeito pouco significante sobre a maioria das quantidades de interesse nummetal.30 Se calcularmos as condutividades DC e AC, a magnetorresistênciaou o coeficiente Hall, admitindo-se uma dependência de τ (ε) com a energia,os resultados encontrados são os mesmos que aqueles que teríamos calcu-lado considerando-se um τ independente da energia, igual a τ (εF ). Nosmetais, essas quantidades são determinadas quase que exclusivamente pelaforma com que os elétrons, próximos do nível de Fermi, são espalhados.31

Esta é uma outra consequência muito importante do princípio de exclusãode Pauli, cuja justificativa será dada no Capítulo 13.

2.5 Problemas

1. Gás de elétron livre e independente em duas dimensões

(a) Qual é a relação entre n e kF em duas dimensões?

(b) Qual é a relação entre kF e rs em duas dimensões?

(c) Prove que, em duas dimensões, a densidade de níveis de elétronslivres g (ε) é uma constante independente de ε, para ε > 0, e 0para ε < 0. Qual é o valor dessa constante?

(d) Mostre que, em consequência de g (ε) ser constante, qualquertermo na expansão de Sommerfeld para n se anula, com exceçãodo termo T = 0. Deduza que µ = εF para qualquer temperatura.

(e) Mostre, usando a Eq. (2.67), que, quando g (ε) é da forma comono item (c), então

µ+ kBT ln³1 + e−µ/kBT

´= εF . (2.95)

(f) Usando (2.95, faça uma estimativa da quantidade pela qual µdifere de εF . Comente sobre o significado numérico desta ”falha”da expansão de Sommerfeld, e sobre as razões matemáticas paraessa ”falha”.

2. Termodinâmica de um gás de elétron livre e independente

30A termopotência é a exceção mais relevante.31Essa afirmação é correta até a ordem de kBT/εF , mas em metais este é sempre um

bom parâmetro de expansão.

Page 57: Estado Solido, Ashcroft, Traduzido

54 2. Teoria de Sommerfeld de Metais

(a) Deduza, usando as identidades termodinâmicas

cv =

µ∂u

∂T

¶n

= T

µ∂s

∂T

¶n

, (2.96)

das Eqs. (2.56) e (2.57), e da terceira lei da termodinâmica (s→0 quando T → 0), que a densidade de entropia, s = S/V , é dadapor

s = −kBZdk

4π3[f ln f + (1− f) ln (1− f)] , (2.97)

onde f (ε (k)) é a função de Fermi (Eq. (2.56)).(b) Sabendo-se que a pressão P satisfaz a Eq. (B.5) do Apêndice B,

P = − (u− T s− µn) , deduza, a partir de (2.97), que

P = kBT

Zdk

4π3ln

Ã1 + exp

"−¡~2k2/2m

¢− µkBT

#!(2.98)

Mostre que (2.98) implica que P é uma função homogênea de µe T de grau 5/2; isto é,

P (λµ,λT ) = λ 5/2P (µ, T ) (2.99)

para qualquer constante λ .(c) Deduza das relações termodinâmicas no Apêndice B queµ

∂P

∂µ

¶T

= n,

µ∂P

∂T

¶µ

= s (2.100)

(d) Mostre, por diferenciação da Eq. (2.99) com relação a λ,que asrelação (2.34) para o estado fundamental mantém-se válida, emqualquer temperatura, na forma

P =2

3u (2.101)

(e) Mostre que, quando kBT << εF , a razão entre o calor especí-fico a pressão constante e o calor específico a volume constantesatisfaz µ

cpcv

¶− 1 = π2

3

µkBT

εF

¶2+O

µkBT

εF

¶4(f) Mostre, levando mais termos na expansão de Sommerfeld de u

e n, que a capacidade térmica eletrônica correta até a ordem deT 3 é dada por

cv =π2

3k2BT g (εF )

−π4

90k4BT

3g (εF )

"15

µg0 (εF )g (εF )

¶2− 21

Ãg00(εF )

g (εF )

!#(2.102)

Page 58: Estado Solido, Ashcroft, Traduzido

2.5 Problemas 55

3. Limite clássico da estatística de Fermi-Dirac

A distribuição de Fermi-Dirac reduz-se à distribuição de Maxwell-Boltzmann, quando a função de Fermi (2.56) for muito menor do quea unidade para qualquer valor positivo de ε, pois neste caso teremos

f (ε) ≈ e−(ε−µ)/kBT (2.103)

A condição necessária e suficiente para que a Eq. (2.103) seja válidapara todo ε positivo é

e−µ/kBT À 1 (2.104)

(a) Considerando válida a relação (2.104), mostre que

rs = e−µ/3kBT 31/3 π1/6 ~ (2mkBT )−1/2 (2.105)

Juntamente com (2.104), isto requer que

rs ˵

~2

2mkBT

¶1/2, (2.106)

que também pode ser considerada como a condição para a vali-dade da estatística clássica.

(b) Qual é o significado da medida que rs deve exceder?(c) Mostre que (2.106) dá origem à condição numérica

rsa0˵105 KT

¶1/2(2.107)

(d) Mostre que a constante de normalização m3/4π3~3, que aparecena distribuição de velocidade de Fermi (2.2) pode também serescrita como (3

√π/4)n (m/2πkBTF )

3/2 tal que fB (0) /f (0) =(4/3√π) (TF /T )

3/2

4. Insensibilidade da função de distribuição a pequenas vari-ações no número total de elétrons

Ao derivarmos a distribuição de Fermi (página 40), argumentamosque a probabilidade de ocupação de um dado nível não mudaria apre-ciavelmente, quando variamos por um o número total de elétrons. Ver-ifique que a função de Fermi (2.56) é compatível com esta hipótese,da seguinte maneira:

(a) Mostre, quando kBT ¿ εF , que quando variamos o número deelétron por um, a uma temperatura fixa, o potencial químicosofrerá uma varaiação igual a

∆µ =1

V g (εF )(2.108)

onde g (ε) é a densidade de níveis.

Page 59: Estado Solido, Ashcroft, Traduzido

56 2. Teoria de Sommerfeld de Metais

(b) Mostre, como consequência disto, que a variação máxima que aprobabilidade de ocupação de um nível f pode sofrer é igual a

∆f =1

6

εFkBT

1

N(2.109)

[Use o cálculo de g (εF ) para elétrons livres (2.65).] Mesmoque temperaturas de miligraus Kelvin possam ser atingidas, nasquais εF /kBT ≈ 108, ∆f ainda é desprezível, quando N for daordem de 1022.

Page 60: Estado Solido, Ashcroft, Traduzido

This is page 57Printer: Opaque this

3Redes Cristalinas

Quem nunca andou pelos departamentos de história natural de museussurpreende-se, às vezes, ao aprender que os metais, tal como a maioria deoutros sólidos, são cristalinos, pois embora sejam usadas as característicascristalinas óbvias do quartzo, diamante, sal-gema, as faces planas carac-terísticas, formando ângulos agudos entre si, estão ausentes nos metaisnas suas formas mais comumente encontradas. Porém, aqueles metais queocorrem naturalmente no estado metálico são muitas vezes encontrados naforma cristalina, o que é completamente mascarada nos produtos metálicosindustrializados devido a grande maleabilidade dos metais, que os permiteadaptarem-se a qualquer forma macroscópica que desejarmos.O verdadeiro teste da cristalinidade não está na aparência superficial

de uma amostra grande, mas sim se, numa escala microscópica, os íonsestão distribuídos num arranjo periódico.1 Esta regularidade microscópicabásica da matéria cristalina foi tomada como hipótese por ser uma maneiraóbvia de explicar as regularidades geométricas de cristais macroscópicos,nos quais as faces planas formam somente determinados ângulos entre si.Esta hipótese foi confirmada experimentalmente em 1913, através do tra-balho de W. Bragg e L. Bragg, que inventaram a cristalografia de raio-X ecomeçaram a investigar como os átomos são distribuídos nos sólidos.

1Às vezes, uma amostra é feita de muitos pequenos pedaços, cada um, grande com-parados com a escala microscópica, e contendo um grande número de íons distribuídosperiodicamente. Este estado “policristalino” é mais comumente encontrado do que umúnico cristal macroscópico, no qual a periodicidade é perfeita, estendendo-se através detoda a amostra.

Page 61: Estado Solido, Ashcroft, Traduzido

58 3. Redes Cristalinas

Antes de descrevermos como determinar a estrutura microscópica dossólidos por difração de raio-X, e como essas estruturas afetam as pro-priedades físicas fundamentais, é útil estudarmos algumas das propriedadesgeométricas mais importantes dos arranjos cristalinos no espaço tridimen-sional. Essas considerações puramente geométricas estão implícitas em quasetodas as análises que encontramos na física do estado sólido, e serão seguidasneste capítulo e nos Capítulos 5 e 7. A primeira das muitas aplicações dessesconceitos será feita para a difração de raio-X no Capítulo 6.

3.1 Rede de Bravais

Um conceito fundamental na descrição de qualquer sólido cristalino é oda rede de Bravais, que especifica o arranjo periódico no qual as unidadesrepetidas do cristal são distribuídas. Essas unidades podem ser um únicoátomo, grupos de átomos, moléculas, íons, etc, mas a rede de Bravais de-screve apenas a geometria da estrutura periódica, independente da naturezadessas unidades. A seguir, damos duas definições equivalente para rede deBravais:

(a) Uma rede de Bravais é um arranjo infinito de pontos dispostos e orien-tados de tal maneira que parece exatamente o mesmo, independentedo ponto do qual a estrutura é observada.

(b) Uma rede de Bravais (tridimensional) é o conjunto de todos os pontos,cujas posições são definidas pelos vetores R, da forma

R = n1a1 + n2a2 + n3a3 (3.1)

onde a1,a2 e a3 são quaisquer três vetores não-coplanares, e n1, n2e n3 são quaisquer números inteiros.2 Então, o ponto

Pniai é al-

cançado, movendo-se ni passos3 de comprimento |ai| na direção deai, para i = 1, 2 e 3.

Os vetores ai que aparecem na definição (b) de uma rede de Bravais sãochamados de vetores primitivos e são ditos gerar ou cobrir a rede.Precisa-se de um pouco de reflexão para se ver que as duas definições de

uma rede de Bravais são equivalentes. Torna-se evidente, logo que enten-demos ambas as definiçòes, que qualquer arranjo satisfazendo (b) tambémsatisfaz (a). Porém, não é óbvio o argumento de que qualquer arranjo sat-isfazendo (a) possa ser gerado por um conjunto apropriado de três vetores

2Continuamos com a convenção de que ”inteiro” significo inteiro positivo, zero ounegativo.

3Quando n é negativo, n passos numa direção significam n passos na direção oposta.O ponto alcançado, certamente, não depende da ordem em que os passos n1 + n2 + n3são realizados.

Page 62: Estado Solido, Ashcroft, Traduzido

3.2 Redes Infinitas e Cristais Finitos 59

primitivos. A prova para isto consiste numa receita explícita para construirtrês vetores primitivos. A construção é dada no Problema 8a.A Figura 4.1 mostra uma parte de uma rede de Bravais bidimensional.4

Vê-se claramente que a definição (a) é satisfeita, e o vetores primitivos a1e a2 requeridos pela definição (b) são mostrados na figura. Mostra-se naFigura 4.2 uma das mais familiares redes de Bravais tridimensional, a redecúbica simples. Sua estrutura especial é devida ao fato de que ela pode sergerada por três vetores mutuamente ortogonais e de comprimentos iguais.É importante observar que não só a disposição, mas também a orien-

tação devem ser as mesmas vistas de qualquer ponto da rede de Bravais.Considere os vértice de uma ”colméia” bidimensional (Figura 4.3). O ar-ranjo dos pontos, quando visto de pontos adjacentes, só é o mesmo se apágina for girada por 180o cada vez que nos movemos de um ponto parao próximo. As relações estruturais são as mesmas, mas as relações orienta-cionais não, tal que os vértices de uma colméia bidimensional não formamuma rede de Bravais. Um caso de maior interesse prático, satisfazendo àsexigências estruturais, mas não às orientacionais da definição (a), é a redetridimensional hexagonal com agrupamento compacto, que será descritamais adiante.

3.2 Redes Infinitas e Cristais Finitos

Uma vez que todos os pontos são equivalente, a rede de Bravais deve serinfinita em extensão. Evidentemente, os cristais reais são finitos, mas seeles forem suficietemente grandes, a grande maioria dos pontos estarão tãodistantes da superfície que não serão afetados por sua existência. Então, asimulação de um sistema infinito é uma idealização muito útil. Se estivermosinteressados nos efeitos de superfície, a noção de uma rede de Bravais aindaé relevante, mas agora devemos supor que o cristal preencha apenas umaporção da rede de Bravais ideal.Frequentemente, consideram-se os cristais finitos, não porque os efeitos

de superfície sejam importante, mas simplesmente por conveniência con-ceitual, do mesmo modo que no Capítulo 2 colocamos o elétron numa caixacúbica de volume V = L3. Geralmente, escolhe-se uma forma mais simplespossível para a região finita da rede de Bravais. Dados os três vetores prim-itivas a1,a2 e a3,usualmente, considera-se a rede finita de N sítios como oconjunto pontos da forma: R = n1a1 + n2a2 + n3a3, onde 0 ≤ n1 ≤ N1,0 ≤ n2 ≤ N2, 0 ≤ n3 ≤ N3 e N = N1N2N3. Este artifício está intimamenterelacionado com a generalização, para sistemas cristalinos, das condiçõesde contorno periódicas usadas no Capítulo 2.

4Uma rede de Bravais bidimensional é também conhecida como malha.

Page 63: Estado Solido, Ashcroft, Traduzido

60 3. Redes Cristalinas

3.3 Mais Ilustrações e Exemplos Importantes

Das duas definições de rede de Bravais, a definição (b) é matematicamentemais precisa e é o ponto de partida óbvio para qualquer tabalho analítico.Porém, ela tem dois pequenos defeitos. Primeiro, para qualquer rede deBravais, o conjunto de vetores primitivos não é único — pelo contrário,existe uma infinidade de escolhas não equivalentes (veja Figura 4. 1) — eé desagradável (e às vezes enganador) confiar plenamente numa definiçãoque enfatize uma particular escolha. Segundo, quando apresentada comum arranjo particular de pontos, usualmente pode-se dizer num relance sea primeira definição é satisfeita, embora a existência de um conjunto devetores primitivos, ou uma prova de que tal conjunto não exista, seja maisdifícil de perceber imediatamente.Considere, por exemplo, a rede cúbica de corpo centrada (bcc), formada

a partir da rede cúbica simples (Figura 4.2) (cujos sítios agora rotulamosde A), acrescentando-se um ponto adicional, B, no centro de cada cubo(Figura 4.5). À primeira vista, poder-se-ia pensar que os pontos centrais Bconduzem a relações diferentes daquelas dos pontos A dos vértices. Porém,podemos imaginar que os pontos centrais B sejam pontos dos vértices deuma segunda rede cúbica simples. Neste novo arranjo, os pontos A dosvértices da rede cúbica original são os novos pontos centrais. Então, todosos pontos têm vizinhança idêntica, de maneira que a rede cúbica de corpocentrado é uma rede de Bravais. Se a rede cúbica original é gerada pelosvetores primitivos

ax, ay, az (3.2)

onde x, y e z são três vetores unitários ortogonais, então um conjunto devetores primitivos para a rede cúbica de corpo centrado seria (Figura 4.6)

a1 = ax, a2 = ay, a3 =a

2(x+ y + z) (3.3)

Um conjunto mais simétrico desses vetores (veja Figura 4.7) é

a1 =a

2(y+ z− x) , a2 = a

2(x+ z− y) , a3 = a

2(x+ y− z) . (3.4)

É importante se convencer, do ponto de vista geométrico e analítico, de queesses conjuntos de vetores primitivos realmente geram a rede de Bravais bcc.Um outro exemplo, igualmente importante, é a rede cúbica de face cen-

trada (fcc). Para contruí-la, acrescenta-se um ponto adicional no centro decada face quadrada da rede cúbica simples (Figura 4.8). Para facilitar a de-scrição, vamos imaginar que cada cubo na rede cúbica simples tenha duasfaces horizontais (fundo e topo) e quatro faces verticais (norte, sul, lestee oeste). Pode parecer que todos esses pontos no novo arranjo não sejamequivalentes, mas de fato eles são. Podemos considerar, por exemplo, a novarede cúbica simples formada pelos pontos adicionados ao centro de todas

Page 64: Estado Solido, Ashcroft, Traduzido

3.4 Convenções 61

as faces horizontais. Os pontos da rede cúbica simples original são agorapontos centrais da nova rede cúbica simples, enquanto que os pontos queforam adicionados aos centros das faces norte-sul da rede cúbica originalestão nos centros das faces leste-oeste da nova rede, e vice-versa.Da mesma maneira, podemos considerar a rede cúbica simples composta

de todos os pontos centrais das faces norte-sul da rede cúbica simples orig-inal, ou de todos os pontos centrais das faces leste-oeste da rede cúbicaoriginal. Em qualquer um desses casos, os demais pontos serão encontradosnos centros das faces da nova estrutura cúbica simples. Então, qualquerponto pode ser considerado como um ponto de vértice ou um ponto centalda face, para qualquer um dos três tipos de face, e, assim, a rede cúbica deface centrada é realmente uma rede de Bravais.Um conjunto simétrico de vetores primitivos para a rede cúbica de face

centrada (veja Figura 4.9) é

a1 =a

2(y + z) , a2 =

a

2(z+ x) , a3 =

a

2(x+ y) . (3.5)

As redes de Bravais cúbicas de face centrada e de corpo centrado sãode grande importância, uma vez que muitos sólidos se cristalizam nessasformas, com um átomo (ou íon) em cada sítio da rede. (veja Tabelas 4.1 e4.2). (Porém, a correspondente forma cúbica simples é muito rara, sendoa fase alfa do polônio o único exemplo conhecido entre os elementos sobcondições normais.)

3.4 Convenções

Embora se tenha definido o termo ”rede de Bravais” para se aplicar a umconjunto de pontos, ele é também muito usado com refência a um conjuntode vetores, ligando um desses pontos a todos os outros. (Uma vez que ospontos são uma rede de Bravais, este conjunto de vetores não depende daescolha do ponto que é tomado como origem.) Também, um outro uso dotermo, vem do fato de que qualquer vetor R determina uma translação oudeslocamento, em que alguma coisa é movida fisicamente através do espaçopor uma distância R na direção do vetor R. O termo ”rede de Bravais” étambém usado para se referir a um conjunto de translações determinadaspelos vetores, ao invés dos próprios vetores. Na prática, é sempre claroqual dos contextos, se o conjunto de vetores ou de translações, está sendousado.5

5O emprego mais geral do termo dá uma definição elegante de uma rede de Bravaiscom a precisão da definição (b) e a natureza não prejudicial da definição (a): Uma redede Bravais é um conjunto discreto de vetores não coplanares fechado sob as operaçõesde adição e subtração vetoriais (i.e., a soma e a diferença de qualquer dois vetores noconjunto, também pertencem ao conjunto.)

Page 65: Estado Solido, Ashcroft, Traduzido

62 3. Redes Cristalinas

3.5 Número de Coordenação

Os pontos numa rede de Bravais, que são os mais próximos de um de-terminado ponto são conhecidos como vizinhos mais próximos. Devido ànatureza da rede de Bravais, cada ponto tem o mesmo numero de vizinhosmais próximos, e esse número é referido como o número de coordenação darede. Uma rede cúbica simples tem o número de coordenação igual a 6; umarede cúbica de corpo centrado, 8; e uma rede cúbica de face centrada, 12.A noção de número de coordenação pode ser estendida a outros arranjos,que não sejam redes de Bravais, desde que cada ponto no arranjo tenha omesmo número de vizinhos mais próximos.

3.6 Célula Unitária Primitiva

Um volume do espaço que, quando transladado através de todos vetoresnuma rede de Bravais, preenchendo todo o espaço sem sobrepor-se ou deixarvazios, é chamado de célula primitiva ou célula unitária primitiva da rede.6

Não existe uma maneira unívoca de escolher a célula primitiva para umadada rede de Bravais. Várias escolhas possíveis de células primitivas paraum rede de Bravais bidimensional são mostradas na Figura 4.10.Uma célula primitiva deve conter exatamente um ponto da rede. Segue-

se que, se n é a densidade de pontos da rede e v é o volume da célulaprimitiva, então nv = 1. Logo v = 1/n. Uma vez que este resultado valepara qualquer célula primitiva, o volume da célula primitiva é independenteda escolha da célula.Segue-se também da definição de uma célula primitiva que, dadas quais-

quer duas células primitivas de formas arbitrárias, é possível dividir aprimeira em pedaços que, quando transladados através de vetores de redeapropriados, podem ser reagrupados para se obter a segunda célula. Isto éilustrado na Figura 4.11.A célula primitiva intuitiva, associada com um conjunto particular de

vetores primitivos a1,a2 e a3, é o conjunto de todos os pontos r da forma

r = x1a1 + x2a2 + x3a3 (3.6)

para todos os xi variando continuamente entre 0 e 1; i.e., o paralelepípedogerado pelos três vetores primitivos a1,a2, e a3. Esta escolha tem a desvan-tagem de não mostrar a simetria completa da rede de Bravais. Por exemplo(Figura 4.12), a célula unitária (3.6) para a escolha dos vetores primitivos(3.5) da rede de Bravais fcc é um paralelepípedo oblíquo, que não tem a

6Translações de células primitivas podem ter pontos comuns de superfície; a condiçãode não-sobreposição tem como objetivo proibir superposição de regiões de volume difer-ente de zero.

Page 66: Estado Solido, Ashcroft, Traduzido

3.6 Célula Unitária Primitiva 63

simetria cúbica completa da rede na qual está embutida. Às vezes é im-portante trabalhar com céluas que têm a simetria completa de sua rede deBravais. Existem duas soluções muito usadas para este problema:

3.6.1 Célula Unitária; Célula Unitária Convencional

Pode-se preencher todo o espaço com células unitárias não-primitivas (con-hecidas apenas como células unitárias ou células unitárias convencionais).Uma célula unitária é uma região que preenche completamente todo o es-paço sem sobrepor-se, quando transladada através de algum subconjuntode vetores da rede de Bravais. A célula unitária convencional é escolhidageralmente maior do que a célula primitiva, mas tendo a simetria requerida.Então, frequentemente, descreve-se a rede cúbica de corpo centrado atravésde uma célula unitária cúbica (veja Figura 4.13) que tem o dobro do vol-ume da célula unitária primitiva bcc, e a rede cúbica de face centrada emtermos de uma célula unitária cúbica (Figura 4.12) que tem o quádruplo dovolume da célula unitária primitiva fcc. (Podemos ver facilmente que essascélulas convencionais têm 2 ou 4 vezes o volume correspondente das célulasunitárias primitivas, calculando-se quantos pontos da rede existem dentroda célula cúbica convencional, tal que nenhum desses pontos esteja sobresua superfície.) Os números que especificam o tamanho dos lados da célulaunitária (tal como o único número a em cristais cúbicos) são chamados deconstantes de rede.

3.6.2 Células Primitivas de Wigner-Seitz

Pode-se sempre escolher uma célula primitiva com a simetria total da redede Bravais. A mais comum dessas escolhas a célula de Wigner-Seitz. Acélula de Wigner-Seitz em torno de um ponto da rede é a região do es-paço que está mais próxima daquele ponto do que de qualquer outro pontoda rede.7 Devido à simetria translacional da rede de Bravais, a célula deWigner-Sitz em torno de qualquer ponto da rede deve-se transformar numacélula de Wigner-Seitz em torno de qualquer outro ponto, quando transladoatravés do vetor que liga os dois pontos. Como qualquer ponto no espaçoé representado por um único ponto na rede, este ponto, assim como seuvizinho mais próximo8 pertencerá a uma célula que contém precisamenteum ponto da rede. Segue-se disto, que uma célula de Wigner-Seitz, quando

7Uma célula deste tipo pode ser definida como qualquer conjunto discreto de pontosque não formam necessariamente uma rede de Bravais. Neste contexto mais amplo, acélula é conhecida como um poliedro de Voronoy. Ao contrário da célula de Wigner-Seitz,a estrutura e orientação de um poliedro geral de Voronoy depende do ponto do arranjosobre o qual se constrói este poliedro.

8Excetos os pontos sobre as superfícies comuns que separam duas ou mais células deWigner-Seitz.

Page 67: Estado Solido, Ashcroft, Traduzido

64 3. Redes Cristalinas

transladada através de todos os vetores de rede, preencherá todo o espaço,sem sobrepor-se; isto é a célula de Wigner-Seitz é uma célula primitiva.Uma vez que nada existe na definição de célula de Wigner-Seitz que se

refira a qualquer escolha particular dos vetores primitivos, a célula primitivaserá tão simétrica quanto a rede de Bravais.9

A célula de Wigner-Seitz é ilustrada para uma rede bidimensional naFigura 4.14, e para as redes de Bravais cúbicas tridimensionais de corpocentrado e de face centrada nas Figuras 4.15 e 4.16.Observe que a célula de Wigner-Seitz em torno de um ponto da rede, pode

ser construída, traçando-se linhas conectando o ponto a todos os outros narede,10 tomando-se a bissecção de cada linha com um plano, e escolhendo-seo menor poliedro contendo o ponto limitado por esses planos.

3.7 Estrutura Cristalina; Rede com uma Base

Um cristal físico é descrito, fornecendo-se sua rede de Bravais básica, jun-tamente com a descrição do agrupamento de átomos, moléculas, íons, etc.,dentro de uma determinada célula primitiva. O termo técnico ”estruturacristalina” é usado quando queremos enfatizar a diferença entre o padrãode pontos abstrato formando a rede de Bravais e um cristal físico real11

ocupando a rede. Uma estrutura cristalina consiste em cópias idênticas damesma unidade física, chamada de base, localizada em todos os pontos deuma rede de Bravais (ou, de forma equivalente, transladada através de to-dos os vetores da rede de Bravais). Às vezes usamos o termo alternativorede com uma base. Porém, o termo ”rede com uma base” é também usadonum sentido mais geral para se referir ao que resulta até mesmo quando aunidade básica não é um objeto ou objetos físicos, mas qualquer outro con-junto de pontos. Por exemplo, os vértices de uma colméia bidimensional,embora não sendo uma rede de Bravais, pode ser representada como umarede de Bravais triangular bidimensional12 com uma base de dois pontos(Figura 4.17). Uma estrutura cristalina com uma base consistindo numúnico átomo ou íon é às vezes chamada de rede de Bravais monoatômica.Pode-se também descrever uma rede de Bravais com uma base, escolhendo-

se uma célula convencional não primitiva. Às vezes, isto é feito para enfati-zar a simetria cúbica das redes de Bravais bcc e fcc, que são então descritascomo redes cúbicas simples geradas pelos vetores ax, ay e az,com uma base

9Uma definição precisa de ”tão simétrica quanto” é dada no Capítulo 7.10Na prática, somente um pequeno número de pontos vizinhos já dão realmente os

planos que limitam a célula.11Mas ainda com a idealização de ter uma extensão infinita.12Gerada por dois vetores primitivos de mesmo comprimento, fazendo um ângulo de

60o entre si.

Page 68: Estado Solido, Ashcroft, Traduzido

3.8 Alguns Exemplos Importantes de Estruturas Cristalinas e Redes com Base 65

de dois pontos,0,

a

2(x+ y+ z) (bcc) (3.7)

ou com uma base de quatro pontos

0,a

2(x+ y) ,

a

2(y+ z) ,

a

2(z+ x) (fcc) (3.8)

3.8 Alguns Exemplos Importantes de EstruturasCristalinas e Redes com Base

3.8.1 Estrutura do Diamante

A rede do diamante13 (formada por átomos de carbono num cristal dediamante) consiste em duas redes de Bravais cúbicas de face centrada in-terpenetrantes, deslocadas ao longo da diagonal do corpo de uma célulacúbica por um quarto do comprimento da diagonal. Pode ser consideradauma rede fcc com base de dois pontos 0 e (a/4) (x+ y+ z) . O númerode coordenação é igual a 4 (Figura 4.18). A rede do diamante não é umarede de Bravais, porque em volta de qualquer ponto a orientação diferedaquela em torno dos vizinhos mais próximo. Elementos que se cristalizamna estrutura do diamante são relacionados na Tabela 4.3.

3.8.2 Estrutura Hexagonal com Agrupamento Compacto

Embora não sendo uma rede de Bravais, a estrutura hexagonal com agru-pamento compacto (hcp) tem a mesma importância que as redes cúbicas decorpo centrado e de face centrada; mais ou menos 30 elementos cristalizam-se na forma hcp (Tabela 4.4).A estrutura básica da rede hcp é uma rede de Bravais hexagonal simples,

obtida pelo empilhamento de redes bidimensionais triangulares diretamenteuma acima da outra. A direção do emplilhamento (a3,abaixo) é conhecidacomo eixo-c. Os três vetores primitivos são:

a1 = ax; a2 =a

2x+

√3

2ay; a3 = cz (3.9)

Os dois primeiros vetores geram uma rede triangular no plano x-y e oterceiro empilha os planos a uma distância c um do outro.A estrutura hexagonal com agrupamento compacto consite em duas re-

des de Bravais hexagonais simples interpenetrantes, deslocadas uma daoutra por a1/3 + a2/3 + a3/2 (Figura 4.20). O nome reflete o fato de que

13Usamos a palavra “rede” sem qualificações para nos referir tanto a uma rede deBravais, como a uma rede com base.

Page 69: Estado Solido, Ashcroft, Traduzido

66 3. Redes Cristalinas

agrupamento compacto de esferas duras pode ser colocado numa tal estru-tura. Considere por exemplo o agrupamento de esferas em camadas reg-ulares, partindo-se do empacotamento numa rede triangular, como sendoa primeira camada. A próxima camada é formada, colocando-se esferasnas depressões deixadas no centro de qualquer triângulo na primeira ca-mada, formando-se assim, uma segunda camada triangular, deslocada emrelação à primeira. O mesmo acontece com a terceira camada em relaçãoà segunda, embora aquela fique diretamente sobre as esferas da primeiracamada. A quarta, diretamente sobre a segunda, e assim sucessivamente.A rede resultante é uma hexagonal com agrupamento compacto com umvalor particular (veja Problema 5):

c =

r8

3a = 1, 63299a (3.10)

Porém, uma vez que a simetria da rede hexagonal com agraupamento com-pacto é independente da razão c/a,o nome não é restrito a este caso. Ovalor c/a =

p8/3 é conhecido como valor ”ideal” e a verdadeira estrutura

com agrupamento compacto, com um valor ideal de c/a, é conhecida comouma estrutura hcp ideal. Porém, a menos que as unidades físicas presentesna estrutura hcp sejam realmente esferas com agrupamento compacto, nãoexiste motivo para que c/a seja ideal. (veja Tabela 4.4).Note que, como no caso da estrutura do diamante, a rede hcp não é uma

rede de Bravais, pois a orientação em torno de um ponto varia de camadapara camada ao longo do eixo-c. Note também que, quando vista do eixo-cos dois tipos de planos se fundem, formando uma arranjo bidimensional dotipo colméia da Figura 4.3, que não é uma rede de Bravais.

3.8.3 Outras Possibilidades de Empacotamento Compacto

Note que a estrutura hcp não é a única maneira de se agrupar esferas durasem camadas. Se as primeiras duas camadas são formadas como descritasacima, mas a terceira colocada em outro conjunto de depressões da segundacamada — i.e., aquelas depressões que não foram usadas nas duas primeirascamadas (veja Figura 4.21) — e então a quarta camada é colocada nasdepressões da terceira diretamente acima das esferas da primeira camada,a quinta acima da segunda, e assim por diante, gera-se uma rede de Bravais.A rede assim obtida é a fcc com a diagonal do cubo perperdicular aos planostriangulares (Figuras 4.22 e 4.23).Existe uma infinidade de outros arranjos compactos, pois cada camada

pode ser colocada em uma das duas posições. Somente a fcc com agrupa-mento compacto resulta numa rede de Bravais, e as estruturas fcc (...ABCABCABC...)e hcp (...ABABAB...) são as mais comumente encontradas. Porém, out-ras estruturas com agraupamento compacto são observadas. Certos metaisterras-raras, por exemplo, têm a estrutura da forma (...ABACABACABAC...) .

Page 70: Estado Solido, Ashcroft, Traduzido

3.9 Outros Aspectos das Redes Cristalinas 67

3.8.4 Estrutura do Cloreto de Sódio

Nos casos das estruturas do diamante e hcp, fomos obrigados a descreveras redes com base, devido ao arranjo geométrico intrínseco dos pontos darede. É também necessária uma rede com base para descrever estruturascristalinas, nas quais os átomos ou íons são localizados somente nos pontosda rede de Bravais, mas na qual o cristal perde a simetria translacionalporque mais de uma espécie de átomo ou íon está presente. Por exemplo,o cloreto de sódio (Figura 4.24) consiste em igual número de íons de cloroe sódio colocados em pontos alternados de uma rede cúbica simples, de talmaneira que cada íon tem seis íons de outra expécie como seus vizinhos maispróximos.14 Esta estrutura pode ser descrita como uma rede de Bravaiscúbica com uma base consistindo em um íon de sódio em 0 e um íon decloro no centro da célula cúbica convencional, (a/2) (x+ y+ z) .

3.8.5 Estrutura do Cloreto de Césio

Similarmente, o cloreto de césio (Figura 4.25) consiste em igual númerode césio e de cloro localizados nos pontos de uma rede cúbica de corpocentrado, tal que cada íon tem oito íons de outra espécie como seus vizinhosmais próximos.15 A simetria translacional desta estrutura é a mesma darede cúbica simples, e é descrita como uma rede cúbica simples com umabase consistindo num íon de césio na origem 0 e de cloro no centro do cubo(a/2) (x+ y + z) .

3.8.6 Estrutura do Sulfeto de Zinco (Zincblende)

A estrutura do sulfeto de zinco (ou zincblende) tem números iguais de íonsde zinco e de enxofre distribuídos na rede do diamante, tal que cada íontem quatro íons da outra espécie como seus vizinhos mais próximos (Figura4.18). Esta estrutura16 é um exemplo de uma rede com base, que deve serassim descrita, tanto devido à posição geométrica dos íons, como tambémà presença de duas espécies de íons.

3.9 Outros Aspectos das Redes Cristalinas

Neste capítulo nos concentramos sobre a descrição da simetria transla-cional das redes cristalinas no espaço físico real. Dois outros aspectos dosarranjos periódicos serão tratados em capítulos seguintes: no Capítulo 5,examinamos as consequências da simetria translacional não no espaço real,

14Veja, por exemplo, a Tabela 4.5.15Veja, por exemplo, a Tabela 4.6.16Veja, por exemplo, a Tabela 4.7

Page 71: Estado Solido, Ashcroft, Traduzido

68 3. Redes Cristalinas

mas num espaço conhecido como espaço recíproco (ou espaço dos vetoresde onda), e no Capítulo 7 descreveremos algumas propriedades da simetriarotacional das redes cristalinas.

3.10 Problemas

1. Em cada um dos seguintes casos indique se a estrutura é uma rede deBravais. Se for, dê os três vetores primitivos; se não, descreve-a comouma rede de Bravais com uma base com o menor número de pontospossível.

(a) Cúbica de base centrada (rede cúbica simples com pontos adi-cionais nos centros das faces horizontais da célula cúbica).

(b) Cúbica de lado centrado (rede cúbica simples com pontos adi-cionais nos centros das faces verticais da célula cúbica).

(c) Cúbica de aresta centrada (rede cúbica simples com pontos adi-cionais nos pontos médios das linha ligando os vizinhos maispróximos)

2. Qual é a rede de Bravais formada por todos os pontos com coorde-nadas cartesianas (n1, n2, n3), se:

(a) Os ni são ou todos pares, ou todos ímpares.

(b) A soma dos ni é par.

3. Mostre que o ângulo entre qualquer duas das linhas (ligações), unindoum sítio da rede do diamante aos seus quatro vizinhos mais próximosé cos−1 (−1/3) = 109o280.(a) Prove que a célula de Wigner-Seitz para qualquer rede de Bravais

bidimensional é, ou um hexágono, ou um retângulo.

(b) Mostre que a razão entre os comprimentos das diagonais de cadaface do paralelogramo da célula de Wigner-Seitz para a redecúbica de face centrada (Figura 4.16) é

√2 : 1.

(c) Mostre que qualquer lado do poliedro que limita a célula deWigner-Seitz da rede cúbica de face centrada (Figura 4.15) é√2/4 vezes o comprimento da célula cúbica convencional.

(d) Prove que as faces hexagonais da célula de Wigner-Seitz da redebcc são todos hexágonos regulares. (Note que o eixo perpendic-ular à face hexagonal, passando pelo seu centro tem apenas asimetria 3, tal que somente esta simetria não é suficiente.)

Page 72: Estado Solido, Ashcroft, Traduzido

3.10 Problemas 69

(a) Prove que a razão ideal para a estrutura hexagonal com agru-pamento compacto é

√8/3 = 1, 633.

(b) O sódio transforma-se da rede bcc para hcp a uma temperaturade 23 K (transformação ”martensitic”). Considerando que a den-sidade permanece a mesma durante a transição, encontre a con-stante de rede a da fase hexagonal, dado que a = 4.23 Å na fasecúbica e que a razão c/a é indistinguível de seu valor ideal.

4. A cúbica de face centrada é a mais densa e a cúbica simple a menosdensa da três redes cúbicas de Bravais. A estrutura do diamente é amenos densa do que qualquer uma dessas. Uma medida disso, é que osnúmeros de coordenação são: fcc, 12; bcc, 8; sc, 6; diamante, 4. Umaoutra é o seguinte: Suponha que esferas idênticas sejam distribuídasno espaço de tal maneira que seus centros estejam sobre os pontos decada uma dessas quatro estruturas, e que as esferas sobre os pontosvizinhos apenas se toquem. (Tal arranjo de esferas é chamdado dearranjo com agrupamento compacto.) Supondo que as esferas tenhamdensidade unitária, mostre que a densidade de um conjunto de esferascom agrupamento compacto em cada uma das quatro estruturas (a”fração de compactação”) é:

fcc:√2π/6 = 0, 74

bcc:√3π/8 = 0, 68

sc: π/6 = 0, 52

diamante:√3π/16 = 0, 34

5. Seja Nn o número dos n-ésimos vizinhos mais proximo de um dadoponto numa rede de Bravais (e.g., numa rede cúbica simples N1 = 6,N2 = 12, etc.) Seja rn a distância ao n-ésimo vizinho mais próx-imo expressa como múltiplo da distância aos primeiros vizinhos maispróximos (e.g., r1 = 1, r2 =

√2 = 1, 414). Faça uma tabela de Nn e

rn para n = 1, ..., 6 para as redes de Bravais fcc, bcc e sc.

6. (a) Dada uma rede de Bravais, seja a1 o vetor que liga um pontoparticular a um de seus vizinhos mais próximos. Seja P 0 umponto da rede que não pertence a linha que passa por P, masque está mais próximo desta do que qualquer outro ponto darede, e seja a2 um vetor ligando P a P 0. Seja P

00um ponto que

não pertence ao plano definido por a1 e a2, mas que está maispróximo ao plano do que qualquer outro ponto da rede, e sejaa3 um vetor ligando P a P

00. Prove que a1,a2 e a3 formam um

conjunto de vetores primitivos para a rede de Bravais.

(b) Prove que uma rede de Bravais pode ser definida como um con-junto discreto de vetores não coplanares, fechado sob as oper-ações de adição e subtração (como descrito na pág. 61).

Page 73: Estado Solido, Ashcroft, Traduzido

70 3. Redes Cristalinas

Page 74: Estado Solido, Ashcroft, Traduzido

This is page 71Printer: Opaque this

4Rede Recíproca

A rede recíproca tem um papel importante na maioria dos estudos analíticosdas estruturas periódicas. Está presente na teoria de difração de cristais, es-tudo abstrato de funções com periodicidade de uma rede de Bravais, ou emquestões como aquela relacionada com a conservação de momento quando asimetria translacional completa do espaço livre é reduzida àquela do poten-cial periódico. Neste breve capítulo, descreveremos algumas propriedadeselementares da rede recíproca de um ponto de vista geral sem vincular aqualquer aplicação em particular.

4.1 Definição de Rede Recíproca

Considere um conjunto de pontos R constituindo uma rede de Bravais, euma onda plana, eik·r. Para um k geral, essa onda plana, evidentemente,não terá a periodicidade da rede de Bravais, mas, certamente, terá, paracertas escolhas especiais do vetor de onda. O conjunto de todos os vetoresde onda K para os quais as ondas planas terão a mesma periodicidadede uma dada rede de Bravais é conhecida como rede recíproca dessa redede Bravais. Analiticamente, K pertence à rede recíproca de uma rede deBravais de pontos R, se a relação

eiK·(r+R) = eiK·r (4.1)

for válida para qualquer r, e para todos os R na rede de Bravais. FatorandoeiK·r, podemos caracterizar a rede recíproca como o conjunto de vetores de

Page 75: Estado Solido, Ashcroft, Traduzido

72 4. Rede Recíproca

onda K, satisfazendo a relação

eiK·R = 1 (4.2)

para todos os R na rede de Bravais.Note que a rede recíproca é definida com relação a uma particular rede

de Bravais. A rede de Bravais que determina uma dada rede recíproca éreferida como rede direta, quando vista em relação à sua recíproca. Notetambém que, embora se tenha definido um conjunto de vetores K, satis-fazendo (4.2) para um conjunto arbitrário de vetores R, tal conjunto de Ké chamado de rede recíproca, somente se o conjunto de vetores R for umarede de Bravais.1

4.2 Rede Recíproca é uma Rede de Bravais

Que a rede recíproca é uma rede de Bravais, segue-se da definição de umarede de Bravais dada no Capítulo 4, juntamente com o fato de que, se K1

e K2 satisfazem (4.2), obviamente, a soma e a subtração desses vetorestambém a satisfarão.Vale a pena obter uma prova desse fato, que nos forneça um algorítimo

explícito para a construção da rede recíproca. Seja a1,a2 e a3 o conjunto devetores primitivos para a rede direta. Então, os vetores da rede recíprocapodem ser gerados pelos três vetores primitivos

b1 = 2πa2 × a3

a1 · (a2 × a3)b2 = 2π

a3 × a1a1 · (a2 × a3) (4.3)

b2 = 2πa1 × a2

a1 · (a2 × a3)

Para verificar que (4.3) dá um conjunto de vetores primitivos para a rederecíproca, devemos primeiro observar que os bi satisfazem2

bi · aj = 2πδij (4.4)

1Em particular, para uma rede com base, usa-se a rede recíproca determinada pelarede de Bravais básica, melhor do que um conjunto K ter que satisfazer (4.2) para osvetores R, descrevendo, tanto a rede de Bravais, como os pontos da base.

2Quando i 6= j, resulta a Eq. (4.4), uma vez que o produto vetorial de dois vetores éortogonal a ambos. Quando i = j, ela resulta devido à identidade vetorial

a1 · (a2 × a3) = a2 · (a3 × a1) = a3 · (a1 × a2) .

Page 76: Estado Solido, Ashcroft, Traduzido

4.3 Recíproca da Rede Recíproca 73

onde δij é o delta de Kronecker:

δij = 0, i 6= j;δij = 1, i = j.

(4.5)

Agora, qualquer vetor k pode ser escrito como combinação linear3 dosvetores bi:

k = k1b1 + k2b2 + k3b3. (4.6)

Se R é um vetor da rede direta, então:

R = n1a1 + n2a2 + n3a3 (4.7)

onde ni são números inteiros. Segue-se de (4.4) que

k ·R = 2π (k1n1 + k2n2 + k3n3) (4.8)

Para eik·R ser igual a um para todo R (Eq. (4.2)), k ·R deve ser iguala 2π vezes um número inteiro, para qualquer escolha dos inteiros ni. Istorequer que os coeficientes ki sejam inteiros. Então a condição (4.2) paraque K sejam um vetor da rede recíproca é satisfeita pelos vetores que sãocombinações lineares (4.6) dos bi com coeficientes inteiros. Logo (comparecom a Eq. (3.1)), a rede recíproca é uma rede de Bravais e os bi podem sertomados como vetores primitivos.

4.3 Recíproca da Rede Recíproca

Uma vez que a rede recíproca é também uma rede de Bravais, podemosconstruir sua rede recíproca. Esta será a rede direta original.Podemos provar isto, construindo os vetores c1, c2 e c3 a partir dos ve-

tores bi, de acordo com a mesma fórmula (4.3) pela qual bi foram con-struídos a partir dos ai. Segue-se então de identidades vetoriais simples(Problema 1) que ci = ai, i = 1, 2, 3.Uma prova ainda mais simples, vem da observação de que, de acordo

com a definição básica (4.2), a recíproca da rede recíproca é o conjunto detodos os vetores G que satisfazem

eiG·K = 1 (4.9)

para todo K na rede recíproca. Como qualquer vetor da rede direta R temesta propriedade (novamente por (4.2), todos os vetores da rede direta estãona rede recíproca da rede recíproca. Além disso, outros vetores não podemsatisfazer esta relação, pois um vetor que não seja da rede direta tem aforma r =x1a1+x2a2+x3a3 com pelo menos um dos xi não sendo inteiro.Para aquele valor de i, eibi·r = ei2πxi 6= 1, e a condição (4.9) é violada parao vetor da rede recíproca K = bi.

3 Isto se aplica para quaisquer três vetores não coplanares. É fácil verificar que osvetores bi não são coplanares, certificando-se de que os vetores ai também não o são.

Page 77: Estado Solido, Ashcroft, Traduzido

74 4. Rede Recíproca

4.4 Exemplos Importantes

A rede de Bravais cúbica simples, com a célula primitiva cúbica de lado a,tem como sua rede recíproca uma rede cúbica simples com a célula cúbicaprimitiva cúbica de lado igual a 2π/a. Isto pode ser visto, por exemplo, daconstrução (4.3), pois se

a1 = ax, a2 = ay, a3 = az (4.10)

entãob1 =

ax, b2 =

ay, b3 =

az (4.11)

A rede de Bravais cúbica de face centrada, com célula convencional cúbicade lado a, tem como rede recíproca uma rede cúbica de corpo centrado comcélula convencional cúbica de lado igual a 4π/a. Isto pode ser mostrado,aplicando-se a construção (4.3) aos vetores primitivos da fcc. O resultadoé

b1 =4π

a

1

2(y + z− x) , b2 = 4π

a

1

2(z+ x− y) , b3 = 4π

a

1

2(x+ y − z)

(4.12)Estes vetores tem precisamente a mesma forma dos vetores primitivos darede bcc (3.4), desde que o lado da célula cúbica seja igual a 4π/a.A rede cúbica de corpo centrado com célula convencional cúbica de lado a

tem como rede recíproca a rede cúbica de face centrada com célula conven-cional cúbica de lado igual a 4π/a. Isto pode ser demonstrado, novamente,a partir de (4.3), mas pode-se mostrar também do resultado acima para arede recíproca da rede fcc, de acordo com o teorema de que a recíproca darecíproca é a rede original.É deixado como exercício para o leitor verificar (Problema 2) que a rede

recíproca de uma rede de Bravais hexagonal simples com constantes de redec e a (Figura 5.1a) é uma outra rede hexagonal simples com constantes derede 2π/c e 4π/

√3a (Figura 5.1b), girada de 30o em torno do eixo-c em

relação à rede direta.4

4.5 Volume da Célula Primitiva da Rede Recíproca

Se v é o volume5 de uma célula primitiva na rede direta, então a célulaprimitiva da rede recíproca tem um volume (2π)3 /v. Isto é demonstradono Problema 1.

4A estrutura hexagonal com agrupamento compacto não é uma rede de Bravais e,portanto, a rede recíproca usada na análise da hcp é a da rede hexagonal simples (vejanota de rodapé 1).

5O volume da célula primitiva é independente da escolha da célula, como foi provadono Capítulo 4.

Page 78: Estado Solido, Ashcroft, Traduzido

4.6 Primeira Zona de Brillouin 75

4.6 Primeira Zona de Brillouin

A célula primitiva de Wigner-Seitz da rede recíproca é conhecida comoprimeira zona de Brillouin. Como o nome sugere, também se define zonasde Brillouin de ordens mais elevadas, que são células primitivas de difer-entes tipos, que se originam na teoria dos níveis eletrônicos num potencialperiódico. Elas são descritas no Capítulo 9.Embora os termos “célula de Wigner-Seitz” e “primeira zona de Bril-

louin” refiram-se a construções geométrica idênticas, na prática, o últimotermo se aplica somente à celula no espaço-k. Em particular, quando sefaz referência à primeira zona de Brillouin de uma determinada rede deBravais no espaço-r (associada com uma estrutura cristalina em particu-lar), significa sempre que estamos nos referindo à célula de Wigner-Seitz darede recíproca associada. Então, como a rede recíproca da rede cúbica decorpo centrado é a rede cúbica de face centrada, a primeira zona de Bril-louin da rede bcc (Figura 5.2a) é a célula de Wigner-Seitz da fcc (Figura4.16). Inversamente, a primeira zona de Brillouin de rede fcc (Figura 5.2b)é justamente a célula de Wigner-Seitz da bcc (Figura 4.15).

4.7 Planos de Rede

Existe uma relação íntima entre vetores na rede recíproca e planos de pontosna rede direta. Esta relação é importante para o entendimento do papelfundamental que a rede recíproca tem na teoria de difração, e será aplicadoàquele problemas no próximo capítulo. Aqui, descreveremos as relações emtermos geométricos gerais.Dada uma rede particular de Bravais, um plano de rede é definido como

qualquer plano contendo pelo menos três pontos não-colineares da rede deBravais. Devido à simetria translacional da rede de Bravais, qualquer umdesses planos conterá, na verdade, uma infinidade de pontos da rede, queformam uma rede de Bravais bidimensional neste plano. Alguns planos derede numa rede de Bravais cúbica são esquematizados na Figura 5.3.Uma família de plano é um conjunto de planos paralelos, igualmente

espaçados, que juntos contém todos os pontos da rede de Bravais tridimen-sional. Qualquer plano de rede é um membro de tal família de planos.Evidentemente, a transformação de uma rede de Bravais numa famíliade planos não é unívoca (Figura 5.3). A rede recíproca nos fornece umamaneira muito simples de classificar todos as possíveis famílias de planosde rede, que está contida no seguinte teorema:

Para qualquer família de planos de rede separados por umadistância d, existem vetores da rede recíproca perpendicularesaos planos, sendo que o menor deles tem o comprimento 2π/d.Inversamente, para qualquer vetor K da rede recíproca, existe

Page 79: Estado Solido, Ashcroft, Traduzido

76 4. Rede Recíproca

uma família de planos de rede normais a K e separados poruma distância d, onde 2π/d é o comprimento do menor vetorde onda da rede recíproca paralelo a K .

Este teorema é uma consequência direta (a) da definição (4.2) de vetoresda rede recíproca em termos de vetores de onda das ondas planas que têmvalor igual a um nos sítios da rede de Bravais, e (b) do fato de que as ondasplanas têm o mesmo valor em todos os pontos pertencentes a uma mesmafamília de planos, cujos planos são perpendiculares ao vetor de onda daonda plana e estão seperados por um número inteiro de comprimentos deonda.Para provar a primeira parte do teorema, dada uma família de planos de

rede, seja n um vetor unitário na direção normal aos planos. Que o vetorK =2πn/d é um vetor da rede recíproca, segue-se do fato de que a ondaplana eiK·r é constante nos planos perpendiculares a K e tem o mesmovalor nos planos separados pela distância λ = 2π/K = d. Como um dessesplanos contém o ponto da rede de Bravais r = 0, eiK·r deve ser igual àunidade em todos os pontos r em qualquer um dos planos. Uma vez queos planos contém todos os pontos da rede de Bravais, eiK·r = 1 para todosos R, tal que K,de fato, é um vetor da rede recíproca. Além disso, K deveser o menor vetor da rede recíproca normal aos planos, pois qualquer vetormenor do que K daria uma onda plana com comprimento de onda maiordo que 2π/K = d. Tal onda plana não pode ter o mesmo valor sobre todosos planos da família e, portanto, não pode resultar numa onda plana queseja unitária em todos os pontos da rede de Bravais.Para provar o teorema inverso, dado um vetor da rede recíproca, seja K

o menor vetor da rede recíproca paralelo ao vetor dado. Considere o con-junto de planos no espaço real sobre os quais a onda plana eiK·r tem umvalor unitário. Esses planos (um dos quais contém o ponto r = 0) são per-pendiculares a K e separados por uma distância d = 2π/K. Como todos osvetores R da rede de Bravais satisfazem eiK·R = 1, para qualquer vetor darede recíproca K, todos eles devem pertencer a esses planos. Além disto, aseparação entre os planos da rede é também d (ao invés de algum múltiplointeiro de d), pois se somente cada n-ésimo plano da família contivesse ospontos da rede de Bravais, então de acordo com a primeira parte do teo-rema, o vetor normal aos planos teria comprimento 2π/nd i.e., o vetor K/nseria um vetor da rede recíproca. Mas, isto contradiria a nossa suposiçãoinicial de que nenhum vetor paralelo a K é menor do que K.

4.8 Índices de Miller dos Planos de Rede

A correspondência entre vetores da rede recíproca e família de planos derede fornece uma maneira conveniente de especificar a orientação de umplano de rede. Geralmente, descreve-se a orientação de um plano, dando-se

Page 80: Estado Solido, Ashcroft, Traduzido

4.8 Índices de Miller dos Planos de Rede 77

um vetor normal a ele. Como sabemos que existem vetores da rede recíprocanormais a qualquer família de planos de rede, é natural escolher um vetor darede recíproca, para representar a normal. Para se fazer a escolha unívoca,usa-se o menor desses vetores da rede recíproca. Desta maneira, chega-seaos índices de Miller do plano:Os índices de Miller de um plano de rede são as coordenadas do menor

vetor da rede recíproca normal àquele plano em relação ao conjunto especí-fico de vetores primitivos da rede recíproca. Então um plano com índicesde Miller h, k, l, é normal ao vetor da rede recíproca hb1 + kb2 + lb3.Assim definidos, os índices de Miller são inteiros, pois qualquer vetor

da rede recíproca é uma combinação linear de três vetores primitivos comcoeficientes inteiros. Uma vez que a normal ao plano é especificada pelomenor vetor da rede recíproca perpendicular ao plano, os inteiros h, k, l nãopossuem fator comum. Note também que os índices de Miller dependem daescolha particular dos vetores primitivos.Nas redes cúbicas simples a rede recíproca é também uma rede cúbica

simples e os índices de Miller são as coordenadas de um vetor normal aoplano no sistema cúbico de coordenadas. Como regra geral, as redes deBravais cúbicas de corpo centrado e de face centrada são descritas emtermos de uma célula convencional cúbica, i.e., como redes cúbicas simplescom bases. Como qualquer plano de rede nas redes fcc ou bcc é tambémum plano de rede na rede cúbica simples básica, a mesma indexação cúbicaelementar pode ser usada para especificar os planos de rede. Na prática,é apenas na descrição de cristais não cúbicos que devemos lembrar que osíndices de Miller são as coordenadas da normal num sistema dado pela rederecíproca, ao invés de pela rede direta.Os índices de Miller de um plano tem a interpretaçao geométrica na rede

direta, que às vezes é dado como uma maneira alternativa de definí-los.Uma vez que o plano de rede com índices de Miller h, k, l é perpendicularao vetor da rede recíproca K = hb1 + kb2 + lb3, este estará contido noplano K · r = A, para uma apropriada escolha da constante A. Este planocorta os eixos determinados pelos vetores primitivos ai da rede direta nospontos x1a1, x2a2 e x3a3 (Figura 5.4), onde xi é determinado pela condiçãode que xiai deve satisfazer a equação do plano: K· (xiai) = A. ComoK · a1 = 2πh, K · a2 = 2πk e K · a3 = 2πl,segue-se que

x1 =A

2πh, x2 =

A

2πk, x3 =

A

2πl. (4.13)

Então, as interseções dos planos de rede com os eixos do cristal são inver-samente proporcionais aos índices de Miller do plano.Os cristalógrafos colocam a carroça diante do boi, definindo os índices

de Miller como sendo um conjunto de inteiros sem fatores comuns, inver-samente proporcional às interseções do plano de cristal com os eixos:

h : k : l =1

h:1

k:1

l. (4.14)

Page 81: Estado Solido, Ashcroft, Traduzido

78 4. Rede Recíproca

4.9 Algumas Convenções para Direções Específicas

Os planos de rede são usualmente especificados através de seus índices deMiller, escritos entre parênteses: (h, k, l). Então, num sistema cúbico, umplano com uma normal (4,−2, 1) (ou, do ponto de vista cristalográfico, umplano que tem interseções (1,−2, 4) com os eixos cúbicos) é conhecido comoum plano (4,−2, 1) . As vírgulas são eliminadas sem confusão, escrevendo-se n, ao invés de −n, simplificando a descrição para (421) . Deve-se con-hecer qual sistema de eixos está sendo usado para interpretar esses símbolossem ambiguidades. Os eixos cúbicos são invariavelmente usados, quando ocristal tem simetria cúbica. Alguns exemplos de planos em cristais cúbicossão mostrados na Figura 5.5.Uma convenção similar é usada para especificar as direções nas redes

diretas, mas para evitar confusão com os índices de Miller (direções na rederecíproca), usam-se colchetes ao invés de parênteses, Assim, a diagonal decorpo de uma rede cúbica simples está na direção [111] e, em geral, o pontoda rede n1a1 + n2a2 + n3a3 está na direção [n1n2n3] da origem.Existe também uma notação para especificar tanto uma família de planos

de rede, como todas as outras famílias que são equivalentes a ela em virtudeda simetria do cristal. Então, os planos (100), (010) e (001) são todos equiv-alentes no cristal cúbico. Refere-se a eles coletivamente como planos 100e, em geral, usa-se hkl para referir-se aos planos (hkl) e todos aqueles quesão equivalentes a eles em virtude da simetria do cristal. Uma convençãosimilar é usada com as direções: as direções [100] , [010] , [001] , [100] , [010]e [001] no cristal cúbico são referidas coletivamente como as direções h100i.Com isto concluímos nossa discussão geométrica geral da rede recíproca.

No Capítulo 6, veremos um exemplo importante da utilidade e do poderdo conceito na teoria da difração de raios-X por um cristal.

4.10 Problemas

1. (a) Prove que os vetores primitivos da rede recíproca definida em(4.3) satisfaz

b1 · (b2 × b3) = (2π)3

a1 · (a2 × a3) (4.15)

(Sugestão: Escreva b1(mas, não b2 ou b3) em termos de ai euse as relações de ortogonalidades ( 4.4).)

(b) Suponha que os vetores primitivos são construídos a partir debi da mesma maneira que os bi foram construídos a partir de

Page 82: Estado Solido, Ashcroft, Traduzido

4.10 Problemas 79

ai (Eq. (4.3)). Prove que esses vetores são justamente os vetoresai; i.e., mostre que

2πb2 × b3

b1 · (b2 × b3) = a1, etc. (4.16)

(Sugestão: Escreva b3 no numerador (mas, não b2) em termosde ai, use a identidade vetorial A× (B×C) = B (A ·C) −C (A ·B), as relações de ortogonalidades (4.4) e o resultado(4.15) acima.)

(c) Prove que o volume de uma célula primitiva de uma rede deBravais é

v = |a1 · (a2 × a3)| , (4.17)

onde ai são os três vetores primitivos. (Juntamente com (4.15),isto estabelece que o volume da célula primitiva da rede recíprocaé (2π)3 /v.)

2. (a) Usando os vetores primitivos dados na Eq. (3.9) e a construção(4.3) (ou por qualquer outro método), mostre que a recíprocade uma rede de Bravais hexagonal simples é também hexagonalsimples, com constantes de rede 2π/c e 4π/

√3a, girada de 30o

em torno do eixo-c em relação à rede direta.

(b) Para qual valor de c/a a razão tem o mesmo valor tanto na rededireta, quanto na rede recíproca? Se c/a é ideal na rede direta,qual é seu valor na rede recíproca?

(c) A rede de Bravais gerada por três vetores primitivos de mesmocomprimento a,fazendo ângulos iguais a θ entre si, é conhecidacomo rede de Bravais trigonal (veja Capítulo 7). Mostre que arede recíproca de uma rede de Bravais trigonal é também trigo-nal, com ângulo θ∗ dado por − cos θ∗ = cos θ/[1+cos θ], e o com-primento do vetor primitivo a∗, dado por a∗ = (2π/a) (1 + cos θ cos θ∗)−1/2 .

3. (a) Mostre que a densidade de pontos de rede (por unidade de área)num plano de rede é d/v, onde v é o volume da célula primitivae d, o espaçamento entre planos vizinhos na família, à qual oplano pertence.

(b) Prove que os planos de rede com a maior densidade de pontossão os planos 111 na rede de Bravais cúbica de face centrada,e os planos 110 na rede de Bravais cúbica de corpo centrado.(Sugestão: Isto é feito mais facilmente, explorando-se as relaçõesentre as famílias de planos de rede e os vetores da rede recíp-roca.)

4. Prove que qualquer vetor da rede recíprocaK é um múltiplo inteiro domenor vetor da rede recíproca,K0, paralelo ao vetor dado. (Sugestão:

Page 83: Estado Solido, Ashcroft, Traduzido

80 4. Rede Recíproca

Considere o contrário e deduza que, como a rede recíproca é umarede de Bravais, existe um vetor da rede recíproca paralelo a K, queé menor do que K0.)

Page 84: Estado Solido, Ashcroft, Traduzido

This is page 81Printer: Opaque this

5Determinação de EstruturasCristalinas por Difração de Raio-X

Distâncias interatômicas típicas em sólidos são da ordem de um Angstron(10−8cm). Uma onda eletromagética capaz de explorar a estrutura mi-croscópica de um sólido deve ter um comprimento de onda pelo menosdessa ordem, correspondente a uma energia da ordem

~ω =hc

λ=

hc

10−8 cm≈ 12, 3× 103 eV. (5.1)

Energias tais como esta, da ordem de vários milhares de elétrons volts(quilovolts ou kV), são energias características de raio-X.Neste capítulo, descreveremos como a distribuição de raios-X espalhada

por um arranjo rígido1 e periódico2 de íons revela a localização dos íonsdentro daquela estrutura. Existem duas maneiras equivalentes de visualisaro espalhamento de raios-X por estruturas periódicas perfeitas, devidas aBragg e a von Laue. Ambos os pontos de vista são ainda largamente usados.O método de von Laue, que explora a rede recíproca, está mais próximo

1Na realidade, os íons vibram em torno de seus sítios de equilíbrio ideal (Capítulos21-26). Isto não afeta as conclusões obtidas neste capítulo (embora logo no início daaplicação da técnica de difração de raio-X não era bem entendido porque tais vibraçõesnão destruíam o padrão característico de uma estrutura periódica). Mostra-se que asvibrações têm duas importantes consequências (veja Apêndice N): (a) diminui a inten-sidade dos picos característicos, que revelam a estrutura cristalina, mas não a elimina;e (b) produz um fundo contínuo de radiação muito mais fraco (o “fundo difuso”.)

2 Sólidos amorfos e líquidos têm praticamente a mesma densidade que um sólidocristalino, e, portanto, são também suscetíveis a investigações com raios-X. Porém, nãosão enconntrados os picos discretos da radiação espalhada característicos dos cristais.

Page 85: Estado Solido, Ashcroft, Traduzido

82 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

das idéias da física do estado sólido moderna, mas o de Bragg ainda é muitousado pelos cristalógrafos. Ambos são descritos abaixos, juntamente com aprova de sua equivalência.

5.1 Formulação de Bragg da Difração de Raio-Xpor um Cristal

Em 1913, W. H. Bragg e W. L. Bragg observaram que substâncias, cujasformas macroscópicas eram cristalinas, produziam padrões característicosda radiação-X refletida muito diferentes daqueles produzidos pelos líqui-dos. Em materiais cristalinos, para comprimentos de onda e direções deincidência bem definidos, foram observados picos muito intensos da radi-ação espalhada (agora conhecidos como picos de Bragg).A explicação de W. L. Bragg para a ocorrência desses picos baseou-se na

hipótese de que os cristais são feitos de planos de íons paralelos, espaça-dos um do outro por uma distância d (i.e., os planos de rede descritos noCapítulo 5). As condições para o aparecimento de picos bem definidos naradiação espalhada são: (1) que os raios-X devam ser refletidos especular-mente3 pelos íons em qualquer plano, e (2) que os raios refletidos oriun-dos de planos sucessivos devam interferir construtivamente. Na Figura 6.1,mostram-se os raios refletivos especularmente por planos vizinhos. A difer-ença de caminho entre os dois raios é igual a 2d sen θ, onde θ é o ângulode incidência.4 Para os raios interferirem construtivamente esta diferençade caminhos deve ser igual a um número inteiro de comprimentos de onda,levando à famosa condição de Bragg:

nλ = 2d sen θ. (5.2)

O inteiro n é conhecido como a ordem da reflexão correspondente. Paraum feixe de raios-X contendo uma faixa de diferentes comprimentos de onda(“radiação branca”) podem ser observadas diferentes reflexões. Não apenasse pode ter reflexões de alta ordem de um dado conjunto de planos derede, como, além do que, devemos reconhecer que existem muitas diferentesmaneiras de seccionar o cristal em planos, cada uma das quais produzirãonovas reflexões (veja, por exemplo, Figura 5.3 ou Figura 6.3).

3Na reflexão especular, o ângulo de incidência é igual ao ângulo de reflexão.4O ângulo de incidência na cristalografia de raio-X é medido, convencionalmente, a

partir do plano de reflexão, ao invés da normal ao plano (como em óptica clássica). Noteque θ é justamente a metade do ângulo de deflexão do feixe incidente (Figura 6.2).

Page 86: Estado Solido, Ashcroft, Traduzido

5.2 Formulação de von Laue da Difração de Raio-X por um Cristal 83

5.2 Formulação de von Laue da Difração deRaio-X por um Cristal

O formulação de von Laue difere daquela de Bragg no sentido de que nestecaso não se escolhe nenhum seccionamento do cristal em planos de rede, enem é imposta nenhuma hipótese ad hoc de reflexão especular.5 Ao con-trário disso, considera-se o cristal como composto de objetos microscópicos(conjunto de íons ou átomos) colocados nos sítios R de uma rede de Bra-vais, cada um dos quais podendo reemitir a radiação incidente em todas asdireções. Picos bem definidos serão observados somente em direções e emcomprimentos de onda para os quais os raios espalhados a partir de todosos pontos da rede interferem-se construtivamente.Para determinar a condição de interferência construtiva, vamos consid-

erar inicialmente apenas dois espalhadores separados por um vetor desloca-mento d (Figura 6.4). Seja um raio-X incidente ao longo da direção n, comcomprimento de onda λ e vetor de onda k = 2πn/λ. Um raio espalhadoserá observado numa direção n0 com comprimento de onda6 λ e vetor deonda k0 = 2πn0/λ, com a condição de que a diferença entre os caminhosdos raios espalhados por cada um dos dois íons seja um número inteiro decomprimentos de onda. Vê-se, da Figura 6.4, que esta diferença é igual a

d cos θ + d cos θ0 = d · (n− n0) . (5.3)

Então, a condição para interferência construtiva é

d · (n− n0) = mλ, (5.4)

para m inteiro. Multiplicando-se ambos os membros de (5.4) por 2π/λencontra-se uma condição para os vetores de onda incidente e espalhado:

d · (k− k0) = 2πm, (5.5)

para m inteiro.Em seguida, considera-se não apenas dois, mas um arranjo de espal-

hadores localizados nos sítios de uma rede de Bravais. Uma vez que os

5A hipótese de Bragg da reflexão especular é, todavia, equivalente à hipótese de queos raios-X espalhados por íons individuais dentro de cada plano de rede inteferem-seconstrutivamente. Então, tanto o método de Bragg, como o de von Laue, são baseadosna mesma hipótese física, e sua equivalência (veja pág. ) já é esperada.

6Aqui (como na formulação de Bragg) considera-se que as radiações incidente e es-palhada tenham o mesmo comprimento de onda. Em termos de fótons, isto significaque nenhuma energia é perdida durante o espalhamento, i.e., considera-se que o es-palhamento é elástico. Para uma boa aproximação, o grosso da radiação espalhada éespalhada elasticamente, embora exista muito mais coisas a serem aprendidas do es-tudo daquelas pequenas componentes da radiação que são espalhadas inelasticamente(Capítulo 24 e Apêndice N).

Page 87: Estado Solido, Ashcroft, Traduzido

84 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

sítios são separados um do outro por vetores R da rede de Bravais, acondição de que todos os raios espalhados interfiram construtivamente é amesma condição (5.5) aplicada simultaneamente a todos os vetores d,quesão vetores de rede:

R · (k− k0) = 2πm, para m inteiro etodos os vetores Rda rede de Bravais.

(5.6)

Isto pode ser reescrito na forma equivalente

ei(k0−k)·R = 1, para todos os vetores Rda rede de Bravais. (5.7)

Comparando-se esta equação com a definição da rede reciproca (4.2),chega-se à condição de Laue para a qual interferência construtiva ocorreráse a variação do vetor de onda, K = k0−k, for um vetor da rede reciproca.Às vezes é mais conveniente ter uma formulação alternativa da condição

de Laue estabelecida inteiramente em termos do vetor de onda incidentek. Note que, devido à rede recíproca ser uma rede de Bravais, se k0−k forum vetor da rede recíproca, k − k0 também o será. Chamando de K esteúltimo vetor, a condição de que k e k0 tenham o mesmo módulo é

k = |k−K| . (5.8)

Quadrando ambos os membros de (5.8), obtém-se a condição

k · K =1

2K; (5.9)

i.e., a componente do vetor de onda incidente k na direção do vetor de ondada rede recíproca K deve ser metade do comprimento de K.Então, um vetor incidente k satisfará à condição de Laue se, e somente se,

a extremidade deste vetor estiver num plano que é o bissetor perpendicularde uma linha ligando a origem do espaço-k ao ponto da rede recíproca K.Tais planos no espaço-k são chamados de planos de Bragg.É uma consequência da equivalência dos pontos de vista de Bragg e Laue,

que será demonstrada na seção seguinte, que os planos de Bragg, associadoscom um pico particular de difração na formulação de Laue, são paralelosà família de planos na rede direta responsável pelo pico na formulação deBragg.

5.3 Equivalência das Formulações de Bragg e vonLaue

A equivalência desses dois critérios para a interferência construtiva de raios-X por um cristal, segue da relação entre vetores da rede recíproca e famílias

Page 88: Estado Solido, Ashcroft, Traduzido

5.3 Equivalência das Formulações de Bragg e von Laue 85

de planos da rede direta (veja Capítulo 5). Suponha que os vetores deonda incidente e espalhado, k e k0, satisfaçam à condição de Laue de queK = k0−k seja um vetor da rede recíproca. Uma vez que as ondas incidentee espalhada têm o mesmo comprimento de onda, k0 e k têm os mesmosmódulos. Segue-se (veja Figura 6.6) que k0 e k fazem o mesmo ângulo θcom o plano perpendicular a K. Portanto, o espalhamento pode ser vistocomo uma reflexão de Bragg, com ângulo de Bragg θ, pela família de planosda rede direta perpendicular ao vetor da rede recíproca K.Para demonstrar que esta reflexão satisfaz à condição de Bragg (5.2) note

que o vetor K é um múltiplo inteiro7 do menor vetor da rede recíproca,K0, paralelo a K. De acordo com o teorema da página 75, o módulo de K0

é igual a 2π/d, onde d é a distância entre planos sucessivos na família deplanos perpendicular a K0 ou a K. Então

K =2πn

d(5.10)

Por outro lado, segue-se da Figura 6.6 que K = 2k sen θ, e então

k sen θ =πn

d. (5.11)

Como k = 2π/λ, a Eq. (5.11) implica que o comprimento de onda satisfazà condição de Bragg (5.2).Então, um pico de difração de Laue, relacionado com a uma variação

do vetor de onda dada pelo vetor da rede recíproca K, corresponde a umareflexão de Bragg por uma família de planos da rede direta perpedicular aK. A ordem, n, da reflexão de Bragg é igual ao comprimento de K divididopelo comprimento do menor vetor da rede recíproca paralelo a K.Uma vez que o vetor da rede recíproca associado com uma dada rede de

Bravais é mais facilmente visualizado do que um conjunto de todos os pos-síveis planos, nos quais a rede de Bravais pode ser decomposta, é muito maissimples de se trabalhar com a condição de Laue para os picos de difração, do que com a condição de Bragg. No restante deste capítulo, aplicaremosa condição de Laue à descrição das três maneiras mais importantes nasquais a análise cristalográfica de raio-X de amostras reais são realizadas,e faremos uma discussão de como podemos extrair informações, não so-mente, com relação à rede de Bravais básica, mas também de arranjos deíons dentro da célula primitiva.

7Esta é uma consequência elementar do fato de que a rede recíproca é uma rede deBravais. Veja Capítulo 5, Problema 4.

Page 89: Estado Solido, Ashcroft, Traduzido

86 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

5.4 Geometrias Experimentais Sugeridas pelaCondição de Laue

Uma onda incidente com vetor de onda k conduzirá a um pico de difração(ou “reflexão de Bragg”) se e somente se a extremidade desse vetor estiversobre um plano de Bragg no espaço-k. Como o conjunto de todos os planosde Bragg é uma família discreta de planos, não se pode preencher todo oespaço-k tridimensional e, em geral, a extremidade do vetor k não estarásobre um plano de Bragg. Então, para um vetor de onda fixo incidente — i.e.,para um raio-X com comprimento de onda definido e direção de incidênciarelativa aos eixos do cristal, também, definida — poderá não haver picos dedifração.Se desejamos procurar experimentalmente pelos picos de Bragg, deve-se

relaxar a condição de k fixo de modo que, ou variamos o módulo de k (i.e.,variando o comprimento do feixe incidente), ou, sua direção (na prática,variando a orientação do cristal em relação à direção de incidência).

5.5 Construção de Ewald

Uma construção geométrica simples devido a Ewald nos ajudará muito navisualização desses vários métodos e na dedução da estrutura do cristal apartir dos picos observados. Traça-se uma esfera no espaço-k centrada naextremidade do vetor incidente k de raio k (tal que essa esfera passe pelaorigem). Evidentemente (veja Figura 6.7), existirá algum vetor k0 satis-fazendo à condição de Laue se, e somente se, algum ponto da rede recíp-roca (além da origem) estiver sobre a superfície da esfera, caso em queocorrerá uma reflexão de Bragg por uma família de planos da rede diretaperpendiculares àquele vetor da rede recíproca.Em geral, a esfera no espaço-k, com a origem sobre sua superfície, pode

não ter nenhum outro ponto da rede recíproca sobre essa superfície e, por-tanto, a construção de Ewald confirma nossa observação de que, para um ve-tor de onda incidente geral, pode não haver nenhum pico de Bragg. Porém,usando-se várias técnica, é possível nos assegurarmos que alguns picos deBragg serão produzidos.

1. Método de Laue Pode-se continuar espalhando de um único cristalde orientação fixa a partir de uma direção incidente fixa, n,mas pode-se procurar por picos de Bragg usando-se um feixe de raio-X contendocomprimentos de onda de λ1 até λ0, ao invés de um monocromático.A esfera de Ewald será então expandida na região contida entre asduas esferas determinadas por k0 = 2πn/λ0 e k1 = 2πn/λ1,e os pi-cos de Bragg serão observados, correspondendo a quaisquer vetores darede recíproca dentro dessa região (Figura 6.8). Fazendo-se a faixa de

Page 90: Estado Solido, Ashcroft, Traduzido

5.5 Construção de Ewald 87

comprimentos de onda relativamente grande, é certo encontrarmosalguns pontos da rede recíproca dentro dessa região; contanto queessa faixa não seja muito grande, podemos evitar muitas reflexões deBragg e, portanto, mantendo-se a idéia razoavelmente simples.

O método de Laue é provavelmente o mais conveniente para deter-minação da orientação de uma amostra de cristal, cuja estrutura sejaconhecida, pois, por exemplo, se a direção de incidência está ao longode um eixo de simetria do cristal, o padrão das franjas produzidas pe-los raios refletidos de Bragg terão a mesma simetria. Como os físicosde estado sólido geralmente estudam substância de estrutur cristalinaconhecida, o método de Laue é provavelmente o de maior interesseprático.

2. Método do Cristal Giratório Este método usa raios-X monocromáti-cos, mas permite variar o ângulo de incidência. Na prática, fixa-se adireção do feixe de raio-X e varia-se a orientação do cristal. No métododo cristral giratório, o cristal é girado em torno de um eixo fixo, etodos os picos de Bragg que ocorrem durante a rotação são gravadosnum filme. Como o cristal gira, a rede recíproca correspondente giraráda mesma maneira em torno do mesmo eixo. Então a esfera de Ewald(que é determinada pelo vetor de onda incidente k) é fixa no espaço-k,enquanto que a rede recíproca como um todo, girará em torno doeixo de rotação do cristal. Durante essa rotação, cada ponto da rederecíproca gira em círculo em torno do eixo de rotação e a reflexão deBragg ocorrerá se este círculo intercepta a esfera de Ewald. Isto estáilustrado na Figura 6.9, para uma geometria particularmente simples.

3. Método do Pó ou Método de Debeye-Scherrer Este é equiv-alente ao método do cristal giratório, no qual permite-se que o eixode rotação varie sobre todas as possíveis orientações. Na prática,essa média isotrópica da direção incidente, é obtida, usando-se umaamostra policristalina ou um pó, cujos grãos são grandes bastante,na escala atômica, capazes de difratarem os raios-X. Devido à orien-tação aleatória dos eixos cristalinos dos grãos individuais, o padrãode difração produzido pelo tal pó é o que seria produzido pela com-binação de todos os padrões de difração para todas as orientaçõespossíveis de um único cristal.

As reflexões de Bragg são agora determinadas, fixando-se o vetorincidente k, e, com ele, a esfera de Ewald, e permitindo-se que arede recíproca gire através de todos os ângulos possíveis em tornoda origem, tal que cada vetor da rede recíproca K dê origem umaesfera de raio K em torno da origem. Tal esfera, interceptará a esferade Ewald num círculo (Figura 6.10a), com a condição de que K sejamenor do que 2k. O vetor ligando qualquer ponto sobre este círculocom a extremidade do vetor de onda incidente é um vetor de onda k0,

Page 91: Estado Solido, Ashcroft, Traduzido

88 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

para o qual a radiação espalhada será observada. Então, cada vetorda rede recíproca de comprimento menor do que 2k gera um cone deradiação espalhada para frente num ângulo φ, onde (Figura 6.10b)

K = 2k sen1

2φ (5.12)

Medindo-se os ângulos φ, para os quais ocorrem as reflexões de Bragg,determinam-se todos os vetores da rede recíproca menores do que2k. De posse dessas informações, de alguns fatos sobre a simetria docristal macroscópico e do fato de que a rede recíproca é uma rede deBravais, pode-se construir a rede recíproca para esse cristal (veja, porexemplo, Problema 1).

5.6 Difração por uma Rede Monoatômica comBase; Fator de Estrutura Geométrico

A discussão anterior foi baseada na condição (5.7) de que os raios espalha-dos de cada célula primitiva interferissem construtivamente. Se a estruturacristalina é a de uma rede monoatômica com base de n-átomos (por ex-emplo, o carbono na estrutura do diamante, ou o berílio hexagonal comagrupamento compacto, ambos com n = 2), então cada célula pode seranalisada, levando-se em conta um conjunto de espalhadores idênticos lo-calizados nas posições d1, ...,dn dentro da célula. A intensidade da radiaçãonum dado pico de Bragg dependerá do quanto os raios espalhados por cadasítio da base interferem-se um com o outro, sendo maior quando a inter-ferência for completamente construtiva, e anulando-se para interferênciascompletamente destrutivas.Se o pico de Bragg está associado com a variação do vetor de onda

k0 − k = K, então a diferença de caminho (Figura 6.4) entre os raiosespalhados em di e dj será K· (di − dj)e as fases dos dois raios diferirãopor um fator ei·K·(di−dj). Logo, as fases dos raios espalhados em d1, ...,dnestão na razão eiK··d1 , ..., eiK··dn .O raio resultante espalhado que emerge deuma célula primitiva é, então, a soma individual dos raios, e terá portantouma amplitude contendo o fator

SK =nXj=1

eiK··dj (5.13)

A quantidade SK, conhecida como fator de estrutura geométrico, ex-pressa o grau de interferência das ondas espalhadas por íons idênticos,dentro da base, podendo diminuir a intensidade do pico de Bragg associ-ado com um vetor da rede recíproca K. A intensidade do pico de Bragg,sendo proporcional ao quadrado do valor absoluto da amplitude, conterá

Page 92: Estado Solido, Ashcroft, Traduzido

5.6 Difração por uma Rede Monoatômica com Base; Fator de Estrutura Geométrico 89

o fator |SK|2 . É importante observar que esta não é a única fonte da de-pendência emK para a intensidade do pico. Além disso, a dependência coma mudança no vetor de onda origina-se da dependência angular ordináriade qualquer espalhamento eletromagnético, junto com a influência sobreo espalhamento da estrutura interna detalhada de cada íon individual nabase. Portanto, o fator de estrutura sozinho não pode ser usado para predi-zer a intensidade absoluta num pico de Bragg.8 Ele pode, porém, levar auma dependência característica comK que é facilmente distinguida mesmoque outras dependências com K sejam superpostas. O caso onde o fatorde estrutura pode ser usado com segurança é quando ele se anula. Istoocorre quando os elementos da base são distribuídos de tal maneira que ex-ista interferência destrutiva para o K em questão; naquele caso, nenhumacaracterística dos raios espalhados por elementos individuais da base podeevitar que o raio se anule.Ilustramos a importância de um fator de estrutura nulo em dois casos:9

5.6.1 Rede Cúbica de Corpo Centrado Considerada comoCúbica Simples com Base

Como a rede cúbica de corpo centrado é uma rede de Bravais, sabemos queas reflexões de Bragg ocorrerão quando a variação no vetor de onda K éum vetor da rede recíproca, que é uma rede cúbica de face centrada. Àsvezes é conveniente considerar a rede bcc como uma rede cúbica simplesgerada pelos vetores primitivos ax, ay e az, com uma base de dois pontosconsistindo em d1 = 0 e d = (a/2) (x+ y+ z) . Deste ponto de vista, arede recíproca é também uma rede cúbica simples, com uma célula cúbicade lado 2π/a. Porém, existirá agora um fator de estrutura SK associadocom cada reflexão de Bragg. No presente caso, (5.13) dá

SK = 1 + exp£iK·12a (x+ y+ z)

¤. (5.14)

Um vetor geral da rede recíproca cúbica simples tem a forma

K =2π

a(n1x+ n2y+ n3z) . (5.15)

Substituindo-se isto em (5.14), encontramos um fator de estrutura

SK = 1 + eiπ(n1+n2+n3) = 1 + (−1)n1+n2+n3

=

½2, n1 + n2 + n3 par,0, n1 + n2 + n3 ímpar.

(5.16)

8Uma breve, mas completa discussão do espalhamento de radiação eletromagnéticapor cristais, incluindo a dedução das fórmulas da intensidade detalhada para váriasgeometrias experimentais descritas acima, é dada por Landau e Lifshitz, Eletrodynamicsof Continuous Media, Capítulo 15, Addison-Wesley, Reading, Mass., 1966.

9Mais exemplos são dados nos Problemas 2 e 3.

Page 93: Estado Solido, Ashcroft, Traduzido

90 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

Então, aqueles pontos da rede recíproca cúbica simples, cuja soma dascoordenadas, tomadas em relação aos vetores primitivos cúbicos, sejamímpares, não produzirão reflexão de Bragg. Isto transforma a rede recíprocacúbica simples numa estrutura cúbica de face centrada que teríamos obtidose tivéssemos tratado a rede direta cúbica de corpo centrado como uma redede Bravais, ao invés de uma rede com base (veja Figura 6.11).Então, se inadvertidamente ou por razões de maior simetria, escolhe-se

para descrever uma rede de Bravais como uma rede com base, ainda assimrecobramos a descrição correta da difração de raio-X, contanto que o fatorde estrutura nulo seja levado em conta.

5.6.2 Rede Monoatômica do Diamente

A rede monoatômica do diamante (carbono, silício, germânio ou estanhocinza) não é uma rede de Bravais e deve ser descrita como uma rede combase. A rede básica é a cúbica de face centrada e a base pode consideradacomo d1 = 0 e d2 = (a/4) (x+ y + z) , onde x, y e z estão ao longo doseixos do cubo e a é o lado da célula cúbica convencional. A rede recíprocaé cúbica de corpo centrado com a célula cúbica convencional de lado iguala 4π/a. Tomando-se os vetores primitivos

b1 =2π

a(y+ z− x) , b2 = 2π

a(z+ x− y) , b3 = 2π

a(x+ y− z)

(5.17)então o fator de estrutura (5.13) para K =

Pnibi é

SK = 1 + exp£12 iπ (n1 + n2 + n3)

¤.

=

2, n1 + n2 + n3 duas vezes um número par1± i n1 + n2 + n3 ímpar0 n1 + n2 + n3 duas vezes um número ímpar.

(5.18)

Para interpretar geometricamente essas condições sobre aPni,observe

que, se substituirmos (5.17) emK =Pnib, podemos escrever o vetor geral

da rede recíproca na forma

K =4π

a(ν1x+ ν2y + ν3z) (5.19)

onde

νj =12 (n1 + n2 + n3)− nj ,

3Xj=1

νj =12 (n1 + n2 + n3) . (5.20)

Sabemos (veja Capítulo 5) que a recíproca da rede fcc com célula cúbica delado a é uma rede bcc com célula cúbica de lado 4π/a. Vamos consideraresta rede como composta de duas redes cúbicas simples de lado 4π/a. A

Page 94: Estado Solido, Ashcroft, Traduzido

5.7 Difração por um Cristal Poliatômico; Fator de Forma Atômico 91

primeira, contendo a origem (K = 0) deve ter todos os νi inteiros (deacordo com (??)) e deve, portanto, ser dado paraK com n1+n2+n3 ímpar(de acordo com (5.20)). A segunda, contendo o ”ponto de corpo centrado”(4π/a) 12 (x+ y+ z) , deve ter todos os νi inteiros +

12 (de acordo com

(??)) e deve, portanto, ser dado para K com n1+n2+n3 ímpar (de acordocom (5.20)).Comparando isto com (5.18), encontramos que os pontos com fator de

estrutura 1±i são aqueles na sub-rede cúbica simples formada pelos pontosde ”corpo centrado”. Aqueles, cujo fator de estrutura é 2 ou 0 estão nasub-rede contendo a origem, onde

Pνi é par, quando S = 2, e ímpar,

quando S = 0. Então os pontos com fator de estrutura zero são novamenteremovidos, aplicando-se a construção ilustrada na Figura 6.11 à sub-redecúbica simples, contendo a origem, convertendo-a numa estrutura cúbicade face centrada (Figura 6.12).

5.7 Difração por um Cristal Poliatômico; Fator deForma Atômico

Se os íons na base não são idênticos, o fator de estrutura (5.13) toma aforma

SK =nXj=1

fj (K) eiK·dj (5.21)

onde fj (K) , conhecido como fator de forma atômico, é determinado in-teiramente pela estrutura interna do íon que ocupa a posição dj na base.Íons idênticos têm fatores de forma idênticos (independentes de onde elessão colocados), tal que, no caso monoatômico, (5.21) reduz-se a (5.13),multiplicada por um valor comum dos fatores de forma.Em tratamento elementar, o fator de forma associado com uma reflexão

de Bragg dada pelo vetor da rede recíproca K é considerado ser propor-cional à transformada de Fourier da distribuição de carga eletrônica docorrespondente íon10

fj (K) = −1e

Zdr eiK·rρj (r) . (5.22)

Então, o fator de forma atômico fj depende de K e da forma detalhadada distribuição de carga do íon que ocupa a posição dj na base. Comoresultado, não se poderia esperar que o fator de estrutura atômico se anu-lasse para qualquer K, a menos que exista alguma relação casual entre os

10A densidade de carga eletrônica ρj (r) é aquela de um íon do tipo j colocado emr = 0; então, a contribuição do íon localizado em R + dj para a densidade de cargaeletrônica do cristal é ρj (r− [R+ dj ]) . (A carga eletrônica é normalmente fatorada dofator de forma atômico para torná-lo adimensional.)

Page 95: Estado Solido, Ashcroft, Traduzido

92 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

fatores de forma de diferentes tipos. Fazendo suposições razoáveis sobre adependência de K dos diferentes fatores de forma, pode-se às vezes distin-guir conclusivamente entre as várias possíveis estruturas cristalinas sobreas origens da variação com K das intensidade dos picos de Bragg (veja, porexemplo, Problema 5).Isto conclui nossa discussão sobre a reflexão de Bragg dos raios-X. Nossa

análise não explorou nenhuma propriedade dos raios-X, que não fosse suanatureza ondulatória.11 Consequentemente, encontraremos muitos dos con-ceitos e resultados deste capítulo reaparecendo em discussões subsequentesde outros fenômenos ondulatórios em sólidos, tais como elétrons (Capítulo9) e neutrons (Capítulo 24).12

5.8 Problemas

1. Amostras pulverizadas de três diferentes cristais cúbicos monoatômi-cos são analisadas com uma câmera de Debeye-Scherrer. Sabe-se queas amostras são cúbica de face centrada, cúbica de corpo centrado euma tem a estrutura de diamante. As posições aproximadas dos qua-tro primeiros anéis de difração em cada caso são (veja Figura 6.13):

VALORES DE φ PARA AS AMOSTRAS

A B C42, 2o 28, 8o 42, 8o

49, 2 41, 0 73, 272, 0 50, 8 89, 087, 3 59, 6 115, 0

(a) Identifique as estruturas cristalinas de A, B e C.

(b) Se o comprimento de onda do feixe do raio-X incidente é 1, 5 Å,qual é o comprimento do lado da célulca cúbica convencional emcada caso?

(c) Se a estrutura do diamante fosse substituída pela estrutura zincblendecom a célula cúbica de mesmo lado, a que ângulos ocorreriam,agora, os quatro primeiros anéis?

11Como resultado disto, não foi possível fazermos afirmações sobre a intensidade ab-soluta dos picos de Bragg, ou sobre o fundo difuso de radiação nas direções que nãofossem permitidas pela condição de Bragg.12Considerada sob o ponto de vista da mecânica quântica, uma partícula de momento

p pode ser vista como uma onda de comprimento de onda λ = h/p.

Page 96: Estado Solido, Ashcroft, Traduzido

5.8 Problemas 93

2. Às vezes é conveniente representar a rede de Bravais cúbica de facecentrada como uma rede cúbica simples, com o lado da célula cúbicaprimitiva a e uma base com quatro pontos.

(a) Mostre que o fator de estrutura (5.13) vale então 4 ou 0 em todosos pontos da rede recíproca cúbica simples.

(b) Mostre que, quando os pontos com fator de estrutura zero sãoremovidos, os demais pontos da rede recíproca formam uma redecúbica de corpo centrado com o lado da célula convencional4π/a. Por que isto seria esperado?

3. (a) Mostre que todos os fatores de estrutura para uma estruturacristalina hexagonal com agrupamento compacto pode ter qual-quer um dos seis valores 1 + einπ/3, n = 1, ..., 6, para todos osvalores de K sobre a rede recíproca hexagonal simples.

(b) Mostre que todos os pontos da rede recíporca tem fator de es-trutura não nulos no plano perpendicular ao eixo-c, contendoK = 0.

(c) Mostre que os pontos com fatores de estrutura nulos são en-contrados em planos alternados na família de planos da rederecíproca perpendicular ao eixo-c.

(d) Mostre que em nesse plano, o ponto que é deslocado de K = 0por um vetor paralelo ao eixo-c tem fator de estrutura zero.

(e) Mostre que a remoção desse ponto de todos os pontos de fatorde estrutura nulo reduz a malha triangular de pontos da rederecíproca ao arranjo tipo colméia (Figura 4.3).

4. Considere uma rede com base de n-íons. Suponha que o i-ésimo íonna base, quando transladado para r = 0, pode ser considerado comocomposto de mi partículas puntiformes de carga −zije, localizadasna posição bij, j = 1, ...,mj .

(a) Mostre que o fator de forma atômico fi é dado por

fi =

mjXj=1

zij eiK·bij . (5.23)

(b) Mostre que o fator de estrutura total (5.21), em consequência de(5.23), é idêntico ao fator de estrutura que teríamos encontradose a rede fosse equivalentemente descrita como tendo uma basede m1 + ...+mn íons.

5. (a) A estrutura do cloreto de sódio (Figura 4.24) pode ser consider-ada como uma rede de Bravais fcc de cubo de lado a, com uma

Page 97: Estado Solido, Ashcroft, Traduzido

94 5. Determinação de Estruturas Cristalinas por Difração de Raio-X

base consistindo em um íon carregado positivamente localizadona origem e outro íon carregado negativamente localizado em(a/2)x. A rede recíproca é cúbica de corpo centrado e o vetorgeral da rede recíproca tem a forma (??), com todos os coe-ficientes νi inteiros ou inteiros +1

2 . Se os fatores de estruturaatômica para os dois íons são f+ e f−, mostre que o fator de es-trutura é SK = f++f−, se os νi forem inteiros, e SK = f+−f−se νi forem inteiros +1

2 . (Por que SK se anula no último caso,quando f+ = f− ?)

(b) A estrutura zincblende (Figura 4.18) é também uma rede deBravais cúbica de face centrada de cubo de lado a, com umabase consistindo em um íon carregado positivamente localizadona origem e o outro íon carregado negativamente localizado em(a/4) (x+ y+ z) . Mostre que o fator de estrutura SK é igual af+± if− se νi são inteiros +1

2 , f++ f− se νi são inteiros eP

νié par, e f+ − f− se νi são inteiros +1

2 eP

νi é ímpar.

(c) Suponha que se conheça que um cristal cúbico seja compostode íons com camada fechada (e então esfericamente simétrico),tal que f± (K) dependa somente do módulo de K. As posiçõesdos picos de Bragg revelam que a rede de Bravais é cúbica deface centrada. Discuta como se poderia determinar, a partir dosfatores de estrutura associados com os picos de Bragg, qual otipo mais provável da estrutura cristalina, se cloreto de sódio ouzincblende.

Page 98: Estado Solido, Ashcroft, Traduzido

This is page 95Printer: Opaque this

6Classificação das Redes de Bravais eEstruturas Cristalinas

Nos Capítulos 4 e 5, descrevemos e exploramos apenas as simetrias transla-cionais das redes de Bravais. Por exemplo, a existência e propriedades bási-cas das redes recíprocas dependem somente da existência de três vetoresprimitivos da rede direta ai e não das relações especiais que eles possamter entre si.1 As simetrias translacionais são as mais importantes para ateoria geral dos sólidos. Contudo, observa-se dos exemplos já descritos, queas redes de Bravais ocorrem, naturalmente, em outras categorias com basesde simetrias diferentes da translacional. Redes de Bravais hexagonais sim-ples, por exemplo, independentemente da razão c/a, assemelham-se a umoutro tipo de rede diferente dos três tipos de redes cúbicas de Bravais jádescritas.É objetivo da cristalografia fazer tais distinções sistemáticas e precisas.2

Aqui, indicaremos apenas as bases para uma classificação cristalográficamais elaborada, dando algumas das categorias mais importantes e intro-duzindo a linguagem pela qual elas são descritas. Na maioria das aplicações,o que de fato interessa são as características de casos particulares, melhordo que uma teoria geral sistemática, pois poucos físicos do estado sólidoprecisam dominar a análise completa da cristalografia. De fato, o leitorcom pouco interesse no assunto pode saltar este capítulo com pouco pre-

1Um exemplo de tal relação é a condição de ortogonalidade ai · aj = a2δij ,válidapara vetores primitivos apropriados numa rede de Bravais cúbica simples.

2Uma visão detalhada do assunto pode ser encontrada em M. J. Buerger, ElementaryCrystallography, Willey, New York, 1963.

Page 99: Estado Solido, Ashcroft, Traduzido

96 6. Classificação das Redes de Bravais e Estruturas Cristalinas

juizo para o entendimento dos capítulos subsequentes, voltando a ele porocasião de esclarecimentos de termos técnicos.

6.1 Classificação das Redes de Bravais

O problema de classificar todas as possíveis estruturas cristalinas é umatarefa muito complexa para se fazer diretamente, de forma que primeiroconsideramos apenas a classificação das redes de Bravais.3 Do ponto devista de simetria, uma rede de Bravais é caracterizada pelas especificaçõesde todas as operações rígidas4 que deixam a rede inalterada. Este conjuntode operações é conhecido como grupo de simetria ou grupo espacial da redede Bravais.5

As operações do grupo de simetria de uma rede de Bravais incluem to-das as translações através dos vetores de rede. Porém, além das translações,existem, em geral, rotações, reflexões e inversões6 que mantém a rede inal-terada. Uma rede de Bravais cúbica, por exemplo, fica inalterada por umarotação de 90o em torno de uma linha de pontos da rede numa direçãoh100i, por uma rotação de 120o em torno de uma linha de pontos da redenuma direção h111i, por reflexão de todos os pontos num plano de rede100,etc.; um rede de Bravais hexagonal simples, fica inalterada por umarotação de 60o em torno de uma linha de pontos da rede paralela ao eixo-c,por reflexão num plano perpendicular ao eixo-c, etc.Qualquer operação de simetria de uma rede de Bravais pode ser decom-

posta numa translação TR através de um vetor R da rede e numa operaçãorígida, mantendo-se pelo menos um ponto da rede fixo.7 Isto não é imediata-mente óbvio. Uma rede de Bravais cúbica simples, por exemplo, é mantidafíxa por uma rotação de 90o em torno de um eixo h100i que passa atravésdo centro da célula primitiva cúbica com pontos da rede nos oito vérticesdo cubo. Isto é uma operação rígida onde nenhum ponto é mantido fixo.Todavia, ela pode ser decomposta numa translação atavés de um vetor darede de Bravais e numa rotação em torno de uma linha de pontos de rede,

3Neste capítulo, a rede de Bravais é vista como uma estrutura cristalina formada peladistribuição, em cada ponto de uma rede de Bravais abstrata, de uma base de simetriamáxima possível (tal como uma esfera centrada num ponto da rede), tal que nenhumasimetria da rede de Bravais de pontos seja perdida devido à inserção da base.

4Operações que preservam as distâncias entre todos os pontos.5Evitaremos a linguagem da teoria matemática de grupo, pois não faremos nenhum

uso das conclusões analíticas às quais elas conduzem.6Reflexões num plano substitui um objeto por sua imagem especular naquele plano;

inversões num ponto P transforma o ponto com coordenadas r (com relação a P , tomadocomo origem) em −r. Todas as redes de Bravais têm simetria de inversão em qualquerponto da rede (Problema 1).

7Note que numa translação através de um vetor (diferente de 0) nenhum ponto semantém fixo.

Page 100: Estado Solido, Ashcroft, Traduzido

6.2 Os Sete Sistemas Cristalinos 97

como ilustrado na Figura 7.1. Veremos a seguir, que tal representação ésempre possível:Considere uma operação de simetria S que não mantém nenhum ponto

da rede fixo. Suponha que esta operação translade a origem da rede deO para R. Agora, considere a operação, onde primeiro aplicamos S e, emseguida, uma translação através do vetor da rede −R, que denotaremospor T−R. A operação composta, que chamaremos de T−RS é também umasimetria da rede, mas ela deixa a origem fixa, uma vez que S translada aorigem para R, enquanto que T−R traz R de volta para a origem. Então,T−RS é uma operação, na qual pelo menos um ponto é mantido fixo (nocaso, a origem). Porém, se após a operação T−RS, realizamos a operaçãoTR,o resultado é equivalente à operação S apenas, uma vez que a aplicaçãofinal de TR, desfaz a aplicação precedente de T−R. Portanto, S pode serdecomposta de T−RS, que deixa um ponto fixo, e TR,que é uma translaçãopura.Assim, o grupo completo de simetria de uma rede de Bravais8 contém

somente operações das seguintes formas:

1. Translações através de vetore da rede de Bravais;

2. Operações que deixam um ponto particular da rede fixo;

3. Operações que podem ser construídas por sucessivas aplicações dasoperações do tipo (1) ou (2).

6.2 Os Sete Sistemas Cristalinos

Quando examinamos simetrias não-translacionais, considera-se às vezes nãoo grupo espacial de uma rede de Bravais completo, mas apenas aquelasoperações que deixam um determinado ponta da rede fixo (i.e., operaçõesna categoria (2) acima). Este subconjunto do grupo de simetria de umarede de Bravais é chamado de grupo puntual da rede de Bravais.Existem somente sete grupos puntuais distintos que uma rede de Bravais

pode ter.9 Qualquer estrutura cristalina pertence a um dos sete sistemascristalinos, dependendo do qual desses sete grupos puntuais é o grupo de

8Veremos mais adiante que uma estrutura cristalina geral pode ter operações desimetria adicionais que não são dos tipos (1), (2) ou (3). Elas são conhecidas como”screw axis” e ”glide planes”.

9Dois grupos puntuais são idênticos se eles contiverem precisamente as mesmas oper-ações. Por exemplo, o conjunto de todas as operações de simetria de um cubo é idênticoao conjunto de todas as operações de simetria de um octaedro regular, como pode servisto facilmente, inscrevendo-se apropriadamente o octaedro no cubo (Fig. 7.2a). Poroutro lado, o grupo de simetria do cubo não é equivalente ao grupo de simetria dotetraedro regular. O cubo possui mais operações de simetris (Fig. 7.2b).

Page 101: Estado Solido, Ashcroft, Traduzido

98 6. Classificação das Redes de Bravais e Estruturas Cristalinas

sua rede de Bravais básica. Os sete sistemas cristalinos são enumerados napróxima seção.

6.3 As Quatorze Redes de Bravais

Quando relaxamos as restrições a operações puntuais e consideramos ogrupo completo de simetria da rede de Bravais, existirão quatorze gruposespaciais distintos que uma rede de Bravais pode ter.10 Então, do ponto devista de simetria, existem quatorze diferentes tipos de redes de Bravais. Estaenumeração foi feito primeiramente por M. L. Frankheim (1842). Porém,Frankheim enganou-se reportando quinze possibilidades. A. Bravais (1845)foi o primeiro a contar as categorias corretamente.

6.4 Enumeração dos Sete Sistemas Cristalinos eQuatorze Redes De Bravais

Relacionamos abaixo os sete sistemas cristalinos e as redes de Bravais per-tencentes a cada um deles. O número de redes de Bravais num sistema édado entre parênteses após o nome do sistema.

• Cúbico (3) O sistema cúbico contém aquelas redes de Bravais,cujos grupos puntuais é o grupo de simetria de um cubo (Fig. 7.3a).Três redes de Bravais com grupos espaciais não equivalentes têm o

10A equivalência de dois grupos espaciais da rede de Bravais é uma noção mais sutildo que a equivalência de dois grupos puntuais (embora ambas se reduzam ao conceitode ”isomorfismo” na teoria de grupo abstrata.) Não é demais dizer que dois grupos sãoequivalentes se eles tiverem as mesmas operações, pois operaçòes de grupos espaciaisidênticos podem diferir de formas inconsequentes. Por exemplo, duas redes de Bravaiscúbicas simples com diferentes constantes de rede, a e a0, são consideradas ter os mesmosgrupos espaciais, embora numa as translações tenham passo a e na outra, a0. Similar-mente, gostaríamos de considerar todas as redes de Bravais hexagonais simples comotendo grupos espaciais idênticos, independentemente, do valor de c/a, que é, obviamente,irrelevante para a simetria total da estrutura.Podemos resolver este problema, notando-se que nesses casos, pode-se deformar con-

tinuamente uma estrutura de um dado tipo numa outra de mesmo tipo, sem perderqualquer uma das operações de simetria. Então, pode-se expandir uniformemente oseixos do cubo de a até a0, mantendo-se sempre a simetria cúbica simples, ou pode-se di-latar (ou comprimir) o eixo-c (ou eixo-a), sempre mantendo a simetria hexagonal simples.Portanto, duas redes de Bravais podem ser ditas ter o mesmo grupo espacial se for pos-sível transformar, continuamente, uma na outra, de tal maneira que qualquer operaçãode simetria da primeira seja transformada continuamente numa operação de simetria dasegunda, e que não exista nenhuma operação adicional de simetria da segunda rede quenão possa ser obtida das operações de simetria da primeira rede.

Page 102: Estado Solido, Ashcroft, Traduzido

6.4 Enumeração dos Sete Sistemas Cristalinos e Quatorze Redes De Bravais 99

grupo puntual cúbico. Eles são cúbica simples, cúbica de corpo cen-trado e cúbica de face centrada. As três foram descritas no Capítulo4.

• Tetragonal (2) Pode-se reduzir a simetria de um cubo, puxando-o por duas faces opostas para esticá-lo e transformá-lo num prismaretangular com uma base quadrada, mas com a medida da alturadiferente da dos lados do quadrado (Fig. 7.3b). O grupo de sime-tria deste objeto é o grupo tetragonal. Assim, esticando-se a rede deBravais cúbica simples contrói-se a rede de Bravais tetragonal sim-ples, que pode ser caracterizada como uma rede de Bravais geradapor três vetores primitivos mutuamene perpendiculares, apenas doisdos quais, com o mesmo comprimento. O terceiro eixo é chamado deeixo-c. Similarmente, esticando-se as redes cúbicas de corpo centradoe face centrada, obtém apenas mais uma rede de Bravais do sistematetragonal, a tetragonal centrada.

Para se vê por que não existe distinção entre a tetragonal de corpocentrado e de face centrada, considere a Fig. 7.4a, que é uma repre-sentação de uma rede de Bravais tetragonal centrada vista do eixo-c.O ponto 2 está num plano da rede a uma distância c/2 do planocontendo os pontos 1. Se c = a, a estrutura é uma rede cúbica decorpo centrado, e para um c qualquer, ela pode evidentemente servista como o resultado da deformação da rede bcc ao longo do eixo-c.Porém, a mesma rede pode também ser vista do eixo-c, como na Fig.7.4b, com os planos da rede considerados como arranjos quadradoscentrados de lado a0 =

√2a. Se c = a0/2 = a/

√2 a estrutura é uma

rede de Bravais cúbica de face centrada, e para c qualquer pode servista como o resultado de se deformar a rede fcc ao longo do eixo-c.

Ou seja, as redes cúbica de face centrada e de corpo centrado sãocasos especiais da rede tetragonal centrada, na qual o valor partic-ular da razão c/a introduz simetrias extras, que são reveladas maisclaramente quando se vê as redes como na Fig. 7.4a (bcc) e Fig. 7.4b(fcc).

Da mesma maneira, pode-se reduzir a simetria puntual da rede tetrag-onal centrada para a ortorrômbica, de duas maneira, deformando-a,ou ao longo do cojunto de linhas paralelas traçadas na Fig. 7.4a paraproduzir a ortorrômbica de corpo centrado, ou ao longo do cojuntode linhas paralelas traçadas na Fig. 7.4b, produzindo a ortorrômbicade face centrada.

Estas quatro redes esgotam o sistema ortorrômbico.

• Monoclínico (2) Pode-se reduzir a simetria ortorrombica, distorcendo-se as faces retangulares perpendiculares ao eixo-c na Fig. 7.3c numparalelogramo geral. Este grupo de simetria do objeto resultante

Page 103: Estado Solido, Ashcroft, Traduzido

100 6. Classificação das Redes de Bravais e Estruturas Cristalinas

(Fig. 7.3d) é o grupo monoclínico. Assim, distorcendo-se uma redede Bravais ortorrômbica simples produz-se uma rede de Bravais mon-oclínica simples, cujas simetrias são aquelas requeridas pelo fato deque elas podem ser geradas por três vetores primitivos, um dos quaisé perpendicular ao plano formado pelos outros dois. Similarmente,distorcendo-se a rede de Bravais ortorrômbica de base centrada produz-se uma rede com o mesmo grupo espacial monoclínico simples. Porém,distorcendo-se ou a rede de Bravais ortorrômibica de face centrada oude corpo centrado produz-se a rede de Bravais monoclínica centrada(Fig. 7.6).

Note que as duas redes monoclínicas correspondem às duas tetrag-onais. A duplicação no caso ortorrômbico reflete o fato de que umarede retangular e uma rede retangular centrada tem dois grupos desimetria bidimensional distintos, enquanto que a rede quadrada e arede quadrada centrada não são distintas, assim como a rede paralel-ogrâmica e paralelogrâmica centrada que têm a mesma simetria.

• Triclínico (1) A destruição do cubo é completada, inclinando-seo eixo-c na Fig. 7.3d, tal que nenhum dos lado seja perpendicular aosoutros dois, resultando no objeto ilustrado na Fig. 7.3e, sobre o qualnão existe nenhuma restrição, a não ser que os pares de faces opostossão paralelas. Assim, distorcendo-se a rede de Bravais monoclínica,construimos a rede de Bravais triclínica. Ela é uma rede gerada portrês vetores primitivos sem nenhuma relação especial entre si, e éportanto uma rede de Bravais de simetria mínima. Mas, o grupopuntual triclínico não é o grupo de um objeto sem qualquer simetria,pois qualquer rede de Bravais é invariante sob inversão num ponto darede. Essa, porém, é a única simetria requerida pela definição geralda rede de uma Bravais e, portanto, é a única operação11 no grupopontual triclínico.

Assim, torturando-se um cubo, chegamos a doze das quatorze redesde Bravais e cinco dos sete sistemas cristalinos. Podemos encontraro décimo terceiro e o sexto, retomando-se o cubo e distorcendo-o demaneira diferente.

• Trigonal (1) O grupo puntual trigonal descreve uma simetriade objetos, e produz-se esticando um cubo ao longo da diagonal docorpo (Fig. 7.3f). A rede assim obtida, distorcendo-se qualquer umadas três redes de Bravais cúbica é a rede de Bravais romboédrica (ou

11Além da operação identidade (não mexe com a rede), que está sempre presente entreos membros de um grupo de simetria.

Page 104: Estado Solido, Ashcroft, Traduzido

6.5 Grupos Puntuais e Grupos Espaciais Cristalográficos 101

trigonal). Ela é gerada por três vetores primitivos de mesmo tamanho,fazendo ângulos iguais entre si.12 .

Finalmente, não relacionada com o cubo é:

• Hexagonal (1) O grupo puntual hexagonal é o grupo de sime-tria de um prisma reto, tendo como base um hexágono regular (Fig.7.3g). A rede de Bravais hexagonal simples (descrita no Capítulo 4)tem um grupo puntual hexagonal e é a única rede de Bravais nosistema hexagonal13,

Os sete sistemas cristalinos e as quatorze redes de Bravais descritasa acima esgota todas as possibilidades. Não é óbvio (ou as redes de-veriam ser conhecidas como redes de Frankheim). Porém, não temnenhuma importância prática entender por que esses são os únicoscasos distintos. É o bastante conhecermos por que as categorias exis-tem e quais são elas.

6.5 Grupos Puntuais e Grupos EspaciaisCristalográficos

A seguir, descreveremos os resultados de uma análise similar, aplicada nãoàs rede de Bravais, mas a estruturas cristalinas em geral. Consideremos aestrutura obtida, tansladando-se um objeto arbitrário através dos vetoresde qualquer rede de Bravais, e tentemos classificar os grupos de simetriados arranjos assim obtidos. Isto depende tanto da simetria do objeto, comoda simetria da rede de Bravais. Uma vez que não se exige que os objetostenham simetria máxima (e.g., esférica) o número de grupos de simetriacresce enormemente: existem 230 grupos de simetria diferentes que umarede com base pode ter, conhecidos como os 230 grupos espaciais. (Comparecom os quatorze grupos espaciais que resultam, quando se exige que a baseseja completamente simétrica.)Os grupos puntuas possíveis de uma estrutura cristalina geral também

já foi enumerado. Eles descrevem as operações de simetria que transforma ocristal nele próprio, deixando um ponto fixo (i.e., simetrias não-translacionais).Existem trinta e dois grupos puntuais distintos que a estrutura cristalinapode ter, conhecidos como os trinta e dois grupos puntuais cristalográficos.

12Valores especiais desse ângulo pode introduzir simetrias extras, que, neste caso, arede pode ser realmente uma das três redes cúbicas. Veja, por exemplo, Problema 2(a).13 Se tentarmos produzir mais redes de Bravais, a partir das distorções da hexag-

onal simples, encontra-se que, mudando o ângulo entre os dois vetores primitivos decomprimentos iguais perpendiculares ao eixo-c resulta numa rede ortorrômbica de basecentrada, mudando seus comprimentos, obtém-se a monoclínica, e inclinando-se o eixo-c,obtém em geral a triclínica.

Page 105: Estado Solido, Ashcroft, Traduzido

102 6. Classificação das Redes de Bravais e Estruturas Cristalinas

(Compare com os sete grupos puntuais que resultam, quando se exige quea base seja completamente simétrica.)Esses vários números e suas relações entre si são sumarizadas na Tab. 7.1Os trinta e dois grupos puntuais cristalográficos podem ser construídos

dos sete grupos puntuais da rede de Bravais, considerando-se sistematica-mente todas as possíveis maneiras de reduzir a simetria dos objetos (Fig.7.3) caracterizada por esses grupos.Cada um dos vinte e cinco novos grupos construídos desta maneira é as-

sociado com um dos sete sistemas de acordo com a seguinte regra: Qualquergrupo construído pela redução da simetria de um objeto caracterizado porum sistema cristalino particular continua pertencendo àquele sistema atéque a simetria tenha sido reduzida de tal forma, que todas as operaçõesde simetria do objeto remanescentes são também encontradas em sistemascristalinos menos simétricos; quando isto acontece, o grupo de simetria doobjeto é transferido para o sistema crislalino menos simétrico. Então, o sis-tema cristalino de um grupo puntual cristalográfico é o menos simétrico14

dos sete grupos puntuais da rede de Bravais, contendo qualquer operaçãode simetria do grupo cristalográfico.Objetos com as simetrias dos cinco grupos cristalográficos no sistema

cúbico são ilustrados na Tab. 7.2. Objetos com as simetrias dos vinte e setegrupos cristalográficos não-cúbicos são mostrados na Tab, 7.3.Grupos puntuais cristalográficos podem conter os seguintes tipos de op-

erações de simetria:

1. Rotações de Múltiplos Inteiros de 2π/n em Torno de um EixoO eixo é chamado de eixo-n de rotação. É facilmente mostrado (Prob-lema 6) que uma rede de Bravais pode conter somente eixos 2, 3, 4 ou6. Como os grupos puntuais cristalográficos estão contidos nos grupospuntuais da rede de Bravais, eles também só podem ter esses eixos.

2. Rotação-Reflexão Mesmo quando uma rotação de 2π/n nãoé um elemento de simetria, às vezes tal rotação seguida por uma

14A noção de hierarquia de simetrias de sistemas cristalinos precisa ser mais elaborada.Na Fig. 7.7 cada sistema cristalino é mais simétrico do que possa ser atingido a partirdele, seguindo-se a seta; i.e., o correspondente grupo puntual da rede de Bravais temtodas as operaçõ es que os grupos, a partir da qual, possam ser atingidos. Parece existiralguma ambiguidade neste esquema, pois os quatro pares cúbica-heagonal, tetragonal-heagonal , tetragonal-trigonal e ortorrômbica-trigonal não são ordenados pela seta. En-tão, poderíamos imaginar um objeto, onde todas as operações de simetria pertencessetanto ao grupo tetragonal como trigonal, mas a nenhum dos grupos mais abaixo. Ogrupo de simetria de tal objeto pertenceria ou ao sistema tetragonal, ou trigonal, poisnão existiria um sistema único de simetria mais baixa. Segue-se deste e dos três outroscasos ambíguos, que todos os elementos de simetria comuns a ambos os grupos num partambém pertencem ao grupo que está hierarquicamente mais abaixo que os dois. (Porexemplo, qualquer elemento comum aos grupos tetragonal e trigonal, também pertenceao grupo monoclínico.) Existe portanto sempre um grupo único de simetria inferior.

Page 106: Estado Solido, Ashcroft, Traduzido

6.6 Nomenclatura dos Grupos Puntuais 103

reflexão num plano perpedendicular ao eixo pode ser. O eixo é entãochamado de eixo-n de rotação reflexão. Por exemplo, os grupos S6 eS4 (Tab. 7.3) têm eixos de rotação-reflexão 6 e 4.

3. Rotação-Inversão Similarmente, às vezes a rotação de 2π/nseguida por uma inversão num ponto pertencente ao eixo de rotaçãoé um elemento de simetria, mesmo quando tal rotação em si não ofor. O eixo é então chamado de eixo-n de rotação-inversão. O eixoem S4 (Tab. 7.3), por exemplo, é também um eixo rotação-inversão4. Porém, os grupos S6 tem somente um eixo rotação-inversão 3.

4. Reflexões Uma reflexão transforma qualquer ponto em sua im-agem especular num plano, conhecido como plano do espelho.

5. Inversões Uma inversão tem um único ponto fixo. Se aqueleponto é considerado como a origem, então qualquer ponto r transforma-se em −r.

6.6 Nomenclatura dos Grupos Puntuais

Duas nomenclaturas, a de Schöenflies e a internacional, são largamenteusadas. Ambas as designações são dadas nas Tabs. 7.2 e 7.3.

6.6.1 Notação de Schöenflies para Grupos PuntuaisCristalográficos Não-Cúbicos

As categorias de Schöenflies são ilustradas, agrupando-se a linhas na Tab.7.3 de acordo com os índices dados do lado esquerdo. São elas:15

15C significa ”cíclico”, D ”diédrico ”, e S ”Spiegel” (espelho). Os subscritos h, v ed significa ”horizontal ”, ”vertical ” e ”diagonal” e refere-se à colocação dos planos doespelho com respeito ao eixo-n, considerado na vertical. (Os planos ”diagonal” em Dndsão verticais e são a bissetriz do ângulo entre os eixo-2.)

Page 107: Estado Solido, Ashcroft, Traduzido

104 6. Classificação das Redes de Bravais e Estruturas Cristalinas

Cn: Esses grupos contém somente eixos-n de rotação.Cnv: Além dos eixox-n, esses grupos têm um plano de espelho que contém

o eixo de rotação, e mais tantos planos adicionais, quantos a existênciados eixos-n exigirem.

Cnh: Esses grupos contém, além dos eixos-n,um único plano de espelhoque é perpendicular ao eixo.

Sn Esses grupos contém somente um eixo-n de rotação-reflexão.Dn Além de um eixo-n de rotação, esses grupos contém um eixo-2

perpendicular ao eixo-n, e mais tantos eixos-2 adicionais foremrequeridos pela existência do eixo-n.

Dnh Esses (o mais simétrico dos grupos) contém todos os elementos deDn, mais um plano de espelho perpendicular ao eixo-n.

Dnd Esses contém os elementos de Dn e mais planos de espelhocontendo o eixo-n, que é a bissetriz do ângulo entre os eixos-2.

É instrutivo verificar que os objetos mostrados na Tab. 7.3, têm realmenteas simetrias requeridas pelos nomes de Schöenflies.

6.6.2 Notação Internacional para Grupos PuntuaisCristalográficos Não-Cúbicos

As categorias internacionais são ilustradas, agrupando-se as linhas na Tab.7.3 de acordo com os índices dados do lado direito. Três categorias sãoidênticas às categorias de Schöenflies:n é a mesma que Cn

nmm é a mesma que Cnv. Os dois m’s referem-se a dois tipos distintos deplanos de epelho contendo o eixo-n. O que eles são, é evidente da ilustraçãodos objetos 6mm, 4mm e 2mm. Isto demonstra que um eixo-2j transformaum plano de espelho vertical em j planos, mas em adição, outros j apare-cem automaticamente como bissetrizes dos angulos entre planos adjacentesno primeiro conjunto. Porém, um eixo-(2j + 1) transforma um plano deespelho em 2j + 1 outros planos equivalentes, e portanto16 C3v é chamadoapenas .de 3m.n22 é o mesmo que Dn. A discussão é a mesma que para nmm, mas

agora eixos-2 são envolvidos, ao invés de planos de espelho verticais.As outras categorias internacionais e suas relações com aquela de Schöen-

flies são as seguintes:n/m é o mesmo que Cnh, exceto que o sistema internacional prefere

considerar C3h como contendo um eixo-6 rotação-inversão, fazendo-o 6 (vejaa próxima categoria). Note também que C1h torna-se simplesmente m, aoinvés de 1/m.

16Para enfatizar a diferença entre eixos−n pares e ímpares, o sistema internaciona, aocontrário de Schöenflies, trata o eixo-3 como um caso especial.

Page 108: Estado Solido, Ashcroft, Traduzido

6.7 Os 230 Grupos Espaciais 105

n é um grupo com um eixo-n de rotação-inversão. Esta categoria contémC3h, disfarçado de 6. Contém também S4 que vai sutilfmente para 4. Mas,S6 torna-se 3 e S2 torna-se 1 em virtude da difernça entre os eixos rotação-reflexão e rotação-inversão.

nm

2m

2m , abreviado por n/mmm, é justamente Dnh exceto que o sistema

internacional prefere considerar D3h como contendo um eixo-6 de rotação-inversão, fazendo-o 62m (veja a próxima categora, e note a similaridadepara a ejeção de C3h de n/m para n). Note também que 2/mmm é con-vencionalmente abreviado como mmm.n2m é o mesmo queDnd exceto queD3h é incluído como 62m. O nome na

verdade sugere um eixo-n de rotação inversão com um eixo-2 perpendiculare um pano de espelho vertical. O caso n = 3 é novamente excepcional, adenominação sendo 3 2m (abreviado, 3m) para enfatizar que neste caso oplano de espelho vertical é perpendicular ao eixo-2.

6.6.3 Nomenclatura para os Grupos Puntuais CristalográficosCúbicos

Os nomes de Schöenflies e internacionais para os cinco grupos cúbicos sãodados na Tab. 7.2. Oh é grupo de simetria completa do cubo (ou octaedro,daí o O), incluindo operações impróprias.17 as quais admitem um plano dereflexão horizontal (h). O é o grupo cúbico (ou octaedro) sem operaçõesimpróprias. Td é o grupo de simetria completo do tetraedro regular, ex-cluindo todas as operações impróprias, e Th é o grupo de simetria completodo tetraedro regular, incluindo todas as operações impróprias, T é o grupode simetria completo do tetraedro regular, excluindo todas as operaçõesimpróprias e Th é o que resulta quando uma inversão é acrescentada a T.Os nomes internacionais para os grupos cúbicos são convencionalmente

dintinguidos daqueles de outros grupos puntuais cristalográficos por conter3 como segundo número, referindo-se ao eixo-3 presente em todos os gruposcúbicos.

6.7 Os 230 Grupos Espaciais

Teremos pouca coisa a dizer sobre os 230 grupos espaciais, a não ser apon-tar que o número é muito maior do que poderíamos pensar. Para cada sis-tema cristalino podemos construir uma estrutura cristalina com um grupoespacial diferente, colocando-se um objeto com as simetrias de cada umdos grupos puntuais em cada uma das redes de Bravais do sistema. Desta

17Qualquer operação que transforma um objeto no seu reverso. Todas as outras oper-ações são próprias. Operações contendo um número ímpar de inversões são impróprias.

Page 109: Estado Solido, Ashcroft, Traduzido

106 6. Classificação das Redes de Bravais e Estruturas Cristalinas

maneira, porém, encontramoa somente 61 grupos spaciais, como mostradona Tab. 7.4.Podemos suprir mais cinco, observando-se que um objeto com simetria

trigonal dá um grupo espacial, ainda não enumerado, quando colocadonuma rede de Bravais hexagonal.18 Outros sete originam-se de casos nosquais um objeto com a simetria de um dado grupo puntual pode ser orien-tado em mais de uma maneira num dada rede de Bravais, tal que originamais de um grupo espacial. Esses 73 grupos espaciais são chamados desimórficoA maioria dos grupos espaciais é não-simórfico, contendo operações adi-

cionais que não podem simplesmente ser decompostas em translações darede de Bravais e de operação de grupos pontuais. Para existirem tais op-erações adicionais é essencial que exista alguma relação especial entre asdimensões da base e as dimensões da rede de Bravais. Quando a base temum tamanho razoavelmente casado aos vetores primitivos da rede, podemse originar dois novos tipos de operações;

1. Eixos ... A uma estrutura cristalina com um eixo XXX

18Embora o grupo puntual trigonal esteja contido no grupo puntual hexagonal, a redede Bravais trigonal não pode ser obtida da rede hexagonal simples por uma distorçãoinfinitesimal. (Isto é contrário a todos os outros pares de sistemas conectados pelas setasna hierarquia de simetria da Fig. 7.7.) O grupo puntual trigonal está contido no grupopuntual hexagonal porque a rede de Bravais trigonal pode ser vista como uma hexagonalsimples com uma base de três pontos consistindo em

0; 13a1,

13a2,

13c; e 2

3a1,

23a2,

23c.

Como resultado, colocando-se uma base com grupo puntual trigonal numa rede de Bra-vais hexagonal resulta em diferente grupo espacial daquele obtido colocando-se a mesmabase numa rede trigonal. Em nenhum outro caso isso se repete. Por exemplo, uma basecom simetria tetragonal, quando colocada numa rede cúbica simples, dá exatamente omesmo grupo espacial como se tivesse sido colodada numa rede tetragonal simples (amenos que exista uma relação especial entre as dimensões do objeto e o comprimento doeixo-c). Isto é refletido fisicamente no fato de que existem cristais que têm bases trigonaisnas redes de Bravais hexagonal, mas não com base tetragonal em redes de Bravais cúbi-cas. No último caso, nada na estrutura de tal objeto requer que o eixo-c tenha o mesmocomprimento que os eixox-a; se a rede permaneceu cúbica foi mera coincidência. Aocontrário, uma rede de Bravais hexagonal simples não pode ser distorcida cotinuamentepara se obter uma rede trigonal, e pode, portanto, manter-se na sua forma hexagonalsimples, mesmo que a base tenha apenas simetria trigonal.Devido aos grupos puntuais trigonais poderem caracterizar um estrutura cristalina

com uma rede de Bravais hexagonal simples, os cristalógrafos afirmam que existemsomente seis sistemas cristalinos. Isto é porque a cristalografia enfatiza mais a simetriapuntual do que a espacial. Porém, do ponto de vista dos grupos puntuais da rede deBravais, existem inquestionavelmente sete sistemas cristalinos: os grupos puntuais D3de D6h são ambos grupos puntuais das redes de Bravais e não são equivalentes.

Page 110: Estado Solido, Ashcroft, Traduzido

6.8 Exemplos entre os Elementos 107

6.8 Exemplos entre os Elementos

No Capítulo 4, relacionamos aqueles elementos com estruturas cristalinascúbica de face centrada, cúbica de corpo centrado, hexagonal com agrupa-mento compacto ou diamante. Mais de 70 por cento dos elementos estãonessas quatro categorias. Os demais, estão distribuídos entre uma variedadede estruturas cristalinas, a maioria com células primitivas poliatômicas queàs vezes são muito complexas. Concluímos este capítulo com mais algunsexemplos listados na Tabs. 7.5, 7.6 e 7.7. Os dados são de Wickoff (vejaTab. 4.1) e para a temperatura ambiente e pressão atmosférica normal, amenos que se diga o contrário.

6.9 Problemas

(a) Prove que qualquer rede de Bravais tem simetria de inversão numponto de rede. (Sugestão: Expresse as translações da rede comocombinações lineares dos vetores primitivos com coeficientes in-teiros.)

(b) Prove que a estrutura do diamante é invariante sob uma inver-são no ponto central de qualquer ligação entre vizinhos maispróximos.

(c) Mostre que a estrutura do diamante não é invariante sob inver-sões em quaisquer outros pontos.

(a) Se os três vetores primitivos para uma rede de Bravais trigonalformam um ângulo de 90o entre si, a rede tem obviamente maissimetria do que a trigonal, sendo cúbica simples. Mostre que seos ângulos são 60o ou arccos (-13) a rede novamente tem maissimetria do que a trigonal, sendo cúbica de face centrada oucúbica de corpo centrado.

(b) Mostre que a rede cúbicas simples pode ser representada comouma rede trigonal com vetores primitivos ai formando um ângulode 60o entre si, com uma base de dois pontos ±1

2 (a1 + a2 + a3) .(Compare esses números com as estruturas cristalinas na Tab.7.5.)

(c) Que estrutura resulta se a base na mesma rede trigonal é con-siderada como ±1

8 (a1 + a2 + a3)?

1. Se dois sistemas são conectados por setas na hierarquia de simetriada Fig. 7.7, então a rede de Bravais no sistema mais simétrico podeser reduzida para aquela de sistema menor simétrico, fazendo-se dis-torções infinitesimais, exceto para o par hexagonal-trigonal. As dis-torções apropriadas foram descritas no texto em todos os caso, excetopar hexagonal-ortorrômbica e trigonal-monoclínica.

Page 111: Estado Solido, Ashcroft, Traduzido

108 6. Classificação das Redes de Bravais e Estruturas Cristalinas

(a) Descreva uma distorção infinitesimal que reduz a rede de Bravaishexagonal simples a uma no sistema ortorrômbico.

(b) Que espécie de rede de Bravais ortorrômbica pode ser obtidadessa maneira?

(c) Descreva uma distorção infinitesimal que reduz a rede de Bravaistrigonal a uma no sistema monoclínico.

(d) Que espécie de rede de Bravais monoclínica pode ser obtida dessamaneira?

(a) Quais dos grupos puntuais trigonais descritos na Tab. 7.3 é umgrupo puntual da rede de Bravais? Isto é, qual dos objetos rep-resentativos tem a simetria do objeto mostrado na Fig. 7.3f?

(b) Na Fig. 7.9, as faces do objeto da Fig. 7.3f são decoradas devárias maneiras redotoras de simetria para produzir objetos comas simetrias dos quatro grupos puntuais trigonais restantes. Referindo-se à Tab. 7.3, indique a simetria do grupo puntual de cada ob-jeto.

2. Qual das 14 redes de Bravais, fora as cúbicas de face centrada e decorpo centrado, que não tenham redes recíprocas da mesma espécie?

(a) Mostre que existe uma família de planos de rede perpendiculara qualquer eixo-n de rotação de uma rede de Bravais, n ≥ 3. (Oresultado é também verdadeiro quando n = 2, mas requer ummuito mais elaborado (Problema 7).)

(b) Deduza de (a) que um eixo-n não pode existir em qualquer redede Bravais tridimensional, a menos que ela possa existir em al-guma rede de Bravais bidimensional.

(c) Prove que nenhuma rede de Bravais bidimensional pode ter umeixo-n com n = 5 ou n ≥ 7.(Sugestão: Primeiro mostre queo eixo pode ser escolhido para passar por um ponto da rede.Então demonstre por reductio ad absurdum, usando o conjuntode pontos nos quais os vizinhos mais próximos do ponto escolhidoé tomado por n rotações para construir um ponto mais próximodo ponto escolhido do que seu ”vizinho mais próximo” .(Noteque o caso n = 5 reque um tratamento ligeiramente diferente dodos outros casos.))

(a) Mostre que, se uma rede de Bravais tem um plano de espelho,então existe uma família de planos de rede paralela ao plano deespelho. (Sugestão: Mostre do argumento da pág. 97 que a ex-istência de um plano de espelho implica a existência de um planode espelho contendo um ponto da rede. Basta então provar queaquele plano contém dois outros pontos de rede não colinearescom o primeiro.)

Page 112: Estado Solido, Ashcroft, Traduzido

6.9 Problemas 109

(b) Mostre que, se uma rede de Bravais tem um eixo-2 de rotação,então existe uma família de planos de rede perpendicular ao eixo.

Page 113: Estado Solido, Ashcroft, Traduzido

110 6. Classificação das Redes de Bravais e Estruturas Cristalinas

Page 114: Estado Solido, Ashcroft, Traduzido

This is page 111Printer: Opaque this

7Níveis Eletrônicos num PotencialPeriódico: Propriedades Gerais

Como os íons num cristal perfeito estão distribuídos num arranjo periódicoregularO, devemos considerar o problema de um elétron num potencialU (r) que tenha a periodicidade da rede de Bravais, isto é:

U (r+R) = U (r) (7.1)

para todos os vetores R da rede de Bravais.Além disto, a escala da periodicidade desse potencial U (∼ 10−8cm)

é idêntica ao comprimento de onda de de Broglie típico para um elétronno modelo de elétrons livres de Sommerfeld, o que nos obriga a usar amecânica quântica para levarmos em conta os efeitos da periodicidade sobreo movimento do elétron.Neste capítulo, discutiremos aquelas propriedades dos níveis eletrônicos

que dependem somente da periodicidade do potencial, independentementede sua forma particular. A discussão continuará nos Capítulos 9 e 10 paratratar dois casos limites de grande interesse físico e servirá como ilustraçãodos resultados gerais obtidos neste capítulo. No Capítulo 11, são resumi-dos alguns dos métodos mais importantes do cálculo detalhado de níveiseletrônicos. Nos Capítulos 12 e 13, discutiremos a importância destes resul-tados, primeiro nos problemas da teoria de transporte eletrônico levantadosnos Capítulos 1 e 2 e indicaremos quanto das anomalias da teoria de elétronlivre (Capítulo 3) é removido dessa maneira. Nos Capítulos 14 e 15, exam-inaremos as propriedades de metais específicos que ilustram e confirmam ateoria geral.

Page 115: Estado Solido, Ashcroft, Traduzido

112 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

Enfatizamos no início que a periodicidade perfeita é um idealização. Ossólidos reais nunca são absolutamente puros, e na vizinhança dos átomosde impureza, o sólido não é o mesmo como em outra parte do cristal. Alémdisso, sempre há uma pequena probabilidade dependente da temperaturade encontrar íons ausentes ou íons fora de suas posições (Capítulo 30),o que destrói a simetria translational perfeita de até mesmo um cristalabsolutamente puro. Finalmente, os íons não são de fato estacionários, massofrem, continuamente, vibrações térmicas em torno de suas posições deequilíbrio.Estas imperfeições têm grande importância. Por exemplo, elas são re-

sponsáveis, no final das contas, pelo fato de que a condutividade elétricados metais não é infinita. Porém, podemos avançar mais, dividindo artifi-cialmente o problema em duas partes: (a) o cristal perfeito ideal fictício,no qual o potencial é genuinamente periódico, e (b) os efeitos sobre aspropriedades de um cristal perfeito hipotético devido aos desvios da peri-odicidade serão tratados como pequenas perturbações.Também, enfatizamos que o problema de elétrons num potencial per-

iódico não se origina somente no contexto dos metais. A maioria de nossasconclusões gerais aplicam-se a todos os sólidos cristalinos, e terá um papelimportante em nossas discussões subseqüentes de isolantes e semicondu-tores.

7.1 O Potencial Periódico

O problema de elétrons num sólido é, em princípio, um problema de muitoscorpos, pois o Hamiltoniano total do sólido não contém somente potenciaisde um elétron, descrevendo as interações dos elétrons com o núcleo atômico,mas também potenciais de pares, descrevendo as intereçòes elétron-elétron.Na aproximação de elétrons independentes essas interações são represen-

tadas por um potencial efetivo de um elétron U (r) . Como escolher qualo melhor potencial efetivo é um problema complicado, que será tratadonos Capítulos 11 e 17. Aqui, não estamos interessados na forma particulardesse potencial, uma vez que, se o cristal é perfeitamente periódico, essepotencial efetivo deve satisfazer a Eq. (7.1). Muitas conclusões podem serobtidas, levando-se em conta apenas este fato. Qualitativamente porém umpotencial cristalino típico comporta-se como aquele mostrado na Fig. 8.1,assemelhando-se aos potenciais atômicos individuais na região próxima aosíons e achatando-se na região entre eles.Vamos então examinar as propriedades gerais da equação de Schrödinger

para um único elétron,

Hψ = εψ (7.2)

Page 116: Estado Solido, Ashcroft, Traduzido

7.2 Teorema de Bloch 113

derivadas do fato de que U (r) tem a periodicidade (7.1). A equação deSchrödinger (2.4) é um caso especial de (7.2) (embora, em alguns aspectos,muito patológico), sendo o potencial nulo o exemplo mais simples de umpotencial periódico.Elétrons independentes, cada um deles obedecendo uma equação de Schrödinger

com um potencial periódico, são conhecidos como elétrons de Bloch (emcontraste com elétrons livres, aos quais se reduzem os elétrons de Bloch,quando o potencial periódico é identicamente nulo). Os estados estacionáriosdos elétrons de Bloch têm a seguinte propriedade, decorrente da periodici-dade do potencial U :

7.2 Teorema de Bloch

Teorema.1 Os autoestados ψ do Hamiltoniano de um elétron H =−~2∇2/2m+U (r) , onde U (r+R) = U (r) para todoR numa rede de Bra-vais, podem ser escolhidos como sendo uma onda plana vezes uma funçãoque tem a mesma periodicidade da rede de Bravais:

ψnk (r) = eik·runk (r) , (7.3)

ondeunk (r+R) = unk (r) (7.4)

para todo R na rede de Bravais.2

Note que (7.3) e (7.4) implica que

ψnk (r+R) = eik·Rψnk (r) . (7.5)

Às vezes, o teorema de Bloch é enunciado da seguinte forma:3 os autoes-tados de H podem ser escolhidos tal que, associado com cada ψ, existe umvetor de onda k tal que

ψnk (r+R) = eik·Rψnk (r) (7.6)

para qualquer Rda rede de Bravais.A seguir, proporemos algumas demonstrações do teoremade Bloch, uma

baseada em considerações gerais da mecânica quântica e a outra, por con-strução explícita.4 .

1O teorema foi demonstrado pela primeira vez por Floquet no caso unidimensional,onde é frequentemente conhecido como teorema de Floquet.

2O índice n é conhecido como índice de banda e ocorre porque, para um dado k,como veremos, existirão muitos autoestados independentes.

3A Eq. (7.6) implica (7.3) e (7.4), pois ela requer que a função u(r) =exp (−ik · r)ψ (r) tenha a periodicidade da rede de Bravais.

4A primeira prova é baseada em alguns resultados formais da mecânica quântica. Asegundo é mais elementar, mas também, em termos de notação, mais complicada.

Page 117: Estado Solido, Ashcroft, Traduzido

114 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

7.2.1 Primeira Demonstração do Teorema de Bloch

Para cada vetor R da rede de Bravais, vamos definir um operador detranslação TR que, operando sobre uma funçào qualquer f (r) , deslocao argumento da função pela quantidade R:

TR f (r) = f (r+R) (7.7)

Como o Hamiltoniano é periódico, tem-se:

TRHψ = H (r+R)ψ (r+R) = H (r)ψ (r+R) = HTRψ (r) (7.8)

Então, uma vez que (7.8) vale para qualquer função ψ, tem-se a identi-dade de operadores:

TRH = HTR (7.9)

Além disto, o resultado da aplicação de duas translações sucessivas nãodepende da ordem em que são aplicadas, pois para qualquer função ψ (r)

TRTR0 ψ (r) = TR0 TR ψ (r) = ψ (r+R+R0) (7.10)

Portanto

TRTR0 = TR0 TR = TR+R0 (7.11)

As equações (7.9) e (7.11) asseguram que TR,para qualquer vetor R darede de Bravais, e o Hamiltoniano H formam um conjunto de operadoresque comutam entre si. Segue-se do teorema fundamental da mecânica quân-tica5 que os autoestados de H podem ser escolhidos para serem simultane-amente autoestados de todos os operadores TR:

Hψ = εψ

TRψ = c (R)ψ (7.12)

Os autovalores c (R) dos operadores de translação estão relacionados, porum lado, devido à condição (7.11)

TR0 TRψ = c (R) TR0ψ = c (R) c (R0)ψ (7.13)

enquanto que, de acordo com (7.11),

TR0 TRψ = TR+R0ψ = c (R+R0) (7.14)

5Veja, por exemplo, D. Park, Introduction to the Quantum Theory, McGraw-Hill,New York, 1964, pág. 123.

Page 118: Estado Solido, Ashcroft, Traduzido

7.2 Teorema de Bloch 115

Segue-se que os autovalores devem satisfazer

c¡R+R0¢ = c (R) c (R0) (7.15)

Agora, sejam ai (i = 1, 2, 3) os três vetores primitivos de uma rede deBravais. Podemos sempre escrever c (ai) na forma

c (ai) = e2iπxi (7.16)

escolhendo-se convenientemente xi.6 Segue-se das aplicações sucessivas de(7.15), que, se R for um vetor geral da rede dado por

R = n1a1 + n2a2 + n3a3 (7.17)

então

c (R) = c (a1)n1 + c (a2)

n2 + c (a3)n3 (7.18)

Mas isto é equivalente a:

c (R) = eik·R (7.19)

ondek = x1b1 + x2b2 + x3b3 (7.20)

e os bi são os vetores primitivos da rede recíproca, satisfazendo (5.4): bi ·aj = 2πδij .Em resumo, mostramos que podemos escolher os autoestados ψ de H tal

que, para qualquer vetor R da rede de Bravais,

TRψ = ψ (r+R) = c (R)ψ = eik·Rψ (r)

Isto é precisamente o teorema de Bloch na forma (7.6).

7.2.2 Condições de Contorno de Born-von Karman

Impondo uma condição de contorno apropriada sobre a função de onda,podemos demonstrar que o vetor de onda k deve ser real e ter valorespermitidos restritos. A condição geralmente escolhida é a generalizaçàonatural da condição (2.5) usada na teoria de Sommerfeld para elétrons livresnuma caixa cúbica. Como naquele caso, introduzimos o volume contendoos elétrons através da condição de Born-von Karman com periodicidademacroscópica (v. Eq. (2.5)). Porém, a menos que a rede de Bravais sejacúbica e L é um múltiplo inteiro da constante de rede a, não é convenientecontinuar trabalhando com um volume cúbico de lado L. Ao invés disto,

6Veremos que, para condições de contorno adequadas, os xi devem ser reais, mas porenquanto eles podem ser considerados como números complexos gerais.

Page 119: Estado Solido, Ashcroft, Traduzido

116 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

é mais conveniente trabalharmos com volumes proporcionais àqueles dascélulas primitivas. Portanto, vamos generalizar as condições de contornoperiódicas (2.5) para:

ψ (r+Niai) = ψ (r) , (i = 1, 2, 3.) (7.21)

onde ai são os três vetores primitivos e Ni são todos inteiros da ordemde 3√N,com N = N1N2N3 sendo o número total de células primitivas do

cristal.Como no Capítulo 2, adotamos esta condição de contorno supondo-se que

as propriedades do sólido nas quais estamos interessados não dependem dacondição de contorno, que é escolhida por conveniência analítica.Aplicando o teorema de Bloch (7.6) à condição de contorno (7.21) encontra-

se

ψnk (r+Niai) = eiNik·aiψnk (r) , (i = 1, 2, 3) (7.22)

que requer

eiNik·ai = 1, i = 1, 2, 3, (7.23)

Quando k tem a forma (7.20), a Eq. (7.23) exige que

ei2πNixi = 1 (7.24)

e, consequentemente, devemos ter

xi =mi

Ni, mi = inteiro (7.25)

Portanto, a forma geral para os vetores de onda de Bloch permitidos é7

k =3Xi=1

mi

Nibi, (mi = inteiro). (7.26)

Segue-se de (7.26) que o volume ∆k do espaço-k para cada valor permi-tido de k é o volume do pequeno paralelepípedo de lados bi/Ni:

∆k =b1N1

·µb2N2

× b3N3

¶=1

Nb1 · (b2 × b3) (7.27)

Uma vez que b1 · (b2 × b3) é o volume de uma célula primitiva da rederecíproca, então a Eq. (7.27) assegura que o número de vetores permitidosnuma célula primitiva da rede recíproca é igual ao número de sítios nocristal.

7Note que (7.26) reduz-se à forma (2.16) usada na teoria de elétron livre, quando arede de Bravais é cúbica simples, sendo ai os vetores primitivos e N1 = N2 = N3 = L/a.

Page 120: Estado Solido, Ashcroft, Traduzido

7.2 Teorema de Bloch 117

O volume de uma célula primitiva da rede recíproca é (2π)3 /v,ondev = V/N é o volume da célula primitiva da rede direta, tal que a Eq. (7.27)pode ser escrita na forma alternativa

∆k =(2π)3

V(7.28)

Isto é precisamente o resultado (2.18) que encontramos no caso de elétronlivre.

7.2.3 Segunda Demonstração do Teorema de Bloch8

Esta segunda prova do teorema de Bloch mostra seu significado de umponto de vista bastante diferente, que exploraremos mais adiante no Capí-tulo 9. Vamos partir com a observação de que podemos sempre expandirqualquer função, obedecendo a condição de contorno de Born-von Karman(7.21), no conjunto de todas as ondas planas, satisfazendo a condição decontorno e, portanto, que tenham vetores de onda da forma (8.27):9

ψ (r) =Xq

cqeiq·r (7.29)

Uma vez que potencial U (r) é periódico na rede, sua expansão de ondaplana conterá somente ondas planas com a periodicidade da rede e, por-tanto, com vetores de onda que são vetores da rede recíproca, 10

U (r) =XK

UK eiK·r (7.30)

Os coeficientes de Fourier UK estão relacionados a U (r) por:11

UK =1

v

Zcélula

dr e−iK·rU (r) (7.31)

Como se tem liberdade para mudar a energia potencial por uma constanteaditiva, vamos escolher que a média espacial U0 do potencial sobre a célulaprimitiva seja nula:

8Embora sendo mais elementar que a primeira demonstração, a segunda prova tam-bém é, em termos de notação, mais complicada, e de grande importância, principalmente,como ponto de partida para o cálculo aproximado do Capítulo 9. O leitor pode, portanto,desejar saltá-la neste momento.

9Daqui por diante, devemos sempre lembrar que as somas sobre o índice mudo k serásobre todos os vetores de onda da forma (7.26) permitidos pela condição de contorno deBorn-von Karman.10A soma indexada por K será feita sobre todos os vetores da rede recíproca.11Veja Apêndice D, onde é discutida a relevância da rede recíproca para expansão de

Fourier de funções periódicas.

Page 121: Estado Solido, Ashcroft, Traduzido

118 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

U0 =1

v

Zcélula

drU (r) = 0 (7.32)

Note que, devido o potencial U (r) ser real, segue-se de (7.31) que oscoeficientes de Fourier satisfazem

U−K = U∗K (7.33)

Se admitirmos que o cristal tem simetria de inversão12 tal que, para umaescolha adequada da origem, U (r) = U (−r) , então (7.31) implica que UKé real, e assim

U−K = UK = U∗K (para cristais com simetria de inversão) (7.34)

Agora, substituimos as expansões (7.29) e (7.30) na equação de Schrödinger(7.2). O termo de energia cinética dá:

p2

2mψ = − ~

2

2m∇2ψ =

Xq

~2

2mq2cq e

iq·r. (7.35)

O termo na energia potencial pode ser escrito13

Uψ =

ÃXK

UK eiK·r

!ÃXq

cq eiq·r!

=XK,q

UK cq ei(K+q)·r =

XK,q0

UK cq0−K eiq0·r, (7.36)

Mudamos os nomes dos índices da soma em (7.36) — de K e q0, para K0 eq — tal que a equação de Schrödinger torna-se:

Xq

eiq·r(µ

~2

2mq2 − ε

¶cq +

XK0UK0 cq−K0

)= 0. (7.37)

Como as ondas planas, satisfazendo a condição de contorno de Born-vonKarman constituem um conjunto ortogonal, o coeficiente de cada termo,separadamente, deve se anular14 e, portanto, para todos os vetores de ondaq permitidos,

12Pede-se ao leitor para seguir o argumento desta seção (e do Capítulo 9) sem asuposição de simetria de inversão, que é feita aqui somente para evitar complicaçõesdesnecessárias na notação.13O último passo segue-se, fazendo-se a substituição K+ q = q0, e notando-se que,

como K é um vetor da rede recíproca, a soma sobre todos os q da forma (7.26) é omesmo que somar sobre todos os q0 daquela forma.14 Isto também pode ser deduzido da Eq. (D.12), do Apêndice D, multiplicando-se

(7.37) pela onda plana apropriada e integrando-se sobre o volume do cristal.

Page 122: Estado Solido, Ashcroft, Traduzido

7.2 Teorema de Bloch 119

µ~2

2mq2 − ε

¶cq +

XK0UK0 cq−K0 = 0 (7.38)

É conveniente escrever q na forma q = k−K,ondeK é um vetor da rederecíproca, escolhido de maneira que k esteja sempre na primeira zona deBrillouin. A Eq. (7.38) torna-seµ

~2

2m(k−K)2 − ε

¶ck−K +

XK0UK0 ck−K−K0 = 0 (7.39)

ou, fazendo-se a mudança de variáveis K0 →K0 −K,µ

~2

2m(k−K)2 − ε

¶ck−K +

XK0UK0−K ck−K0 = 0 (7.40)

Enfatizamos que as Eqs. (7.38) e (?? nada mais é do que representaçãoda equação de Schrödinger no espaço dos momentos, simplificada pelo fatode que, devido à periodicidade, Uk só difere de zero quando k for um vetorda rede recíproca.Para um k fixo na primeira zona de Brillouin, o conjunto de equações

(7.40), para todos os vetores da rede recíproca K, acopla somente aquelescoeficientes ck, ck−K, ck−K0 , ck−K00 , ..., cujo vetor de onda difere de kpor um vetor da rede recíproca. Então, o problema original foi separadoem N problemas independentes: um para cada valor permitido de k naprimeira zona de Brillouin. Cada um desses problemas tem soluções quesão superposição de ondas planas, contendo somente o vetor de onda k eos vetores diferindo de k por um vetor da rede recíproca.Levando esta informação para a expansão (7.29) da função de onda ψ,

vê-se que, se o vetor de onda q tiver somente os valores k, k−K, k−K0,k−K00, ..., então a função de onda será da forma:

ψk =XK

ck−K ei(k−K)·r (7.41)

Se escrevermos esta equação como

ψk (r) = eik·r

ÃXK

ck−K e−iK·r!

(7.42)

isto, então, terá a forma da função de Bloch (7.3), com a função periódicau (r) dada por15

15Note que existirão (infinitamente) muitas soluções para o conjunto (infinito) deequações (7.40) para um dado k. Essas soluções são classificadas pelo índice de banda n(veja a nota de rodapé 2).

Page 123: Estado Solido, Ashcroft, Traduzido

120 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

uk (r) =XK

ck−K e−iK·r. (7.43)

7.3 Observações Gerais sobre o Teorema de Bloch

1. O teorema de Bloch introduz um vetor de onda k que tem o mesmopapel para o movimento num potencial periódico que o vetor de ondado elétron livre na teoria de Sommerfeld. Note, porém, que, emborao vetor de onda do elétron livre seja simplesmente p/~, onde p éo momento do elétron, no caso de Bloch k não é proporcional aomomento eletrônico. Isto está de acordo com os princípios gerais, poiso o Hamiltoniano não tem invariância translacional total na presençade um potencial que não é constante, e portanto seus autoestados nãoserão autoestados simultâneos do operador momento. Esta conclusãoé confirmada pelo fato de que o operador momento p = ~

i ~∇, atuandosobre ψnk dá

~i∇ψnk =

~i∇ ¡eik·ruk (r)¢

= ~kψnk + eik·r~i∇uk (r) (7.44)

que não é, em geral, uma constante vezes ψnk; isto é, ψnk não é umautoestado do momento.

Entretanto, em muitos aspectos, ~k é uma extensão natural de p parao caso do potencial periódico. É conhecido como momento cristalinodo elétron, para enfatizar essa similaridade, mas não pode ser con-fundido com o momento, pois não o é. Uma compreensão intuitiva dosignificado dinâmico do vetor de onda k só pode ser obtida, quandose considera a resposta dos elétrons de Bloch a campos eletromag-néticos aplicados externamente (Capítulo 12). Só então, emergirá suasemelhança com p/~. Por enquanto, o leitor deveria ver k como umnúmero quântico característico da simetria translacional de um po-tencial periódico, da mesma maneira que o momento p é um númeroquântico característico da mais completa simetria translacional doespaço livre.

2. O vetor de onda k, que aparece no teorema de Bloch sempre pode serlimitado à primeira zona de Brillouin (ou a qualquer célula primitivaconveniente da rede recíproca). Isto é porque qualquer k0, não naprimeira zona de Brillouin, pode ser escrito como

Page 124: Estado Solido, Ashcroft, Traduzido

7.3 Observações Gerais sobre o Teorema de Bloch 121

k0 = k+K (7.45)

onde K é um vetor da rede recíproca, sendo k um vetor da primeirazona de Brillouin. Como eiK·R = 1 para qualquer vetor da rede recíp-roca, se o teorema de Bloch (7.6) vale para k0, ele valerá também parao vetor de onda k.

3. O índice n aparece no teorema de Bloch porque, para um dado k,existem muitas soluções da equação de Schrödinger. Observamos istona segunda prova do teorema de Bloch, mas também pode ser vistodo seguinte argumento:

Vamos ”olhar ” para todas as soluções da equação de Schrödinger(7.2) que tem a forma de Bloch

ψ = eik·ru (r) (7.46)

onde k é fixo e u (r) tem a periodicidade da rede de Bravais. Substituindo-se isto na equação de Schrödinger encontramos que u é determinadopelo problema de autovalor

Hk uk (r) =

Ã~2

2m

µ1

i∇+ k

¶2+ U (r)

!uk (r) (7.47)

= εk uk (r)

com a condição de contorno

uk (r) = uk (r+R) (7.48)

Devido à condiçào de contorno periódica, podemos considerar (7.47)como um problema de autovalores Hermitiano restrito a uma únicacélula primitiva do cristal. Uma vez que o problema de autovalor éestabelecido num volume finito, esperamos, baseados em princípiosgerais, que exista uma família infinita de soluções com autovaloresdiscretos,16 que rotulamos com o índice de banda n.

Note que, em termos do problema de autovalores especificado por(7.47) e (7.48), o vetor de onda k aparece apenas como um parâmetrono Hamiltoniano Hk. Esperamos, portanto, que cada um dos níveis

16Da mesma forma que o problema de um elétron livre em uma caixa de dimensõesfinitas fixas tem um conjunto de níveis de energias discretas, os modos normais devibração de um tambor finito têm um conjunto de freqüências discretas etc.

Page 125: Estado Solido, Ashcroft, Traduzido

122 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

de energia, para um dado k, varie continuamente com k.17 Destamaneira, chega—se à descrição dos níveis de um elétron num potencialperiódico em termos de uma família de funções contínuas18 εn (k) .

4. Embora o conjunto completo dos níveis possa ser descrito com krestrito a uma única célula primitiva, é útil permitir que k varie emtodo espaço-k, mesmo que isto resulte numa descrição completamenteredundante. Devido o conjunto de todas as funções de onda e níveisde energia para dois valores de k, diferindo por um vetor da rederecíproca serem idênticos, podemos atribuir os índices n aos níveis detal maneira que, para um dado n, os autoestados e autovalores sejamfunçòes periódicas de k na rede recíproca:

ψn,k+K (r) = ψn,k (r)

εn (k+K) = εn (k)(7.49)

Isto leva à descrição dos níveis de energia de um elétron num poten-cial periódico em termos de uma família de funções contínuas εnk (ouεn (k)), cada uma com a periodicidade da rede recíproca. A infor-mação contida nessas funções é referida como estrutura de banda dosólido.

Para cada n,o conjunto de níveis eletrônicos especificado por εn (k)é chamado de banda de energia. A origem do termo ”banda” serávisto no Capítulo 10. Aqui, notamos apenas que, como cada εn (k) éperiódica e contínua em k, tem um limite superior e inferior, tal quetodos os níveis εn (k) estão entre esses limites.

5. Pode-se mostrar, de uma maneira geral (veja Apêndice E), que umelétron num nível especificado por n e k tem uma velocidade médianão nula, dada por:

vn (k) =1

~∇k εn (k) (7.50)

Isto é um fato muito importante. Ele assegura que existem níveisestacioários (i.e., independentes do tempo) para um elétron num po-

17Esta expectativa está implícita, por exemplo, na teoria de perturbação ordinária,que só é possível porque pequenas variações dos parâmetros no Hamiltoniano conduzema pequenas variações dos níveis de energia. No Apêndice E são calculadas explicitamenteas variações nos níveis de energia para pequenas variações em k.18O fato de que a condição de contorno de Born-von Karman restringe os vetores k a

valores discretos da forma (7.26) não tem nenhuma influência sobre a continuidade deεn (k) como uma função de uma variável contínua k, pois o problema de autovalor dadopor (7.47) e (7.48) não faz nenhuma referência ao tamanho do cristal e é bem definidopara qualquer k. Deve-se notar também que o conjunto de valores de k da forma (7.26)torna-se denso no espaço-k no limite de um cristal infinito.

Page 126: Estado Solido, Ashcroft, Traduzido

7.4 Superfície de Fermi 123

tencial periódico, nos quais, a despeito da interação do elétron com osíons fixos na rede, os elétrons se movem continuamente sem qualquerdegradação de sua velocidade média. Isto está em contraste com aidéia de Drude de que as colisões seriam simplesmente choques en-tre o elétron e o íon estático. Suas implicações são de fundamentalimportância, e serão exploradas nos Capítulos 12 e 13.

7.4 Superfície de Fermi

O estado fundamental de N elétrons livres19 é construído, ocupando-setodos os níveis de um elétron k com energias ε (k) = ~2k2/2m menores doque εF ,onde εF é determinada, exigindo-se que o número total de níveis deum elétron com energias menores do que εF seja igual ao número total deelétrons (Capítulo 2).O estado fundamental de N elétrons de Bloch é construído de uma

maneira similar, exceto que os níveis de um elétron são agora rotuladospelos números quânticos n e k, εn (k) não tem a forma simples daquelado elétron livre, e k deve estar confinado a uma única célula primitiva darede recíproca se contarmos cada nível somente uma vez. Quando os maisbaixos desses níveis estão ocupados por um número específico de elétrons,podemos obter duas configuraçòes distintas:

1. Um certo número de bandas pode estar completamente ocupadas,enquanto que todas as demais permanecem vazias. A diferença emenergia entre o nível mais “alto” ocupado e o mais “baixo” (isto é, o“topo” da banda mais alta ocupada e o “fundo” da banda vazia maisbaixa) é conhecida como faixa de energia proibida ou gap de energia.Encontraremos que sólidos com um gap de energia muito maior do quekBT (T próximo da temperatura ambiente) são isolantes (Capítulo12). Se o gap for comparável a kBT , o sólido é conhecido como umsemicondutor intrínseco (Capítulo 28). Uma vez que o número deníveis numa banda é igual ao número de células primitivas do cristal(pág. 116) e como cada nível pode acomodar dois elétrons (um paracada estado de spin), uma configuração contendo um gap de energiapode ocorrer (embora isso não seja necessário) somente se o númerode elétrons por célula primitiva é par.

2. Determinado número de bandas pode estar parcialmente ocupada.Quando isto ocorre, a energia do nível mais alto ocupado, a energia

19Não distinguiremos, em termos de notação, entre o número de elétrons de conduçãoe o número de células primitivas, quando esta distinção estiver clara no contexto; porém,esses números só serão iguais numa rede de Bravais monovalente monoatômica (e.g., osmetais alcalinosi).

Page 127: Estado Solido, Ashcroft, Traduzido

124 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

de Fermi εF , está dentro do limite de energia de uma ou mais ban-das. Para cada banda parcialmente ocupada, existe uma superfície noespaço-k, separando os niveis ocupados dos níveis vazios. O conjuntode todas essas superfícies é conhecido como superfície de Fermi e éuma generalização, para os elétrons de Bloch, da esfera de Fermi deelétrons livres. As partes da superfície de Fermi originadas das ban-das parcialmente ocupadas são conhecidas como ramos da superfíciede Fermi.20 Veremos (Capítulo 12) que um sólido tem propriedadesmetálicas, quando existir uma superfície de Fermi.

Analiticamente, o ramo da superfície de Fermi na n-ésima banda é umasuperfície no espaço-k determinada por21

εn (k) = εF (7.51)

Então, a superfície de Fermi é uma superfície de energia constante (ou umconjunto de superfícies de energia constante) no espaço-k, da mesma formaque as mais familiares superfícies equipotenciais da teoria eletrostática sãosuperfícies de energia constante no espaço real.Como εn (k) são periódicas na rede recíproca, a solução completa de

(7.51) para cada n é uma superfície no espaço-k com periodicidade darede recíproca. Quando um ramo da superfície é representado por umaestrutura periódica completa, diz-se que é descrito no esquema de zonarepetida. Às vezes, todavia, é preferível representar cada ramo de maneiraque qualquer nível fisicamente distinto seja representado apenas por umponto da superfície. Isto é obtido, representando-se cada ramo por aquelaporção da superfície periódica completa contida dentro de uma única célulaprimitiva da rede recíproca. Tal representação é descrita como um esquemade zona reduzida. A célula primitiva escolhida é às vezes, mas nem sempre,a primeira zona de Brillouin.A geometria da superfície de Fermi e suas implicações físicas serão ilustradas

em muitos dos próximos capítulos, particularmente, nos Capítulos 9 e 15.

20Em muitos casos importantes, a superfície de Fermi está completamente dentrode uma única banda, e geralmente é encontrada dentro de um número razoavelmentepequeno de bandas (Capítulo 15).21 Se εF é, geralmente, definida como a energia que separa o mais alto nível ocupado do

mais baixo nível desocupado, então não é especificada univocamente num sólido com umgap de energia, pois qualquer energia no gap satisfaz esta condição. Não obstante, fala-sede ”energia de Fermi” de um semicondutor intrínseco. O que se quer dizer é potencialquímico, que é bem definido a qualquer temperatura diferente de zero (Apêndice B).Quando T → 0, o potencial químico de um sólido com um gap de energia aproxima-seda energia do meio do gap (Capítulo 28) e às vezes considera-se que esta é a ”energia deFermi” de um sólido com um gap. Quer com a definição correta (indeterminado) quercom a definição coloquial de εF , a Eq. (7.51) assegura que os sólidos com gap de energianão têm superfície de Fermi.

Page 128: Estado Solido, Ashcroft, Traduzido

7.5 Densidade de Níveis 125

7.5 Densidade de Níveis22

Frequentemente precisamos calcular quantidades, que são somas ponder-adas sobre níveis eletrônicos, de várias propriedades de um elétron. Taisquantidades são da forma23

Q = 2Xn,k

Qn (k) (7.52)

onde para cada n, soma-se sobre todos os k permitidos, correspondentesa níveis fisicamente distintos, isto é, todos os k que são da forma (7.26),pertencendo a uma única célula primitiva.24

No limite de um cristal muito grande, os valores de k permitidos (7.26)estão muito próximos um do outro e a soma pode ser substituída por umaintegral. Como o volume do espaço-k ocupado por cada k permitido tem omesmo valor como no caso do elétron livre, a prescriçào derivada naquelecaso (Eq. (2.29)) continua válida, e encontramos que25

q = limV→∞

Q

V= 2

Xn

Zdk

(2π)3Qn (k) (7.53)

onde a integral é sobre uma célula primitiva.Se, como às vezes é o caso,26 Qn (k) depende de n e k somente através

da energia εn (k) , então, por analogia com o caso do elétron livre, podemosdefinir uma densidade de níveis por unidade de volume (ou densidade deníveis) g (ε) tal que q tenha a forma (cf. Eq. (2.60)):

q =

Zdε g (ε) Q (ε) (7.54)

Comparando (7.54) e (7.53) encontramos que

g (ε) =Xn

gn (ε) (7.55)

onde gn (ε), a densidade na n-ésima banda, é dada por

gn (ε) =

Zdk

4π3δ (ε− ε (k)) (7.56)

22Numa primeira leitura, pode-se pular esta seção, sem perda de continuidade,voltando-se a ela em capítulos subsequentes, quando necessário.23O fator 2 é porque cada nível especificado por n e k pode acomodar dois elétrons

de spins contrários. Nós consideramos que Qn (k) não depende do spin s do elétron. Sedepender, o fator 2 deve ser substituído por uma soma em s.24A função Qn (k) tem geralmente a periodicidade da rede recíproca, tal que a escolha

da célula primitiva é irrelevante.25Veja o Capítulo 2 para as observações apropriadas.26Por exemplo, se q é a densidade de número eletrônico n, então Q (ε) = f (ε) , onde

f é a função de Fermi; se q é a densidade de energia eletrônica u, então Q (ε) = ε f (ε) .

Page 129: Estado Solido, Ashcroft, Traduzido

126 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

onde a integral é sobre uma célula primitiva.Uma representação alternativa da densidade de níveis pode ser con-

struída, notando-se que, como no caso do elétron livre (Eq. (2.62)):

gn (ε) dε = (2/V )×½número de vetores de onda permitidos na n-ésimabanda no intervalo de energia entre ε e ε+ dε

((8.58))O número de vetores de onda permitidos na n-ésima banda neste inter-

valo de energia é justamente o volume de uma célula primitiva no espaço-k,com ε ≤ εn (k) ≤ ε+ dε, dividido pelo volume ocupado por cada valor dek permitido, ∆k =(2π)3 /V. Então

gn (ε) dε =

Zcp

dk

4π3×½1, se ε ≤ εn (k) ≤ ε+ dε0, se outra situção

(7.57)

Como dε é infinitesimal, isto também pode ser expresso como uma inte-gral de superfície. Seja Sn (ε) a porção da superfície εn (k) = ε contida nacélula primitiva, e seja δk (k) a distância perpendicular entre as superfíciesSn (ε) e Sn (ε+ dε) no ponto k. Então (Fig. 8.2):

gn (ε) dε =

ZSn(ε)

dS

4π3δk (k) (7.58)

Para encontrar uma expressão explícita para δk (k), note que, comoSn (ε) é uma superfície de energia constante, o gradiente-k de εn (k) ,∇εn (k) é um vetor normal àquela superfície, cuja magnitude é igual àtaxa de variação de εn (k) na direção normal; isto é,

ε+ dε = ε+ |∇εn (k)| δk (k) (7.59)

e então

δk (k) =dε

|∇εn (k)| (7.60)

Substituindo (7.60) em (7.58), chegamos na forma

gn (ε) =

ZSn(ε)

dS

4π31

|∇εn (k)| (7.61)

que dá a relaçào explícita entre a densidade de níveis e a estrutura debanda.A equação (7.61) e a análise que conduz a ela serão aplicadas em capítulos

subseqüentes.27Aqui só chamamos a atenção para a seguinte propriedadebastante geral da densidade de níveis:

27Veja também Problema 2.

Page 130: Estado Solido, Ashcroft, Traduzido

7.6 Problemas 127

Uma vez que εn (k) é periódica na rede recíproca, limitada acima e abaixopara cada n, difenciável em todo o espaço, deve existir valores de k em cadacélula primitiva para os quais |∇ε| = 0. Por exemplo, o gradiente de umafunção diferenciável se anula nos pontos de máximos e mínimos, mas comocada εn (k) é limitada e periódica, isto assegura que para cada n existirápelo menos um máximo e um mínino em cada célula primitiva.28

Quando o gradiente de εn (k) se anula, o integrando na densidade deníveis (7.61) diverge. Pode-se mostrar que em três dimensões29 tais singu-laridades são integráveis, dando valores finitos para gn. Porém, elas resul-tam em divergências da inclinação dgn/dε. Estas são conhecidades comosingularidades de van Hove.30 Elas ocorrem em valores de ε para os quais asuperfície de energia constante Sn (ε) contém pontos nos quais ∇εn (k) seanula. Como as derivadas da densidade de estados na energia de Fermientram em todos os termos, exceto no primeiro, na expansão de Som-merfeld,31 deve-se estar previnido para as anomalias no comportamentoa baixas temperaturas se existirem pontos de ∇εn (k) anulando-se na su-perfície de Fermi.Singularidades típicas de van Hove são mostradas na Fig. 8.3 e são ex-

aminadas no Problema 2, Capítulo 9.Isto conclui nossa discussão dos aspectos gerais dos níveis de um elétron

num potencial periódico.32 Nos dois capítulos seguintes, consideramos doiscasos limites muito importante, mas bem diferentes, que fornecem ilus-trações concretas das discussões, bastante abstratas, deste capítulo.

7.6 Problemas

1. Potenciais Periódicos em Uma Dimensão

A análise geral dos níveis eletrônicos num potencial periódicos, inde-pendentes dos aspectos detalhados do potencial, pode ser levado con-sideravelmente mais adiante em uma dimensão. Embora o caso uni-dimensional seja, em muitos aspectos, atípicos (não há nenhuma ne-cessidade para um conceito de uma superfície de Fermi) ou enganoso(a possibilidade - realmente, em duas e três dimensões, a probabili-dade - de superposição de banda desaparece), apesar disso, permitever algumas das características de estrutura de banda tridimensional,

28Uma análise geral de quantos pontos de gradiente nulos têm que ocorrer é bastantecomplexo. Veja, por exemplo, G. Weinreich, Solids, Willey, New York, 1965, págs. 73-79.29Em uma dimensão, o próprio gn (ε) será infinito em uma singularidade de van Hove.30Essencialmente, as mesmas singularidades ocorrem na teoria das vibrações de rede.

Veja Capítulo 23.31Veja, por exemplo, Problema 2f, Capítulo 2.32O Problema 1 leva a análise geral um pouco mais adiante no caso tratável, mas um

pouco ilusório, de um potencial periódico unidimensional.

Page 131: Estado Solido, Ashcroft, Traduzido

128 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

que descreveremos por cálculo aproximado nos Capítulos 9, 10 e 11,obtidas de um tratamento exato em uma dimensão.

Considere, então, um potencial unidimensional U (x) (Fig. 8.4).É conveniente visualizar os íons como residindo nos pontos de mínimode U que nós tomamos para definir o zero de energia. Visualisamos opotencial periódico como uma superposição de barreiras de potenciaisv (x) de largura a, centradas nos pontos x = ±na (Fig. 8.5):

U (x) =∞X

n=−∞v (x− na) (7.62)

O termo v (x− na) representa a barreira de potencial para um elétrontunelando entre os íons sobre lados opostos do ponto na. Por sim-plicidade, vamos considerar que v(x) = v (−x) (o análogo em umadimensão da simetria de inversão que consideramos acima), mas nãofaremos nenhuma outra suposição sobre v, tal que a forma do poten-cial U é muito geral.

A estrutura de banda do sólido unidimensional pode ser expressana forma muito simples em termos das propriedades de um elétronna presença de uma única barreira de potencial v (x) . Considere,portanto, um elétron incidente do lado esquerdo de uma barreira depotencial v (x) com energia33 ε = ~2K2/2m. Como v (x) = 0 quando|x| ≥ a/2, nessas regiões a função de onda ψl (x) terão a forma

ψl (x) = eiKx + r e−iKx, x ≤ −a2

= t eiKx, x ≥ a2

(7.63)

Isto é ilustrado esquematicamente na Fig. 8.5a.

Os coeficientes de transmissão e reflexão t e r dão a amplitudede probabilidade com que um elétron tunelará ou será refletido pelabarreira, respectivamente; eles dependem do vetor de onda incidenteK numa maneira determinada pelos aspectos detalhados da barreirade potencial v. Porém, podem-se deduzir muitas propriedades da es-trutura de banda do potencial periódico U, recorrendo-se apenas apropriedades muito gerais de t e de r. Uma vez que v é par, ψr (x) =ψl (−x) é também uma solução para a equação de Schrödinger comenergia ε. De (7.63) segue-se que ψr (x) tem a forma

ψr (x) = t e−iKx, x ≤ −a2

= e−iKx + r eiKx, x ≥ a2

(7.64)

33Nota : neste problema, K é uma variável contínua e não tem nada a ver com a rederecíproca.

Page 132: Estado Solido, Ashcroft, Traduzido

7.6 Problemas 129

Evidentemente, isto descreve uma partícula incidente do lado direitoda barreira, como representado na Fig. 8.5b.

Como ψl e ψt são duas soluções independentes da equação deSchrödinger para a barreira única com a mesma energia, qualqueroutra solução com aquela energia será uma combinação linear34 dessasduas: ψ = Aψl + B ψr. Em particular, como o Hamiltoniano docristal é idêntico àquele para um único íon na região a/2 ≤ x ≤ a/2,qualquer solução da equação de Schrödinger com energia ε deve seruma combinação linear de ψl e ψr naquela região:

ψ (x) = Aψl (x) +B ψr (x) , −a

2≤ x ≤ a

2. (7.65)

Agora, o teorema de Bloch assegura que a escolha de ψ deve satisfazer

ψ (x+ a) = eika ψ (x) (7.66)

para um apropriado k. Diferenciando-se (7.66) encontramos tambémque ψ0 = dψ/dx satisfaz

ψ0 (x+ a) = eika ψ0 (x) (7.67)

(a) Impondo a condição (7.66) e (7.67) em x = −a/2, e usando(7.63) a (7.65), mostre que a energia do elétron de Bloch estárelacionada com seu vetor de onda k por:

cos ka =t2 − r22t

eika +1

2te−ika, ε =

~K2

2m(7.68)

Verifique que isto dá a resposta certa no caso de elétron livre(v ≡ 0) .

A equação (7.68) é mais informativa quando fornecemos um poucomais de informação sobre os coeficientes de transmissão e de reflexão.Escrevemos o número complexo t em termos de sua magnitude e fase:

t = |t| eiδ (7.69)

O número real δ é conhecido como deslocamento de fase, pois eleespecifica a mudança na fase das ondas transmitidas relativa àquelada onda incidente. Conservação do elétron requer que a probabilidadede transmissão mais a probabilidade de reflexão seja um:

1 = |t|2 + |r|2 . (7.70)

34Um caso especial do teorema geral de que existem n soluções independentes parauma equação diferencial linear de n-ésima ordem.

Page 133: Estado Solido, Ashcroft, Traduzido

130 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

Isto, e alguma outra informação útil, pode ser provada como segue.Sejam φ1 e φ2 quaisquer duas soluções da esquação de Schrödingerde uma barreira com a mesma energia:

− ~2

2mφ00i + v φi =

~2K2

2mφi, i = 1, 2 (7.71)

Defina w (φ1,φ2) (o ”Wronskiano”) por

w (φ1,φ2) = φ01 (x)φ2 (x)− φ1 (x)φ02 (x) (7.72)

(b) Prove que w é independente de x, deduzindo de (7.71) que suaderivada se anula.

(c) Prove (7.70), através do cálculo de w (ψl,ψ∗l ) para x ≤ −a/2 e

x ≥ a/2, notando que, devido v (x) ser real, ψ∗l será uma soluçãopara a mesma equação de Schrödinger como ψl.

(d) Calculando w (ψl,ψ∗r) , prove que rt

∗ é imaginário puro, tal quer deve ter a forma

r = ± i |r| eiδ, (7.73)

onde δ é o mesmo que em (7.69).

(e) Mostre, como consequência de (7.68), (7.69) e (7.73), que a en-ergia e vetor de onda do elétron de Bloch são relacionados por

cos (Ka+ δ)

|t| = cos ka, ε =~2K2

2m(7.74)

Como |t| é sempre menor que um, mas se aproxima daunidade para grandes valores de K (a barreira torna-se crescen-temente menos efetiva à medida que energia incidente cresce), olado esquerdo de (7.74) plotado contra K tem a estrutura repre-sentada na Fig. 8.6. Para um dado k, os valores permitidos de K(e consequentemente as energias permitidas ε (k) = ~2K2/2m)são dados pela interseção da curva na Fig. 8.6 com a linha hor-izontal de altura igual a cos (ka) . Note que os valores de K navizinhança desses, satisfazendo

Ka+ δ = nπ (7.75)

dá |cos (Ka+ δ)| / |t| > 1, e são, portanto, valores não permi-tidos para qualquer k. As regiões de energia correspondentessão gaps de energia. Se δ é uma função limitada de K (comogeralmente é o caso), então haverá infinitamente muitas regiõesde energia proibida, e também, infinitamente muitas regiões deenergias permitidas para cada valor de k.

Page 134: Estado Solido, Ashcroft, Traduzido

7.6 Problemas 131

(f) Suponha que a barreira seja muito fraca (tal que |t| ≈ 1, |r| ≈ 0).Mostre que o gaps de energia são então muito estreitos, a largurado gap contendo K = nπ/a, sendo

εgap ≈ 2πn ~2

ma2|r| . (7.76)

(g) Suponha que a barreira seja muito forte, tal que |t| ≈ 0, |r| ≈1. Mostre que as bandas de energia permitida são então muitoestreitas, com larguras

εmáx − εmín = O (|t|) (7.77)

(h) Como exemplo concreto, considera-se às vezes o caso no qualv (x) = gδ (x) , onde δ (x) é a função delta de Dirac (um casoespecial do ”modelo Kronig-Penney”). Mostre que neste caso

cotg δ = −~2K

mg, |t| = cos δ. (7.78)

Este modelo é um exemplo comum nos livros-textos de um po-tencial periódicos em uma dimensão. Note, porém, que a maioriadas estruturas que temos estabelecido é, num grau considerável,independente da dependência funcional particular de |t| e δ comK.

2. Densidade de Níveis

(a) No caso de elétron livre a densidade de níveis na energia de Fermipode ser escrita na forma (2.64) g (εF ) = mkF /~2π2.Mostre quea forma geral (7.61) reduz-se a esta, quando εn (k) = ~2k2/2me a superfície (esférica) de Fermi está completamente dentro deuma célula primitiva.

(b) Considere uma banda na qual, para k suficientemente pequeno,εn (k) = ε0 +

¡~2/2

¢ ¡k2x/mx + k

2z/mz + k

2z/mz

¢( como pode

ser o caso num cristal de simetria ortorrômbica) onde mx,my

e mz são constantes positivas. Mostre que se ε estiver próximobastante de ε0, tal que esta forma seja válida, então gn (ε) éproporcional a (ε− ε0)

1/2, assim sua derivada torna-se infinita

(singularidade de van Hove) à medida que ε se aproxima domínimo da banda (Sugestão: Use a forma (8.57) para a densi-dade de níveis). Deduza disso que, se a forma quadrática paraεn (k) permanecer válida até εF , então gn (εF ) pode ser escritana generalização óbvia da forma para elétron livre (2.65):

g (εF ) =3

2

n

εF − ε0(7.79)

Page 135: Estado Solido, Ashcroft, Traduzido

132 7. Níveis Eletrônicos num Potencial Periódico: Propriedades Gerais

onde n é a contribuição dos elétrons na banda para a densidadeeletrônica total.

(c) Considere a densidade de níveis na vizinhança de um pontode sela, onde εn (k) = ε0 +

¡~2/2

¢ ¡k2x/mx + k

2z/mz − k2z/mz

¢,

onde mx,my e mz são constantes positivas. Mostre que, quandoε ≈ ε0, a derivada da densidade de níveis tem a forma

g0n (ε) ≈ constante, ε > ε0

≈ (ε− ε0)−1/2

, ε < ε0 (7.80)

Page 136: Estado Solido, Ashcroft, Traduzido

This is page 133Printer: Opaque this

8Elétrons num Potencial PeriódicoFraco

Pode-se obter muito informação a respeito da estrutura imposta sobre osníveis de energia eletrônicos pelo potencial periódico, se este potencial forfraco. Esta abordagem antigamente pode ter sido considerada como um ex-ercírcio acadêmico instrutivo. Porém, sabemos agora, que em muitos casosesta hipótese, aparentemente, irrealista, dá resultados surpreendentementemuito próximo do esperado. Estudos teórico e experimental modernos dosmetais, que se encontram nos grupos I, II, III e IV da tabela periódica(i.e., metais, cuja estrutura atômica consiste em elétrons s e p fora de umacamada fechada de configuração de gás nobre) indicam que os elétrons decondução podem ser descritos como se estes estivessem em movimento numpotencial quase constante. Esses elementos são frequentemente referidoscomo matais de elétrons quase-livres, pois o ponto de partida para sua de-scrição é o gás de elétrons livres de Sommerfeld, modificado pela presençade um potencial periódico fraco. Neste capítulo, examinaremos algumasdas características mais gerais da estrutura de banda do ponto de vista deelétrons quase-livres. Aplicações a metais particulares serão examinadas noCapítulo 15.Não parece óbvio porque as bandas de condução desses metais sejam

assim tal como elétrons livres. Existem duas razões fundamentais do porquêdas interações fortes dos elétrons entre si e com os íons positivos podemresultar em efeitos de um potencial muito fraco:

1. A interação elétron-íon é mais forte a distâncias muito pequenas, masos elétrons são proibidos (pelo princípio de Pauli) de chegarem muito

Page 137: Estado Solido, Ashcroft, Traduzido

134 8. Elétrons num Potencial Periódico Fraco

próximos dos íons, pois esta região já está ocupado por elétrons de”caroço”.

2. Na região permitida para os elétrons de condução, sua mobilidadediminui ainda mais o potencial resultante sobre um elétron, poiseles podem ”blindar” os campos dos íons carregados positivamente,diminuindo o potencial efetivo total.

Essas observações oferecem apenas a indicação mais simples do porquê adiscussão que se segue tem aplicação prática muito ampla. Retornaremosmais tarde ao problema de justificar esta abordagem de elétrons quase-livres, tomando-se o ponto 1 no Capítulo 11 e o ponto 2 no Capítulo 17.

8.1 Aproximação Geral da Equação de Schrödingerquando o Potencial é Fraco

Quando o potencial é nulo, as soluções da equação de Schrödinger são on-das planas. Um ponto de partida razoável para o tratamento de potenciaisperiódicos fracos é, portanto, a expansão da soluçào exata em ondas planasdescrita no Capítulo 8. A função de onda de um nível de Bloch com mo-mento cristalino k pode ser escrito na forma dada na Eq. (7.41):

ψk (r) =XK

ck−K ei(k−K)·R (8.1)

onde os coeficientes ck−K e a energia ε do nível são determinados peloconjunto de equações (7.40):·

~2

2m(k−K)2 − ε

¸ck−K +

XK0UK0−K cK0−K = 0. (8.2)

A soma em (8.1) é sobre todos os vetores K da rede recíproca, e para umdado k, existe uma equação da forma (8.2) para cada vetor K da rederecíproca. As (infinitamente muitas) soluções diferentes da Eq. (8.2) paraum dado k são rotuladas com o índice de banda n. O vetor de onda kpode (mas, não é necessário) ser considerado pertencente à primeira zonade Brillouin do espaço-k.No caso de elétron livre, todas as componentes de Fourier UK são exata-

mente nulas. A Eq. (8.2), torna-se, então,¡ε0k−K − ε

¢ck−K = 0, (8.3)

onde introduzimos a notação:

ε0q =~2

2mq2. (8.4)

Page 138: Estado Solido, Ashcroft, Traduzido

8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 135

A Eq. (8.3) requer que, para cada K, ou ck−K = 0 ou ε = ε0k−K. Aúltima possibilidade pode ocorrer somente para um único K, a menos queaconteça de alguns dos ε0k−K serem iguais para diferentes escolhas deK. Setal degenerescência não ocorre, então a classe de soluções esperadas paraelétrons livres:

ε = ε0k−K, ψk ∝ ei(k−K) · r (8.5)

Porém, existindo um grupo de vetores da rede recíproca K1, ...,Km, sat-isfazendo

ε0k−K1= · · · = ε0k−Km

, (8.6)

então, quando ε for igual ao valor comum dessas energias de elétrons livresexistem m soluções de ondas planas degeneradas independentes. Comoqualquer combinação de soluções degeneradas é também uma solução, tem-se a completa liberdade de escolher os coeficientes ck−K paraK =K1, ...,Km.Essas observações simples adquirem mais essência, quando os UK não

são nulos, mas muito pequenos. A análise ainda se divide, naturalmente,em dois casos, correspondendo aos casos não-degenerados e degeneradospara elétrons livres. Porém, agora, a base para a distinção não é mais aigualdade exata1 de dois ou mais níveis de elétrons livres distintos, massomente se eles são iguais à parte termos da ordem de U.Caso 1 Fixa-se k e considera-se um particular vetor da rede recíprocaK1 tal que as energias de elétrons livres ε0k−K1

estão distantes dos valoresε0k−K (para todos os demais K) comparados com U (veja Fig. 9.1):2¯

ε0k−K1− ε0k−K

¯À U, para k fixo e todos os K 6=K1. (8.7)

Queremos investigar os efeitos do potencial sobre o nível de elétron livredado por

ε = ε0k−K1, ck−K = 0, K 6=K1. (8.8)

Na situação em que K = K1 na Eq. (8.2) (e, usando a notação simplificada(8.4)), temos (abandonando a linha do índice K0 do somatório):¡

ε− ε0k−K1

¢ck−K1

=XK

UK−K1ck−K (8.9)

1O leitor que é familiar com a teoria de perturbação estacionária pode pensar que,se não existir nenhuma degenerescência exata, podemos sempre considerar grandes asdiferenças de energia entre todos os níveis comparadas com U, considerando U suficien-temente pequeno. Isto é ainda verdadeiro para qualquer k dado. Porém, uma vez quetemos dado U bem definido, não importa quão pequeno ele seja, queremos um procedi-mento válido para todos os k na primeira zona de Brillouin. Veremos que não importaquão pequeno U seja, poderemos sempre encontrar alguns valores de k para os quaisa separação entre os níveis não perturbados é muito menor do que U. Portanto, o queestamos fazendo é mais sutil do que a teoria de perturbação degenerada convencional.

2Nas igualdades desta forma, usaremos U para nos referirmos a uma componente deFourier típica do potencial.

Page 139: Estado Solido, Ashcroft, Traduzido

136 8. Elétrons num Potencial Periódico Fraco

Uma vez que escolhemos a constante aditiva na energia potencial tal queUK = 0, quando K = 0 (veja pág. 117), somente os termos com K 6=K1

aparecem do lado direito de (8.9). Como estamos examinando aquelassoluções para as quais ck−K se anulam para K 6= K1 no limite de U seanulando, esperamos que o lado direito de (8.9) seja de segunda ordem emU. Isto pode ser explicitamente confirmado, escrevendo a Eq. (8.2) paraK 6= K1 como

ck−K =UK1−K ck−K1

ε− ε0k−K+

XK0 6=K1

UK0−K ck−K0

ε− ε0k−K. (8.10)

Separamos da soma em (8.10) o termo contendo ck−K1, pois ele será uma or-dem de magnitude maior do que os demais termos, que envolvem ck−K0 paraK0 6=K1. Esta conclusão depende da suposição (8.7) de que o nível ε

0k−K1

não é quase-degenerado com algum outro ε0k−K. Essa quase-degenerescênciafaria com que alguns dos denominadores em (8.10) fosse da mesma ordemde grandeza de U, cancelando o termo explicito em U no numerador e resul-tando em termos adicionais na soma (8.10) comparáveis ao termo K =K1.Portanto, se não existir nenhuma quase-degenerescência,

ck−K =UK1−K ck−K1

ε− ε0k−K+O ¡U2¢ (8.11)

Inserindo esta equação em (8.9), encontramos:

¡ε− ε0k−K1

¢ck−K1

=XK

UK−K1UK1−K

ε− ε0k−Kck−K1

+O ¡U3¢ (8.12)

Então o nível de energia perturbado ε difere do valor para elétron livrepor termos da ordem de U2. Para resolver a Eq. (8.12) para ε até a ordemde U2, é suficiente substituir o valor de ε aparecendo no denominador dolado direito por ε0k−K1

, levando à seguinte expressão3 para ε, correta atésegunda ordem em U :

ε = ε0k−K1+XK

|UK−K1|2

ε0k−K1− ε0k−K

ck−K1+O ¡U3¢ (8.13)

A Eq. (8.13) nos diz que bandas não-degeneradas fracamente pertur-badas repelem-se mutuamente, pois qualquer nível ε0k−K que esteja abaixode ε0k−K1

contribui com um termo em (8.13) que aumenta o valor de ε,

enquanto que qualquer nível que esteja acima de ε0k−K1contribiu com um

termo que diminui a energia. Porém, a característica mais importante queemerge desta análise do caso de nenhuma quase-degenerescência, grosso

3Usamos a Eq. (7.33), U−K = U∗K.

Page 140: Estado Solido, Ashcroft, Traduzido

8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 137

modo, é o desvio em segunda ordem em U na energia em relação ao valorde elétron livre. No caso quase-degenerado (como veremos agora) o desviona energia pode ser linear em U. Portanto, para um potencial periódicofraco, somente os níveis de elétrons livres quase-degenerados é que são sig-nificantemente desviados dos seus valores não perturbados e por isto vamosdedicar mais atenção a esse importante caso.Caso 2 Suponha que o valor de k seja tal que existam vetores da rederecíproca K1,K2, . . . ,Km com ε0k−K1

, ε0k−K2, . . . , ε0k−Km

todas diferindoentre si por termos da ordem4 de U, mas muito separadas das demais ε0k−Kna escala de U :¯

ε0k−K − ε0k−Ki

¯À U, i = 1, . . . ,m, K 6=K1, . . . ,Km (8.14)

Neste caso, devemos tratar separadamente aquelas equações dadas por(8.2), quando K é igual a qualquer um dos m valores K1, . . . ,Km. Istodá m equações correspondendo a uma única equação (8.9) no caso não-degenerado. Nessas m equações, separamos da soma aqueles termos con-tendo os coeficientes ck−Kj

, j = 1, . . . ,m, que não são pequenos no limiteda interação nula, dos demais ck−K, que serão pelo menos da ordem de U.Então temos:¡ε− ε0k−Ki

¢ck−Ki

=mXj=1

UKi−Kj ck−Kj+X

K6=K1...Km

UK−Ki ck−K, i = 1, . . .m.

(8.15)Fazendo a mesma separação na soma, podemos escrever (8.2) para os de-mais níveis como

ck−K =1

ε− ε0k−K

mXj=1

UKj−K ck−Kj+

XK0 6=K1,...Km

UK0−K ck−K0

, K 6= K1, . . .Km

(8.16)(que corresponde à equação (8.10) no caso não-degenerado).Como ck−K será pelo menos da ordem de U, quando K 6=K1, . . .Km, a

Eq. (8.16) dá

ck−K =1

ε− ε0k−K

mXj=1

UKj−K ck−Kj+O ¡U2¢ (8.17)

Substituindo esta equação em (8.15), encontra-se que

¡ε− ε0k−Ki

¢ck−Ki

=mXj=1

UKi−Kj ck−Kj+mXj=1

XK6=K1...Km

UK−Ki UKj−Kε− ε0k−K

ck−Kj+O¡U3¢

(8.18)

4Em uma dimensão m não pode ser maior que 2, mas em três dimensões m pode sermuito grande.

Page 141: Estado Solido, Ashcroft, Traduzido

138 8. Elétrons num Potencial Periódico Fraco

Compare este resultado com o da Eq. (8.12) para o caso não-degenerado. Aliencontramos uma expressão explícita para o desvio na energia da ordemde U2 (ao qual se reduz o conjunto de equações (8.18) quando m = 1).Agora, porém, encontramos que, até a ordem de U2, a determinação dosdesvios nos m níveis quase-degenerados reduz-se à solução de m equaçõesacopladas5 para ck−Ki

. Entretanto, os coeficientes no segundo termo dolado direito dessas equações são de ordem mais alta em U do que aquelesno primeiro termo.6 Consequentemente, para encontramos as correções emU mais importantes, podemos substituir (8.18) pelas equações mais simples:¡

ε− ε0k−Ki

¢ck−Ki

=mXj=1

UKi−Kj ck−Kj , i = 1, . . . ,m. (8.19)

que são justamente as equações gerais para um sistema de m níveis quân-ticos.7

8.1.1 Níveis de Energia Próximos de um Único Plano deBragg

O exemplo mais simples e mais importante da discussão precedente équando dois níveis de elétrons livres diferem um do outro por uma energiada ordem de U,mas estando muito distantes de todos os demais, comparadocom U. Quando isto acontece, a Eq. (8.19) reduz-se a duas equações:¡

ε− ε0k−K1

¢ck−K1

= UK1−K2 ck−K2 ,

(8.20)¡ε− ε0k−K2

¢ck−K2

= UK2−K1 ck−K1

Quando apenas dois níveis estão envolvidos não há razão para contin-uarmos com a convenção notacional que rotula esses níveis simetricamente.Portanto, introduzimos variáveis particularmente mais convenientes para oproblema de dois níveis:

q = k−K1 e K =K2 −K1, (8.21)

5Estas equações são muito parecidas com as equações da teoria de perturbação de-generada de segunda ordem, para as quais elas se reduzem quando todas as εk−Ki

foremrigorosamente iguais, i = 1, . . . ,m. (Veja L. D. Landau and E. M. Lifshitz, QuantumMechanics, Addison-Wesley, Reading Mass., 1965, pág. 134.)

6O numerador é explicitamente da ordem de U2, e como somente valores de K difer-entes de K1, . . . ,Km aparecem na soma, o denominador não é da ordem de U, quandoo valor de ε estiver próximo de ε0k−Ki

, i = 1, . . . ,m.7Observe que uma regra prática para voltar de (8.18) para a forma mais precisa dada

em (8.19) é simplesmente substituir U por U 0, onde

U 0Kj−Ki= UKj−Ki

+X

K6=K1,...,Km

UKj−KUK−Ki

ε− ε0k−K.

Page 142: Estado Solido, Ashcroft, Traduzido

8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 139

e escrevemos (8.20) como¡ε− ε0q

¢cq = UK cq−K

(8.22)¡ε− ε0q−K

¢cq−K = U−K cq = U

∗K cq.

Temos:

ε0q ≈ ε0q−K,¯ε0q − ε0q−K0

¯À U, para K0 6=K,0. (8.23)

Agora ε0q é igual a ε0q−K para algum vetor da rede recíproca somente quando

|q| = |q−K| . Isto significa (Figura 9.2a) que q deve estar com a extremi-dade sobre o plano de Bragg, que divide ao meio a linha ligando a origemdo espaço k ao ponto da rede recíproca K. A proposição de que ε0q = ε0q−K0

apenas paraK0 =K requer que q esteja somente sobre este plano de Bragge sobre nenhum outro plano.Então a condição (8.23) tem o significado geométrico de que q deve estar

próximo de um plano de Bragg (mas não deve estar próximo a uma regiãoonde dois ou mais planos de Bragg se interceptem). Portanto, o caso de doisníveis quase-degenerados refere-se a um elétron cujo vetor de onda satisfaz,aproximadamente, a condição para um único espalhamento de Bragg.8 Cor-respondentemente, o caso geral de muitos níveis quase-degenerados aplica-se ao tratamento de um nível de elétron livre, cujo vetor de onda estejapróximo a uma região onde ocorra simultaneamente muitas reflexões deBragg. Como os níveis quase-degenerados são os mais profundamente afe-tados por um potencial periódico fraco, concluimos que um potencial per-iódico fraco tem seus maiores efeitos somente sobre os níveis de elétronslivres, cujos vetores de onda estão próximos de uma região onde podemocorrer reflexões de Bragg.Mais adiante, discutiremos sistematicamente quando os vetores de onda

de um elétron livre estão ou não sobre planos de Bragg, assim como aestrutura geral que isto impõe sobre os níveis de energia num potencialfraco. Em primeiro lugar, porém, vamos examinar a estrutura de níveis,quando apenas um único plano de Bragg está envolvido, determinado por(8.22). Essas equações têm uma solução quando¯

ε− ε0q −UK−U∗K ε− ε0q−K

¯= 0 (8.24)

Isto leva a uma equação quadrática¡ε− ε0q

¢ ¡ε− ε0q−K

¢= |UK|2 (8.25)

8Um feixe de raio-X incidente sofre uma reflexão de Bragg somente se seu vetor deonda estiver sobre um plano de Bragg (veja Capítulo 6).

Page 143: Estado Solido, Ashcroft, Traduzido

140 8. Elétrons num Potencial Periódico Fraco

As duas raízes

ε =1

2

¡ε0q + ε0q−K

¢±Ãε0q − ε0q−K

2

!2+ |UK|2

1/2 (8.26)

dão o efeito dominante do potencial periódico sobre as energias dos doisníveis de elétron livre ε0q e ε

0q−K, quando q está próximo de um plano de

Bragg determinado por K. Esta situação é mostrada na Figura 9.3.O resultado (8.26) é particularmente simples para pontos estando sobre

o plano de Bragg, pois, quando q está sobre o plano de Bragg, ε0q = ε0q−K.Assim

ε = ε0q ± |UK| , q sobre um único plano de Bragg. (8.27)

Então, em todos os pontos sobre o plano de Bragg, um nível é deslocadouniformemente para cima pela quantidade |UK| e o outro é uniformementedeslocado para baixo pela mesma quantidade.Verifica-se facilmente de (8.26) que quando ε0q = ε0q−K,

∂ε

∂q=~2

m

µq−12K

¶; (8.28)

i.e., quando o ponto q está sobre o plano de Bragg o gradiente de ε é paraleloao plano (veja Figura 9.2b). Como o gradiente é perpendicular a superfíciesnas quais a função é constante, as superfícies de energia constante no planode Bragg são perpendiculares ao plano.9

Quando q está sobre um único plano de Bragg, podemos facilmente de-terminar a forma das funções de onda correspondendo às duas soluçõesε = ε0q ± |UK| . De (8.22), quando ε é dado por (8.27), os dois coeficientescq e cq−K satisfazem10

cq = ± sgn (UK) cq−K. (8.29)

Como esses dois coeficiente são aqueles dominantes na espansão em ondasplanas (8.1), segue-se que se UK > 0, então

|ψ (r)|2 ∝µcos

1

2K · r

¶2, ε = ε0q + |UK| ,

|ψ (r)|2 ∝µsen

1

2K · r

¶2, ε = ε0q − |UK| ,

9Este resultado, às vezes, mas nem sempre, é verdadeiro mesmo quando o potencialperiódico não é fraco, pois os planos de Bragg ocupam posições de razoavelmente altasimetria.10Por simplicidade, consideramos aqui que UK é real (o cristal tem simetria de inver-

são).

Page 144: Estado Solido, Ashcroft, Traduzido

8.1 Aproximação Geral da Equação de Schrödinger quando o Potencial é Fraco 141

enquanto que, se UK < 0, então

|ψ (r)|2 ∝µsen

1

2K · r

¶2, ε = ε0q + |UK| ,

|ψ (r)|2 ∝µcos

1

2K · r

¶2, ε = ε0q − |UK| . (8.30)

Às vezes os dois tipos de combinações lineares são chamadas de tipo-

p³|ψ (r)|2 ∼ sen2 12K · r

´e tipo-s

³|ψ (r)|2 ∼ cos2 12K · r

´, devido a de-

pendência de sua posição próximo a um ponto da rede. A combinação tipo-snão se anula na posição do íon; na combinação tipo-p a densidade de cargase anula com o quadrado da distância do íon para pequenas distâncias, queé também uma característica dos níveis atômicos-p.

8.1.2 Bandas de Energia em uma Dimensão

Podemos ilustrar essas conclusões gerais em uma dimensão, onde a de-generescência dupla é a maior que pode ocorrer neste caso. Na ausência dequalquer interação os níveis de energia eletrônica são justamente parábo-las no espaço-k (Figura 9.4a). Até a ordem dominante no fraco potencialperiódico unidimensional esta curva permanece correta exceto próximo dos”planos” de Bragg (que são pontos em uma dimensão). Quando q estápróximo de um ”plano” de Bragg correspondendo ao vetor K da rede recíp-roca (i.e., o ponto 1

2K) os níveis de energia corrigidos são determinados,traçando-se uma outra parábola de elétron livre centrada em K (Figura9.4b), observando que a degenerescência no ponto de interseção é sepa-rada pela quantidade 2 |UK| de tal maneira que ambas as curva tenhaminclinação nula naquele ponto, e traçando novamente a Figura 9.4b paraobtermos a Figura 9.4c. A curva de elétron livre original é modificada comona Figura 9.4d. Quando todos os planos de Bragg e suas associadas com-ponentes de Fourier forem incluidas, encontramos um conjunto de curvastais como aquele mostrado na Figura 9.4e. Esta maneira particular de rep-resentar os níveis de energia é conhecido como esquema de zona estendida.Se insistirmos em especificar todos os níveis pelo vetor de onda k na

primeira zona de Brillouin, então devemos transladar os pedaços da Figura9.4e através de vetores da rede recíproca para a primeira zona de Brillouin.O resultado é mostrado na Figura 9.4f. A representação é aquela do esquemade zona reduzida (veja pág. 124)Podemos também enfatizar a periodicidade no espaço-k, estendendo-se

periodicamente a Figura 9.4f através de todo espaço-k para obtermos aFigura 9.4g. que enfatiza que um nível particular em k pode ser descrito porqualquer vetor de onda diferindo de k por um vetor da rede recíproca. Estarepresentação é o esquema da zona repetida (veja pág. 124). O esquema dazona repetida classifica cada nível com um valor de k pertencente à primeira

Page 145: Estado Solido, Ashcroft, Traduzido

142 8. Elétrons num Potencial Periódico Fraco

zona de Brillouin, enquanto que o esquema de zona estendida enfatiza acontinuidade com os níveis de elétrons livres. O esquema de zona repetidaé a representação mais geral, embora altamente redundante, pois o mesmonível é mostrado muitas vezes, para todos os vetores de onda equivalentesk, k ±K, k ± 2K, ....

8.2 Curvas Energia-Vetor de Onda em TrêsDimensões

Em três dimensões a estrutura das bandas de energia é às vezes mostradapelo gráfico ε vs. k ao longo de linhas retas particulares no espaço-k. Taiscurvas são geralmente mostradas num esquema de zona reduzida, pois paradireções gerais no espaço-k elas não são periódicas. Mesmo na aproximaçãode elétron completamente livre essas curvas são surpreendentemente com-plexas. Um exemplo é mostrado na Figura 9.5, que foi construído, plotando,enquanto k variava ao longo de linhas particulares mostradas na figura,os valores de ε0k−K = ~2 (k−K)2 /2m para todos os vetores K da rederecíproca, suficientemente próximos da origem para que as energias sejammenores do que o topo da escala vertical.Observe que a maioria das curvas são altamente degeneradas. Isto é

porque as direções ao longo das quais as energias foram plotadas são linhasde simetria bastante alta, tal que pontos ao longo delas estejam provavel-mente à mesma distância de vários vetores da rede recíproca como dequalquer um vetor dado. A adição de um potencial periódico fraco, emgeral, removerá algumas, mas nem todas, destas degenerescências. A teo-ria (matemática) de grupos às veze é usada para determinar quantas taisdegenerescências serão removidas.

8.3 O Gap de Energia

Geralmente um potencial periódico fraco introduz um ”gap de energia” nosplanos de Bragg. Por isto, entendemos o seguinte:Quando UK = 0, enquanto k cruza um plano de Bragg a enegia muda

continuamente da menor raiz de (8.26) para a maior, como ilustrado naFigura 9.4b. Quando UK 6= 0, isto não é bem assim. A energia somentevaria continuamente com k, quando se cruza um plano de Bragg, se per-manecermos na menor (ou maior) raiz, como ilustrado na Figura 9.4c. Paramudarmos de ramo, quando k variar continuamente, agora é necessário quea energia varie descontinuamente pelo menos pela quantidade 2 |UK| .Veremos no Capítulo 12 que esta separação matemática das duas bandas

é refletida numa separação física: quando a ação de um campo externomuda o vetor de onda do elétron, a presença do gap de energia requer que

Page 146: Estado Solido, Ashcroft, Traduzido

8.4 Zonas de Brillouin 143

sobre o cruzamento do plano de Bragg, o elétron deve emergir num nível,cuja energia permaneça no ramo original de ε (k) . É esta propriedade quetorna o gap de energia de fundamental importância nas propriedades detransporte eletrônico.

8.4 Zonas de Brillouin

Usando a teoria de elétrons num potencial periódico fraco para determinara estrutura de banda completa de um cristal tridimensional resulta emconstruções geométricas de grande complexidade. Às vezes é importantedeterminar a superfície de Fermi (veja pág. 123) e o comportamento deεn (k) na sua vizinhança.Fazendo-se isto para potenciais fracos, o procedimento é inicialmente

desenhar a esfera de Fermi para elétrons livres centrada em k = 0. Emseguida, observa-se que a esfera será deformada de uma maneira da qual aFigura 9.6 é caracterísitca,11 quando cruza um plano de Bragg e de umamaneira correspondentemente mais complexa, quando ela passa próximo devários planos de Bragg. Quando os efeitos de todos os planos de Bragg sãoinseridos, isto leva a uma representação da superfície de Fermi como umaesfera fraturada no esquema da zona estendida. Para construir as porçõesda superfície de Fermi situadas várias bandas no esquema da zona reduzida,translada-se todas as porções de uma única esfera fraturada de volta paraa primeira zona através de vetores da rede recíproca. Este procedimento étornado sistemático através da noção de zonas de Brillouin mais elevadas.Relembre que a primeira zona de Brillouin é a célula primitiva de Wigner-

Seitz da rede recíproca (págs. 64 e 75), i.e. o conjunto de pontos que estãomais próximos deK = 0 do que de qualquer outro ponto da rede recíproca.Como os planos de Bragg dividem ao meio as linhas ligando a origemaos pontos da rede recíproca, pode-se também definir a primeira zona deBrillouin como um conjunto de pontos que podem ser alcançados a partirda origem sem cruzar nenhum plano de Bragg.12

Zonas de Brillouin mais elevadas são simplesmente outras regiões limi-tadas por planos de Bragg, definidas como segue:A primeira zona de Brillouin é o conjunto de pontos no espaço-k que

podem ser alcançados a partir da origem sem cruzar nenhum plano deBragg. A segunda zona de Brillouin é o conjunto de pontos que podem seralcançados a partir da primeira zonas, cruzando-se somente um plano de

11 Isto segue-se da demonstração da pág.140 de que a superfície de energia constanteé perpendicular a um plano de Bragg, quando eles se interceptam, na aproximaçào deelétron quase-livre.12Excluimos das considerações os pontos situados sobre os planos de Bragg, que são

pontos comuns à superfície de duas ou mais zonas. Definimos as zonas em termos deseus pontos interiores.

Page 147: Estado Solido, Ashcroft, Traduzido

144 8. Elétrons num Potencial Periódico Fraco

Bragg. A (n+ 1)-ésima zona de Brillouin é o conjunto de pontos que nãopertencem a (n − 1)-ésima zona e que podem ser alcançados a partir dan-ésima zona, cruzando-se apenas um plano de Bragg.Alternativamente, a n-ésima zona de Brillouin pode ser definida como o

conjunto de pontos que podem ser alcançados, a partir da origem, cruzando-se n− 1 planos de Bragg.Essas definições são ilustradas na Figura 9.7 para o caso bidimensional.

As superfícies das três primeiras zonas para as redes fcc e bcc são mostradasna Figura 9.8. Ambas as definições enfatizam o fato fisicamente importantede que as zonas são delimitadas por planos de Bragg. Então elas são regiões,em cujas superfícies os efeitos de um potencial periódico fraco são impor-tante (i.e., primeira ordem), mas em cujo interior os níveis de energia deelétrons livres são perturbados somente em segunda ordem.É muito importante observar que cada zona de Brillouin é uma célula

primitiva da rede recíproca. Isto é porque a n-ésima zona de Brillouiné simplesmente o conjunto de pontos que tem a origem como o n-ésimoponto da rede recíproca mais próximo (um ponto K da rede recíproca émais próximo de um ponto k do que k é da origem se e somente se k éseparado da origem por um plano de Bragg determinado por K). Dadoisto, a prova de que a n-ésima zona de Brillouin é uma célula primitiva éidêntica à prova dada na página 63 de que a célula de Wigner-Seitz (i.e.,a primeira zona de Brillouin) é primitiva, substituindo-se a frase ”n-ésimovizinho mais próximo” por ”vizinho mais próximo” naquele argumento.Como cada zona é uma célula primitiva, existe um algorítmo simples para

construir os ramos da superfície de Fermi no esquema de zona repetida13:

1. Desenhe a esfera de Fermi de elétron livre.

2. Deforme-a ligeiramente (como ilustrado na Figura 9.6) na vizinhançaimediata de um plano de Bragg. (No limite de potenciais extrema-mente fracos esta etapa às vezes pode ser ignorada para uma primeriaaproximação.)

3. Pegue o pedaço da superfície de elétron livre que está dentro da n-ésima zona de Brillouin e translade-o através de todos os vetores darede recíproca. A superfície resultante é o ramo da superfície de Fermi(convencionalmente atribuído à n-ésima banda) no esquema de zonarepetida.14

13A representação da superfície de Fermi no esquema de zona repetida é a mais geral.Depois de inspecionar cada ramo em toda sua intensidade periódica, podemos escolhercom clareza aquela cela primitiva que representa a estrutura topological do todo (queàs vezes, mas nem sempre, é a primeira zona de Brillouin).14Um procedimento alternativo é transladar os pedaços da superfície de Fermi na n-

ésima zona através daqueles vetores da rede recíproca que transferem os pedaços dan-ésima zona na qual eles contidos para a primeira zona. (Tais translações existem,

Page 148: Estado Solido, Ashcroft, Traduzido

8.5 Fator de Estrutura Geométrico em Redes Monoatômicas com Base 145

Geralmente falando, o efeito do potencial periódico fraco sobre as super-fícies construídas a partir da esfera de Fermi de elétron livre sem a etapa2, é simplesmente arredondar as arestas e cantos da superfície. Porém, seo ramo da superfície de Fermi consistir em pedaços muito pequenos de su-perfície (envolvendo níveis ocupados ou vazios, conhecidos como ”bolsõesde elétrons” ou ”bolsões de buracos”), então o potencial periódico fracopode fazê-los desaparecer. Além disso, se a superfície de Fermi de elétronlivre tiver partes com secções transversais muito estreitas, um potencialperiódico fraco pode desconectá-la em tais pontos.Algumas construções adicionais apropriadas para a discussão de elétrons

quase-livres em cristais fcc são ilustradas na Figura 9.10. Essas superfíciesde Fermi tais como de elétrons livres são de grande importância no entendi-mento de superfícies de Fermi reais de muitos metais. Isto é ilustrado noCapítulo 15.

8.5 Fator de Estrutura Geométrico em RedesMonoatômicas com Base

Nada foi dito até aqui que explorasse qualquer propriedade do potencialU (r) além de sua periodicidade, e, por conveniência, a simetria de inversão.Se olharmos com mais atenção para a forma de U, reconhecendo que eleé derivado de uma soma de potenciais atômicos centrados na posição dosíons, poderemos obter mais informações que serão importantes no estudode estruturas eletrônicas de redes monoatômicas com base, tal como asestruturas do diamante e hexagonal com agrupamento compacto (hcp).Suponha que a base consista de íons idênticos localizados nas posições

dj . Então, o potencial periódico U (r) terá a forma

U (r) =XR

Xj

φ (r−R− dj) (8.31)

Levando-se isto na Eq. (7.31) para UK, encontramos que

UK =1

v

Zcélula

dr e−iK· rXR, j

φ (r−R− dj)

=1

v

Ztodoespaço

dr e−iK· rXj

φ (r− dj) (8.32)

ouUK =

1

vφ (K) S∗K, (8.33)

uma vez que a n-ésima zona é uma célula primitiva.) Isto é ilustrado na Figura 9.9. Asuperfície de Fermi no esquema de zona repetida é então constuída, transladando-se asestruturas resultante na primeira zona através de todos os vetores da rede recíproca.

Page 149: Estado Solido, Ashcroft, Traduzido

146 8. Elétrons num Potencial Periódico Fraco

onde φ (K) é a transformada de Fourier do potencial atômico,

φ (K) =

Ztodoespaço

dr e−iK· r φ (r) (8.34)

e SK é o fator de estrutura geométrico introduzido em nossa discussão dedifração de raio-X (Capítulo 6):

SK =Xj

e−iK·dj . (8.35)

Então, quando a base leva a um fator de estrutura nulo para algunsplanos de Bragg, i.e., quando os picos de difração de raio-X desses planosestão ausentes, então a componente de Fourier do potencial periódico as-sociada com tais planos se anulam; i.e., a separação dos níveis em ordemmais baixa desaparece.O resultado é de particular importância na teoria dos metais com es-

trutura hexagonal com agrupamento complacto, dos quais existem mais de25 (Tabela 4.4). A primeira zona de Brillouin para a rede hexagonal sim-ples é um prisma com base hexagonal regular. Porém, o fator de estruturaassociado com a base e o topo do prisma se anula (Problema 3, Capítulo6).Portanto, de acordo com a teoria de elétrons quase-livres, não existe nen-

huma quebra de degenerescência dos níveis de elétrons livres nesses faces.Poderia parecer, ainda, que pequenas separações desses níveis ocorreriamdevido a efeitos de segunda ordem (ou ordem mais elevada). Todavia, se oHamiltoniano de um-elétron é independente do spin, então, pode-se mostrarque, numa estrutura hcp, qualquer nível de Bloch com vetor de onda k sobrea face hexagonal da primeira zona de Brillouin é pelo menos duplamente de-generado. Consequentemente, a separação dos níveis é rigorosamente nula.Em situações tais com esta às vezes é mais conveniente considerar a rep-resentação da estrutura da zona onde esses planos com gap nulo sejam defato ignorados. As regiões em que isso é considerado são conhecidas comzonas de Jones ou grandes zonas.

8.6 Importância do Acoplamento Spin-Órbita emPontos de Alta Simetria

Até agora consideramos que o spin do elétron fosse completamente inertesob o ponto de vista da dinânica. De fato, porém, um elétron movendo-se sob a ação de um campo elétrico, tal como aquele de um potencialperiódico, experimenta um potencial proporcional ao produto escalar de seumomento magnético de spin pelo produto vetorial de sua velocidade com

Page 150: Estado Solido, Ashcroft, Traduzido

8.7 Problemas 147

o campo elétrico. Refere-se a esta interação adicional como acoplamentospin-órbita e é de grande importância na física atômica (veja Capítulo 31).O acoplamento spin-órbita é importante no cálculo de quase todos os níveisde elétrons livres em pontos do espaço-k de alta simetria, pois acontece àsvezes de os níveis que são rigorosamente degenerados, quando esse efeito éignorado, a degenerescência é quebrada na presença do acoplamento spin-órbita.Por exemplo, a seperação dos níveis eletrônicos nas faces hexagonais

da primeira zona em metais hcp é inteiramente devido ao acoplamentospin-órbita. Como a magnitude do acoplamento spin-órbita cresce com onúmero atômico, esta separação é sensível em metais pesados hexagonais,mas muito pequeno e pode ser ignorado em metais leves. Consequente-mente, existem dois diferentes esquemas para construir superfícies de Fermital como as de elétrons livres. Isto é ilustrado nas Figuras 9.11 e 9.12.

8.7 Problemas

1. Superfície de Fermi para elétrons quase-livres próximo deum único plano de Bragg

Para investigar a estrutura de banda para elétrons quase-livres dadapor (8.26) próximo a um plano de Bragg, é conveniente medir o ve-tor de onda q em relaçào ao ponto 1

2K sobre o plano de Bragg. Es-crevendo q =1

2K+ k, e decompondo k em suas componenetes paralela(kk) e perpendicular (k⊥) ao vetor K, então (8.26) torna-se

ε = ε0K/2 +~2

2nk2 ±

µ4ε0K/2

~2

2nk2k + |UK|

¶1/2(8.36)

É também conveniente medir a energia de Fermi εF em relação aomenor valor de qualquer uma das bandas obtidas de (8.36) no planode Bragg, escrevendo:

εF = ε0K/2 − |UK|+∆ (8.37)

tal que, quando ∆ < 0, nenhuma superfície de Fermi intercepta oplano de Bragg.

(a) Mostre que, quando 0 < ∆ < 2 |UK| , a superfície de Fermi estácontida inteiramente na banda mais baixa e intercepta o planode Bragg num cículo de raio

ρ =

r2m∆

~2(8.38)

Page 151: Estado Solido, Ashcroft, Traduzido

148 8. Elétrons num Potencial Periódico Fraco

(b) Mostre que, se ∆ > 2 |UK| , a superfície de Fermi está contidaem ambas as bandas, cortando o plano de Bragg em dois círculosde raios ρ1 e ρ2 (Figura 9.6), e que a diferença das áreas dos doiscírculos é

π¡ρ22 − ρ21

¢=4mπ

~2|UK| . (8.39)

(A área desses círculos pode ser medida diretamente em algunsmetais por meio do efeito Haas-van Alphen (Capítulo 14), eportanto |UK| pode ser determinado diretamente da experiênciapara metais de elétrons quase-livres.)

2. Densidade de níveis para um modelo de duas bandas

Até certo ponto este problema é artificial no que os efeitos de planosde Bragg ignorados podem conduzir a correções comparáveis aosdesvios, que encontraremos aqui, do resultado de elétron livre. Poroutro lado, o problema é instrutivo no sentido de que as característi-cas qualitativas são gerais.

Decompondo-se q em suas componentes paralela (qk) e perpendicular(q⊥) ao vetor K então (8.26) torna-se

ε =~2

2mq2⊥ + h±

¡qk¢

(8.40)

onde

h±¡qk¢=~2

2m

hq2k +

12

¡K2 − 2qkK

¢i±(· ~22m

12

¡K2 − 2qkK

¢¸2+ |UK|2

)1/2(8.41)

é função apenas de qk. A densidade de níveis pode ser calculada de(7.56), resolvendo-se a integral numa célula primitiva apropriada so-bre os vetores de onda q em coordenadas cilíndricas com o exio-z nadireção de K.

(a) Mostre que, quando a integral sobre q é efetuada, o resultadopara cada banda é

g (ε) =1

4π2

µ2m

~2

¶³qmáxk − qmínk

´(8.42)

onde, para cada banda, qmáxk e qmínk são soluções de ε = h±¡qk¢.

Verifique que o resultado familiar para elétrons livres é obtidono limite |UK|→ 0.

(b) Mostre que

qmínk = −r2mε

~2+O ¡U2K¢ , (ε > 0) , qmáxk = 1

2K (8.43)

Page 152: Estado Solido, Ashcroft, Traduzido

8.7 Problemas 149

para a banda mais baixa, se a superfície de energia constante(com energia ε) corta o plano da zona (isto é, εK/2− |UK| ≤ ε ≤εK/2 + |UK|).

(c) Mostre que para a banda superior, deveria ser interpretado comodando uma densidade de níveis

g+ (ε) =1

4π2

µ2m

~2

¶³qmáxk − 1

2K´, para ε > εK/2 + |UK|

(8.44)

(d) Mostre que dg/dε é singular em ε = εK/2 ± |UK| , tal que adensidade de níveis tem a forma mostrada na Figura 9.13. (Essassingularidades não são características do potencial fraco nem daaproximação de duas banda. Veja página 127.

3. Efeito do potencial fraco em regiões do espaço-k onde planosde Bragg se encontram

Considere o ponto W (kW = (2π/a)¡1, 12 , 0

¢na zona de Brillouin

da estrutura fcc mostrada na Figura 9.14. Nesse ponto, três planosde Bragg ((200) , (111) , (111)) se encontram e, consequentemente, asenergias de elétron livre

ε01 =~2

2mk2,

ε02 =~2

2m

µk−2π

a(1, 1, 1)

¶2,

ε03 =~2

2m

µk−2π

a(1, 1, 1)

¶2,

ε04 =~2

2m

µk−2π

a(2, 0, 0)

¶2, (8.45)

são degeneradas quando k = kW e iguais a εW = ~2k2W /2m.

(a) Mostre que numa região do espaço-k próximo do ponto W, asenergias em primeira ordem são dadas pelas soluções de15¯

¯ ε01 − ε U1 U1 U2U1 ε02 − ε U2 U1U1 U2 ε03 − ε U1U2 U1 U1 ε04 − ε

¯¯ = 0

15Considere que o potencial periódico U tem simetria de inversão, tal que UK sejareal.

Page 153: Estado Solido, Ashcroft, Traduzido

150 8. Elétrons num Potencial Periódico Fraco

onde U2 = U200, U1 = U111 = U111, e que no ponto W as raízessão

ε = εW − U2 (duas vezes), ε = εW + U2 ± 2 |U1| (8.46)

(b) Usando um método similar, mostre que as energias no ponto U¡kU = (2π/a)

¡1, 14 ,

14

¢¢são

ε = εU − U2, ε = εU +12U2 ± 1

2

¡U22 + 8U

21

¢1/2, (8.47)

onde εU = ~2k2U/2m.

4. Definição alternativa de zonas de Brillouin

Seja k um ponto no espaço recíproco. Suponha que esferas de raio ksejam traçadas em torno de cada ponto K da rede recíproca excetoa origem. Mostre que, se k está no interior de n− 1 esferas, e sobre asuperfície de nenhuma, então este ponto estará no interior da n-ésimazona de Brillouin. Mostre que se k está no interior de n − 1 esferas,e na superfície de m esferas adicionais, então é um ponto comum aoslimites da n-, (n+ 1)-, ..., (n+m)-ésimas zonas de Brillouin.

5. Zonas de Brillouin numa rede quadrada bidimensional

Considere uma rede quadrada bidimensional com constante de redea.

(a) Escreva, em unidades de 2π/a, o raio de um círculo que podeacomodar m elétrons livres por célula primitiva. Construa umatabela relacionando quais das sete primeiras zonas de Brillouinda rede quadrada (Figura 9.15a) estão completamente cheias,quais estão parcialmente cheias e quais estão completamentevazias, para m = 1, 2, . . . , 12. Verifique que, se m ≤ 12, os níveisocupados estão inteiramente dentro das sete primeiras zonas, eque, quando m ≥ 13, os níveis na oitava e nas zonas mais ele-vadas tornam-se ocupados.

(b) Esboce todos os ramos da superfície de Fermi para os casom = 1, 2, . . . , 7 em células primitivas adequadas. A superfíciena terceira zona, por exemplo, pode ser vista como na Figura9.15b.

Page 154: Estado Solido, Ashcroft, Traduzido

This is page 151Printer: Opaque this

9Método das Ligações Fortes

No Capítulo 9 calculamos os níveis eletrônicos num metal, considerando-ocomo um gás de elétrons de condução quase-livres, perturbado apenas fraca-mente por um potencial periódico dos íons. Podemos também considerá-losob um ponto de vista diferente, dependendo do sólido (metal ou isolante),como uma coleção de átomos neutros fracamente interagentes. Como umexemplo extremo disto, imagine agruparmos átomos de sódio numa redecúbica de corpo centrado com uma constante de rede da ordem de cen-tímetros ao invés de angstrons. Todos os elétrons estariam então em níveisatômicos localizados em sítios da rede e não teriam nenhuma semelhançacom as combinações lineares de algumas ondas planas descritas no Capítulo9.Se diminuíssemos a constante de rede, artificialmente grande, de nosso

arranjo de átomos de sódio, em algum ponto antes de atingirmos o valorverdadeiro da constante de rede do sódio metálico, teríamos que abandonara idéia de identificar os níveis eletrônicos da rede com os níveis atômicos deátomos de sódio isolados. Isto se tornaria necessário para um nível atômicoparticular, quando as distâncias interatômicas ficassem comparáveis à ex-tensão espacial de sua função de onda, pois um elétron naquele nível sen-tiria, então, a presença dos átomos vizinhos.A situação real para os níveis 1s, 2s, 2p e 3s do sódio atômico é mostrada

na Figura 10.1. As funções de onda atômicas para estes níveis são traçadasem torno de dois núcleos separados por uma distância de 3, 7 Å, que é adistância entre vizinhos mais próximos no sódio metálico. A sobreposiçãodas funções de onda 1s centradas nos dois sítios é totalmente desprezível eindica que estes níveis atômicos ficam essencialmente inalterados no sódio

Page 155: Estado Solido, Ashcroft, Traduzido

152 9. Método das Ligações Fortes

metálico. A sobreposição dos níveis 2s e 2p é extremamente pequena, eesperamos encontrar níveis no metal que sejam muito parecidos com essesníveis atômicos. Porém, a sobreposição dos níveis 3s (que contém os elétronsda valência atômica) é considerável e não existe nenhuma razão para es-perarmos que os níveis eletrônicos do metal assemelhem-se a esses níveisatômicos.A aproximação de ligações fortes ou de cabresto-curto (tight-binding)

trata o caso em que a sobreposição das funções de onda atômicas são sufi-cientes para requerer correções à idéia de átomo isolado, mas não ao pontode tornar a descrição atômica completamente irrelevante. A aproximação émais útil para descrever bandas de energia que se originam de camadas-dparcialmente preenchidas dos átomos de metal de transição e para descreverestruturas eletrônicas de isolantes.À parte de sua utilidade prática, a aproximação de ligações fortes provê

um modo instrutivo de visualização complementar entre os níveis de Bloch ede elétron quase-livre, permitindo uma reconciliação entre as característicasaparentemente contraditórias entre níveis atômicos localizados e níveis deondas planas tipo elétrons livres.

9.1 Formulação Geral

No desenvolvimento da aproximação das ligações fortes, admitimos que navizinhança de cada ponto da rede o Hamiltoniano do cristal periódico, H,pode ser aproximado pelo Hamiltoniano, Hat , de um único átomo local-izado naquele ponto da rede. Admitimos, também, que os níveis ligados doHamiltoniano atômico são bem localizados; i.e., se ψ é um nível ligado deHat para um átomo na origem,

Hat ψn = En ψn (9.1)

então exigimos que ψn (r) seja muito pequena quando r exceder a distânciada ordem da constante de rede, que nós nos referimos como o ”alcance” deψn.No caso extremo no qual o Hamiltoniano do cristal só começa a diferir

de Hat (para um átomo, cujo ponto da rede tomamos como a origem) parapontos distantes de r = 0 que excedam o alcance de ψn (r), a função deonda ψn (r) será uma excelente aproximação para a função de onda doestado estacionário do Hamiltoniano completo, com autovalor En. Assimtambém serão as funções ψn (r−R) para todos os R na rede de Bravais,pois H tem a periodicidade da rede.Para calcular as correções para este caso extremo, escrevemos o Hamil-

toniano H do cristal como

H = Hat +∆U (r) (9.2)

Page 156: Estado Solido, Ashcroft, Traduzido

9.1 Formulação Geral 153

onde∆U (r) contém todas as correç ões para os potenciais atômicos necessáriospara produzir o potencial periódico do cristal (veja Figura 10.2). Se ψn (r)satisfaz a equação de Schrödinger atômica (9.1), então satisfará também aequação de Schrödinger (9.2), com a condição de que ∆U (r) se anule ondeψn (r) não se anular. Se assim for, então cada nível atômico ψn (r) pro-duziria N níveis no potencial periódico, com funções de onda ψn (r−R) ,uma para cada um dos N sítios na rede. Para preservar a descrição deBloch, devemos encontrar as N combinações lineares dessas funções deonda degeneradas que satisfaçam à condição de Bloch (veja Eq. (7.6)):

ψ (r+R) = eik ·R ψ (r) (9.3)

As N combinações lineares que precisamos são

ψnk (r) =XR

eik ·rψn (r−R) (9.4)

onde k sãos os N valores do vetor de onda na primeira zona de Brillouinconsistentes com a condição de contorno periódica de Born-von Karman.1

A condição de Bloch (9.3) é satisfeita pela função de onda (9.4), notando-seque

ψ (r+R) =XR0eik ·R

0ψn¡r+R−R0¢

= eik ·R"XR0eik ·(R

0−R) ψn (r− (R0−R))#

= eik ·R"XR

eik ·R ψn¡r− R¢#

= eik ·R ψ (r) (9.5)

Então, a função de onda (9.4) satisfaz a condição de Bloch com o vetorde onda k, continuando a exibir o carácter atômico dos níveis. Porém, asbandas de energia obtidas desta maneira têm pouca estrutura, εn (k) sendosimplismente a energia do nível atômico En, independente do valor de k.

1Exceto quando estamos estudando explicitamente os efeitos de superfície, devemosevitar a tentação de tratar um cristal finito restringindo a soma sobre os vetore R em(9.4) aos sítios de uma porção finita da rede de Bravais. É mais conveniente somarsobre uma rede de Bravais infinita (a soma convergindo rapidamente devido ao curtoalcance da função de onda atômica ψn (r)) e representar o cristal finito com a condiçãode contorno usual de Born-von Karman, que impõe a restrição (7.7) sobre k, quandovale a condição de Bloch. Somando-se sobre todos os sítios, é admissível, por exemplo,fazermos a substituição da variável da soma R0 por R = R

0−R, na penúltima linha daEq. (9.5).

Page 157: Estado Solido, Ashcroft, Traduzido

154 9. Método das Ligações Fortes

Para corrigir esta deficiência devemos reconhecer que uma hipótese maisrealista é que ψn (r) torna-se pequeno, mas não exatamente nula, antes que∆U torne-se apreciável (veja Figura 10.2). Isto sugere que buscamos umasolução para a equação de Schrödinger do cristal que mantenha a formageral (9.4):2

ψ (r) =XR

eik ·R φ (r) , (9.6)

mas com a função φ (r) não necessariamente uma função de onda exatado estado estacionário atômico, mas que deve ser determinada através decálculo adicional. Se o produto∆U (r) ψn (r) , embora não nulo, é extrema-mente pequeno, podemos esperar que a função φ (r) seja muito parecidacom a função de onda atômica ψn (r) ou com as funções de onda com asquais ψn (r) é degenerada. Baseados nesta espectativa, podemos procu-rar φ (r) que possa ser expandida num número relativamente pequeno defunções de onda atômicas localizadas:3 ,4

φ (r) =Xn

bn ψn (r) (9.7)

Se multiplicarmos a equação de Schrödinger do cristal

H ψ (r) = (Hat +∆U (r)) ψ (r) = ε (k) ψ (r) (9.8)

pela função de onda atômica ψ∗m (r), integrarmos em todo o espaço r eusarmos o fato de queZ

ψ∗m (r) H ψ (r) =

Z(H ψm (r))

∗ ψ (r) dr = EmZ

ψ∗m (r) ψ (r) dr

(9.9)encontramos que

(ε (k)−Em)Z

ψ∗m (r) ψ (r) dr =

Zψ∗m (r) ∆U (r) ψ (r) dr (9.10)

Substituindo-se (9.6) e (9.7) em (9.10) e usando a ortonormalidade dasfunções de onda atômicas,Z

ψ∗m (r) ψn (r) dr = δmn (9.11)

2Pode-se mostrar (veja página ??) que qualquer função de Bloch pode ser escrita naforma (9.6), a função φ, sendo conhecida como função de Wannier, tal que nenhumageneralidade é perdida nesta suposição.

3 Incluindo somente funções de onda atômicas localizadas (i.e., ligadas) em (9.7),fazemos nossa primeira aproximação séria. Um conjunto completo de níveis atômicosinclui também níveis ionizados. Este é o ponto no qual o método deixa de ser aplicávelpara níveis bem descritos pela aproximação de elétrons quase-livres.

4Devido a esta método de aproximação de φ, o método de ligações fortes às vezes éconhecido como o método de combinações lineares de orbitais atômicos ( ou LCAO dasiniciais de Linear Combination of Atomic Orbitals).

Page 158: Estado Solido, Ashcroft, Traduzido

9.1 Formulação Geral 155

chegamos numa equação de autovalores que determina os coeficientes bn (k)e as energias de Bloch ε (k):

(ε (k)−Em) bm = − (ε (k)−Em)Xn

XR6=0

Zψ∗m (r) ψn (r−R) eik·R dr

bn+Xn

(ψ∗m (r) ∆U (r) ψn (r) dr) bn

+Xn

XR6=0

Zψ∗m (r) ∆U (r) ψn (r−R) eik·R dr

bn(9.12)O primeiro termo do lado direito da Eq. (9.12) contém integrais do tipo5Z

ψ∗m (r) ψn (r−R) dr (9.13)

Interpretamos nossa hipótese de níveis atômicos bem localizados com osignificado de que (9.13) é pequena comparada com a unidade. Admitimosque as integrais no terceiro termo do lado direito de (9.12) sejam peque-nas, uma vez que elas também contém o produto de duas funções de ondaatômicas centradas em diferentes sítios. Finalmente, admitimos que o se-gundo termo do lado direito de (9.12) é pequeno, uma vez que esperamosque as funções de onda atômicas tornem-se pequenas a distâncias suficien-temente grandes onde o potencial periódico desvia-se apreciavelmente docorrespondente potencial atômico.6

Consequentemente, o lado direito de (9.13) (e, portanto (ε (k)−Em) bm)é sempre pequeno. Isto é possível se ε (k) − Em for pequeno sempre quebn não o for (e vice-versa). Então, ε (k) deve ser semelhante a um nívelatômico, digamos E0, e todos os bm, exceto aqueles correspondentes a essenível e níveis degenerados com ele (ou próximo dele) em energia, devem serpequenos:7

ε (k) ≈ E0, bm ≈ 0, exceto quando Em ≈ E0 (9.14)

5 Integrais, cujos integrandos contém um produto de funções de onda centradas emdiferentes sítios da rede, são conhecidas como integrais de sobreposição (overlap inte-grals). A aproximação de ligações fortes explora a pequena magnitude dessas integrais.Estas integrais têm também um papel importante na teoria do magnetismo (Capítulo32).

6Esta última suposição tem menos fundamento do que as outras, uma vez que ospotenciais iônicos não precisam necessariamente decair tão rapidamente como as funçõesde onda atômicas. Porém, é também menos importante para a obtenção das conclusõesque obteremos, pois o termo em questão não depende de k. De certo modo, este termosimplesmente serve para corrigir os potenciais atômicos dentro de cada célula, incluindoos campos dos íons que estão fora dessa célula.

7Note a semelhança deste raciocínio com aquele empregado nas páginas 134 a 138.Ali, porém, concluímos que a função de onda era uma combinação linear de apenas um

Page 159: Estado Solido, Ashcroft, Traduzido

156 9. Método das Ligações Fortes

Se a estimativa em (9.14) fosse exatamente uma igualdade, voltaríamosao caso extremo no qual os níveis do cristal eram idênticos aos níveis atômi-cos. Porém, agora podemos determinar os níveis no cristal com maior pre-cisão, explorando (9.14) para estimar o lado direito de (9.12), considerandona soma sobre n somente aqueles níveis com energias ou degeneradas oumuito próximas de E0. Se o nível atômico 0 é não-degenerado,8 i.e., umnível-s, na aproximação (9.12) reduz-se a uma única equação, dando umaexpressão explícita para a energia da banda, originando-se desse nível-s(geralmente chamada ”banda-s”). Se estivermos interessados em bandasoriginando-se de um nível atômico p, que é triplamente degenerado, então(9.12) daria um conjunto de três equações homogêneas, cujos autovaloresdariam ε (k) para as três bandas-p, e cujas soluções b (k) dariam as com-binações lineares apropriadas dos níveis atômicos p que compõem φ nosvários k na zona de Brillouin. Para obtermos uma banda-d a partir dosníveis atômicos d, teríamos que resolver uma equação secular 5× 5, etc.Se o ε (k) resultante estiver suficientemente longe dos valores atômicos

num certo k, seria necessário repetir o procedimento, incluindo-se à expan-são (9.7) de φ, aqueles níveis atômicos adicionais, de cujas energias o ε (k)se aproxima. Na prática, por exemplo, geralmente resolve-se uma equação6×6 que inclui ambos, os níveis d e s, no cálculo da estrutura de banda dosmetais de transição, que tem no estado atômico uma camada-s externa euma camada-d parcialmente preenchida. Este procedimento recebe o nomede ”mistura s− d” ou ”hibridização”.Às vezes as funções de onda atômicas tem um alcance muito curto, tal que

precisamos manter na soma sobreR em (9.12) apenas os termos de vizinhospróximos, o que simplifica bastante a análise subsequente. De passagem,ilustramos a estrutura de banda que emerge no caso mais simples.9

9.1.1 Aplicação a uma banda-s originária de um único nívelatômico-s

Se todos os coeficiente b em (9.12) forem nulos, exceto aquele para umúnico nível atômico s, então (9.12) dá diretamente a estrutura de banda da

pequeno número de ondas planas, cujas energias de elétrons livres eram muito próximasuma da outra. Aqui, concluímos que a função de onda pode ser representada, atravésde (9.7) e de (9.6), por apenas um pequeno número de funções de onda atômicas, cujasenergias atômicas são muito próximas uma da outra.

8No momento ignoramos o acoplamento spin-órbita. Podemos, portanto, nos concen-trar inteiramente nas partes orbital dos níveis. O spin pode ser incluído, simplesmente,multiplicando-se as funções de onda orbital pelos spinores apropriados, e duplicando-sea degenerescência de cada um dos níveis orbitais.

9O caso mais simples é aquele de uma banda-s. O próximo caso mais complicado,uma banda-p, é discutido no Problema 2.

Page 160: Estado Solido, Ashcroft, Traduzido

9.1 Formulação Geral 157

correspondente banda-s:

ε (k) = Es − β +RPγ (R) eik·R

1 +RPα (R) eik·R

(9.15)

onde Es é a energia do nível atômico s, e

β = −Zdr ∆U (r) |φ (r)|2 , (9.16)

α (R) =

Zdr φ∗ (r) φ (r− r) (9.17)

e

γ (R) = −Zdr φ∗ (r) ∆U (r) φ (r−R) . (9.18)

Os coeficiente (9.16) a (9.18) podem ser simplificados, recorrendo-se acertas simetrias. Uma vez que φ é um nível s, φ (r) é real e depende so-mente do módulo de r. Disto segue-se que α (−R) = α (R) . Isto e a simetriade inversão da rede de Bravais, que requer que ∆U (−r) = ∆U (r) , tam-bém implica que γ (−R) = γ (R) . Nós desprezamos os termos em α nodenominador de (9.15), pois eles dão pequenas correções ao numerador.Uma última simplificação vem ao admitirmos que apenas as separaçoesentre vizinhos mais próximos dão integrais de sobreposição com valoresapreciáveis.Juntando estas observações, podemos simplificar (9.15) para

ε (k) = Es − β −Xv m p

γ (R) cosk ·R (9.19)

onde a soma é apenas sobre os R na rede de Bravais que conectam a origemaos seus vizinhos mais próximos.Para sermos explícitos, vamos aplicar (9.19) ao cristal cúbico de face

centrada. Os 12 vizinhos mais próximos da origem (veja Figura 10.3) estãoem

R =a

2(±1,±1, 0) , a

2(±1, 0,±1) , a

2(0,±1,±1) . (9.20)

Se k =(kx, ky, kz) , então os 12 valores correspondentes de k ·R são

k ·R =a

2(±ki,±kj) , i, j = x, y; y, z; z, x. (9.21)

Agora ∆U (r) = ∆U (x, y, z) tem a simetria cúbica completa da rede, eé então inalterado por permutações de seus argumentos ou mudanças nosseus sinais. Isto, junto com o fato de que a função de onda de nível-s φ (r)só depende do módulo de r, implica que γ (R) é a mesma constante γ paratodos os 12 vetores (9.20). Por conseguinte, a soma em (9.19) dá, com aajuda de (9.21),

ε (k) = Es−β−4γ¡cos 12kxa cos

12kya+ cos

12kya cos

12kza+ cos

12kza cos

12kxa

¢(9.22)

Page 161: Estado Solido, Ashcroft, Traduzido

158 9. Método das Ligações Fortes

onde

γ =

Zdr φ∗ (x, y, z)∆U (x, y, z)φ∗

¡x− 1

2a, y − 12a, z

¢A equação (9.22) revela o aspecto característico das bandas de energia

na aproximação de ligações fortes: a largura de banda — i.e., a separaçãoentre as energias mínima e máxima na banda — é proporcional ao pequenovalor da integral de sobreposição (overlap) γ. Então, as bandas de ligaçõesfortes são bandas estreitas, e, quanto menor a sobreposição, mais estreitaé a banda. No limite de subreposição nula a largura da banda tambémse anula, e a banda torna-se N vezes degenerada, correspondendo ao casoextremo no qual o elétron simplesmente reside em qualquer um dos Nátomos isolados. A dependência da largura da banda com a integral desobreposição é ilustrada na Figura 10.4.Além de exibir o efeito da sobreposição na largura da banda, a Eq, (9.22)

ilustra várias características gerais da estrutura de banda do um cristalcúbico de face centrada que não são peculiares ao caso de ligações fortes.São elas:

1. No limite de ka pequeno, (9.22) reduz-se a:

ε (k) = Es − β − 12γ + γk2a2. (9.23)

Isto é independente da direção de k — i.e., as superfícies de energiaconstante nas proximidades de k = 0 são esféricas.10

2. Se ε é plotada na direção de qualquer linha perpendicular a uma dasfaces do quadrado da primeira zona de Brillouin (Figura 10.5), elacruza a face quadrada com inclinação nula (Problema 1).11

3. Se ε é plotada na direção de qualquer linha perpendicular a umadas faces hexagonais da primeira zona de Brillouin (Figura 10.5), emgeral, ela não cruza a face hexagonal com inclinação nula.

9.2 Observações Gerais sobre o Método deLigações fortes

1. Nos casos de interesse prático, mais de um nível atômico aparecemna expansão (9.7), levando a uma equação secular 3 × 3 no caso dos três

10 Isto pode ser deduzido, de uma maneira geral, para qualquer banda não-degeneradanum cristal com simetria cúbica.11Compare o caso de elétron quase-livre (página 140), onde a taxa de variação de ε

ao longo de uma linha normal a um plano de Bragg era sempre nula, assim que o planoera cruzado, para pontos distantes de qualquer outros planos de Bragg. O resultado dométodo de ligações compactas ilustra a possibilidade mais geral que surge porque nãohá nenhum plano de simetria de espelho paralelo à face hexagonal.

Page 162: Estado Solido, Ashcroft, Traduzido

9.2 Observações Gerais sobre o Método de Ligações fortes 159

níveis-p, a uma equação secular 5× 5 para os cinco níveis-d etc. A Figura10.6, por exemplo, mostra a estrutura de banda que se origina dos cálculosbaseados no método das ligações fortes para os 5 vezes degenerados níveis-3d no níquel. As bandas são plotadas para três direções de simetria na zona,cada uma das quais tendo seu conjunto característico de degenerescências.12

2. Uma característica muito geral do método de ligações fortes é arelação entre a largura de banda e as integrais de sobreposição (overlap)

γij (R) = −Zdr φi (r) ∆U φj (r−R) . (9.24)

Se os γij são pequenos, então a largura de banda é correspondentementepequena. Como uma regra prática, quando a energia de um dado nívelatômico aumenta (i.e., a energia de ligação diminui), o mesmo acontececom a extensão espacial de sua função de onda. Consequentemente, asbandas mais baixas num sólido são muito estreitas, mas as larguras debanda aumentam com a energia. Em metais, quanto mais elevada for abanda (ou as bandas) mais larga ela será, pois o alcance espacial dos níveisatômicos mais altos são comparáveis à constante de rede, e a aproximaçãode ligações fortes tem sua validade questionável.3. Embora as funções de onda das ligações fortes (9.6) sejam obtidas

de níveis atômicos localizados φ, a probabilidade de se encontrar um elétronnum nível de ligações fortes será a mesma para qualquer célula do cristal,uma vez que sua função de onda (tal como qualquer função de onda deBloch) só muda pelo fator de fase eik · r quando nos movemos de uma célulapara outra separadas por uma distância R. Então, quando r varia de umacélula para outra, sobrepõe-se à estrutura atômica dentro de cada célulauma variação sinusoidal nas amplitudes de Re ψ e Imψ, como ilustrado naFigura 10.7.Uma outra indicação de que os níveis de ligações fortes têm uma onda

com caráter viajante ou itinerante vem do teorema de que a velocidademédia de um elétron num nível de Bloch com vetor de onda k e energiaε (k) é dada por v (k) = (1/~) ∂ε/∂k. (Veja Apêndice E.) Se ε é inde-pendente de k, ∂ε/∂k é zero, que é consistente com o fato de que emníveis atômicos genuinamente isolados (que conduzem à largura de bandazero) os elétrons realmente são mantidos em átomos individuais. Porém,se houver qualquer sobreposição não nula nas funções de onda atômicas,então ε não será constante em toda zona. Como uma pequena variação emε implica num pequeno valor diferente de zero de ∂ε/∂k, e conseqüente-mente, numa pequena, mas não nula, velocidade média, contanto que hajaqualquer sobreposição, os elétrons poderão mover-se livremente pelo cristal!Diminuindo-se a sobreposição, reduz-se somente a velocidade; isso não elim-ina o movimento. Pode-se imaginar este movimento como um tunelamento

12As bandas calculadas são tão largas que lançam dúvidas sobre a validade de toda aexpansão. Um cálculo mais realista teria que incluir, pelo menos, o efeito dos níveis 4s.

Page 163: Estado Solido, Ashcroft, Traduzido

160 9. Método das Ligações Fortes

quântico de um sítio da rede para outro. Quanto menor a sobreposição(overlap), menor é a probabilidade de tunelamento e, conseqüentemente,maior é o tempo que o elétron leva para percorrer uma dada distância.4. Em sólidos que não são redes de Bravais monoatomicas, a aprox-

imação de ligações fortes é mais complicada. Este problema aparece nosmetais hexagonais com agrupamento compacto, que são hexagonais sim-ples com uma base de dois pontos. Formalmente, pode-se tratar a base dedois pontos como uma molécula, cujas funções de onda admite-se seremconhecidas, e procede-se como acima, usando funções de onda moleculares,em vez de funções de onda atômicas. Se a sobreposição de vizinhos próximoscontinua pequena, então, em particular, será pequena em cada ”molécula” ,e um nível atômico s dá lugar a dois níveis moleculares quase-degenerados.Assim, um único nível atômico s dá origem a duas bandas de ligações fortespara a estrutura hexagonal com agrupamento compacto.Alternativamente, pode-se continuar construindo combinações lineares

de níveis atômicos centrados nos pontos da rede de Bravais e nos pontosda base, generalizando-se (9.6) para

ψ (r) =XR

eik · r (aφ (r−R) + bφ (r− d−R)) , (9.25)

(onde d é a separação entre dois átomos da base). Essencialmente, isto podeser visto como a primeira maneira de abordar o problema, na qual, porém,as funções de onda moleculares aproximadas são usadas, a aproximaçãopara os níveis moleculares sendo combinados com a aproximação de ligaçõesfortes para os níveis do cristal todo.13

5. Em elementos mais pesados, o acoplamento spin-órbita é de grandeimportância (veja página 146) para determinar os níveis atômicos, e, por-tanto, deveria ser incluído no tratamento de ligações fortes do alargamentodestes níveis em bandas no sólido. Em princípio, a extensão é direta. Sim-plesmente, inclui-se em∆U (r) a interação entre o spin do elétron e o campoelétrico de todos os íons, exceto daquele na origem, e incorpora-se aquelainteração no Hamiltonian atômico. Uma vez que isto é feito, já não podemosmais usar combinações lineares de funções de onda de orbitais atômicos in-dependentes do spin, mas tem-se que trabalhar com combinações linearesde ambos os níveis, orbital e spin. Assim, a teoria de ligações fortes de umnível-s, quando o acoplamento spin-órbita é apreciável, não aproximaria φpor um único nível atômico s, mas por uma combinação linear (com oscoeficientes dependendo de k) de dois níveis com a mesma função de ondaorbital e dois spins opostos. A teoria de ligações fortes de uma banda-diria de um problema determinantal 5 × 5 para 10 × 10 etc. Como men-cionamos no Capítulo 9, os efeitos do acoplamento spin-órbita, embora,às vezes pequeno, freqüentemente pode ser bastante crucial, como quando

13As ”funções de onda moleculares aproximadas” serão portanto dependentes de k.

Page 164: Estado Solido, Ashcroft, Traduzido

9.2 Observações Gerais sobre o Método de Ligações fortes 161

eles eliminam degenerescências que, rigorosamente, estariam presentes setal acoplamento fosse ignorada.14

6. Toda a análise de níveis eletrônicos em um potencial periódiconeste capítulo (e nos dois precedentes) foi feita dentro da aproximação deelétron independente, que, ou ignora a interação entre elétrons, ou, no máx-imo, a inclui de algum maneira através de um potencial periódico efetivoexperimentado por cada elétron. Veremos no Capítulo 32 que a aproxi-mação de elétron independente pode falhar quando ela dá pelo menos umabanda parcialmente cheia, que deriva de níveis atômicos bem localizadoscom pequenas integrais de sobreposição. Em muitos casos de interesse (no-tadamente, em isolantes e para as bandas muito baixas em metais) esteproblema não aparece, uma vez que as bandas de ligações fortes são tãobaixas em energia que são completamente cheias. Porém, a possibilidadede um tal fracasso da aproximação de elétron independente deve ser lem-brada quando a bandas estreitas de ligações fortes são derivadas de ca-mada atômicas parcialmente cheias — em metais, geralmente as camadas de f. Deveria-se estar, particularmente, atento desta possibilidade em sólidoscom uma estrutura magnética.Esta falha da aproximação de elétron independente obscurece a imagem

simples que a aproximação de ligações forte sugere: o de uma transiçãocontínua do estado metálico ao estado atômico, quando a distância in-teratômica é aumentada continuamente.15 Se olhamos a aproximação deligações fortes, então quando a constante de rede em um metal aumenta, asobreposição entre todos os níveis atômicos tornam-se, eventualmente, pe-quenos, e todas as bandas – até mesmo a banda (ou bandas) de conduçãoparcialmente cheia – se tornariam bandas estreitas de ligações fortes. Es-treitando a banda de condução, a velocidade dos elétrons diminuiria e acondutividade do metal baixaria. Então, esperaríamos que a condutividadefosse diminuindo continuamente para zero, proporcionalmente às integraisde sobreposição, à medida que o metal for se expandido.Porém, é provável que um cálculo mais completo, que vá além da aprox-

imação de elétron independente, prediga que, além de um certo valor daseparação entre os vizinhos mais próximos, a condutividade caisse abrup-tamente para zero, tornando o material um isolante (a chamada transiçãode Mott).A razão para este desvio da predição do método de ligações fortes está na

inabilidade da aproximação de elétron independente para tratar a repulsãoadicional muito forte que um segundo elétron sente num determinado sítioatômico, quando outro elétron já está ali. Comentaremos isto mais adiante

14A inclusão do acoplamento spin-órbita no método de ligações compactas é descritapor J. Friedel, P. Lenghart, and G. Leman, J. Phys. Chem. Solids 25, 781 (1964).15Um procedimento difícil para se realizar no laboratório, mas muito tentador para

visualizar teoricamente, como uma ajuda para entender a natureza das bandas de ener-gia.

Page 165: Estado Solido, Ashcroft, Traduzido

162 9. Método das Ligações Fortes

no Capítulo 32, mas mencionamos o problema aqui porque às vezes é de-scrito como uma falha do método das ligações fortes.16 Isto é ilusório, poisa aproximação de ligações fortes para o modelo de elétron independenteé a melhor aproximação do modelo; a falha é da própria aproximação deelétron independente.

9.3 Funções de Wannier

Concluímos este capítulo com uma demonstração de que a funções de Blochpara qualquer banda sempre pode ser escrito na forma (9.4), na qual aaproximação de ligações fortes é baseada. As funções φ que representam opapel das funções de onda atômicas são conhecidas como funções de Wan-nier. Tais funções de Wannier podem ser definidas para qualquer banda, in-dependente se ela é ou não bem descrita pela aproximação de ligações fortes;mas, se a banda não é uma banda de ligações fortes estreita, as funções deWannier guardarão pouca semelhança com quaisquer das funções de ondaeletrônicas para o átomo isolado.Para estabelecer que qualquer Bloch funcionam ψnk (r) pode ser escrita

na forma (9.4), notamos primeiro que, considerada como uma função dek para r fixo, ψnk (r) é periódica na rede recíproca. Portanto, tem umaexpansão em série de Fourier em ondas planas com vetores de onda narecíproca da rede recíproca, i.e., na rede direta. Assim, para qualquer rfixo, podemos escrever

ψnk (r) =XR

fn (R, r) eiR ·k, (9.26)

onde os coeficientes na soma dependem tanto de r como dos ”vetores deonda” R, pois para cada r é uma função diferente de k que está sendoexpandida.Os coeficientes de Fourier em (9.26) são dados pela fórmula de inversão17

fn (R, r) =1

v0

Zdk e−iR·k ψnk (r) (9.27)

A Equação (9.26) é da forma (9.4), desde que a função fn (R, r) só de-penda de r e R através de sua diferença r−R. Mas se r e R são ambosdeslocados pelo vetor R0 da rede Bravais, então f fica inalterado como

16Veja, por exemplo, H. Jones, The Theory of Brillouin Zone and Electrons States inCrystals, North-Holland, Amsterdam, 1960, pág. 229.17Aqui v0 é o vulume no espaço-k da primeira zona de Brillouin, e a integral é sobre a

zona. As Equações (9.26) e (9.27) (com r considerado um parâmetro fixo) são justamenteas Eqs. (D.1) e (D.2) do Apêndice D, com os espaços direto e recíproco permutados.

Page 166: Estado Solido, Ashcroft, Traduzido

9.3 Funções de Wannier 163

uma conseqüência direta de (9.27) e do teorema de Bloch, na forma (7.5).Assim fn (R, r) tem a forma

fn (R, r) = φn (r−R) (9.28)

Diferente das funções atômicas de ligações fortes φ (r), as funções deWan-nier φn (r−R) em sítios diferentes (ou com índices de banda diferentes)são ortogonais (veja Problema 3, Eq. (9.34)). Como o conjunto completo defunções de Bloch pode ser escrito como combinações lineares das funçõesde Wannier, as funções Wannier φn (r−R) para todo n e R forma umconjunto completo ortogonal. Essas funções oferecem uma base alterna-tiva para uma descrição exata dos níveis de elétron independente em umpotencial cristalino.A semelhança formal da função de Wannier com a função de ligações

fortes cria a expectativa de que as funções de Wannier também serão local-izadas — i.e, quando r é muito maior do que algum comprimento na escalaatômica, φn (r) será extremamente pequena. Para a extensão que isto podeser estabelecido, a função de Wannier oferece uma ferramenta ideal por dis-cutir fenômenos no qual a localização espacial dos elétrons tem um papelimportante. Talvez as áreas mais importantes de aplicação são estas:

1. Tentativas para derivar uma teoria de transporte para elétrons deBloch. A analogia de pacotes de onda de elétron livres, níveis eletrôni-cos num cristal, que são localizados em r e k, são construídos conve-nientemente com o uso de funções de Wannier. A teoria das funçõesde Wannier é proximamente relacionada à teoria de quando e comoa teoria de semiclassical de transporte através de elétrons de Bloch(Capítulo 12 e 13) falha.

2. Fenômenos envolvendo níveis eletrônicos localizados, devido, por ex-emplo, a impurezas atrativas que ligam um elétron. Um exemplomuito importante é a teoria de níveis doador e aceitador em semi-condutores (Capítulo 28).

3. Fenômenos magnéticos, nos quais os momentos magnéticos localiza-dos existem nos sítios de impurezas.

As discussões teóricas do alcance das funções de Wannier são em geralmuito sutil.18Grosso modo, o alcance das funções de Wannier diminui como aumento do gap da banda (como se pode esperar da aproximação deligações fortes, na qual as bandas tornam-se mais estreitas à medida queo alcance das funções de onda atômicas diminui). Os vários fenômenos

18Um argumento relativamente simples, mas apenas em uma dimensão, é dado porW. Kohn, Phys. Rev. 115, 809 (1959). Uma discussão mais geral pode ser encontradaem E. I. Blount, Solid State Physics, Vol. 13, Academic Press, New York, 1962, pág.305.

Page 167: Estado Solido, Ashcroft, Traduzido

164 9. Método das Ligações Fortes

de ”breakdown”e ”breakthrough” que mencionaremos no Capítulo 12 queocorrem quando o gap da banda é pequeno, encontram sua reflexão nofato de que as teorias baseadas na localização da função de Wannier ficammenos confiáveis neste limite.

9.4 Problemas

1. (a) Mostre que ao longo das direções de simetria principais mostradasna Figura 10.5 a expressão de ligações fortes para a energia (9.22)de uma banda-s num cristal cúbico de face centrada reduz-se àsseguintes:

i. Ao longo de ΓX (ky = kz = 0, kx = µ2π/a, 0 ≤ µ ≤ 1)

ε = Es − β − 4γ (1 + 2 cosµπ)

ii. Ao longo de ΓL¡kx = ky = kz = µ2π/a, 0 ≤ µ ≤ 1

2

¢ε = Es − β − 12γ cos2 µπ

iii. Ao longo de ΓK¡kz = 0, kx = ky = µ2π/a, 0 ≤ µ ≤ 1

2

¢ε = Es − β − 4γ ¡cos2 µπ + 2cosµπ¢

iv. Ao longo de ΓW¡kx = 0, ky = µ2π/a, kz =

12µ2π/a, 0 ≤ µ ≤ 1

¢ε = Es − β − 4γ ¡cosµπ + cos 12µπ + cosµπ cos 12µπ¢

v. Mostre que, sobre as faces quadradas da zona, a derivadanormal de ε se anula.

vi. Mostre que, sobre as faces hexagonais da zona, a derivadanormal de ε se anula somente ao longo das linhas ligando ocentro do hexágono a seus vértice.

2. Bandas-p de ligações fortes em cristais cúbicos

Lidando com cristais cúbicos, as combinações lineares mais conve-nientes dos três níveis atômicos p degenerados têm a forma xφ (r) ,y φ (r) e z φ (r), onde as funções φ só dependem do módulo do ve-tor r. As energias das três correspondentes bandas-p de (9.12) sãoencontradas, fazendo-se zero o determinante¯

(ε (k)−Ep) δij + βij + γij (k)¯= 0 (9.29)

Page 168: Estado Solido, Ashcroft, Traduzido

9.4 Problemas 165

onde

γij (k) =XR

eik · r γij (R) ,

γij (R) = −Zdr ψ∗i (r) ψj (r−R) ∆U (r) ,

βij = γij (R = 0) . (9.30)

(Omitiu-se em (9.29) um termo multiplicando ε (k) − Ep que dáorigem a correções muito pequenas, análogas àquelas dadas pelo de-nominador de (9.15) no caso da banda-s.)

(a) Como uma consequência da simetria cúbica, mostre que

βxx = βyy = βzz = β

βxy = 0 (9.31)

(b) Admitindo que γij (R) sejam desprezíveis, exceto para vizinhosmais próximos R, mostre que γij (k) é diagonal para uma redede Bravais cúbica simples, tal que xφ (r), yφ (r) e zφ (r) gera,cada uma, bandas independentes. (Note que isto deixa de ser ocaso se os γij (R) para os próximos vizinhos mais próximos Rsão também considerados na expressão.)

(c) Mostre que, para uma rede de Bravais cúbica de face centrada,com apenas os γij correspondentes a vizinhos mais próximosapreciáveis, as bandas de energia são dadas pelas raízes de

0 =

¯¯¯

ε (k)− ε0 (k)+4γ0 cos

12kya cos

12kza

−4γ1 sen 12kxa sen 12kya −4γ1 sen 12kxa sen 12kza

−4γ1 sen 12kya sen 12kxaε (k)− ε0 (k)+4γ0 cos

12kza cos

12kxa

−4γ1 sen 12kya sen 12kza

−4γ1 sen 12kza sen 12kxa −4γ1 sen 12kza sen 12kyaε (k)− ε0 (k)+4γ0 cos

12kxa cos

12kya

¯¯¯

(9.32)onde

ε0 (k) = Ep − β − 4γ2¡cos 12kxa cos

12kza+ cos

12kxa cos

12kya+ cos

12kya cos

12kza

¢γ0 = −

Zdr£x2 − y ¡y − 1

2a¢¤φ (r) φ

µhx2 +

¡y − 1

2a¢2+¡z − 1

2a¢2i1/2¶

∆U (r) ,

γ1 = −Zdr¡x− 1

2a¢ ¡y − 1

2a¢φ (r) φ

µh¡x− 1

2a¢2+¡y − 1

2a¢2+ z2

i1/2¶∆U (r) ,

γ2 = −Zdr x

¡x− 1

2a¢φ (r) φ

µh¡x− 1

2a¢2+¡y − 1

2a¢2+ z2

i1/2¶∆U (r) (9.33)

Page 169: Estado Solido, Ashcroft, Traduzido

166 9. Método das Ligações Fortes

(d) Mostre que todas as três bandas são degeneradas em k = 0 eque, quando k está na direção, ou do eixo do cubo (ΓX), ou deuma diagonal do cubo (ΓL), existe uma dupla degenerescência.Esboce as bandas de energia (em analogia com a Figura 10.6)ao longo dessas direções.

3. Prove que as funções de Wannier centradas em diferentes sítios darede são ortogonais,Z

φ∗n (r−R) φn0¡r−R0¢ dr ∝ δn,n0 δR,R0 , (9.34)

recorrendo à ortonormalidade das funções de Bloch e à identidade(F.4) do Apêndice F. Mostre também queZ

dr |φn (r)|2 = 1 (9.35)

se a integral de |ψnk (r)|2 sobre uma célula primitiva for normalizadaa unidade.