Upload
helder
View
19
Download
0
Embed Size (px)
DESCRIPTION
banco de dados
Citation preview
Ladeira Livros
Como se faz um banco de dados (em Histria)
Tiago Gil Laboratrio de Histria Social
Universidade de Braslia
2015
Copyright Tiago Lus Gil Capa: Durval de Souza Filho Preparao dos originais: Manoel Rendeiro Neto Editorao Eletrnica: David da Silva Carvalho Ladeira Livros Rua General Cmara, 385 Centro Porto Alegre
ISBN: 978-85-69621-00-3 Conselho Editorial Joo Luis Ribeiro Fragoso (UFRJ) Martha Hameister (UFPR) Tiago Bernardon de Oliveira (UFPB) Luis Augusto E. Farinatti (UFSM) Helen Osrio (UFRGS)
Dados Internacionais de Catalogao na Publicao (CIP) Ficha catalogrfica elaborada pelo bibliotecrio Miguel ngelo Bueno Portela, CRB1
2756
G463c Gil, Tiago. Como se faz um banco de dados (em histria) [recurso
eletrnico] / Tiago Gil. Porto Alegre : Ladeira Livros, 2015. 127 p. : il. Documento em PDF. Inclui bibliografia. ISBN 978-85-69621-00-3. 1. Histria - Metodologia. 2. Banco de dados. 3. Informtica. I. Ttulo.
CDU 930:004.652
Contedo
PREFCIO ............................................................................................................... 5
INTRODUO ........................................................................................................ 7
ALGUMAS QUESTES TERICAS E METODOLGICAS .......................................... 11
UM ARTESANATO, UMA OPERAO ..................................................................................14
DESMONTANDO AS COISAS EM ORDEM ..........................................................................21
EM OMBROS DE GIGANTES .............................................................................................31
ALGUMAS QUESTES PRPRIAS DA INFORMTICA ............................................ 50
ESTRUTURA DE DADOS ...................................................................................................50
MODELOS CONCEITUAIS, LGICOS E FSICOS .......................................................................58
ASPECTOS VISUAIS SOBRE AS BASES ..................................................................................63
ENTRE A TCNICA E A TEORIA: PROBLEMAS COTIDIANOS E DECISES PRTICAS ...........................71
ENGENHARIA DE PESQUISA ................................................................................. 83
LEVANTAMENTO INICIAL .................................................................................................83
COLETANDO OS DADOS E ABASTECENDO A BASE ..................................................................87
ADMINISTRAO DA BASE ..............................................................................................95
MONTANDO BASES: ALGUNS EXEMPLOS CONCRETOS......................................... 98
BASES CENTRADAS NA FONTE ....................................................................................... 100
BASES CENTRADAS NO MTODO ................................................................................... 112
CONCLUSO ...................................................................................................... 122
BIBLIOGRAFIA .................................................................................................... 123
Prefcio
Este livro foi fruto de um ps-doutorado realizado na
cole des Hautes tudes en Sciences Sociales (EHESS) entre
agosto de 2013 e janeiro de 2014, dentro do projeto "O Bom
Governo das Gentes: hierarquias sociais e representao
segundo a poltica catlica do sculo XVI ao XVIII". Para tanto, li
centenas de artigos, livros e captulos sobre o tema, alm de
dezenas de manuais de informtica. Os resultados dessa
pesquisa tambm foram aproveitados em cursos presenciais
sobre bancos de dados, realizados na UFRJ em outubro de 2014
e na UFRGS em dezembro do mesmo ano, quando as ideias aqui
apresentadas foram alvo de debates. Os dados obtidos foram
utilizados em outras publicaes, a saber: Storici e informatica:
luso dei database (1968-2013), publicado na revista Memoria e
ricerca (Itlia, 2015) e "Our own in-house software: una
historia de historiadores programadores na obra Historiografa,
giro digital y globalizacin. Reflexiones tericas y prcticas
investigativas de Juan Andrs Bresciano (Uruguay, 2015).
Agradeo aos colegas do Departamento de Histria da UnB,
Marcelo Balaban, Neuma Brilhante, Teresa Marques, Luiz
Noguerl e Marcos Pereira pela leitura atenta, assim como aos
estudantes do Laboratrio de Histria Social da UnB, que
discutiram animadamente seu contedo. No poderia deixar de
agradecer aos professores Joo Fragoso, Jonas Moreira Vargas,
Roberto Guedes Ferreira, Antonio Carlos Juc de Sampaio,
Thiago Krause, Hlida Conceio, Helen Osrio e Lus Augusto
Farinatti, que igualmente leram e comentaram o original. O
material tambm foi avaliado pelo mestre em computao Cssio
Couto, que fez diversas sugestes.
A pesquisa contou com financiamento da CAPES
(Programa Capes/Cofecub) e do CNPq.
CLIQUE AQUI
PARA ADQUIRIR
A VERSO
IMPRESSA DESSE
LIVRO
[7]
Introduo
Este um livro voltado para estudantes de Histria
e para quem quer informatizar sua pesquisa desde o comeo.
Por informatizar quero dizer criar uma base de dados, ou, como
se diria em ingls to database something. Seu objetivo de
ajudar o leitor a incrementar sua pesquisa em Histria, com
algumas aplicaes possveis para as cincias sociais em geral.
No se trata de um manual tcnico. A proposta aqui contribuir
para o leitor pensar como alguns recursos prprios do universo
das bases de dados e da informtica podem melhorar a
investigao, desde a proposio do problema at a escrita do
trabalho, passando pela coleta e anlise das informaes que
daro suporte s concluses. A ateno, contudo, ficar nas
formas de organizar os materiais.
temerrio escrever um livro como este. Tratando-
se de informtica, ele estar datado em poucos anos. Todavia,
tentei escrev-lo pensando em questes clssicas, de longo
prazo, inclusive tomando auxlio de debates entre Histria e
Informtica que existem desde os anos 1960. Estes debates
apresentam alguns problemas estruturais na organizao das
informaes que prpria do trabalho do historiador, com a
chegada cada vez mais avassaladora das mquinas. E como
defensor do planejamento, tentei pensar o texto para alm do
seu consumo imediato, de modo a prolongar seu uso no tempo,
no tema e no espao. Veremos que conveniente fazer a
mesma coisa com as bases de dados.
O perigo da rpida obsolescncia desse tipo de
publicao se agrava devido necessidade quase direta de
referncia ao uso de certos programas. Amanh os programas
deixaro de existir e outros (melhores ou no) sero lanados.
Para tentar amenizar isso, o texto todo foi escrito levando em
[8] conta aspectos mais gerais dos programas, sem referncia a um
pacote especfico. Fiz isso no apenas pelo problema da
obsolescncia: geralmente as pessoas acham que construir
bancos de dados ou fazer anlise de redes sociais, para dar um
exemplo, resume-se a usar um programa, minimizando a mo do
historiador em seu trabalho. Aqui quero o trabalho humano, para
o bem e para o mal, mostrando as opes por trs desse
personagem que faz pesquisa usando (ou no) bases de dados.
Muitas vezes, utilizarei metforas relacionadas ao
universo da cozinha, no apenas por uma questo didtica, mas
tambm por acreditar que de fato so campos que tm alguma
semelhana. E vou comear com um exemplo claro. A proposta
aqui no de criar sistemas que faam todo o trabalho, com
uma completa mecanizao. No quero propor uma mquina
onde voc coloca todos os produtos, como leite, batatas,
manteiga, alho e sal, para na ponta dela sair um belo pur.
preciso conhecer as engrenagens da base de dados. Nesse
caso, a ideia de um meio termo entre o artesanato simples,
amassando as batatas com a mo, e aquela nefasta mquina
que faz tudo sozinha. Garfos, facas, descascadores e
multiprocessadores podem ser teis. Proponho, assim, um
artesanato automatizado, com o uso pontual e deliberado de
recursos informticos. E como artesanato que , convm ao
historiador saber construir suas prprias ferramentas ou saber
adapt-las para usos inusitados, como quase tudo em Histria.
Ao leitor ctico ou desconfiado das bases de dados
ou das possibilidades que a informtica oferece na produo do
conhecimento histrico, j aviso que este ser um livro de
Histria. Vamos falar de alguns problemas prprios do universo
da pesquisa, desde a proposio do problema at a redao
final. Ao leitor que acredita que as bases de dados so um
problema exclusivamente tcnico, lembro que existem milhares
de bases de dados tecnicamente perfeitas, mas que se tornaram
[9] obsoletas e inutilizveis diante de problema prprios do universo
do historiador. H bases que foram feitas para um tipo de uso e,
por opes mal feitas na sua origem, no permitem nada alm. E
h aquelas que sequer conseguiram responder pergunta
original. Sim, porque as bases tm relao direta com nossas
perguntas, ou deveriam ter. E preciso planejar para tirar
proveito delas. Quanto mais planejadas, por mais tempo sero
teis.
Um banco de dados pode servir para escancarar
nossas posies tericas mais ocultas e at algumas indesejadas.
Quando somos obrigados a racionalizar nosso objeto a ponto de
faz-lo caber em registros de uma tabela, precisamos expor mais
as nossas posies. No h espao para um pensamento como
nosso tema muito complexo (como se alguns temas fossem
simples). preciso saber como dar vazo a essa complexidade e
precisamos fazer isso de modo claro, de tal maneira que at um
computador entenda. S tiramos da mquina aquilo que
colocamos l dentro.1
Em 1996, um livro interessante, do qual pretendi
tirar bastante proveito, foi lanado na Inglaterra. Databases in
historical research, de Harvey e Press, tinha tudo para ser uma
obra de referncia entre os historiadores. Pensava a histria no
meio da evidente encruzilhada a que a humanidade estava
chegando, representada pela informtica. O livro parece antever
que, no futuro prximo, cada vez mais os historiadores
utilizariam as bases de dados para incrementar suas pesquisas.
Mas no foi assim e nem Harvey e Press foram os primeiros a
errar com essa mesma previso. Contudo, o caso deles
especial. Quando escreveram sua obra, as databases estavam se
1 CHARLE, Christophe, Problemes de traitement informatique dune enquete
sur trois lites en 1901, in: MILLET, Hlne (Org.), Informatique et prosopographie, [s.l.]: CNRS, 1985.
[10] consolidando na informtica, em todos os campos do
conhecimento e pareciam mesmo estar se tornando um tema
hegemnico na relao entre histria e informtica.2
Este livro no pretende rememorar os velhos
tempos em que as bases de dados podiam ser vistas como o
futuro da histria. Entendo que desde meados dos anos 1990 os
historiadores que dialogavam com a tecnologia da informao j
no so os mesmos que constroem bancos de dados para suas
pesquisas. Esses ltimos me parecem o pblico mais direto
dessas linhas. Se no a maioria dos historiadores, este l
outro problema. O nosso, aqui, consiste em discutir sobre boas
formas de fazer pesquisa histrica centrada em bancos de dados,
como diziam Harvey e Press em meados dos 1990. Ento,
convido o leitor a uma breve aventura pela tecnologia, mas sem
sair do nosso cho de historiador.
2 HARVEY, Charles; PRESS, Jon, Databases in Historical Research. Theory,
Methods and Applications, London: Macmillan Press, 1996.
[11]
Algumas questes tericas e
metodolgicas
Um banco de dados quase uma forma de narrativa
histrica.3 Ele obedece, perfeita ou imperfeitamente, aos
preceitos e s concepes de mundo (e, dentro desses, das
opinies sobre o problema de pesquisa) do pesquisador. A
primeira posio terica acreditar que seja possvel reduzir a
complexidade do social a ponto de faz-la caber na forma de
registros de uma tabela, tal como os historiadores acreditam ser
possvel fazer nas linhas de um texto. Mas essa no a nica
posio terica possvel no trabalho com bases de dados. No
quero dizer que marxistas vo produzir bases de um tipo e que
os liberais produziro, necessariamente, de outro, ainda que isso
seja perceptvel e bastante provvel. Nossas posies tericas
podem ser variadas, heterogneas, eclticas, mas esto l, no
cantinho delas, esperando a hora de aparecer para organizar o
mundo dentro dos nossos produtos. No caso da pesquisa em
Histria, isso inclui a escolha de objetos, de conjuntos de fontes,
de metodologias e de interlocutores. E na montagem da base de
dados no diferente.
Para ser mais claro, apresentarei aqui diversas
formas de abordar o problema. Posso dizer que existem dois
tipos de bases, as analticas (orientadas pelo mtodo, como
3 No vou discutir o significado terico de narrativa histrica, j
exaustivamente abordado por centenas de historiadores ao longo dos ltimos 40 anos. Apenas para tomar um referencial, apresentarei aqui uma definio retirada de Lawrence Stone, que ao apontar a volta narrativa, destaca algumas de suas caractersticas no discurso histrico: ser descritiva, focada mais ao homem do que s circunstncias, atenta mais ao particular e ao especfico que aos conjuntos e marcada pela retrica. STONE, Lawrence, The revival of narrative: reflections on a new old history, Past and Present, n. 85, p. 324, 1979.
[12] preferem alguns autores), voltadas para um problema de
pesquisa, e as empricas (orientadas pela fonte) que procuram
dar conta de um corpus documental, como uma base de
registros paroquiais, de batismos, por exemplo. Isso tem relao
com uma concepo de histria que prev o trabalho do
historiador como um passo importante para o acesso ao
conhecimento do passado, uma vez que as bases analticas
estariam orientadas por um problema de pesquisa. As bases
empricas, por seu turno, organizariam o material de trabalho,
sem um acesso direto ao passado, porquanto foram organizadas
por um historiador de modo diverso ao estado original da fonte.
Tambm poderia dizer que h dois tipos de bases
de dados: as annimas e as com referncia nominal. Existem as
pesquisa que demandam ateno s histrias pessoais e aquelas
para as quais isso no afeta o resultado. Poderia colocar, de um
lado, as bases de dados dos micro-historiadores, dos demgrafos
historiadores de Cambridge e de algumas cepas de demgrafos
franceses. No outro extremo, colocaramos os cliometristas e
dezenas de demgrafos franceses to tributrios de Louis Henry
como os primeiros, mais interessados, contudo, em calcular o
intervalo intergensico dos camponeses do Sculo XVII do que
mapear as opes de casamento de um ncleo familiar
especfico ao longo do mesmo sculo.
Entre aqueles que fazem bases no annimas,
dando nfase aos agentes histricos e aos seus nomes, podemos
apontar outra diviso: os que fazem bases individuais
(biogrficas), os que fazem bases ao-por-ao e aqueles que
criam sistemas para recolher, em outras bases, informaes
sobre os agentes. No h aqui uma hierarquia de qualidade de
base nem o melhor jeito de fazer o trabalho. H trs ideias de
como deve ser feito o trabalho do historiador.
A primeira enfatiza as trajetrias individuais,
[13] atomizando os personagens e dando pouco espao para
dinmicas sociais e situaes inusitadas. Por exemplo, se criamos
um campo para profisso, teremos que colocar ali toda a
informao de uma vida de atividades ou escolher uma mais
importante, varrendo debaixo do tapete outras informaes que
poderiam se revelar fundamentais no andamento da pesquisa.
Mas podemos inserir vrios campos de profisso: profisso1,
profisso2, etc. Quantos seriam necessrios? Depende do
personagem. E qual seria a profisso1 quando nosso heri
mantm duas paralelas? Estamos sempre fazendo opes,
orientados por nossos problemas de pesquisa. At a, tudo
epistemologicamente timo, ajuda em um estudo
prosopogrfico. A questo que nossas perguntas mudam ao
longo da pesquisa.
A segunda opo, registrar em tabelas ao-por-
ao parece muito melhor nesse sentido. Ao invs de
registrarmos "pessoas", registraramos "atos". Ela elimina os
problemas apresentados acima, mas no nada neutra. Faz
parte de uma concepo de histria muito em voga no atual
estgio dos estudos, que enfatiza a interao social e as redes
de relacionamento. Talvez no seja indicada para outros temas
de pesquisa. Por outro lado, o que so aes ou atos? Um
espirro e um homicdio tm o mesmo significado? Uma conversa
tem semelhante estatuto e deve ser desmembrada no mesmo
formulrio de um arranjo matrimonial? Esse arranjo matrimonial
significaria apenas um registro na tabela ou dezenas deles
(considerando a cerimnia oficial, as testemunhas, a festa)?
A terceira alternativa pode ser tomada em
diferentes contextos. Pode ter sido uma opo segura, devido
incerteza sobre qual procedimento metodolgico seria mais
adequado para o problema de pesquisa adotado. Mas pode ser
igualmente uma soluo de convenincia, diante de informaes
de fontes diversas e desorganizadas. De modo geral, todas
[14] envolvem aspectos tericos, metodolgicos e tcnicos e fazem
isso ao mesmo tempo, de tal maneira que no podemos dissociar
estes trs elementos durante o trabalho.
Um artesanato, uma operao
J vimos que h muito do historiador por trs dessa
aparente deciso tcnica de construir um banco de dados . Mas
isso no ocorre por causa dos bancos. O mesmo poderia ser dito
do trabalho do historiador com seus recortes, suas notas, seus
instrumentos de organizao dos materiais dirios de trabalho,
fichas, cadernos, canetas ou laptops. Em texto clssico de 1974,
Michel de Certeau dizia:
Em histria, tudo comea com o gesto de selecionar, de reunir, de, dessa forma, transformar em "documentos" determinados objetos distribudos de outra forma. Essa nova repartio cultural o primeiro trabalho. Na realidade ela consiste em produzir tais documentos, pelo fato de recopiar, transcrever ou fotografar esses objetos, mudando, ao mesmo tempo, seu lugar e seu estatuto. Esse gesto consiste em "isolar" um corpo, como se faz em fsica. Forma a "coleo". [...] O material criado por aes combinadas que o repartem no universo do uso,
que tambm vo procur-lo fora das fronteiras do uso e que fazem com que seja destinado a um reemprego coerente. a marca dos atos que modificam uma ordem recebida e uma viso social. Instauradora de signos oferecidos a tratamentos especficos, essa ruptura no , portanto, nem apenas, nem primeira vista, o efeito de um "olhar". necessria uma operao tcnica.
4
A tcnica, geralmente desprezada pelos
4 DE CERTEAU, Michel, A operao histrica, in: LE GOFF, Jacques; NORA,
Pierre (Orgs.), Histria: novos problemas, So Paulo: Livraria Francisco Alves Editora, 1978, p. 30.
[15] historiadores, assume no texto de Certeau, um lugar
fundamental: Se verdade que a organizao da histria
relativa a um lugar e a um tempo, inicialmente o por suas
tcnicas de produo [...] a histria mediada pela tcnica.5
Isso significa exatamente aquele conjunto de operaes que
comea com o gesto de selecionar e de reunir, para em seguida
criar o material por aes combinadas que vo reparti-lo no
universo do uso para um reemprego coerente. Graficamente,
poderamos apresentar o raciocnio da seguinte forma:
Figura 1 - Esquema ilustrativo de uma afirmao de Michel de Certeau
Em um texto de 1986, Jean-Phillipe Genet apresenta
um modelo aproximado do de Certeau, numa tentativa mais
clara de produzir conhecimento histrico com o uso de bancos
de dados. Para ele, tudo comea com o Real Passado, um
abstrato mundo real do qual no temos todos os indcios,
devido perda ou ao desconhecimento desses traos, ou seja,
por um dficit positivo. Com um processo de seleo e busca,
montamos um Real Histrico, composto pelas fontes conhecidas.
Uma vez coletadas e interpretadas, elas se transformam em uma
coleo (palavra que tambm utilizada e reforada por
Certeau) de dados, que Genet denominou de metasoures
(metafontes). Graficamente, o argumento do autor poderia ser
expresso da seguinte maneira.
5 Ibid., p. 28.
[16]
Figura 2 - Esquema ilustrativo de uma afirmao de Jean-Phillipe Genet
Poderamos antepor um elemento diante desses
dois modelos: um problema de pesquisa. A seleo das fontes,
mencionada por Certeau, s faz sentido diante de um
problema/questo que oriente essa seleo. bem verdade que
o problema pode se apresentar no contato com alguma
documentao, e no, apenas, com a leitura de outros estudos
(muito menos por um crebro genial ou pela intercesso divina).
No importa de onde surgiu a ideia. Importa que colocado um
problema, mesmo que frgil, ele demanda o passo seguinte - a
seleo das fontes. O esquema ficaria um pouco alterado, mas
coerente com as posies acima apresentadas, comeando com
um problema, que tem origem na experincia do historiador,
seja com fontes, com sua vida pessoal, com suas leituras, ele
seleciona e rene suas fontes para desmont-las com aes
combinadas, criando um material ou "metafontes" que sero
reordenadas na anlise e descritas em um texto, mediado pelas
opes tericas e metodolgicas do autor e pelo problema de
pesquisa original.
Figura 3 - Esquema das etapas da produo do conhecimento histrico
[17]
Essa descrio de procedimentos, que enfatiza as
tcnicas prprias do historiador, , agora, nosso foco no debate
sobre a informatizao. H dcadas os historiadores buscam
automatizar seus procedimentos. E como foi dito antes, no h
como criar um software em que, utilizando as tcnicas do
conhecimento histrico, coloquemos o problema e obtenhamos a
resposta. O que possvel (e bastante vivel) automatizar
alguns procedimentos do historiador em cada uma dessas
etapas, para que o pesquisador possa fazer tantas aes
combinadas quanto pretenda de modo eficiente e criar uma
ferramenta com a qual ele possa reunir os materiais, os dados,
ou as "metafontes", em um ambiente que permita selees,
buscas e ordenamentos variados sem a perda da informao
original. Em suma, trata-se de organizar o trabalho de modo a
permitir experincias. Como disse o mesmo Certeau:
A utilizao de tcnicas atuais de informao conduz o historiador a separar o que at agora se encontrava em seu trabalho: a construo dos objetos de pesquisa e, portanto, tambm as unidades de compreenso; a acumulao de "dados" (informao secundria, ou material refinado) e seu arranjo em lugares onde possam ser classificados e deslocados; a explorao tornada possvel pelas diversas operaes a que esse material
suscetvel.6
Ressalte-se, contudo que esta tarefa tem suas
dificuldades. Se for correto que podemos administrar muito
melhor nossos dados com o uso de uma boa base, igualmente
certo que uma base mal feita v gerar problemas de toda ordem.
Criar uma tabela para coletar os dados de uma fonte pode
parecer muito simples, em alguns casos, mas no . Novamente
Genet nos apresenta um problema crucial: a necessidade de
conhecer profundamente as fontes que utilizamos, antes de
montar um banco de dados com elas. Conforme o autor:
6 Ibid., p. 34.
[18]
O dado [...] um artefato, no sentido que os arquelogos empregam este termo, um objeto construdo em funo de alguns objetivos bem precisos. De uma mesma fonte dois historiadores extraem dados completamente diferentes. A operao de constituio e de estabelecimento do dado depende, assim, de trs parmetros complementares. O primeiro, que preciso manter no seu devido lugar a crtica das fontes [...] justamente por causa das imensas possibilidades
oferecidas pelo computador, me parece que a crtica das fontes sobre todas as suas formas se impe com um rigor maior...
7
preciso saber o modo como a fonte foi construda,
seu pblico, seus autores, seus limites, seus objetivos e que
interesses agiram para que aquele documento chegasse quela
forma (que finalmente teve mas que diferentes projetos
desejavam alterar). Alm dessa erudio documental, Genet
destaca a importncia do conhecimento tcnico sobre as bases e
seu dilogo com o fazer histrico e com a erudio das fontes.
Ao escolher campos que acolhero nossos dados , estaremos
escolhendo que informaes vamos privilegiar e quais as que
sero consideradas menos importantes ou que sero menos
desdobradas.
Podemos criar um campo data, mas tambm
preparar um para dia, outro para ms e finalmente um para o
ano. Se a opo for pelo primeiro, importa elaborar um campo
do tipo data (como veremos adiante). Caso contrrio, podemos
estabelecer campos numricos para dias, meses e anos. Mas
interessa fazer esse desdobramento? Nossa pergunta demanda
padres que envolvam atividades regulares dentro de um ms
(como o pagamento de aluguis)? Ou dentro de um ano
7 GENET, Jean-Philippe, Histoire, informatique, mesure, Histoire & Mesure,
v. 01, n. 01, p. 0718, 1986, p. 10 e 11(Traduo nossa. O original est em francs).
[19] (aniversrios ou safras)? E se nossas atividades tiverem uma
regularidade semestral ou quinquenal? Saber escolher os campos
certos tecnicamente importante, no somente pela tcnica da
informtica, mas tambm por nossas tcnicas de historiador.
O mesmo Certeau que discutia sobre o que faz o
historiador quando faz Histria falava, naquele ano de 1974, do
uso do computador em nossa disciplina. No o fazia com a
maestria do programador, mas com a do estudioso do tempo. E
ao fazer isso, ressaltava exatamente a mo do pesquisador nesta
empreitada e seu lugar no tempo. Na pgina 33, ele afirma:
A especificao de seu papel [da histria] no determinada pelo prprio aparelho (o computador, por exemplo) que coloca a histria no conjunto de opresses e possibilidades nascidas da instituio cientfica presente. A elucidao do prprio da histria descentrada em relao a esse aparelho: reflui no tempo preparatrio de programao que a passagem pelo aparelho torna necessria, e rejeitada [no sentido de um resultado, expelida] no outro extremo, no tempo de explorao aberto pelos resultados obtidos. Elabora-se, em funo dos interditos fixados pela mquina, por objetos de
pesquisa a serem construdos, e, em funo do que permite essa mquina, por uma maneira de tratar os produtos standart da informtica.8
Novamente aqui o foco est nas decises do
historiador, ao planejar a programao sobre os materiais que
utiliza. Ele tambm enfoca os limites da mquina, que acabam
entrando no que possvel obter de resposta. Como j dissemos,
isso pode ser matizado atravs do conhecimento tcnico de
informtica. Veremos isso mais adiante.
8 DE CERTEAU, A operao histrica, p. 33. Grifo nosso.
[20]
Nos anos de 1960 e 1970, o desejo pela
informatizao era justificado pela dificuldade de contar grandes
sries e de analisar regularidades de longos textos. Na Frana,
na Inglaterra, na Alemanha e nos Estados Unidos, o foco do uso
destas mquinas se justificava na contagem de grandes massas
documentais de fontes homogneas. Era o momento de
concepo de muitos trabalhos que ficariam prontos nos anos de
1970 e 1980. Esse interesse profundo pelas sries no foi apenas
um modismo ou febre, mas fruto de uma mudana de
concepes que teve consequncias profundas na forma de fazer
histria. As sries se tornaram importantes diante da crescente
preocupao com a definio de modelos.
As sries agora abriam o flanco de um debate at
ento interdito, devido impossibilidade fsica de observar
grandes regularidades sociais e, consequentemente, seus limites,
suas rupturas e seus casos excepcionais. Foi nesse contexto em
que certos objetos se tornaram possveis, encontrados nas
margens daquilo que se encaixava nos modelos de muitos
historiadores. Foi nesse contexto que a incluso do computador
como uma ferramenta do historiador se tornou relevante. E isso,
especialmente para a constituio de grandes bancos de dados
de sries manejveis e no apenas para flutuaes demogrficas
e econmicas, mas igualmente para o estudo de regularidades
nos textos, alm das hierarquias sociais, o que visvel na
preocupao com os estudos das categorias scio-profissionais.
Se for correto que ns historiadores temos nossa
forma e nossas tcnicas de organizar a informao, que nos so
to caras devido s especificidades do conhecimento histrico,
nada nos impede de dialogar com nossos vizinhos da
informtica, para observar como organizam as informaes,
como dispem de meios eficazes e criativos de organizar o
mundo entre tabelas e registros. Uma das demandas
fundamentais desse esforo passa pelo desafio de classificar as
[21] coisas, no caso da informtica, atribuindo-lhe uma codificao.
Classificar parte do trabalho do historiador. Pode-se perguntar
se possvel fazer histria sem classificar. Chamar um ser
humano de agente histrico j uma classificao, assim como
cham-lo de ser humano. Do ponto de vista da Qumica, um
amontoado de tomos, maiormente de carbono. E posso dividir
esses amontoados de carbono entre os que detm os meios de
produo e os que vendem sua fora de trabalho; ou entre o
prncipe e o povo.
E no se trata apenas de usar de instrumentos de
comparao, mas de formalizar com a clareza necessria para o
processamento com os nossos critrios de anlise manifestos na
escolha dos campos, por exemplo. Se estudo uma obra literria,
como sei se o gnero que tenho em mos (romance, poesia, etc)
era comum na poca ou um formato marginal? As coisas s so
o que so em sua relao com as outras. Digo que uma obra
de fico pois sei que existem outras disponveis que no o so.
certo que posso definir o contexto a partir do texto9 e que isso
me ajuda a compreender diversos aspectos daquela sociedade
que gerou o texto. Mas sem comparar, classificar ou contar,
ficarei privado de qualquer afirmao que inclua expresses
como a maioria, a menor parte, um bom nmero, poucos,
melhores e piores. Nesse sentido, formalizar nossos critrios
em um banco de dados facilita a comparao e permite uma
clareza maior do universo que estamos estudando.
Desmontando as coisas em ordem
Colocar a histria dentro de um banco de dados
uma simplificao, mas nosso trabalho sempre uma
simplificao. A complexidade da vida social no cabe no texto,
9 Como querem os contextualistas ingleses.
[22] tanto que precisamos de conceitos para nos aproximar dela,
como tampouco cabe nos campos de uma base. Resta simplificar
menos, ou, como disse Jean-Philippe Genet, admitir a obrigao
de consentir um empobrecimento fundamentado que estabelece
o trabalho cientfico.10
A criao de base de dados tem como pressuposto a
possibilidade de tomar um papel velho11
, que a pesquisa
transformar em fonte, de modo a produzir um desmonte. Em
outras palavras, vamos tomar um documento e desfaz-lo em
pedacinhos. Mas esse procedimento s ter sentido se os
pedacinhos forem reorganizveis depois, se pudermos
apresentar diferentes problemas para transformar aquele
conjunto de pedacinhos em uma narrativa clara. E o mais
importante: nesse processo todo de desmonte, o historiador
que deve estar coordenando tudo, decidindo, optando e
remontando as coisas segundo critrios do nosso mtier. E
preciso muito planejamento para que as bases sejam teis nesse
processo.
H diferentes formas de construir bases de dados,
como j argumentei, e cada uma delas fruto de uma forma de
pensar a histria. Da mesma maneira, cada uma dessas opes
vai envolver formas diferentes de desmontar os materiais,
tanto os empricos como com os interlocutores (bibliografia).
Contudo, a construo de bancos de dados no to subjetiva
como pode parecer. H certos procedimentos que so
importantes e regulares em qualquer pesquisa. Adiante, veremos
que as partes integrantes de uma base so as tabelas,
compostas por campos e registros. Criamos campos como
10
GENET, Histoire, informatique, mesure(Grifo nosso. O original est em francs). 11
Faz referncia aos documentos, que podem ser orais, imagticos ou de qualquer outra natureza.
[23] caixinhas onde colocamos certas informaes que nos parecem
iguais. Essa simplificao, importante dizer, no privilgio de
quem usa bases de dados. Dizemos que todas as datas so
datas, tanto o dia de hoje quanto o 14/07/1789, mesmo que
tenham significados simblicos muito diferentes. Dizemos que
Joo e Pedro so nomes de pessoas, e no, simples conjuntos de
letras.
Faz-se o mesmo em bases de dados. Contudo,
dependendo do problema de pesquisa e das caractersticas de
cada fonte, podemos dizer que para fins de criao de bancos de
dados, h dois tipos de fontes: aquelas para as quais a forma
muito importante e aquelas em que a forma no to
importante.12 Por forma, estou entendendo aqui a regularidade
linear de certos fragmentos dentro de um documento. Na frase
Eu sou professor de Histria, h uma ordem linear importante,
sujeito, verbo e complemento. Se eu alterar os fragmentos, o
sentido ser igualmente alterado. Algo semelhante acontece, por
exemplo, com registros de batismo. Desde que comearam a ser
feitos de modo sistemtico (e preservados), na Itlia do Sculo
XIV,13
eles seguem um modelo muito particular, como no
exemplo abaixo:
Aos quatro do ms de novembro de mil oitocentos e dezoito anos, nessa Igreja Matriz do Patrocnio de So Jos, batizei e pus os santos leos ao inocente Francisco filho de Manoel Roberto, e Maria Izabel, naturais dessa freguesia. Padrinhos o Capito Francisco da Silva, e Leucadia Maria, sua mulher, todos fregueses dessa freguesia. Fiz e assinei. O Vigrio Colado, Theodoro Jos
12
Agradeo ao Professor Jean-Pierre Dedieu por chamar a ateno para este ponto. 13
DE VRIES, Jan, Population, in: BRADY JR., Thomas; OBERMAN, Heiko; TRACY, James (Orgs.), Handbook of European History 1400-1600. Late Middle Ages, Renaissance and Reformation., Leiden / New York / Koln: E. J. Brill, 1994.
[24]
de Freitas Costa14
A forma importantssima em um registro de
batismo que, dificilmente, comear com o nome dos padrinhos.
Esse modelo ser igual, na ordem dos fatores, em milhes de
registros no mundo todo: data; local; ato (batismo e leos);
nome do batizando; pais e padrinhos (com as respectivas
informaes pessoais); assinatura. claro que h muitssimas
nuances e variaes e j falaremos delas, mas h uma longa e
constante regularidade para a maior parte dos casos, ou melhor,
h uma expectativa, da poca e nossa, de que essas
informaes apaream. Deveriam aparecer.
O outro tipo de fonte aquela em que a forma, no
sentido j expresso, de sequncia linear de informaes, no
importante e nem esperada. Para um texto ficcional, por
exemplo, no h expectativa de formato, salvo uma ligeira ideia
de que eles so, geralmente, divididos em captulos, mas nem
isso to srio. O mesmo ocorre com as correspondncias. Elas
tm algumas regularidades, como os livros tm suas editoras e
autores: remetente, destinatrio, data e local. Mas seu contedo
interno, a carta propriamente dita, no formalizvel. Podemos
criar campos para destacar as pessoas e os locais mencionados,
mas essas informaes no so partes necessrias de uma carta
nem so esperadas pelo leitor ou pelo pesquisador.
Se for correto que preciso planejar para criar uma
boa base de dados, igualmente importante ter uma boa
quantidade de informaes prvias para iniciar o planejamento.
Saber diferenciar as potencialidades diversas de cada conjunto
documental fundamental para iniciar os trabalhos. E o carter
mais ou menos formal dos documentos um bom critrio de
14
Livro de Batismos 02, So Jos. 1818. Arquivo da Cria de So Jos dos Pinhais.
[25] avaliao. preciso conhecer a fonte para prever problemas.
Eles sempre estaro presentes, os problemas, mas o
planejamento nos livrar daqueles mais estpidos, dos quais
crtico nenhum nos poupar.
Saber identificar a forma em um documento no
algo simples. Continuemos planejando a informatizao dos
nossos registros de batismo. Para eles basta uma tabela que
tenha poucos campos:
Figura 4 - Modelo de tabela para batismos
J temos pronto nosso banco de dados. Vamos
comear a preench-lo. O prximo registro que vamos incluir
ser este:
Aos vinte de maro de mil oitocentos e dezoito anos nesta Igreja Matriz do Patrocnio de So Jos, batizei e pus os santos leos ao inocente Joo, filho legitimo de Joaquim lvares e Maria dos Anjos, naturais dessa freguesia. Padrinhos, Joo de Bastos e Ana lvares, sua mulher, todos fregueses dessa freguesia. Fiz e assinei O Vigrio Colado Theodoro Jos de Freitas Costa
Vamos preenchendo tudo: data, local, nome do
batizando, e... filho legtimo? Essa informao no estava no
registro anterior, que orientou meu modelo, por essa razo a
[26] "legitimidade" no foi includa na minha base. Que tipo de campo
devo criar para dar conta disso? Que variveis posso encontrar
nesta observao antes do nome dos pais que trata da
legitimidade da criana? E por que alguns registros simplesmente
omitem esse dado? Como dizia Certeau, a formalizao da
pesquisa tem precisamente por objetivo a produo de "erros" -
insuficincias, faltas - cientificamente utilizveis. No nosso caso,
a simples tentativa de organizar a informao j nos trouxe
questes fundamentais para compreender a fonte e o universo
cultural que estamos observando. Criar um campo pode parecer
absolutamente tcnico, e , mas muito mais do que isso.
Segundo Dedieu,15
ao encontrar o inesperado que produzimos
conhecimento, e formalizar dados em uma base pode ser um
meio para isso.
Poderamos encontrar outros tantos exemplos que
nos mostrariam que criar uma base de dados para registros de
batismo no tarefa fcil. E a afirmao inicial de que bastaria
uma nica tabela tampouco correta ( possvel, mas seria
melhor desdobrar em vrias). Podemos falar, apenas para dar
algum exemplo, dos avs sobre os quais frequentemente h
informao. Tambm podemos lembrar o que normalmente
aparece sobre cada um dos participantes, dos pais e padrinhos:
sua origem, residncia, condio social, posio poltica e suas
relaes sociais. No mesmo livro de onde retirei aqueles
registros, comum, por exemplo, encontrar que o padrinho
filho de um capito. Ento devemos inserir um campo posio
militar do pai do padrinho?
Em sua tese de doutorado, Martha Hameister16
nos
15
JEAN-PIERRE DEDIEU, Entrevista. 16
HAMEISTER, Martha Daisson, Para dar calor nova povoao: Estudo sobre estratgias sociais e familiares a partir dos registros batismais da Vila do Rio Grande (1738-1763), UFRJ, Rio de Janeiro, 2006.
[27] conta de um registro de batismo singular. No batizado de Felcia,
filha de escravos alforriada na pia batismal (do que se esperava
a liberdade sem interferncia do senhor, j que o valor dela fora
entregue no ato do batismo, segundo o costume da poca),
havia, alm dos dados do batismo, um longo texto explicativo
que narrava uma tentativa de interferncia do senhor da me
sobre a liberdade da menina, que fora inibida pelo proco, que
justificava, detalhadamente, as motivaes que orientaram sua
ao. certo que tal documento nico. Mas qual deveria ser o
tratamento dado para ele? Ignoraramos tal maravilha por falta
de um campo justificativa da insistncia do padre em alforriar o
batizando? Certamente no. Tampouco me parece boa a ideia
de apenas mencion-lo no famoso campo Observaes, onde
costuma cair tudo aquilo que no fomos capazes de planejar. H
muitas formas de contar uma histria, assim como h muitas
formas de montar uma base de dados . Mas a proposta aqui no
de apresentar uma base voltada para batismos. No nesse
momento.
Se bem que os registros de batismo parecem muito
mais complexos do que o primeiro olhar nos permite supor,
ainda assim, h uma regularidade em sua produo. No Sculo
XX, encontraremos at mesmo formulrios previamente prontos,
feitos em grfica para o registro de batizados pelos padres.
Outro tipo de fonte bastante regular so os inventrios post-
mortem, feitos para identificar os bens dos falecidos para
promover a partilha entre os herdeiros. Difusos por boa parte do
Ocidente, eles tm uma estrutura bastante semelhante.17
Embora muitos dos disponveis pelo mundo no correspondam
ao esperado, h certa lgica da fonte que permite, entre outras
17
VAN DER WOUDE, A.M.; SCHUURMAN, A., Probate inventories: a new source for the historical study of wealth, material culture, and agricultural development: papers presented at the Leeuwenborch conference (Wageningen, 5-7 May 1980), [s.l.]: Hes, 1980.
[28] coisas, a comparao. E se, algumas vezes, encontraremos
inventrios completamente fora da curva, que nos traro
muitas dvidas sobre como devem ser inseridos na base de
dados, o simples questionamento de suas diferenas em relao
ao padro de sua feitura (que inclusive regulado por Lei) j nos
d muitas ideias sobre a sociedade que o criou. A simples
constatao da diferena j nos ajuda a fazer boa Histria.
Talvez o mais interessante de trabalhar com
inventrios seja perceber seu carter plural, digamos assim.
Eles tm uma sequncia linear para a sua produo: abertura,
avaliao dos bens, apresentao dos documentos
comprobatrios e partilha.18
comum encontrar dados da famlia
do falecido, assim como informaes sobre o parentesco dos
escravos que eram propriedade do falecido, quando em
sociedades escravistas. Contudo, possvel encontrar uma
diversidade de fontes no previstas, como recibos de compra de
medicamentos e atendimento mdico (geralmente devido a
alguma doena que levou morte o inventariado), assim como
testamentos e comprovantes de pagamento de servios
fnebres. Esses papis eram includos, pois tudo deveria ser
pago antes da partilha.
Eis a sua pluralidade, que se agua quando
pensamos que a abertura, a avaliao, os documentos e a
partilha so, igualmente, quatro fontes com estruturas muito
diversas. Se pensarmos em incluir os testamentos, teremos mais
elementos para estruturar dentro de uma base de inventrios.
Isso porque os testamentos, apesar de lembrarem as cartas por
sua aparncia (narrativa linear e o tamanho), so documentos
absolutamente estruturados, seguindo um cnone que pouco se
18
FRAGOSO, Joo; PITZER, Renato Rocha, Bares, homens livres pobres e escravos - notas sobre uma fonte mltipla. Os Inventrios Post-mortem, Revista Arrabaldes, v. 1, n. 2, p. 2952, 1988.
[29] alterou em sculos.
19 Havia uma frmula, que informava sobre o
contexto da redao do documento, geralmente uma
enfermidade aliada a dvidas sobre o que deus guardava para o
testador. Pedia-se clemncia Santssima Trindade, aos santos e
s santas da corte dos cus, ao santo do nome da pessoa e
ao(s) santo(s) de devoo, em especial, e ao seu anjo da
guarda. Na sequncia, uma lista dos ltimos desejos.
Todas essas fontes tm uma forma importante, uma
sequncia de fragmentos esperada tanto por ns quanto por
seus criadores. Isso no faz delas objetos fceis de informatizar.
Como vimos, h sempre espao para surpresas e isso muito
positivo para a produo do conhecimento histrico. Contudo,
grande parte dessas surpresas no exatamente
surpreendente. muito normal, nas fontes que tenho, encontrar
descries sobre a naturalidade dos avs do batizando, mas no
surpreendente que sejam omitidas em muitos casos. Da
mesma forma ser comum encontrar informaes as mais
diversas sobre os padrinhos. O padre no tinha em mente
apontar a patente militar de todos os padrinhos, mas
mencionava a de alguns. Ser melhor colocar um campo
patente militar para os padrinhos ou criar uma tabela associada
em que colocaremos todas as informaes que surgirem, as mais
diversas e imprevisveis, sobre os participantes do
acontecimento?
A soluo no simples e devemos pensar ainda
mais longe. Uma vez abastecida a base, devemos ter acesso fcil
e possibilidade de fazer buscas complexas nos nossos dados.
Isso ser mais ou menos possvel de acordo com a base que
montamos, da forma como dispomos os dados uns em relao
aos outros. O sistema de busca varia de software para software,
mas ele ser mais ou menos eficaz de acordo com a estrutura de
19
VOVELLE, Michel, Ideologias e mentalidades, So Paulo: Brasiliense, 1987.
[30] campos que criamos para acolher os dados. Da mesma forma,
conveniente pensar na longevidade da nossa base. Para alm de
usar sistemas que sejam fceis de converter para formatos
futuros, fazendo essa migrao de tempos em tempos, j que a
rpida obsolescncia algo comum no universo digital,
precisamos pensar em bases que atendam a mais de uma
pesquisa ou que estejam preparadas para pesquisas futuras. Os
debates sobre a reusability, ou reusabilidade, numa
desaconselhada traduo para o portugus, so bastante
comuns e ainda no bem resolvidos.20
Contudo, manter o foco
na estrutura da fonte ainda a sada mais conveniente. E isso
requer alguma erudio, tcnica famosa no Sculo XIX e que
ainda tem sua importncia na programao do Sculo XXI.
20
SCHRER, Kevin, Historical demography, social structure and the computer, in: DENLEY, Peter; HOPKIN, Deian (Orgs.), History and Computing, Manchester: Manchester University Press, 1987; THALLER, Manfred, Methods and techniques of historical computation, in: DENLEY, Peter; HOPKIN, Deian (Orgs.), History and Computing, Manchester: Manchester University Press, 1987.
[31]
Em ombros de gigantes
Fazer bases de dados em histria tem sua prpria
histria. E ela no pequena. Vamos apresentar um
levantamento seletivo de experincias com esta perspectiva. Ele
no apresenta todas as experincias com bases, que foram
centenas no campo da histria, mas traz algumas que podem
ajudar a pensar problemas crnicos deste tipo de abordagem.
Muitas das questes que nos colocamos hoje j foram muito
discutidas antes, por grandes nomes da historiografia. Vamos
conhecer suas experincias e aproveitar a viagem para
apresentar alguns problemas importantes no desenvolvimento
das bases de dados.
A experincia do Padre Busa, em 1949
Quando em 1946 o padre jesuta italiano Roberto
Busa acabou sua tese sobre o conceito de presena em S.
Toms de Aquino, ele se deu conta que as expresses
geralmente tomadas na obra do santo, praesens e
praesentia, no eram as melhores para o seu estudo. Aquele
conceito se manifestava melhor na forma da partcula in, que
nunca fora organizada nos ndices de que dispunha para o
estudo. Busa no se acovardou e comeou um lento trabalho de
organizao dos textos tomsticos em fichas de frases e de
palavras. Neste momento surgiu a ideia de mecanizar o
trabalho. Anos depois, em 1949, em uma viagem aos Estados
Unidos, ele investigou as possibilidades existentes em dezenas
de universidades, encontrando dilogo junto IBM. Como ele
mesmo conta, a primeira resposta foi negativa: no seria
possvel fazer um ndice daquele porte com os equipamentos da
IBM. Diante da negativa, Busa teria invocado o prprio slogan da
companhia na poca: The difficult we do right away; the
impossible takes a little longer (O difcil ns fazemos agora; o
[32] impossvel demora um pouco mais). Ganhou o apoio da IBM,
mesmo sem ter dinheiro.21
Toda a preocupao de Busa, naquele momento,
estava no processamento da informao e no nas formas de
estocagem dos dados. A forma de fazer isso j estava definida
de antemo e seguia os mesmos pressupostos usados por ele na
confeco de fichas manuais, que continham palavras, frases e
suas localizaes nos textos tomistas. A palavra database (base
de dados) no aparece no seu texto, ainda que a expresso data
bank (banco de dados) seja utilizada uma nica vez, justamente
quando ele narra as dvidas que surgiram no momento de
publicar os resultados, se seriam publicados em um livro, na
forma de um enorme catlogo, ou se somente seria oferecido o
banco gerado no processo. A opo final foi pela publicao de
quinhentos exemplares de um grande catlogo.
A primeira questo que me parece pertinente com
este caso a forma com Busa criou uma demanda de pesquisa e
foi em busca da tcnica para solucion-la. E mesmo uma sada
cara e que levaria anos (neste caso, 30 anos), envolvendo o
treinamento de dezenas de ajudantes no processamento dos
cartes perfurados e fitas, foi pacientemente aceita tendo em
vista o ganho maior ao longo prazo. Esta a segunda concluso
que podemos tirar desta empreitada: o custo de
desenvolvimento e abastecimento de bancos de dados parece
alto, e certamente . Contudo, a capacidade de recuperar os
registros de forma automtica, rpida e fcil aps a concluso do
trabalho bastante compensadora. Os materiais organizados por
Busa ficaram disponveis para os pesquisadores da obra de Santo
Toms, que poderiam agora, com qualquer problema de
pesquisa, atingir seus objetivos com grande velocidade.22
21
BUSA, Roberto, The Annals of Humanities Computing: The Index Thomisticus, Computers and the Humanities, v. 14, p. 8390, 1980. 22
Disponvel na web no endereo: Index Thomisticus, disponvel em: , acesso em: 27 set. 2013.
[33]
Por fim, temos o ausente presente, o conceito de
banco de dados, no apresentado por Busa em seu texto por ser
demasiado evidente para quem passou dcadas criando um.
Justamente naquilo que o projeto de Busa tinha de melhor:
armazenar conhecimento de modo organizado, de modo a
permitir rpida consulta posterior. Sendo assim, podemos definir
um banco de dados como um lugar onde podemos estocar a
integralidade das informaes relativas a um assunto23
,
entendendo que este ltimo pode ser um tema ou um problema
de pesquisa. Outros acrescentariam que as informaes de um
database deveriam estar estruturadas e interligadas entre si a
partir de um modelo lgico especfico. Enfim, podemos resumir
dizendo tratar-se de uma coleo organizada de dados.24
Toda
esta discusso, contudo, passava longe da cabea de Busa e s
se tornou central a partir dos anos 1970. At ento, a grande
promessa da informtica no estava no armazenamento, mas no
seu grande potencial de processamento das informaes. Por
outro lado, um data bank seria o conjunto dos cartes,
simplesmente.
O Colquio da cole Normale Suprieure de Saint-Cloud,
de 1965
Em 1965 um grupo de historiadores tambm
deixava registrado seu debate sobre o uso de mquinas IBM e
Bull. No se tratava de um debate tcnico, ainda que estas
questes estivessem sendo discutidas. Foi durante um colquio
23
Base de donnes - Wikipdia, disponvel em: , acesso em: 27 set. 2013. 24
Database - Wikipedia, disponvel em: , acesso em: 27 set. 2013; Database - Wikipedia, the free encyclopedia, disponvel em: , acesso em: 27 set. 2013.
[34] realizado na cole Normale Suprieure de Saint-Cloud, em maio
de 1965. O evento reunia alguns dos nomes mais expressivos da
historiografia francesa de ento, como Ernest Labrousse e
Adeline Daumard. Ainda estvamos no tempo do carto
perfurado e das fitas magnticas, e estes foram alguns dos
pontos tratados na apresentao de Robert Faure, Machines et
programmes. Quelques vues sur l'utilisation des machines
traiter l'information en histoire sociale.25 A interveno de Faure
indica qual era o pensamento da poca: a automatizao das
fontes, ou seja, a passagens dos dados dos documentos
histricos para cartes ou fitas magnticas, que seria possvel
atravs do uso de codificaes bem feitas, a partir de um
vocabulrio ou thesaurus.
Apesar do tom predominantemente tcnico da
apresentao de Faure, bem como do debate subsequente26
,
entre cartes perfurados e fitas magnticas, ali j estavam
colocadas algumas questes importantes do ponto de vista do
historiador e que tem relao direta com a mesma questo
tcnica. Em primeiro lugar, o uso de um vocabulrio um
elemento que vai seguir atual para a construo de bancos de
dados. Hoje os programadores chamam isso de Dicionrio de
dados. Veremos sobre isso mais adiante, no h pressa.
Outro ponto, este ainda mais fundamental,
introduzido na apresentao de Faure e discutido com maior
profundidade em outra comunicao, de Jacques Dupaquier: o
problema da classificao e consequente uso de codificaes.
Faure ingenuamente acreditava na possibilidade de uma
25
FAURE, Robert, Machines et programmes. Quelques vues sur lutilisation des machines traiter linformation en histoire sociale, in: Lhistoire sociale: sources et mthodes, Paris: Presses Universitaires de France, 1967; FAURE, Robert, Mquinas e programas. Pontos de vista sobre a utilizao das mquinas destinadas a elaborar a informao em histria social, in: A Histria Social: problemas, fontes e mtodos, Lisboa: Edies Cosmos, 1973. 26
Os debates e comentrios posteriores s apresentaes foram todos publicados na verso original francesa, bem como na edio lusa de 1973.
[35] codificao perfeita, que mantivesse as caractersticas da fonte.
Contudo, um dos comentaristas, Claude Mazauric, destacava
que:
...a determinao do cdigo a questo mais delicada para o historiador [...] pois de acordo com as datas, de acordo com as pocas, com os tipos de documentos, as
informaes no so equivalentes.27
Dupaquier, neste mesmo evento, apresenta o texto
Problmes de la codification socio-professionelle.28 Sua
apresentao volta ao tema das classificaes, mas de modo
sutil. no comentrio de Adeline Daumard que o tema ressurge
de modo expressivo. Daumard respondia aos crticos de seu
trabalho sobre as classificaes scio-profissionais, que era
acusado de estabelecer uma grade a priori . Concordando com
seus crticos, ela dizia que
...estabelecer esta classificao, estabelecer claramente uma hierarquia, quase, no fundo, resolver o problema.
Tratava-se de um problema clssico em histria. Ao propor uma pergunta, estamos enquadrando agentes e
processos dentro de certos parmetros que nos parecem certos,
mas ao chegar ao final da pesquisa, descobrimos os limites de nossos conceitos:
Se tivssemos um cdigo perfeito seria quase intil de estudar o que quero, a burguesia, pois saberamos de imediato o que ela . Diante deste paradoxo que est o paradoxo da histria: precisamos de uma classificao
27
Mazauric, em comentrio ao texto de FAURE, Machines et programmes. Quelques vues sur lutilisation des machines traiter linformation en histoire sociale(Traduo nossa. O original est em francs). 28
JACQUES DUPAQUIER, Problmes de la codification socio-professionelle, in: Lhistoire sociale: sources et mthodes, Paris: Presses Universitaires de France, 1967.
[36]
para poder trabalhar; mas ao mesmo tempo, precisamos nos resguardar de prejulgar o resultado. Esta a razo pela qual, na minha opinio, a soluo deve ser a busca de modo emprico, a fim de traduzir a realidade.29
Neste debate, classificao e codificao eram
sinnimos. E codificar significava transferir as classificaes para
dentro da lgica da computao da poca. Codificar era a forma
disponvel de manifestar formalmente as concepes terico-
metodolgicas do pesquisador, atravs de procedimentos claros
e transparentes. A partir de um estudo preliminar, foi elaborada
uma lista de classificaes prprias para as sociedades francesas
do sculo XVIII, XIX e XX, dividindo as pessoas entre agrupaes
profissionais, de renda e de hierarquia social.
Em 1962, Daumard publicou um artigo com seu
projeto de classificao scio-profissional.30
Era uma proposta
de concepo, uma forma de entender a hierarquia social
naquela sociedade. Podemos dizer que tal texto correspondia ao
que os programadores chamam hoje de Modelo conceitual.
Era isso que fazia Daumard ao criar uma lista de
identificadores possveis para o universo que estudava. E isso
no era um privilgio do tipo de histria que ela fazia, prprio
do trabalho do historiador. Estamos sempre escolhendo palavras
que identificam e caracterizam nossos objetos. Um banco de
dados exige isso na hora de seu desenvolvimento. A
complexidade do mundo social ser sempre maior que nossa
capacidade de compreend-la. Ou melhor, compreender
demanda simplificao. Resta-nos simplificar com a maior
29
Ibid. 30
ADELINE DAUMARD, Une rfrence pour ltude des socites urbaines en France aux XVIIIe et XIXe sicles projet de code socio-professionnel, Revue dHistoire Moderne et contemporaine, v. X, p. 185210, 1963; ADELINE DAUMARD, Structures sociales et classement socio-professionnel. Lapport des archives notariales au XVIIIe et au XIXe sicle., Revue Historique, v. 86, n. CCXXVII, 1962.
[37] complexidade possvel. E, para isso, devemos estar atentos no
desenvolvimento destes modelos conceituais. A mquina no vai
entender coisas como meu agentes se comportam de um modo
difcil de entender. preciso incluir esta complexidade no
modelo, de modo claro.
Lawrence Stone, no incio dos anos 1970
Vejamos agora um diagnstico, feito em 1971, por
Lawrence Stone, em seu clebre Prosopography, publicado
naquele inverno na revista Daedalus. Em um texto direto, ele
apresentava a metodologia que havia consagrado seu clssico
livro The Crisis of the Aristocracy.31 O uso do computador era
ainda considerado uma novidade, uma vez que os
historiadores...
lenta e timidamente comeam a explorar as potencialidades da nova ferramenta tecnolgica, eles comeam a perceber sua quase ilimitada capacidade de lidar precisamente com o tipo de material que a prosopografia apura.32
Stone nos apresenta o cenrio do uso destes
equipamentos no meio acadmico anglo-saxo da poca. Apesar
de considerar a Inglaterra e os Estados Unidos como o primeiro
e o segundo centros de pesquisa em histria do mundo, ele
admite que seus colegas americanos e franceses estavam na
frente no mundo da informtica:
...h fortes traos nacionais para essa diviso de perspectivas - pois os estadunidenses e os franceses tm muito mais acesso a e confiana nos computadores que
31
STONE, Lawrence, The Crisis of the Aristocracy, 1558-1641, Oxford: Oxford University Press, 1965. 32
STONE, Lawrence, Prosopografia, Revista de Sociologia e Poltica, v. 19, n. 39, p. 115137, 2011.
[38]
seus colegas ingleses -, fortes traos culturais - com ameaas de uma nova guerra entre os antigos e os modernos, entre as humanidades e as cincias...33
Havia motivos para tanto receio. O prprio Stone
apontava alguns dos problemas advindos com o uso do
computador. Ao comentar uma possvel tendncia de separao
entre a prosopografia das massas (foco nos grupos) com a das
elites (foco nos grandes homens), ele destacava o papel do
computador neste perigo:
O perigo foi bastante aumentado pelo advento do computador, que foi adotado pelos pesquisadores mais estatisticamente orientados com todo o entusiasmo indiscriminado dos ninfomanacos e rejeitado pelos menos cientficos, em parte devido a melindres intelectuais, em parte devido a uma complacncia ignorante dos prazeres
que esto perdendo. 34
O uso de grandes computadores ainda era privilgio
dos cientistas polticos, dentro das humanidades. Naquele
contexto, eram os estudos de eleies uma das principais
aplicaes das novas tecnologias. Para Stone, o maior trunfo do
computador era...
A correlao de numerosas variveis afetando grandes
massas de dados , reunidas em uma base uniforme, precisamente o que o computador pode fazer melhor; tambm o que h de mais laborioso e, em vrios casos, virtualmente impossvel de trabalhar sem auxlios eletrnicos, mesmo para os historiadores com orientao mais matemtica. doloroso admitir que o advento de um aparato tcnico poderia ditar o tipo de questes histricas formuladas e os mtodos utilizados para
solucion-los35
33
Ibid. 34
Ibid. 35
Ibid.
[39]
Mas Stone era otimista ao considerar que:
A disponibilidade do computador crescentemente seduzir os historiadores a concentrar suas energias nos problemas que podem ser solucionados pela quantificao, problemas que s vezes - mas de maneira nenhuma sempre - so os mais importantes ou interessantes.36
Tal como para Busa e Faure, era o processamento
de grandes quantidades de registros que importava. Ainda no
estava claro o uso de bancos de dados que permitissem
consultas sistemticas. Mas algo mais fica sugerido no texto de
Stone. a demanda por materiais uniformes. Tanto Faure
como Busa esto, o tempo todo, pensando em processar uma
nica fonte. Para Busa, o texto de Santo Toms, para Faure, as
fontes devem ser transferidas para fitas magnticas. No caso de
Stone, parece haver espao para combinar dados de diferentes
origens dentro de bases uniformes.
Por outro lado, ele retoma o debate sobre as
classificaes, reforando aquilo que Daumard e Dupaquier j
salientavam. Stone falava dos erros frequentes nos estudos
prosopogrficos, dando nfase aos erros nas classificaes dos
contedos.
Classificaes significativas so essenciais para o sucesso de qualquer pesquisa, mas infelizmente para o historiador cada indivduo desempenha muitos papis, alguns dos quais esto em conflito com outros. 37
Mas o problema no estava na natureza dos
agentes histricos, mas na mo dos historiadores:
...se uma subdiviso que depois se revela de importncia
36
Ibid. 37
Ibid.
[40]
crtica no for notada a tempo, usualmente tarde demais para voltar e realizar todo o trabalho de novo - uma dificuldade que particularmente aguda em pesquisas auxiliadas por computadores, pois os cdigos determinam as questes que podem ser depois formuladas.38
Com isso tornamos ao problema apresentado por
Daumard, alguns anos antes. Preciso de uma boa classificao
para conhecer o passado e preciso conhecer o passado para ter
uma boa classificao. No entanto, o conhecimento prvio do
passado pode comprometer os resultados da investigao, uma
vez que aplico aos dados o pr-conceito que j tinha, sem
atentar para elementos novos surgidos no andar da pesquisa.
Para isso, h necessidade de repensar as classificaes todo o
tempo. E este problema pode ser complexo, como pensava
Daumard, ou tratar-se de uma escolha estpida, como parece
prever Stone, que j prope fazer tudo novamente. A
classificao no apenas uma pr-explicao como ela tambm
limita as perguntas possveis para os dados processados. Neste
sentido, o dano causado pelo processamento veloz dos
computadores pode alertar o historiador para a importncia de
pensar sobre suas classificaes.
Por fim, parece interessante notar como Stone, j
naquela poca identificava uma postura que parece ter sido
hegemnica entre os historiadores nos ltimos 40 anos, ao tratar
do advento do computador na pesquisa em histria:
...seria adotar a postura do avestruz fingir que isso no est acontecendo agora e que no acontecer em uma escala ainda maior nos anos vindouros39
E os anos vindouros prometiam muito.
38
Ibid. 39
Ibid.
[41] O primeiro Manual de Computao para historiadores
Em 1971, o historiador Edward Shorter lanava The
historian and the Computer. A practical guide.40 Era a primeira
vez que surgia um manual voltado diretamente para o pblico da
disciplina. Seu foco principal era ensinar os historiadores
interessados em estudos quantitativos como preparar sua
pesquisa para um bom processamento com o uso de cartes
perfurados. A tarefa era fcil: aprender a usar um IBM 360 seria
to simples quanto entender o funcionamento do motor de um
automvel! Aps algumas pginas sem conseguir explicar o
funcionamento do computador, mas decifrando os assustadores
nomes das partes que o compunham, ele enfim nos fala que no
fundamental entender o funcionamento completo da mquina:
bastava o mnimo para perder o medo.
Shorter foi audaz e pioneiro, mas criou um livro
absolutamente datado. Apesar de ter servido por
aproximadamente dez anos, sua obra ficou muito presa
tecnologia disponvel nos anos 1960 e 70, como os lendrios
softwares Fortran e Cobol (que ainda so usados hoje, mas no
por historiadores). Mas no podemos compreender Shorter como
algum fora de seu tempo. Todo o contrrio. No mesmo ano em
que era lanado The historian and the computer, surgia a revista
Computers and medieval data processing uma publicao
canadense voltada para a informatizao dos estudos sobre
Idade Mdia. A publicao no trazia artigos, mas notcias sobre
publicaes, projetos e outras informaes interessantes para o
medievalista moderno.
Ao longo de sua existncia (durou entre 1971 e
1987), Computers trazia em cada edio uma lista dos projetos
40
SHORTER, Edward, The historian and the Computer. A practical guide, New Jersey: Prentice-Hall, 1971.
[42] sobre histria medieval que lanavam mo da informtica. Ao
todo, foram mencionados 354 projetos, a grande maioria nos
Estados Unidos, seguidos de Canad e Frana. Era um pblico
que compreendia muito bem as palavras de Shorter: os
equipamentos mais utilizados foram, de longe, os IBM 360 e
370, rodando, na maioria dos casos, o Fortran IV, alm de
outros como PL/1 e Snobol.41 O foco temtico de Shorter,
contudo, era um tanto distante daqueles projetos da Computers
and medieval data processing. A maior parte daquelas
empreitadas visava o processamento de textos e sua lematizao
automtica. Shorter estava dirigido para os estudos
quantitativos, dentro do mesmo contexto que trazia os
computadores como ferramentas incontornveis.
Por outro lado, seu objetivo central domesticar
aquilo que considerava o aparente mistrio das mquinas.
Buscando a vulgarizao e a ruptura com a postura do avestruz,
Shorter ficou mais prximo do entusiasmo indiscriminado dos
ninfomanacos, como dizia Stone.
Reconstructing historical Communities: um projeto
pioneiro
Em 1979, Alan Marcfarlane publicava, em
colaborao com Charles Jardine, um breve texto no 7
Congresso Internacional de Histria Econmica.42
Apesar de
breve, o texto continha a essncia das reflexes iniciadas em
1972, quando se iniciara a aventura de Macfarlane e Sarah
41
UNIVERSIT DE MONTRAL INSTITUT DTUDES MDIVALES, Computers and Medieval Data Processing: Informatique Et Etudes Medievales, [s.l.]: Universit de Montreal, Institut dtudes medievales., 1971. 42
MACFARLANE, Alan, Computer input of Historical Records for multi-source record linkage, in: Proceedings of the Seventh International Economic History Conference, Edinburgh: [s.n.], 1979.
[43] Harrison na tentativa de informatizar fontes para o estudo de
histria local na Inglaterra.43
O resultado da pesquisa tornou-se
livro um pouco antes, com o nome de Reconstructing historical
Communities.44 Destaco isso tudo, pois me parece que esta
comunicao trazia elementos realmente inovadores para aquele
momento e que so questes-chave ainda hoje.
Jardine e Macfarlane pareciam extremamente
insatisfeitos com o que a tecnologia oferecia naquele momento.
Os programas no se adequavam s necessidades de pesquisa
do grupo e por vrias razes. A primeira era conceitual: os
programas de gerenciamento de bancos de dados disponveis na
poca eram problem-oriented (orientados a partir de um
problema, algo que tambm se pode chamar de method-
oriented, orientado pelo mtodo) e no pela fonte. A
programao dava conta de tarefas a cumprir e no havia
condies para, por exemplo, aplicar as proposies
metodolgicas de Louis Henry e Wrigley, no que diz respeito,
respectivamente, ao chamado mtodo de reconstituio de
famlias e aos Record-linkage methods. Isso se dava pelo fato de
que estas metodologias empregavam o uso de qualidades
diferentes de dados, a partir de fontes, de modo relacional.
Para ilustrar o tamanho do problema, ele
apresentou um exemplo usando o longevo pacote SPSS (ainda
hoje hegemnico nas Cincias Sociais). Seu argumento era de
que o programa era adequado para os surveys criados pelos
socilogos, mas identificou seu limite: se ele dispunha de uma
tabela com dados sobre a educao infantil e de outra com as
informaes sobre as famlias e quisesse cruzar os registros, no
seria possvel por conta do modelo conceitual prprio do pacote.
43
MACFARLANE, Alan, The computer revolution and local history. 44
MACFARLANE, Alan, Reconstructing historical Communities, Cambridge: Cambridge University Press, 1977.
[44] Alm disso, os pacotes da poca, incluindo SPSS, no dispunham
de elementos para incluir documentos inteiros, o que forava a
perda de dados involuntria, sem falar na incapacidade dos
aplicativos em processar contedos incertos, imprecisos ou
confusos, (fuzzy data).
na constatao dos limites do que era praticado
na poca por seus colegas que Macfarlane vai explorar dois
caminhos at ento desconhecidos pelos historiadores (e diria,
tambm, pelos programadores). O primeiro e mais importante
elemento a adoo de um modelo de dados sourced-oriented
(orientado pela fonte). Ao invs de extrair dos documentos os
dados necessrios para cumprir as exigncias do programa, em
campos possveis, a fonte seria colocada integralmente dentro do
programa, sem cortes. Isso seria possvel graas pr-edio
dos textos, j que no haveria utilidade em simplesmente ter os
textos integrais no computador. Seria importante cont-los,
cruz-los e aplicar outras metodologias de acordo com a
necessidade. Deste modo, se um registro de batismo dizia que
John, filho de Henry Abbott foi batizado em 5 de maio de 1607,
o documento seria assim transcrito para o entendimento da
mquina da seguinte maneira:
(P (N John) (K the son of (P (N Henry Abbott))) (E was
baptized. (D 5th May 1607)))
[explicao: P = person (pessoa); N = name (nome); K = kinship
(parentesco, indicando o tipo em linguagem natural, no caso, o
ingls); E = event (evento); D = date (data))]
Ou seja, uma pessoa chamada John tinha
parentesco (k), no caso, era filho de outra pessoa chamada
Henry Abbott e participou de um evento, um batizado, em uma
data, no caso, no dia 5 de maio de 1607. Com o uso destes
cdigos e parnteses, um historiador explicaria mquina o
[45] significado de cada coisa: datas, nomes, relacionamentos, etc.
Demandava algo importante e vlido, com debate, at os dias
atuais: a normatizao de nomes e a atualizao da lngua. No
caso, inclusive textos em latim foram traduzidos para tornar o
clculo possvel. O uso do recurso de pr-edio foi adotado,
pouco tempo depois, no desenvolvimento do kleio, por Manfred
Thaller, sobre o qual falaremos mais adiante.45
Recentemente
esta prtica tornou-se modelo nas linguagens da internet, com a
chamada web semntica, onde as palavras em um site no so
mais amontoados de letras organizados pelo formato (texto
grande ou pequeno, com negrito ou em itlico, etc).
semelhante ao que se utiliza com a linguagem XML, para dar um
exemplo disponvel na internet.
Alm da programao orientada pela fonte histrica
estruturada de modo legvel pelo computador, Macfarlane e
Jardine foram pioneiros no uso de uma tecnologia ainda muito
pouco conhecida na poca: o modelo relacional de dados, hoje
hegemnico a ponto de ser tomado quase como norma. Na
poca, utilizaram um manual sobre databases feito por C. J.
Date, famoso no apenas pela didtica na explicao dos
recursos tcnicos, mas igualmente por ter pertencido ao grupo
que criou, dentro da IBM, a linguagem SQL. O uso dessa
tecnologia tornava possvel cruzar dados de diferentes tabelas,
que conteriam informaes de fontes diversas, as quais
permitiriam o emprego de anlises como as de Henry e Wrigley.
Manfred Thaller e o kleio
No final dos anos 1970 a equipe de Manfred Thaller,
no Max Plank Institute ,comeou a desenvolver uma ferramenta
45
ROWLAND, Robert, L`informatica e il mestiere dello storico, Quaderni Storici, v. 78, n. 03, p. 693 720, 1991.
[46] para o processamento de dados em histria. Chamava-se kleio.
Os primeiros resultados s comearam a surgir em meados da
dcada seguinte. O kleio era um programa feito sob medida para
a pesquisa histrica e orientado pela fonte: implicava na
transcrio controlada dos documentos para uma linguagem
compreensvel pelo computador, atribuindo cdigos pr-definidos
ao texto. Em boa medida, ele seguia de perto as formulaes de
Macfarlane e h quem associe as duas iniciativas.46
O sistema de Thaller, influenciado ou no por
Macfarlane, previa a criao de um programa que poderia ser
instalado em outras mquinas, coisa que no fora considerada
em Cambridge. Com o tempo, o kleio passou de uma linguagem
que tratava dados de fontes para uma historical Workstation, na
qual qualquer historiador, sem grande conhecimento de
informtica, poderia trabalhar sem dependncia de um
programador, o que geraria uma grande economia no de tempo
na pesquisa. A ferramenta dispunha de conexes com outros
sistemas de anlise, como o SPSS. Neste sentido, kleio sempre
foi um organizador de informao, mais do que um software
completo, prximo de uma base de dados de historiador.
O trabalho de abastecimento era feito seguindo a
ordem da documentao e no segundo demandas de
formulrios pr-definidos. Neste sentido, havia igualmente uma
economia de trabalho no preenchimento das fontes. O grande
mrito de kleio era exatamente o fato de ser orientado pela
fonte, a ponto de no interferir, ou de interferir muito pouco, na
estrutura original dos documentos. Segundo Thaller:
Dados so administrados na forma de colees de pedaos de texto, sem qualquer suposio sobre seu significado. Todas as suposies (o status social derivado de uma dada ocupao; o significado cronolgico da data
46
Ibid.
[47]
apontada para dias diferentes no calendrio de vrias dioceses; a taxa de cmbio de duas moedas diferentes) so geridos em tabelas completamente independentes
dos dados originais.47
Kleio foi um dos primeiros programas (e talvez um
dos nicos) a criar sistema de identificao de dados incertos e
imprecisos (fuzzy). Fora desenvolvida uma codificao especial
para indicar incertezas e imprecises, o que dava uma grande
vantagem comparativa entre este programa e os softwares
comerciais da poca, contra os quais Thaller se manifestava
preocupado, precisamente pela falta deste tipo de recurso.48
Neste sentido, novamente h uma proximidade com Macfarlane.
O sistema Fichoz
Em um artigo de 2004, Jean Pierre Dedieu
apresentava um banco de dados que j tinha alguns anos de
existncia: o sistema Fichoz.49
Trata-se de uma base centrada no
mtodo, na qual h uma metodologia de trabalho prvia ao
tratamento dos dados. A ideia principal a de que possvel
decompor a vida dos agentes histricos em eventos. Neste
sentido, para cada ato seria criado um registro com informaes
como a data, o local, a interao com outro agente e um campo
de detalhamento. A interao e a anlise detalhada de cada ato
so os pontos fortes desta forma de coletar e organizar os
dados. Deste modo, seriam possveis buscas por indivduos
(biografias), por grupos de indivduos (prosopografias), por
47
THALLER, Methods and techniques of historical computation. 48
THOMAS, William, Computing and the Historical Imagination, in: SCHREIBMAN, Susan; SIEMENS, Ray; UNSWORTH, John (Orgs.), A Companion to Digital Humanities, Oxford: Blackwell, 2004. 49
DEDIEU, Jean Pierre, Les grandes bases de donnes: une nouvelle approche de lhistoire sociale. Le systme Fichoz, Revista da Facultade de Letras- Histria, v. 05, 2004.
[48] pessoas conectadas com outras por algum motivo (anlise de
redes sociais) e por sries, de acordo com a necessidade. Isso
seria possvel, pois cada registro colocaria dois ou mais agentes
histricos em relao uns com os outros:
A nova concepo do trabalho em histria social nos d a soluo. preciso tratar cada dado como um evento dentro da vida de um ator. A documentao deve ser lida
como um conjunto de sequencias que descrevem as aes efetuadas ou sofridas por um ator individual. Cada uma destas aes deve corresponder a um registro dentro da base de dados contendo todos os elementos necessrios a sua interpretao: natureza e descrio da ao, identificao do ator, data, referncia, elementos de contexto, etc. A converso dos documentos em atos da responsabilidade do pesquisador que o faz a partir de sua
margem de interpretao.50
O trao marcante deste sistema sua versatilidade.
As buscas e cruzamentos de informao seriam feitas no mesmo
formulrio criado para o abastecimento, permitindo escolher
muitos campos simultaneamente, inclusive de tabelas
relacionadas. Isso era relativamente fcil graas ao software
utilizado, o Filemaker. Porm, o grande mrito da base est na
sua estrutura: ela ao mesmo tempo robusta e verstil, ao
utilizar poucos campos e tirar proveito da possibilidade, ilimitada,
em qualquer sistema, de criar registros. E como cada ato seria
um registro, bastaria gerar tantos registros quantos fossem
necessrios para desmontar um processo histrico, reagrupando
o mesmo por pessoas, datas, localidades ou metodologias. Esta
estrutura permitia receber dados de qualquer tipo de fonte:
Tal esquema se prova extraordinariamente robusto e permite de cobrir o conjunto dos casos possveis, qualquer que seja a fonte crnica, arquivos
50
Ibid.(Traduo nossa. O original est em francs).
[49]
administrativos ou judicirios, correspondncias, atos notariais, registros paroquiais, literatura de segunda mo ou outro. Isso permite claramente uma contagem extremamente veloz dos instrumentos pblicos registros paroquiais, estado civil, atos notariais que so em ltima anlise instrumentos para criar relaes interindividuais. E posiciona de maneira imediata o assunto dentro do contexto da carreira de cada um dos
atores.51
A base Fichoz ainda utilizada por um grupo de
pesquisadores e para diversas pesquisas.
* * *
A proposta neste captulo no foi a de esgotar as
iniciativas de uso de bancos de dados dentro da produo do
conhecimento histrico, assunto para o qual seria necessria
uma enciclopdia. Mas vimos, com a ajuda de algumas
experincias pontuais, alguns temas relevantes que sero
retomados ao longo das prximas pginas. E, mais importante,
vimos que o uso do computador em histria tem uma longa data
e que no h motivo para reinventar a roda.
51
Ibid.
[50]
Algumas questes prprias da
informtica
Quando se fala de questes tcnicas os
historiadores costumam correr para as montanhas. difcil saber
os motivos da longeva averso de nossos colegas ao universo da
informtica. Alguns apresentam justificativas epistemolgicas,
outros optam por expor seu desprezo pela tcnica (a respeito de
que j discutimos antes) e muitos se consideram incapazes de
aprender. Mas acredito que quem aprendeu a usar um aparelho
celular ou o email poder facilmente aprender alguns dos
elementos bsicos que caracterizam as bases de dados.
Veremos que no to complicado. O problema
grande devido falta de didtica ou de pacincia dos
programadores. Tentaremos ser didticos aqui. Tudo bastante
lgico. Se formos capazes de discutir sobre as representaes do
poder no Antigo Regime, seremos capazes de aprender alguns
procedimentos da informtica.
Estrutura de dados
A primeira coisa que importa saber quais so os
elementos que compem uma base de dados, sua estrutura.
bem mais simples do que Althusser! Uma base um conjunto de
TABELAS articuladas. Alguns usam a palavra entidade para
designar as tabelas, um nome um tanto sobrenatural. Essas
tabelas podem conter diferentes tipos de informao: sobre
pessoas, casas, terras, por exemplo, endereos, etc. Podemos
criar apenas uma tabela, se for o caso. Sobre essa deciso, que
[51] envolve predominantemente problemas prprios do
conhecimento histrico, veremos adiante, quando lermos sobre a
montagem de bases. Continuemos com as nossas tabelas.
Figura 5 - Ilustra a estrutura de um banco de dados
Uma tabela formada por campos e registros
(tambm conhecidos como "colunas" e "linhas"). Nas colunas,
indicam-se os campos do banco de dados (tambm chamados
por alguns de atributos), como geralmente aparece em
formulrios, por exemplo, nome, endereo e estado civil. As
linhas correspondem aos registros. No caso de uma tabela feita
para organizar e gerenciar uma turma escolar, a tabela seria
composta por campos como nome, matrcula e idade, por
exemplo. Os registros seriam tantos quantos fossem os alunos
matriculados na turma.
Figura 6 - Modelo de tabela
(conceitual)
Figura 7 - Modelo de tabela (como em um
formulrio)
Como pudemos ver, algo bem mais simples que
Lvi-Strauss. Agora, que j dominamos essa informao,
[52] podemos avanar um pouco mais. Cada um dos campos (ou
atributos, a mesma coisa) da nossa base deve ter sua prpria
personalidade, ou seja, devem ser qualificados. Ele pode ser um
campo de texto (curto ou longo), de nmero, de data, de
imagem