FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
A dadidade (ou dadidão) do dado Raquel Meister Ko. Freitag
FREITAG, Raquel M.K. A dadidade (ou dadidão) do dado, Linguística Rio, vol.3, n.1, maio de 2017. ISSN: 2358-6826 Informações do autor Raquel Meister K.o Freitag Depto. Letras Vernáculas e PPG Letras, Universidade Federal de Sergipe Contato: [email protected] Outras informações Enviado: 19 de fevereiro de 2017 Aceito: 18 de abril de 2017 Online: 02 de junho de 2017
RESUMO: O objetivo deste texto é tecer considerações sobre a entidade “dado linguístico”, a fim de contribuir para a formação do linguista. São abordadas questões relativas à organização de bancos de dados linguísticos, considerando autoria, posse e propriedade dos dados e a aleatoriedade dos dados. PALAVRAS CHAVE: Dados linguísticos, Autoria, Aleatori-edade.
Introdução
SãopoucososcursosdegraduaçãoemLinguísticanoBrasil(conheçotrês,todos
noestadodeSãoPaulo).1Enquantoaformaçãodeengenheiros,arquitetosegeógrafosé
feitaemumcursodegraduaçãoemespecífico,noBrasil,amaioriadoslinguistasadvém
decursosdegraduaçãoemLetras,nahabilitaçãolicenciatura,mastemsuaformaçãover-
ticalidadenaáreaempequenosnichosdegruposdepesquisa(quandovinculadosaum
projetodepesquisanainiciaçãocientíficaouprogramaequivalente),ou,então,fazem-na
porcontaprópria.Aformaçãonaacademia,viainserçãoemgruposdepesquisa,tendea
levarosjovenspesquisadoresaseespelharemnosvaloresenomododefazerpesquisa
dossêniores,comoqueumefeitodohabitus(BOURDIEU,1974),oquelevaasituações
emque,muitasvezes, fazemosascoisasdeumjeitoporquesemprese fezassim,nem
1 Na pós-graduação, há bem mais cursos de Linguística, embora predominem os cursos de Letras, com áreas de concentração/linhas específicas para estudos linguísticos, especialmente nas regiões Norte e Nordeste. No entanto, mesmo nos programas de Linguística, a adequação aos ditames da Capes quanto à organização curricular e prazos deixa pouco espaço para aspectos mais práticos da formação. Na minha experiência, tanto como aluna de gradua-ção e pós-graduação, como orientadora de graduação e de pós-graduação, observo que a formação metodológica que prevalece na trajetória do pesquisador é aquela advinda do contato com a graduação.
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
sempresesabeporquê,sósesabequeéassim.Aocontráriodoqueseesperaria,naaca-
demia,emgeral,hámuitopoucoespaçoparaareflexãometodológicae,porconseguinte,
paraorompimentodaspráticasjáconsagradas,gerandoinovação2.
Poroutrolado,olinguistaautodidataesbarraemumproblema:noBrasil,temos
muitonosdedicadoàapresentaçãodeteorias,interfacesereleiturasdeteorias,masnão
temosmuitadiscussãosobreametodologiaquedásuporteaessasteoriastodas.Nomá-
ximo,encontramosdescriçõesdemétodosdepesquisasucintas,navozpassiva,dandoa
falsaimpressãodequeéextremamentefácilexecutarumprocedimentometodológiconas
diferentesáreasdaLinguística.
Umachamadadepublicaçãoquetemcomoobjetivotrazeràdiscussãoaformação
dolinguistaéumaoportunidadeparalevantarpontosqueaindasãofalhos.Eumdospon-
tosqueconsiderocrucialepoucorefletidodeformaconscienteéadadidãoouadadidade
dodado.
Dadidãoedadidadenãosãopalavras,insisteemmelembrarocorretordoeditor
detexto.Paraexplicaroqueeuquerodizercomessesneologismos,primeiroprecisodis-
cutirasuaraiz,overbodar.
Qualéamelhoranáliseparaoverbodarnoportuguêsbrasileiro?Éumverbodi-
transitivo?Verboleveousuporte?Sãodiversasaspossibilidadesparafomentarumain-
vestigação linguística–verporexemploosestudosdeSilva (2005)eScher (2006).O
verbodarassumeconotaçõesmaisvulgares,quandosetornaintransitivo(ou,aomenos,
comosobjetoselípticos),oupodeaindaserhipercorrigido,comoéocasodeumapropa-
gandadexampu,quedábrilhoaoscabelos(fig.1)
2 Não é por comodismo, não é por aculturação. Eu ousaria dizer que fazemos o que sempre fazemos porque sabe-mos a que resultados vamos chegar. E precisamos chegar a um resultado para poder dar propulsão à mola do financiamento: tenho que ter X artigos publicados em revistas para poder ter chances de concorrer a um edital de fomento, ou simplesmente para ter progressões na carreira. Corre-se menos riscos ao se tentar publicar um artigo com um tema abordado ao modo do que que se espera no campo do conhecimento do que um artigo resultante do teste de novas abordagens (que podem ou não ter resultados publicáveis). Se estamos tratando da formação do linguista, é preciso trazer à tona questões que são delicadas, mas que precisam ser discutidas, como a naturalização de comportamentos na academia (apenas para situar: https://www.cartacapi-tal.com.br/revista/929/a-academia-e-seus-comportamentos-patologicos).
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
Qualseriaaformadeverbaldoverbodar?Emília,doSítiodoPica-PauAmarelode
MonteiroLobato(2014[1933]),erauma“dadeiradeideias”;porquenãoumxampu“da-
dordebrilho”?Daredoarapresentamacepçõesmuitopróximas,masnãosãoamesma
coisa.Eumearriscariaadizerquenãotêmomesmovalordeverdade,porissonãopodem
serconsideradoscomovariantesdeumamesmavariávellinguística.PorqueemSociolin-
guística,analisamosdados,enãodoados!Eésobreessaentidade,odadolinguístico,que
voutratarnestetexto.3Inicialmente,discutooqueéaentidadedadolinguístico,para,em
seguida,encaminharpontuaçõessobreadadidade/dadidãodosdadosnaSociolinguís-
tica,masquesãoextensíveisaoutrasabordagens,nãosódaLinguística.
1. O que é um dado?
Nanossacultura,concretamente,dado
éumaformageométricatridimensionalcomseis
lados,utilizadaemjogos(fig.2).Maisumafaceta
dodado:suarelaçãocomasorte,comoacaso(e
comaaleatoriedadedosdados).Edado assume
outra significação: um qualquer. Isso permite
construçõescomo“dadodado”.Dadoéumtermo
técnicopolissêmicoemLinguística,eumaexpres-
sãocomo“Umdadodado”temmaisdeumainterpretação.
3 Possenti (2009[1998]) utiliza o recurso gráfico do negrito e do itálico para representar a diferença entre duas acepções de dado na Análise do Discurso (o dado dado e o dado dado). Um sentido seria o dado que é herdado, doado, mais ou menos como o xampu, e o outro sentido seria o dado que realmente é dado, que resolve, dado bom mesmo. Confesso que não consigo entender essas filigranas nesse campo, mas registro a fonte da distinção entre os dados, encaminhando para meu campo, que é de orientação mais funcional.
Figura1:Fotodoxampudoadordebrilho.
Figura2:Umdado.
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
1.Umdadodado.
2.Umdadodado.
Onegritonosexcertosmarcaaposiçãodenúcleodosintagmanominal.Em(1),o
dadoéumqualquer,nosentidodeescolhidoaoacaso,e,em(2)odadoédado(nosentido
dedoado,comonoxampu).Aposiçãodenúcleoouadjuntodosintagmaocupadapordado
pode,porexemplo,distinguirasabordagensempíricasouintuitivas,emumviésaosmol-
desdadiscussãoentreformalismovs.funcionalismonodebatetravadonarevistaDelta
nosanos1990.4Aoposição“dadodado”e“dadodado”,nestedebate,distinguiriaolin-
guistadegabinete,quecria,pensaumdadoparailustrarseufenômeno(masquepoderia
serqualqueroutrodado),aolinguistadecampo,quevaiembuscadeumdadoquesaia
dealgumlugar,quesejadado/doado.Umadistinçãoentreessesdoistiposdedadopode-
riasersistematizadanaoposiçãodadoinduzidovs.dadoespontâneo.Mas,comoespero
explicitarconvincentementemaisàfrente,estaéumadistinçãofalaciosaefalseável.Para
conduziradiscussãoqueproponho,vouassumiradistinçãodedadonaposiçãodenúcleo
dosintagma;comoemumaabordagemdasociolinguísticadeorientaçãovariacionista,
voudiscutirseas formasdebasedosdeverbaisdedaredoar são intercambiáveisem
outrocontexto:nalexiabancodedados.
2. O que é um banco de dados?
Asabordagensempíricasquevisamdescreverosusoslinguísticosapartirdasre-
gularidadesprescindemdeumsuporte:osdadoslinguísticos.Osdadosestãoaí,osdados
estãonomundo.Podemosdizer,semmedodeerrar,queosdadossãogeradosesponta-
neamente.Masaindanãoexisteumamáquinaquepeguedadosnomundo,organize-ose
oscoloqueàdisposiçãodeumpesquisador,oquerevelaumgrandeproblemadanossa
área:apoucainteraçãocomáreastecnológicas,quelidamtambémcomprocessamento
4 Considero essencial para a formação de um linguista, seja qual for a sua orientação teórica, conhecer o debate na revista Delta: Votre e Naro (1989), Nascimento (1990), Dillinger (1991) e Kato (1998). Houve um tempo em que publicações eram lidas e debatidas, replicadas, treplicadas e muitos aprendiam com a exposição de diferentes pontos de vista sobre fatos da língua. Não sei dizer em que momento ou por que perdemos esse hábito de ler, discutir e compartilhar nossas impressões sobre os trabalhos em desenvolvimento. Só sei dizer que perdemos muito com essa não prática.
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
dalinguagem,comoalinguísticacomputacionalqueédesenvolvidanoscursosdeCiên-
ciasdaComputação.Afinal,seSiri,daApple,Cortana,daMicrosoft,eAllo,daGoogle,as-
sistentespessoais, “entendem”seusproprietários, inclusiveemportuguêse comcerta
precisão,ésinaldequeexistetecnologiaparacaptarestímulosemáudioeostransformar
emregistroescrito,aseremprocessadosporalgoritmosdeparsing(atranscriçãoauto-
mática,umsonhodetodosquetrabalhamcomdadosdeáudio!).Noentanto,aindaesta-
mosdistantesdenosvalerdestastecnologiasparanossaspesquisas,pelomenosnoque
setemfeitoemSociolinguística,enoBrasil(eesteéoutropontoquelinguistasemfor-
maçãodeveriaminvestir:emformasdeautomatizarotrabalho,parapodermosdarconta
deumvolumemuitomaisamplodedados,enosdedicarmaistempoàanálise).
Mas,mesmoassim,pormaistecnologiaqueexista(equepotencialmenteestivés-
semosutilizando),aindarestatodoumtrabalhobraçalquesópodeserfeitoporumhu-
mano,especialmentenacoletadedadosclássicadaSociolinguísticaVariacionista,com
entrevistasgravadascomfalantes.Acoleçãodedadoscoletados(corpusouamostra)é
organizadaeconstituiumbancodedados.Paracontribuircomaformaçãodopesquisa-
dor,gostariadetrazerparaadiscussãoaspectosrelacionadosaosbancosdedadossoci-
olinguísticosrelativosaotrabalhosubjacenteàorganizaçãodosdadoseasdefiniçõesde
autoria,posseepropriedadedosprodutosderivadosdesteprocessoeàsquestõesdeale-
atoriedadedosdados.
Paraisso,voupedirlicençapara:a)sairdopadrãoacadêmico-científico,comme-
nosrigorcientíficoemaisteoranedótico,afimdemeaproximarmaiscomopúblico;e,
emdecorrênciadisso,b)meeximirdaresponsabilidadedecontaronomedossantosdos
milagresrelatados(emboraemalgunscasosissosejaimpossíveldeacontecer,dadaare-
percussãogeral).
3. Como a Sociolinguística entrou no Brasil?
Demodogeral,nãofazemossociolinguísticavariacionistadeorientaçãolaboviana
noBrasil.Compoucasexceções,fazemosumasociolinguísticademodomuitopeculiar,a
sociolinguísticavariacionistadoBrasil(cf.FREITAG,2016).Nessemodelo,paramuitos
pesquisadores,asociolinguísticaévistacomoumametodologiadegeraçãodedadospara
testagemdeteoriasedescriçãode língua(oudevariedades).Tantoque“casamentos”,
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
comoaSociolinguísticaParamétricaeoSociofuncionalismo,porexemplo,foramcelebra-
dosnoBrasil,porpesquisadoresbrasileiros,tendopoucarepercussãonoexterior.Dema-
neirageral,ostítulosdostrabalhosassumidos(ereconhecidopelospares)comosocio-
linguísticos, como artigos, dissertações e teses, priorizam na posição de núcleo o
fenômenolinguísticosobanálise,deixandonaposiçãodeadjuntoacomunidadedefala
(referidanonívelgeográfico)oualgumaspectosocial.Vaiserdifícilencontrar,dentreos
pesquisadoresbrasileirosdaárea,umquebataamarcadeWilliamLabov,que,durante
toda a sua carreira, realizoumais de 1000 entrevistas sociolinguísticas, pessoalmente
(LABOV,2016).Ocontatocomoprocessodecampoampliaaspossibilidadesdeanálise
dopesquisador,namedidaemquepermitecaptarnuançasquenãoestãopresentesna
transcrição(modulaçãoeintensidadedavoz)oumesmonoáudio,comoasexpressões
faciaiseocontextofísicodaentrevista,porexemplo.
Poroutrolado,deter-seexclusivamentenaanálisedeumagrandecoleçãodeda-
dos,jásistematizadosetranscritos,permiteaopesquisadoraprofundar-seemdescrições
maisminuciosasdasregularidadesenocotejamentodedadosateorias.Comessetraba-
lho,foipossíveldepreenderumagramáticabrasileira,umanormalinguísticabrasileira
calcadanaregularidadedeusosreais,emdadosempíricos.Opesquisadordefinequeisso
ouaquiloéportuguêsbrasileiroapartirdorecortedeumfenômenoedaobservaçãoda
regularidadedeseucomportamentoemumaamostralinguísticasistemática–obancode
dados–queésocialmenteestratificada.Édessaabordagemquedecorremgeneralizações
do tipo:maior escolaridade leva àmaiorpresençademarcasde concordância,menor
faixaetárialevaamaiorusodeagente,eassimpordiante.
Mas,parachegaraessasgeneralizações,houvetodoumtrabalhoanteriordedeli-
neamento,coletaesistematizaçãodasamostraslinguísticas,quetradicionalmenteapa-
recenasmetodologiasnavozpassiva.Foramselecionadosinformantes,entrevistasforam
realizadas,osáudiosforamtranscritos.Nãoestáexplícitoosujeitoagentedetodasessas
ações.Quemfezaseleçãodosinformantes?quemgravouasentrevistas?quemtranscre-
veuoáudio?Aestratégiadavozpassivaapontaparaaideiadeempreendimentocoletivo
queéumbancodedados(sócio)linguísticos.Ousodavozpassivadáaideiadequenão
foiumapessoa,umúnicopesquisador,quemofez;foiumaequipedepesquisadores,com
diferentesfunçõeseemdiferentesfases.Adespessoalizaçãodasaçõesdeconstituiçãode
umbancodedadoslevaaquestõesdeautoriaedeposseepropriedade,umoutroponto
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
que,dentrodasboaspráticasdepesquisa,precisaserdiscutidonaformaçãodolinguista
(quemsãoosdonosdosdados,maisàfrente).
UmfatorquepodetercontribuídoparaoformatodasociolinguísticanoBrasilhoje
éofinanciamentodaspesquisas,quetendeapriorizaraspropostascoletivaseamplas.
NosretrospectosdoGTdeSociolinguísticadaAnpoll,oscoordenadoresrelatamosesfor-
çosdospesquisadoresparaacaptaçãoderecursosjuntoaagênciasdefomento,comoa
Finep, Capes, CNPq e fundações estaduais, que priorizam propostas coletivas, tanto
quantoapesquisadores,comoquantoaáreasdoconhecimentoenvolvidas(talvezaexce-
ção sejamasbolsas incentivo individual –produtividade, jovenspesquisadores, etc.).5
Nestaconjuntura,projetosqueatendamadiferentesobjetosdeinvestigaçãoalinhadosa
umapropostaagrupadora,comoaconstituiçãodeumbancodedadossociolinguísticos
deumadeterminadacomunidade,tendemaserpriorizadosemfunçãodapossibilidade
deotimizaçãoderecursoseesforços.
4. Os donos dos dados
Coletardadosdátrabalho,enãodápararesumiraumalinhaemvozpassivatodo
essetrabalho(FREITAG;MARTINS;TAVARES,2012).Porisso,éimportantediscutiraau-
toriadeumbancodedados.Sãopoucosospesquisadoresquepodemdizerquetêmum
bancodedadosparachamardeseupropriamente.Issosignificaqueopesquisador,único
esolitário,desenhouaamostra,foiacampoidentificarosfalantesquepreenchiamoperfil
daestratificaçãodaamostra,elemesmoentrevistou,depoistranscreveuerevisouagra-
vaçãodeáudiodecadaumdosfalantesquefoientrevistado,paraentão,enfim,realizar
seutrabalhodepesquisa.Háaindamuitospesquisadoresquetrabalhamassim.Ninguém
conhecemelhorosseusdadosdoqueestetipodepesquisador,paraobemeparaomal.
Noladopositivo,opesquisadorqueacompanhoudodesenhodapesquisaàtranscrição
dosdadosécapazdeidentificarmuitosaspectosquenãoforamcaptadospelagravação,
elucidandodadostruncados,porexemplo.Noladonegativo,opesquisadorpodeestartão
envolvidocomseufenômenoquepodecomeçaraverdadosondenãoexiste,umaforçada
inconscientenatranscrição(ouvirdemais).Afinal,osdadossãoseusesóseus(será?).
5 Periodicamente, as ações do GT de Sociolinguística são compiladas em coletâneas organizadas, assim como balanços da área, que podem ser conferidos em Brandão (1994), Vandresen (2003), Savedra (2010).
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
Arealidadedamaioriadospesquisadores,noentanto,édiferente.Osbancosde
dadoscostumamserconstruídoscoletivamente,seguindomaisoumenosumacertaes-
trutura:umpesquisadorouumgrupodepesquisadores,todossêniores,desenhamuma
amostra,definindoascategoriasdeestratificaçãodosinformanteseonúmeromínimode
falantesporcélula.6Apartirdestedesenho,ospesquisadoresinicianteseemformação
trabalhamparaencontrarosfalantesquepreenchamascélulas,entrevistá-los;transcre-
veroáudiodagravaçãocostumasertarefadospesquisadoresiniciantes(iniciaçãocien-
tífica),revisaratranscriçãocostumasertarefadospesquisadoresemformação(mestran-
dosedoutorandos).Eassimumbancodedadosnãotemumautor;temvários.Quala
parceladecontribuiçãodecadaumnesteprocessodeconstituiçãodeumbancodedados?
Aentrevistafinal,gravadaetranscrita,sóexistiriaporqueumgrupodepesquisadores
sênioresdelineouapropostadobancodedados;poroutrolado,aconcretizaçãodobanco
dedadosprojetadosóserealizariaemumempreendimentocoletivocomospesquisado-
resinicianteseemformação.
Umbancodedadoscoletivoéumempreendimentocolaborativoouvoluntário?O
quealguémganhaaoconstituirumbancodedados?Comodestaqueianteriormente,a
sociolinguísticabrasileira – assim comoasdemais áreasda ciência – é financiadapor
agênciasquevalorizamprojetosquetenhamabrangênciaamplia,visandoocompartilha-
mento,daíaênfaseembancosdedadossociolinguísticos,quepodemserutilizadosmais
deumavez,paraestudardiferentesfenômenos.Ofinanciamentodeprojetosquevisama
constituiçãodebancosdedadossociolinguísticosrecobreasdespesasdecapitalecusteio,
masnãoderecursoshumanosexclusivamenteparaessefim;paraisso,pesquisadoresini-
cianteseemformaçãoaderemaoprojeto(combolsaounão),colaborandocomaidenti-
ficaçãodeumfenômenolinguísticoasertratadoaotempoemquecontribuiparaacons-
tituiçãodobancodedados.Sejanumplanode trabalhode iniciaçãocientíficaounum
projetodemestradooudoutorado,asregrastácitasestabelecidasentreogrupoqueatua
naconstituiçãodosbancosdedadoséqueacontrapartidaaousodeumtodo(obancode
dados)écolaborarcomumaparte(entrevistas,transcrições,revisões).Oacessoaotodo
nãoégratuito;assimcomoacolaboraçãonaspartesnãoévoluntária.E,depoisdepronto,
6 “Falante”, “informante”, “sujeito”, “participante”; depois do termo “dado”, estes são outros termos usados como variantes, mas que carregam diferentes significados subjacentes e que mereceriam uma reflexão mais aprofundada (talvez, em outra oportunidade).
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
umbancodedados,aindaquefinanciadocomodinheiropúblico,nãoédedomíniopú-
blico:houveumtrabalhointelectualpordetrásdesuaelaboração,desdeaconcepçãoaté
aconsecução,queconfiguraautoria.Logo,seuusodeveserreferidoapropriadamente.
Seobancodedadosfoifinanciadocomdinheiropúblicodeveriaserpúblico,no
sentidodesercompartilhadoabertamente,certo?Nemsempre,enãoporquestõesde
posseepropriedade,masporquestõesdeéticaempesquisa.Hábancosdedadosque
disponibilizamsuasamostrasnainternet.ÉocasodoIboruna(http://www.iboruna.ibi-
lce.unesp.br), que exige cadastro para acesso, do SP2010 (http://proje-
tosp2010.fflch.usp.br/node/3) totalmente aberto, doNURC-RE (OLIVEIRA Jr., 2016) e,
parcialmente, do PEUL (http://www.letras.ufrj.br/peul/amostras%201.html) e do
NURC-RJ(http://www.letras.ufrj.br/nurc-rj/),quedisponibilizamastranscrições.
Poroutrolado,nemsempreaaberturapúblicadosdadosépossível.Adocumen-
taçãosociolinguística–conjuntodeprocedimentosadotadosparaaconstituiçãodeban-
cosdedadossociolinguísticos(cf.FREITAG,asairA)–nãoéingênuanemneutra,menos
aindaasséptica,navozpassivaenaterceirapessoa.Oprocessodeseleçãodosfalantese
todooperíododetempoemquedocumentadorefalanteconvivemparagerarosdados
influenciamnosresultados.Háriscosnadocumentaçãosociolinguísticaquepodemepre-
cisamserminimizados,comaelaboraçãopréviadodesenhodapesquisa,comotreina-
mentoadequadodopesquisadordecampoecomocuidadonadivulgaçãodosresultados.
Aregulamentaçãodasquestõeséticasempesquisaenvolvendosereshumanos(os
nossosfalantessãosereshumanos)partedopontodevistaquetodaaatividadedepes-
quisaapresenta riscos.Considerandoqueexistemriscosempesquisa, a submissãode
projetosaoscomitêsdeéticatemsetornadoumprocedimentoacadadiamaisconstante,
emfunçãodosimperativosinstitucionais,relacionadosaagênciasdefinanciamentoouao
vínculodotrabalhocomainstituiçãodepesquisa.
Nuncapensamosemfazermalaoinformanteporrealizarumaentrevistasociolin-
guística,masesteprocedimentosistematicamenteadotadonasdocumentaçõessociolin-
guísticasnoBrasil,emfunçãodeseuroteiro,podelevarofalantearememorarexperiên-
ciasquepodemgerarsituaçõesdemelancolia.Aofalardecertaspassagensdesuavida,
umfalantepodeatéchorar.Seráqueofalantevaiconcordarqueseuchorosejacompar-
tilhadopublicamente(disponívelnainternet)?Ou,então,nocalordomomento,ofalante
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
fazumacolocaçãopoucopoliticamentecorreta(euconheçoumaentrevistasociolinguís-
ticaemqueofalanteexpõesuaposiçãoemrelaçãoaoaumentode“homossexualismo”
nosdiasdehoje,culpadousodesupositóriosnascrianças,quese“acostumaram”eque,
porisso,osfilhosdelenuncausaramsupositório).Aindaqueobancodedadosanonimize
ofalante,certaspistasdeixadasnodecorrerdaentrevistapodemidentificá-lo,como,por
exemplo,umfalanteanonimizadonobancodedados,masquedizduranteaentrevista
queeravereadorequetrabalhounainstituiçãotalnaépocatal.Otermodeconsentimento
livreeesclarecido,requisitoobrigatórioembancosdedadoscujoprojetodeconstituição
foiapreciadoporcomitêdeéticaempesquisa,resguardaopesquisadorea instituição
queabrigaobancodedados,masnemsempreo falanteéesclarecidoaopontodeter
consciênciadequepartedesuavidavaisetornarpúblicaecompartilhada,inclusivena
internet.
“Nãodêligânciadisso”éumdadomuitointeressantecomoverbodar.Masestá
numaentrevistasociolinguística(comtermodeconsentimentolivreeesclarecidoassi-
nado)emque,emdadomomento,ainformantevangloria-sedofatodeseupaitermatado
umvizinhoeterseevadidoparaoutroestado.Pormaisinteressantequesejaodado,o
crivo finaldopesquisadoresuaresponsabilidadeperanteosdadoseasuadivulgação
podelevaraexclusãodestaentrevistadeumbancodedados,parapreservar-se(àinfor-
manteeasimesmo).
Anonimatoéumacondição,masnãoéumaobrigatoriedade.Muitasvezes,nãotem
comoanonimizar;outrasvezes,oprópriofalantequerseridentificado.Porisso,umadis-
cussãosobreosimpactosdessaspequenasdecisõesécrucialnodesenhodeumacoleta
dedados
Aindaemrelaçãoaodesenhodoprojetodedocumentaçãosociolinguísticaeas
questõeséticassubjacentes,éprecisodeixarclaroaoinformanteemquecélulasocialele
será alocado. Ao analisar o tratamento do sexo/gênero na sociolinguística brasileira,
constateique,nasperguntasdechecagemdaentrevistasociolinguística,aestratificação
porfaixaetáriaeporescolarizaçãoeramconferidas,masadesexo/gênero,não(FREITAG,
2015).Aobuscaro falanteno campo, parapreencher a célula social, presumimos seu
sexo/gênero,eessatalvezsejaumaperguntamaissimplesdesefazer.Masemestratifi-
caçõesdo tipoportuguês culto/portuguêspopular, seráqueépossívelpedir ao infor-
manteaautoindicação?Seráqueessaautoindicaçãobatecomaquelaqueépresumida
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
pelodocumentador,pesquisadordecampo?Você,leitor,jásecolocounasituaçãodese
disporaconcederumaentrevistasociolinguísticaetemposdepoissereconhecercomo
umfalantedeportuguêspopular?
Otreinamentodecampododocumentadoréumaparteimportantedoprocesso
deconstituiçãodeumbancodedados,masque,muitasvezeséaligeiradaousimples-
mentesuprimida.Odiferentecausaestranhamento.Odocumentadornãopoderirnem
corrigirofalante,sóporqueelefalou“apesardosapesares”ou“nóisvinhemo”.Aindaque
sejaumareaçãoinconsciente,trazconstrangimentoaofalante,éumriscoquepodeser
evitado.Assimcomopodemserevitadososdesgastesdecorrentesdeumatranscrição
ortográficaadaptada(aquelaquemarcatraçosdafala).
Considerarasquestõesenvolvendoéticaempesquisanaconstituiçãodeumbanco
dedadoséumanecessidaderelativamenterecente,decorrentedasimposiçõesdeagên-
ciasdefomento,que,decertaforma,sãoasmesmasimposições(anecessidadedefinan-
ciamento)quederamacaradaSociolinguísticadoBrasil,combancosdedadoscoletivos
paraadescriçãolinguística.Noentanto,semprehouveoutliers,comoemtodosemcam-
posdaciência,e,nosúltimosanos,trabalhosquetomamcomopontodepartidaacomu-
nidadeeseusfatoresconstitutivos,enãoumfenômenolinguístico–comoavariaçãoeo
efeitodasredesnoMorrodosCaboclos(FERRARI,1994)eacaracterizaçãosociolinguís-
ticadacomunidadedefaladeSãoPaulo(OUSHIRO,2015),porexemplo–têmemergido,
sinalizandoumamudançadetendência,quetraznovosdesafiosenovasdiscussõesteó-
rico-metodológicasnasociolinguísticabrasileira.Seaciênciabrasileiraéfinanciadapelos
pais(http://revistagalileu.globo.com/Revista/noticia/2016/07/ciencia-no-brasil-e-ban-
cada-pelos-pais.html),talvezestesejaomomentodemudarumciclo.
5. O quão dados são os dados de um banco de dados?
Aabordagemdodado/doadocostumaserassociadaaoacaso,aleatório,nosentido
queodador/doadorseriaumapessoaqualquer.Tantoqueosestudossociolinguísticos,
pelomenosnoBrasil,costumamassumirquesuasamostrassãoprobabilísticas,aleató-
riaseestratificadas,oquequerdizerquequalquerfalantedapopulaçãodelimitadateria
omesmonúmerodechancesdeserescolhidoparapreencheracotadecadaestrato.Na
prática,sabemosqueateoriaéoutra:osfalantesquecolaboramparaaconstituiçãode
umbancodedadossociolinguísticasãoaquelesquedispõemdetempoparacolaborar,
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
cedendonomínimoumahoradesuavidaparaessafinalidade.Imperamadisponibilidade
eavoluntariedade,oquelevaaummodelodecotasporconveniênciae julgamento.A
conveniênciapermiteaoperacionalidadedacoleta,noentanto, impõeàanálisemenor
poderexplanatório;pornãoatenderaumcritérioestatístico,nãopode(ou,melhor,não
deve)sergeneralizadaaumapopulação.Amostrasassimconstituídasnãopoderiam,em
tese,subsidiargeneralizaçõessobre“a”línguafaladaemtallugar.E,porserempautadas
naconveniência,limitamareplicabilidade,namedidaqueháumviésdeseleção(FREI-
TAG,asairB).
Oviésdeseleçãopodesedarnomomentodatranscriçãoimpressionísticadosda-
dos:aquiloqueétranscritonemsempreéoqueofalantefalou,masoqueotranscritor
ouviu:adependerdoseufenômeno,haverámaiorsensibilidadeparapercebê-loemarcá-
lo,emtranscriçõesortográficasadaptadasoufonéticas;ou,então,avariantedotranscri-
torsesobrepõeàvarianterealizadapelofalante,numprocessoinconscientedeacomo-
daçãolinguística.Porisso,odadodadonãoétãoaleatórioassim,nemparaumlado,nem
paraooutro.Semprehaveráumviésdeseleção.
Considerações
Teraoportunidadedediscussãodeaspectosquepermeiama formaçãodo lin-
guistaéimportanteparaformarmosumaculturadecríticaeavaliaçãodofazerdanossa
área,comoumtodo,aotempoquepodemostambémnosposicionarediscutir,resgatando
umaculturadedebate(voltoainsistirnosdebatesdaDelta).
Emtempo:recorrendoaooráculodoséculoXXI,nãoacheinenhumaocorrênciade
“dadidão”,mas1090ocorrênciaspara“dadidade”,basicamenterelacionadasaocampoda
ontologia(consultaaoGoogle,empáginasemportuguês,nadatalimitedachamadapara
apublicaçãodestaedição).7Embora“dadidade”sejamaisprodutiva,achoque“dadidão”
ficamelhor.Linguistas,eisumtemaparanovaspesquisas!
7 Na revisão, apareceram 1750 ocorrências para “dadidade” e ainda nenhuma para “dadidão”.
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
Agradecimentos
Agradeçoàminhaorientadora,EdairMariaGörski,quemepermitiuentrarnumgrupode
pesquisaefazerotodosfaziam,etambémpormepermitirquebrarasregrasdevezem
quando.Agradeçoaospareceristas,aum,porsuascontribuiçõesparanovasdiscussõese,
aooutro,porme lembrardohabitusdaacademia.EagradeçoàLiviaOushiro,porsua
leituraatentaesincera.
REFERÊNCIAS
BOURDIEU, Pierre. A economia das trocas simbólicas. Trad. Sérgio Miceli. São Paulo: Perspec-tiva, 1974.
BRANDÃO, Silvia Figueredo. GT de Sociolinguística. Revista da Anpoll, v. 1, n. 1, 1994.
DILLINGER, Mike. Forma e função na lingüística. DELTA, v. 7, n. 1, p. 395-407, 1991.
FERRARI, Lilian. Variação linguística e redes sociais no Morro dos Caboclos. Tese (Doutorado em Linguística) - Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1994.
FREITAG, Raquel Meister Ko. (Re)discutindo sexo/gênero na sociolinguística. In: FREITAG, Ra-quel Meister Ko.; SEVERO, Cristine Gorski (Org.). Mulheres, Linguagem e Poder - Estudos de Gênero na Sociolinguística Brasileira. São Paulo: Blücher, 2015, p. 17-74.
FREITAG, Raquel Meister Ko. Amostras sociolinguísticas: probabilísticas ou por conveniência? (a sair A).
FREITAG, Raquel Meister Ko. Documentação sociolinguística – coleta de dados e ética em pes-quisa. São Cristóvão: EdUFS (a sair B).
FREITAG, Raquel Meister Ko. Sociolinguística no/do Brasil. Cadernos de Estudos Lingüísticos, v. 58, n. 3, p. 445-460, 2016.
FREITAG, Raquel Meister Ko; MARTINS, Marco Antonio; TAVARES, Maria Alice. Bancos de da-dos sociolinguísticos do português brasileiro e os estudos de terceira onda: potencialidades e li-mitações. Alfa, v. 56, n. 3, p. 917-944, 2012.
KATO, Mary A. Formas de Funcionalismo na Sintaxe. DELTA, v. 14, n. spe, p. 00,1998.
LABOV, William. Afterword: Where are we now? Journal of Sociolinguistics, v. 20, n. 4, p. 581–602, 2016.
LOBATO, Monteiro. Reinações de Narizinho. Rio de Janeiro: Globo Livros, 2014 [1933].
NASCIMENTO, M. do. Teoria gramatical e mecanismos funcionais do uso da língua. Delta, v. 6, n. 1, p. 83-98, 1990.
OLIVIERA Jr, Miguel. NURC Digital Um protocolo para a digitalização, anotação, arquivamento e disseminação do material do Projeto da Norma Urbana Linguística Culta (NURC). CHIMERA: Ro-mance Corpora and Linguistic Studies, v. 3, n. 2, p. 149-174, 2016.
FREITAG A dadidade (ou dadidão) do dado
www.linguisticario.letras.ufrj.br 2017 | vol. 3 | n.1 |
OUSHIRO, Lívia. Identidade na pluralidade: avaliação, produção e percepção linguística na cidade de São Paulo. Tese (Doutorado em Linguística). Universidade de São Paulo, São Paulo, 2015.
POSSENTI, Sirio. O dado dado e o dado dado (o dado em análise do discurso). In: POSSENTI, Sírio. Os limites do discurso: ensaios sobre discurso e sujeito. São Paulo: Parábola, 2009, p. 23-31.
SAVEDRA, Mônica Maria Guimarães. Estudos e pesquisas em sociolinguística no contexto pluri-língue do Brasil. Revista da Anpoll, v. 1, n. 29, 2010.
SCHER, Ana Paula. Nominalizações em-ada em construções com o verbo leve dar em português brasileiro. Letras de Hoje, v. 41, n. 1, 2006.
SILVA, Leilane Ramos da. Construções lexicais complexas com o verbo dar: estruturas de signifi-cados ou instrumentos de construção de sentidos. Estudos Lingüísticos, v. 34, p. 563-568, 2005.
VANDRESEN, Paulino. A trajetória do GT de Sociolingüística da ANPOLL–1985-2001. In: C. Ron-carati; J. Abraçado (Org.). Português Brasileiro-Contato Lingüístico e História. Rio de Janeiro: 7Le-tras, 2003, p. 13-29.
VOTRE, Sebastião Josué; NARO, Anthony Julius. Mecanismos funcionais do uso da língua. DELTA, v. 5, n. 2, p. 169-184, 1989.
ABSTRACT: The goal of this text is to raise a few remarks on the entity “linguistic data” in order to con-tribute to the formation of linguists. The organization of linguistic datasets considering their authorship, pos-session, ownership and randomness are the aspects under discussion. KEYWORDS: Linguistic data. Authorship. Randomness.
FREITAG, Raquel M.K. A dadidade (ou dadidão) do dado, Linguística Rio, vol.3, n.1, maio de 2017. ISSN: 2358-6826
Enviado: 19 de fevereiro de 2017 Aceito: 18 de abril de 2017
Online: 02 de junho de 2017