Linguística de
Corpus
e Tradução
Stella E. O. Tagnin
TRADUSP - 2015
Roteiro da apresentação
 Convencionalidade e Fraseologia
 Linguística de Corpus
 Metodologia de pesquisa
 Exemplos de pesquisas
Convencionalidade
e Fraseologia
O Falante Ingênuo 
Tradutor Ingênuo
desconhece
 as convenções morfológicas:
jailer vs. prisoner
carcereiro vs. prisioneiro
 as convenções de ordem:
dead or alive vs. vivo ou morto
 as convenções de coocorrência:
have breakfast vs. tomar o café
have a meal vs. fazer uma refeição
O Falante/Tradutor Ingênuo
desconhece
 as convenções de aceitabilidade: by and large
o mais das vezes
 as convenções semânticas:
hard nut to crack
osso duro de roer
 as convenções pragmáticas:
How do you do?
Muito prazer
(Adaptado de Fillmore, C.J. 1979. Innocence. A Second Idealization for Linguistics,
Berkeley Linguistic Society 5, 63-76)
Níveis de Convencionalidade
sintático
combinabilidade: take a step vs dar um passo
ordem: vivo ou morto vs dead or alive
gramaticalidade: let alone, de quando em vez
imagem
semântico
expressão: kick the bucket, pintar o sete
situação
pragmático
fórmula: Congratulations
Colocações Adjetivas
outside chance – possibilidade remota
public television – televisão educativa
spinal column — coluna dorsal
capital punishment – pena de morte
Japanese current - corrente do Japão
green light – sinal verde
red onion – cebola roxa
red wine – vinho tinto
red hair – cabelo ruivo
Colocações Nominais
N2 + N1 Labor Day — Dia do Trabalho
labor pains — dores de parto
seashore — beira-mar
village green — praça pública
jug ears – orelhas de abano
metal mouth – sorriso metálico
N1 + Prep + N2
justice of the peace — juiz de paz
cost of living - custo de vida
Tree of Knowledge — Árvore do Conhecimento
Colocações Verbais
V + N
[obj]
muster courage — armar-se de coragem
pay a compliment — fazer um elogio
make a decision — tomar uma decisão
take a step — dar um passo
take vacation – tirar férias
fill a prescription — aviar uma receita
pit [a fruit] – tirar o caroço
Colocações Verbais
N[subj] + V
a river flows — um rio corre
a nose runs — um nariz escorre
a volcano erupts — um vulcão entra em erupção
V + Adj take ill — ficar doente
fall asleep — cair no sono
grow old — ficar velho
V + Adv
climb aboard — subir a bordo
come ashore — desembarcar
Colocações Adverbiais
Adv. + Adj.
lavishly illustrated — fartamente ilustrado
deeply offended — profundamente ofendido
mortally offended — mortalmente ofendido
critically injured — gravemente ferido
Verb + Adverb
fully agree — concordar plenamente
cry loudly — chorar copiosamente
lie outright — mentir descaradamente
take seriously — levar a sério
pay dearly — pagar caro
Binômios e Multinômios
pen and pencil – lápis e papel/papel e lápis
night and day* – dia e noite*
from time to time – de tempos em tempos
knife and fork – garfo e faca
dead or alive – vivo ou morto
face to face – cara a cara
cats and dogs – cães e gatos / gatos e cachorros
over and over and over; red, white and blue
cama, mesa e banho; casa, comida e roupa
lavada
Expressões Convencionais e
Idiomáticas
Expressões Convencionais
That’s my fault — A culpa é minha
in the old days — nos velhos tempos
thirty-some years — trinta e poucos anos
Expressões Idiomáticas
kick the bucket — bater as botas
pull sb’s leg — tirrar o sarro de alguém
blow one’s top — perder a cabeça
raise hell — botar a boca no mundo
cost an arm and a leg – custar os olhos da cara
Fórmulas Discursivas
Citações
To be or not to be... — Ser ou não ser...
The die is cast — A sorte está lançada
Provérbios
Not all that glitters is gold.
Nem tudo que reluz é ouro.
Do as I say, not as I do
Faça o que eu digo, não faça o que eu faço.
Marcadores
Conversacionais
Come to think of it,... — Por falar nisso,...
In other words, ... — Em outras palavras,
You see, ... - Sabe, ...
Well,... — Bem,...
May I interrupt? — Posso interromper?
What do you think? — O que você acha?
That’s it. — É isso (aí).
I’m all ears. — Sou todo ouvidos.
Are you with me? — Está entendendo?
Mhm
Fórmulas Situacionais
Act your age — Não seja criança.
Have fun — Bom divertimento/Divirta-se
That’s the pot calling the kettle black.
Olha o roto falando do esfarrapado.
It takes two to tango.
Quando um não quer, dois não brigam.
Fórmulas de Rotina
Cumprimentos
Good morning, Hello, How are you?
Bom dia, Oi, Como vai?
Desculpas
Sorry, Excuse me, Pardon me
Desculpe, Sinto muito, Perdão
Votos
Happy New Year — Feliz Ano Novo
Merry Christmas — Feliz Natal
Get well soon — Estimo as melhoras
Linguística de
Corpus
O que é um
corpus
e para que
serve?
O que é um corpus? (cf.
Aurélio Eletrônico)
(1) Conjunto de documentos,
dados e informações
sobre determinada matéria.
O que é um corpus hoje?
Uma coletânea de textos
em formato eletrônico,
compilada segundo critérios específicos,
considerada representativa de uma língua
(ou da parte que se pretende estudar),
destinada à pesquisa
A História dos Corpora
 Década de 60 – corpora de 1 milhão de
palavras!
 Brown – inglês americano (1964)
 - textos publicados em 1961
 200 textos de 5.000 palavras cada
 15 categorias distintas
 LOB (Lancaster/Oslo/Bergen) – (1978)
contrapartida em inglês britânico
 London-Lund: 500 mil, falado (1980)
 Frown + Flob (Freiburg) – 1990
 American English 2006 + British English 2006
A História dos Corpora
Década de 1960: advento do
computador
Década de 1970: consolidação,
corpora diversos, línguas diversas;
corpora maiores, corpora anotados
(Escandinávia) – tudo digitalizado
Década de 1980: invenção do scanner
Década de 1990: disponibilidade de
textos já digitalizados
Novo milênio: textos da internet
Web como corpus (WaC)
Os Corpora Atuais
BNC – 1995 – 100 milhões de palavras - 90% língua
escrita – on-line 40 milhões
 10% língua falada
 corpus fechado
 Bank of English (Cobuild)
 Birmingham 1987 – 20 milhões de palavras
 Hoje 650 milhões de palavras
 corpus aberto/dinâmico/orgânico – em constante
atualização
 Collins Corpus: 2.5 billion words (inclui BoE)
 Collins WordBanks Online – 57 milhões de palavras Pago!!! http://www.collinslanguage.com/contentsolutions/wordbanks
Os Corpora Atuais
 COCA – Corpus of Contemporary American English www.americancorpus.org/
 450 milhões de palavras
 1990 – 2012
 BNC-BYU = BNC completo http://corpus.byu.edu/bnc/
 100 milhões de palavras
 ANC – American National Corpus http://www.americannationalcorpus.org/
 Textos a partir de 1990
 15 milhões de palavras para download (“Open” portion)
 MASC - Manually Annotated Sub-Corpus
Os Corpora Atuais
 Corpus do Português
http://www.corpusdoportugues.org/
45 milhões de palavras
1300s – 1900s
 Corpus Brasileiro
http://corpusbrasileiro.pucsp.br/cb/Inicial.html
 www.linguateca.pt  Acesso a recursos  AC/DC Acesso a
corpora /Disponibilização de corpora

1 bilhão de palavras
Qual a grande vantagem dos
corpora?
Observação da
linguagem em uso
- natural contrapõe-se à introspecção
Chomskyana
- gramatical -
Qual é a diferença?
Firth/Halliday
Chomsky
 Desempenho
 Competência
 Descrição linguística
 Universais linguísticos
 Empirismo
 Racionalismo
 Observação
 Introspecção
 Probabilidade
 Possibilidade
Corpus linguist vs armchair
linguist
“... I don’t think there can be
any corpora, however large,
that contain information
about all of the areas of
English lexicon and grammar
that I want to explore...”
Corpus linguist vs armchair
linguist
“... Every corpus [...] however
small, has taught me facts
that I couldn’t imagine finding
out about in any other way.”
(Fillmore, C.J. “Corpus linguistics” or “Computer-aided
armchair linguistics”. In Svartvik, Jan (ed.) Directions in
Corpus Linguistics, Proceedings of Nobel Symposium 82,
Stockholm, 4-8 August 1991, Berlin/NY: Mouton de
Gruyter, 1992, 35-60)
Para que servem os
corpora?
 Terminologia
 Tradução
 PLN: Processamento Automático de Língua Natural
 tradução automática
 treinamento de ferramentas
Áreas de Pesquisa
Lexicologia
 Lexicografia: compilação
de dicionários
 Terminologia: compilação
de glossários
 Intuitivo vs. Natural
Áreas de Pesquisa
Tradução
Estudos contrastivos: naturalidade da língua
Normalização/ Simplificação/ Explicitação
Estratégias de tradução
Normas de tradução
Ensino e treinamento
Fontes de referência
Áreas de Pesquisa
PLN (corpus para treinamento)
Desenvolvimento de ferramentas
computacionais
 Sumarização
 Sumarização de multidocumentos
 Anotação morfossintática
 Auxílio à escrita
 Simplificação de texto
 Tradução automática
Tipos de Corpora
Quanto à língua
monolíngues
bilíngues
multilíngues
Corpora monolíngues
 língua geral: jornalísticos e literários
 língua de especialidade: técnicos
 traduções
 TEC - Translation English Corpus
 corpus de referência / de contraste
língua geral
 variedade de gêneros
 variedade de registros

Quanto ao tempo
Sincrônicos: “instantâneo” da
língua
Diacrônico: evolução da
língua:
LOB vs FLOB
BROWN vs FROWN
American 2006 vs British 2006
Corpora multilíngues
comparáveis:
 originais em duas ou mais línguas
 Ex.: CorTec
paralelos:
 originais + tradução/traduções
 Ex.: CorTrad, COMPARA
Corpora de Aprendizes
de Língua Estrangeira
de Língua Materna
de Tradução
Corpora On-line - Inglês
WebCorp: http://www.webcorp.org.uk
 Linguist’s Search Engine (LSE): http://wse1.webcorp.org.uk/
TEC – Translation English Corpus
http://ronaldo.cs.tcd.ie/tec2/jnlp/
W3c: Guttenberg + upload
http://www.gutenberg.org/wiki/Main_Page
Corpora On-line - com Português
 COMPARA:
http://www.linguateca.pt
 Lácio-Web: http://www.nilc.icmc.usp.br/lacioweb
 CoMET: www.fflch.usp.br/dlm/comet
 CorTec:
http://www.fflch.usp.br/dlm/comet/consulta_co
rtec.html
 CorTrad:
http://www.fflch.usp.br/dlm/comet/consulta_cortrad
.html
Área de Pesquisa
120
100
80
60
40
20
0
Tradução
Descrição de
linguagem
Ensino
Terminologia
PLN
Terminologia - Línguas
Multilingüe
Inglês-Português
Espanhol-Port
Alemão-Port
Português
Inglês
nc
ia
s
M
éd
ica
EC
s
O
Ci
N
ên
O
cia
M
IA
s
Hu
m
an
as
Ju
ríd
Ju
ico
ra
m
en
ta
Na
do
no
ci
ên
cia
Cu
lin
ár
ia
Tu
r is
Bi
oc
m
o
om
bu
Té
st
cn
ív
ico
el
-c
ie
nt
ífi
co
Es
co
la
r
Ho
te
la
ria
Pu
bl
ici
da
de
Ci
ê
Terminologia - Domínios
10
9
8
7
6
5
4
3
2
1
0
C
Eq
An
se
or
p
us
o/
co
o
or
al
rp
us
us
a
In
te
rp
re
ta
çã
C
ot
aç
ã
or
p
ão
/c
ci
ão
iç
al
ên
ef
in
ui
v
D
co
gi
a
óg
i
ol
o
in
ol
m
te
r
tru
ç
on
s
er
Fa
z
Fr
a
em
ár
io
ss
ua
g
G
lo
Li
ng
Terminologia - Foco
9
8
7
6
5
4
3
2
1
0
Tradução - Línguas
Esp -> Ptg
Alemão <-> Ptg
Multilíngue
Ptg --> Ital
Fr -> Ptg
Port -> Inglês
Inglês <-> Port
Inglês -> Port
Tradução - Domínio
AV
Musica
Outros
HQ + Infantil
Juramentado
Literário
Jurídico
Acadêmico
MEDICINA
Infanto-juvenil
R
gi
a
sa
is
a
C
og
n
içã
AV
Av
al
ia
ep
çã
re
o
se
nt
aç
ão
ni
ve
r
o
so
át
ic
ur
isc
Lé
xi
c
Es
til
o
ol
o
te
m
D
U
ão
aç
an
iz
se
M
o
et
áf
C
or
oe
as
sã
o
In
le
te
xi
rte
ca
M
l
xt
ar
ua
ca
lid
do
ad
re
s
e
Cu
ltu
Po
ra
is
nt
o
de
vi
st
a
O
rg
Fr
a
Tradução - Foco
14
12
10
8
6
4
2
0
Novas tendências
 AV: legendagem para surdos e ensurdecidos,
audiodescrição, dublagem.
 Interpretação
Metodologia de
pesquisa com corpus
Compilação de corpus
Planejamento
 Tipo de corpus: comparável? Paralelo?
 População: tipos de textos?
Coleta
 Internet? / escanear?
Preparação dos textos
 Formato .txt
 Nomear arquivos
 Organizar arquivos
Pesquisa com Linguística de
Corpus
1. Corpus de estudo
2. Corpus de referência / comparação
3. Ferramenta de análise
Exploração de corpus
1. Wordlist
2. Keywords
3. Concordâncias
Wordlist – Lista de Palavras
KeyWords – Palavras-chave
vs
Wordlist do
corpus de estudo
Wordlist do
corpus de referência/comparação
Keywords = palavras características do
corpus de estudo
KeyWords – Palavras-chave
Keywords
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ.
CUP
1.024
WORLD 1.197
TEAM
575
GAME
486
HIS
714
GERMANY435
SOCCER 374
HE
778
ITALY
332
SAID
670
WAS
892
PLAYERS 337
GOAL
352
BALL
260
IN
3.214
COACH
229
TOURNAMENT
SPORTS 234
PLAY
264
FRANCE 208
FANS
193
MATCH
265
MINUTE 206
BRAZIL
209
WIN
193
WCUPING.LST %
0,77
1
0,90
301
0,43
48
0,36
22
0,53
257
0,33
14
0,28
0
0,58
429
0,25
5
0,50
343
0,67
716
0,25
15
0,26
51
0,19
2
2,40
7.019
0,17
0
205
0,15
0,18
13
0,20
37
0,16
6
0,14
1
0,20
49
0,15
9
0,16
19
0,14
15
FREQ.
3.291,6
0,06
1.538,4
1.396,6
0,05
1.284,9
1.206,4
0,08
1.021,0
0,06
0,13
969,6
851,9
815,9
1,31
738,5
0
658,5
643,5
618,7
610,2
604,4
593,5
551,6
521,2
REFENG2.LST %
0,000000
2.496,9
0,000000
0,000000
1.296,2
0,000000
0,000000
1.130,6
0,000000
1.017,6
987,2
0,000000
0,000000
0,000000
761,0
0,000000
661,0
0,000000
0,000000
0,000000
0,000000
0,000000
0,000000
0,000000
0,000000
KEYNESS P
0,000000
0,000000
0,000000
0,000000
0,000000
0,000000
0,000000
Concord - Concordâncias
Palavra de busca em contexto - KWIC
Pesquisas terminológicas
Como identificar uma unidade fraseológica?
1 Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Su
2 de Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Sustentável (CBTS) Saiba tudo
3 ara estabelecer padrões de qualidade para as modalidades de turismo em nosso país. Ambientalistas,
4 antes de movimentos sociais, empresários e especialistas em turismo de todo o país reuniram5já Jardim Europa, durante o III Workshop de Certificação do Turismo Sustentável, para fundar o Conselh
6 o Turismo Sustentável, para fundar o Conselho Brasileiro de Turismo Sustentável (CBTS), entidade
7 ro de Turismo Sustentável (CBTS), entidade intersetorial do turismo, apta a delimitar uma estratégia
8 limitar uma estratégia única e ampla para a certificação do turismo sustentável no Brasil e para o
9 ndependente. O III Workshop do Programa de Certificação do Turismo Sustentável - Brasil
10 , para a implementação de uma estratégia de certificação do turismo no Brasil. Este processo participat
11 credenciador internacional). O processo de Certificação do Turismo Sustentável no Brasil vem sendo
32 éis de selva planejam crescimento nos negócios Apostando no turismo ecológico, os hotéis de selv %
33 restaurante e dependências de serviço. `Oferecemos o puro turismo ecológico ao nosso turista, que
39 rcado de trabalho - José Zunquim - Presidente da BRAZTOA Turismo Receptivo no Brasil e Salao do
44 criança e no adolescente - Gerson Coutinho Estrela (DRT) - Turismo Sustentável e Infância
45 o Altenfelder - Amarques e Associados (Consultoria MTUR) Turismólogos, Guias de Turismo e
57 icos através da associação destes com certas palavras, como turismo ecológico, natural, romântico,
80 13. EcoTurismo Cultural - Ch. Guimarães - GO 14. Econautas Turismo Ambiental - SP 15. Espirito da
96 pta a delimitar uma estratégia única para a certificação do turismo sustentável no Brasil e para o
97 dos à nossa realidade. A principal meta da Certificação do Turismo Sustentável é a caracterização e
98 te viáveis e socialmente justos. O que é a Certificação em Turismo A Certificação é uma ferramenta
99 ntados de forma regionalizada. Esquemas de certificação de turismo representam um papel importan
100 responsabilidade e competitividade para o setor privado do turismo. Configuram-
Como identificar uma unidade fraseológica?
1 Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Su
2 de Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Sustentável (CBTS) Saiba tudo
3 ara estabelecer padrões de qualidade para as modalidades de turismo em nosso país. Ambientalistas,
4 antes de movimentos sociais, empresários e especialistas em turismo de todo o país reuniram5já Jardim Europa, durante o III Workshop de Certificação do Turismo Sustentável, para fundar o Conselh
6 o Turismo Sustentável, para fundar o Conselho Brasileiro de Turismo Sustentável (CBTS), entidade
7 ro de Turismo Sustentável (CBTS), entidade intersetorial do turismo, apta a delimitar uma estratégia
8 limitar uma estratégia única e ampla para a certificação do turismo sustentável no Brasil e para o
9 ndependente. O III Workshop do Programa de Certificação do Turismo Sustentável - Brasil
10 , para a implementação de uma estratégia de certificação do turismo no Brasil. Este processo participat
11 credenciador internacional). O processo de Certificação do Turismo Sustentável no Brasil vem sendo
32 éis de selva planejam crescimento nos negócios Apostando no turismo ecológico, os hotéis de selv %
33 restaurante e dependências de serviço. `Oferecemos o puro turismo ecológico ao nosso turista, que
39 rcado de trabalho - José Zunquim - Presidente da BRAZTOA Turismo Receptivo no Brasil e Salao do
44 criança e no adolescente - Gerson Coutinho Estrela (DRT) - Turismo Sustentável e Infância
45 o Altenfelder - Amarques e Associados (Consultoria MTUR) Turismólogos, Guias de Turismo e
57 icos através da associação destes com certas palavras, como turismo ecológico, natural, romântico,
80 13. EcoTurismo Cultural - Ch. Guimarães - GO 14. Econautas Turismo Ambiental - SP 15. Espirito da
96 pta a delimitar uma estratégia única para a certificação do turismo sustentável no Brasil e para o
97 dos à nossa realidade. A principal meta da Certificação do Turismo Sustentável é a caracterização e
98 te viáveis e socialmente justos. O que é a Certificação em Turismo A Certificação é uma ferramenta
99 ntados de forma regionalizada. Esquemas de certificação de turismo representam um papel importan
100 responsabilidade e competitividade para o setor privado do turismo. Configuram-
Como identificar uma unidade fraseológica?
1 Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Su
2 de Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Sustentável (CBTS) Saiba tudo
3 ara estabelecer padrões de qualidade para as modalidades de turismo em nosso país. Ambientalistas,
4 antes de movimentos sociais, empresários e especialistas em turismo de todo o país reuniram5já Jardim Europa, durante o III Workshop de Certificação do Turismo Sustentável, para fundar o Conselh
6 o Turismo Sustentável, para fundar o Conselho Brasileiro de Turismo Sustentável (CBTS), entidade
7 ro de Turismo Sustentável (CBTS), entidade intersetorial do turismo, apta a delimitar uma estratégia
8 limitar uma estratégia única e ampla para a certificação do turismo sustentável no Brasil e para o
9 ndependente. O III Workshop do Programa de Certificação do Turismo Sustentável - Brasil
10 , para a implementação de uma estratégia de certificação do turismo no Brasil. Este processo participat
11 credenciador internacional). O processo de Certificação do Turismo Sustentável no Brasil vem sendo
32 éis de selva planejam crescimento nos negócios Apostando no turismo ecológico, os hotéis de selv %
33 restaurante e dependências de serviço. `Oferecemos o puro turismo ecológico ao nosso turista, que
39 rcado de trabalho - José Zunquim - Presidente da BRAZTOA Turismo Receptivo no Brasil e Salao do
44 criança e no adolescente - Gerson Coutinho Estrela (DRT) - Turismo Sustentável e Infância
45 o Altenfelder - Amarques e Associados (Consultoria MTUR) Turismólogos, Guias de Turismo e
57 icos através da associação destes com certas palavras, como turismo ecológico, natural, romântico,
80 13. EcoTurismo Cultural - Ch. Guimarães - GO 14. Econautas Turismo Ambiental - SP 15. Espirito da
96 pta a delimitar uma estratégia única para a certificação do turismo sustentável no Brasil e para o
97 dos à nossa realidade. A principal meta da Certificação do Turismo Sustentável é a caracterização e
98 te viáveis e socialmente justos. O que é a Certificação em Turismo A Certificação é uma ferramenta
99 ntados de forma regionalizada. Esquemas de certificação de turismo representam um papel importan
100 responsabilidade e competitividade para o setor privado do turismo. Configuram-
Como identificar uma unidade fraseológica?
1 Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Su
2 de Turismo Sustentável (CBTS) Por: Conselho Brasileiro de Turismo Sustentável (CBTS) Saiba tudo
3 ara estabelecer padrões de qualidade para as modalidades de turismo em nosso país. Ambientalistas,
4 antes de movimentos sociais, empresários e especialistas em turismo de todo o país reuniram5já Jardim Europa, durante o III Workshop de Certificação do Turismo Sustentável, para fundar o Conselh
6 o Turismo Sustentável, para fundar o Conselho Brasileiro de Turismo Sustentável (CBTS), entidade
7 ro de Turismo Sustentável (CBTS), entidade intersetorial do turismo, apta a delimitar uma estratégia
8 limitar uma estratégia única e ampla para a certificação do turismo sustentável no Brasil e para o
9 ndependente. O III Workshop do Programa de Certificação do Turismo Sustentável - Brasil
10 , para a implementação de uma estratégia de certificação do turismo no Brasil. Este processo participat
11 credenciador internacional). O processo de Certificação do Turismo Sustentável no Brasil vem sendo
32 éis de selva planejam crescimento nos negócios Apostando no turismo ecológico, os hotéis de selv %
33 restaurante e dependências de serviço. `Oferecemos o puro turismo ecológico ao nosso turista, que
39 rcado de trabalho - José Zunquim - Presidente da BRAZTOA Turismo Receptivo no Brasil e Salao do
44 criança e no adolescente - Gerson Coutinho Estrela (DRT) - Turismo Sustentável e Infância
45 o Altenfelder - Amarques e Associados (Consultoria MTUR) Turismólogos, Guias de Turismo e
57 icos através da associação destes com certas palavras, como turismo ecológico, natural, romântico,
80 13. EcoTurismo Cultural - Ch. Guimarães - GO 14. Econautas Turismo Ambiental - SP 15. Espirito da
96 pta a delimitar uma estratégia única para a certificação do turismo sustentável no Brasil e para o
97 dos à nossa realidade. A principal meta da Certificação do Turismo Sustentável é a caracterização e
98 te viáveis e socialmente justos. O que é a Certificação em Turismo A Certificação é uma ferramenta
99 ntados de forma regionalizada. Esquemas de certificação de turismo representam um papel importan
100 responsabilidade e competitividade para o setor privado do turismo. Configuram-
Pesquisas em Tradução
 Peculiaridades de um autor / tradutor
 Corpus com textos do autor / tradutor
 Corpus de referência
 Keywords = características do autor / tradutor
OU
 Corpus com textos do tradutor 1
 Corpus com textos do tradutor 2
 Keywords = características do tradutor 1
Trinta primeiras
palavras-chave do
Corpus de Estudo
Português Original
(romances de Chico
Buarque).
Sergio Marra Aguiar,
2010
ParaConc
Busca paralela
Textos alinhados
Ref.: Sergio Marra Aguiar
Budapest
Comparando tradutores
(Gonçalves, 2006)
Concord: prosódias, compensações, decisões lexicais
1 Of course, the investment was a good one and
Segouin had managed to give the impression that it
was by a favour of friendship the mite of Irish money
was to be included in the capital of the concern.
HT: Sem dúvida, o investimento era bom. Ségouin procurara
demonstrar que a migalha de dinheiro irlandês seria incluída no
capital do negócio por consideração à amizade.
OS: Sem dúvida, o investimento era seguro e Ségouin dera a
impressão de que se tratava de um grande favor aceitar o
miserável dinheiro irlandês na capitalização do negócio.
Exemplos de Comparação
Palavras-chave
Comparação upn-os x d-upn-os:
N
W ORD FREQ. UPN-OS.TXT %
1
GALLAHER
58
1,18
2
CHANDLER
44
0,90
3
LITTLE
40
0,82
Comparação
upn-ht
x
d-upn-ht:
4
IGNATIUS
38
0,78
5
AMIGO
23
0,47
FREQ.
0
0
0
0
23
D-UPN-OS.LST %
KEYNESS
300,6
227,9
207,2
196,8
0,04
58,9
Exemplos de Comparação
Palavras-chave
Comparação de upn-os com upn-ht:
(Utilizando o comando“compare two lists”, da
ferramenta Wordlist)
N
1
2
WORD
IGNATIUS
PRA
FREQ.
UPN-OS.TXT %
FREQ.
UPN-HT.TXT %
0,12
KEYNESS
38
0,78
5
23,1
13
0,27
0
15,7
3
TÁ
7
0,14
0
8,5
4
TE
6
0,12
0
7,3
5
VOLTA
6
0,12
0
7,3
6
VOU
6
0,12
0
7,3
7
CONTA
6
0,12
0
7,3
8
DEU
6
0,12
0
7,3
6
0,12
0
7,3
41
0,84
16
9
10
NÉ
DISSE
0,39
7,3
Resumindo...
A Linguística de Corpus
 permite obter uma grande quantidade de dados de
forma rápida
 evidencia dados que não seria possível “descobrir”
de forma manual
 fornece dados objetivos para embasar afirmações
 permite fazer pesquisas que seriam impossíveis de
forma manual
Bibliografia básica
 McEnery, Tony & Hardie, Andrew. 2012. Corpus
Lingusitics: Method, theory and practice.
Cambridge:Cambridge University Press
 Berber Sardinha, Tony. 2004. Linguística de Corpus.
Barueri, SP: Manole.
 Gries, Stefan Th. 2009. What is corpus linguistics.
Language and Linguistics Compass 3 (2009): 1–17.
 Gries, Stefan Th. 2010. Corpus linguistics and
theoretical linguistics - A love–hate relationship? Not
necessarily… International Journal of Corpus
Linguistics, 327–343. John Benjamins Publishing
Company
Puxando a sardinha para
nossa brasa...
 Tagnin, S.E.O. 2013. O Jeito que a gente diz. Capítulo 5.
São Paulo: Disal.
 Alves, F. & Tagnin, S.E.O. Corpora e ensino de tradução: o
papel do automonitoramento e da conscientização
cognitivo-discursiva no processo de aprendizagem de
tradutores novatos. In Viana, V. & Tagnin, S.E.O. 2010.
Corpora no ensino de línguas estrangeiras. São Paulo:
HUB Editorial, 189-203.
 Tagnin, S. & Bevilacqua, C. 2013. Corpora na
Terminologia. São Paulo: HUB Editorial.
 Viana, V. & Tagnin, S. 2015. Corpora na Tradução. São
Paulo: HUB Editorial.
Descargar

TAGNIN, S.E.O.. Linguística de Corpus e Tradução. 2015.