O Tesouro informatizado da Lingua Galega (TILGA)
Once mill?s de palabras galegas est? recollidas no Tesouro Informatizado da Lingua Galega, un traballo colosal feito polo Instituto da Lingua Galega (cuxo director ?Ant? Santamarina) e ?froito dun convenio do ILG coa Direcci? Xeral de Pol?ica ling?stica da Xunta de Galicia desde 1986.
Esta base de datos est?constitu?a por escolmas de distintos textos publicados dende 1612 ?actualidade (revistas, libros...) e pode consultarse en Internet no enderezo : https://ti.usc.es/TILG/
Tesouro informatizado da lingua galega moderna.
Este traballo empezou en 1985. Foi ideado por Ant? Santamarina (quen fixo a
m?ima recompilaci? da lingua galega no seu "Diccionario
de diccionarios" en CD Rom
). Desenvolveu as ferramentas inform?icas para concordar e lematizar Arturo
Reguera. Colaboraron moitos bolseiros (na axuda definitiva que ser?dentro duns
d?s ir?a lista completa). Imaxin|software desenvolveu a ferramenta para que se
poida ver por internet. E a Conseller? de Educaci? (hoxe de Educaci? e
Ordenaci? Universitaria) a trav? da Direcci? Xeral de Pol?ica Ling?stica
forneceu o financiamento necesario desde 1986.
Esta base de datos cont? textos do galego moderno, desde 1612 ?actualidade. Ten 11.409.358 rexistros e arredor de 90 mil lemas. Est?pensada como corpus para a fabricaci? dun diccionario pero seguramente a s? utilidade non se esgota niso.
Para investigadores e curiosos da nosa lingua, ?rese ao p?lico. ?un corpus
xa bastante representativo pero non pechado a?da. Na medida en que se dispo?
de forza e medios seguirase engadindo textos.
O que cont? a base de datos
NB 1. Hai palabras gramaticais de frecuencia alt?ima (o, a, os, que, de etc.)
que s?se lematizaron parcialmente. Representan case un tercio das palabras
dunha obra.
NB 2. Tampouco se lematizaron os nomes propios opacos. O Mi? da secuencia
demarcada como <1r? *Mi?1> non aparece (pero si o Gafos de <1r? dos Gafos>).
Coa lista de nomes propios farase no seu d? unha base de datos ?parte.
Polo de agora s?se proporcionan as ferramentas de busca por lema e por palabra.
Buscas por lema: Baixo un lema aparecen t?alas formas flexivas dunha palabra:
canto, cantas…, cantei, cantaches…, cantase, cantases… aparecen debaixo do lema
CANTAR. Branco, branca, brancos… branqui? aparecen debaixo de BRANCO. Tam?
reducimos a un lema as variantes fon?icas e morfol?icas dunha mesma palabra;
as? baixo REPARAR aparecen arreparar, arroparar, raparar, reparar, roparar en
infinitivo ou nunha forma flexiva; baixo a forma can?ica INGUA aparecen ingua,
?gola, engua, ingle, ?goa, ?gola, ingre e ingue (cos seus plurais, de
habelos).
NB 3. Hai palabras que te?n unha frecuencia alt?ima; por ex. o verbo VIR ten
en todo o corpus 42.363 ocorrencias; neste caso a consulta non devolve
resultados; ten que refinar a busca restrinx?doa a un per?do de anos ou
escollendo por autores, por obras ou por categor?s.
NB 4. Para a lematizaci? usouse como ferramenta unha gram?ica baseada no VOLGA
(Vocabulario ortogr?ico da lingua galega, tam? do ILG). No VOLG hai moitos
casos en que se remite dunha variante ‘condenada’ para outra ‘canonizada’ (por
ex. no VOLGA ten entrada CALAVEIRA pero dise que a voz correcta ?CAVEIRA);
nestes casos hai dous (ou m?s) lemas en lugar do lema ?ico como vimos en
INGUA.
NB 5. ?probable que o consultante te? d?idas sobre a variante que os
fabricantes desta base escolleron como lema. Moitos galegos saben que o cast.
“avellano” se di ABELAIRA, ABELEIRA e a?da de outros xeitos. Pode facer (neste
caso) d?s cousas: (a) escribir na caixa do lema abel* e o programa dev?velle
unha lista de lemas; clique nun dos que lle ofreza; (b) escribir na caixa do
lema abel?ira e o programa dev?velle o lema atopado; (c) ou ben escribir na
caixa de consulta por palabras unha forma que te? probabilidades de figurar
como ‘palabra’ e xa lle indica un lema baixo o que buscar.
Buscas por palabra. Nesta opci? o programa busca calquera conxunto de letras
que na escrita te?n polo menos un espacio en branco ?dereita ou ?esquerda (ou
dos dous lados). Se busca casas s?aparecer? os contextos en que figura esa
palabra exacta (pero non os que conte?n casa ou casi?).
NB 6. Pode usar tam? os dous comod?s que acabamos de mencionar na busca por
lemas en NB 5: o * (ex.: mosca*) no remate dunha palabra para ‘un un ou m?s
caracteres’; ou o ? (ex.: b?ilar) en calquera lugar dunha palabra para indicar
‘un car?ter calquera’. Se hai coincidencias (ou ?posible) abrirase unha vent?
cunha lista para que escolla.
Buscar segunda palabra (ademais do lema ou da palabra). Hai palabras que te?n
diferentes graos de solidariedade e adoitan sa? contiguas ou pr?imas. O
programa permite estas buscas. Escriba, por exemplo, na caixi? de lema farrapo
e na de segunda palabra gaita e prema buscar.
NB 7. Pode haber lemas hom?imos discriminados cunha nota ?dereita; por ex. hai
varios mallar. Se busca lema mallar e segunda palabra centeo non lle devolve
resultados (porque non escribiu o lema completo). Probe a escribir mallar* e
escolla o mallar correcto. Po? na caixa de segunda palabra centeo e prema
buscar.
Refinar a busca. Nos dous casos (busca por lema e por palabra) p?ese, e ?
veces ?necesario como se indicou en NB 3, restrinxir a busca ou ben a un
per?do de anos ou ben a uns autores/obras determinados. Para a busca por anos
non se necesita m?s que escribir o lema ou a palabra que se busca, escoller nas
caixas correspondentes o ano de inicio e o de remate, e clicar buscar; para a
busca por autores ou obras, escribir o lema ou a palabra que se busca,
seleccionar os autores ou obras desexados, ir ata o final da t?oa, clicar
enviar a consulta, e clicar despois en buscar.
Buscas por categor? gramatical. Restrinxe as buscas a unha categor?
determinada. Se algu? quere traballar por exemplo sobre os perfectos fortes
galegos consultar?os lemas de cada un dos verbos que te?n perfecto forte (p.
ex. FACER, VIR, ESTAR etc.) e restrinxir?a busca (abrindo a vent?de opci? de
categor?) aos perfectos (e se quere tam? aos pluscuamperfectos e imperfectos
de subxuntivo) seleccionando as persoas correspondentes. Te? en conta que son
seis formas can?icas e seis variantes. Lembre ir ata o final da lista de
categor?s, clicar enviar a consulta, e clicar despois en buscar.
Ant? Santamarina