Notas de prensa

Preséntase o novo Corpus Documental do Galego actual (CORGA) elaborado polo Centro Ramón Piñeiro

A versión ampliada desta ferramenta lingüística elaborada polo Centro Ramón Piñeiro para a Investigación en Humanidade incorpora preto de 32 millóns de palabras, das que algo máis de 400.000 son formas diferentes. Proceden de xornais, semanarios, revistas, ensaios e ficción (novela, relato curto e teatro).

O secretario xeral de Política Lingüística, Valentín García, presentou en rolda de prensa o novo Corpus Documental do Galego Actual (CORGA). A versión ampliada desta ferramenta lingüística elaborada polo Centro Ramón Piñeiro para a Investigación en Humanidades (CRPIH) -dependente da Consellería de Cultura, Educación e Ordenación Universitaria- incorpora preto de 32 millóns de palabras, das que algo máis de 400.000 son formas diferentes.

Segundo sinalou o secretario xeral durante a súa intervención “a nova versión ampliada do CORGA pon a disposición da comunidade científica e da cidadanía en xeral novas posibilidades para o estudo e a investigación lingüística nunha aposta polas tecnoloxías da información e da comunicación, e polos recursos tecnolóxicos en galego, tal e como sinala o Plan Xeral de Normalización da Lingua Galega”.

Participaron na presentación, amais de García Gómez, os directores do CORGA, Guillermo Rojo e María Sol López, e os responsables da coordinación lingüística e informática do proxecto, os investigadores da Universidade de Santiago de Compostela Eva Domínguez e Mario Barcala, respectivamente.

Corpus de Referencia do Galego Actual

O CORGA é un corpus documental desenvolvido no CRPIH e integrado por distintos tipos de textos -xornais, semanarios, revistas, ensaios e textos de ficción (novela, relato curto e teatro)- que abrangue temporalmente desde o ano 1975 ata a actualidade e que está codificado no estándar XML (eXtensible Markup Language).

A nova versión ampliada –a 1.7, dispoñible na rede no enderezo http://corpus.cirp.es/corga consta de case 32 millóns de palabras, das que algo máis de 400.000 son formas diferentes. Sobre este conxunto de formas ortográficas é posible consultar palabras ou expresións en xeral, por tipos de texto, épocas, áreas temáticas ou calquera combinación dos parámetros anteriores. Ademais, disponse dun sistema de consulta da nómina de autores e obras que permite buscar que obras ou autores están no corpus, saber que número de palabras totais e documentos corresponde á busca realizada ou que cantidade de palabras contén o CORGA nunha certa área temática, período de tempo etc.

Ferramentas tecnolóxicas avanzadas

O CRPIH traballa tamén na mellora de varias ferramentas que posibilitan as consultas máis avanzadas e propician dar un salto cualitativo nas posibilidades de busca sorteando as limitacións impostas polas consultas por forma ortográfica. Así, rematouse o subcorpus de adestramento xornalístico e de narrativa que utiliza o Etiquetador-Lematizador do Galego Actual (XIADA) -constituído na nova versión ampliada por algo máis de 600.000 formas ortográficas (correspondentes a case 750.000 elementos gramaticais)-, que está a disposición gratuíta da comunidade investigadora na versión 2.6 do Corpus de Referencia do Galego Actual etiquetado (CORGAetq) no enderezo http://corpus.cirp.es/corgaetq.

O CRPIH dispón tamén doutros dous recursos lingüísticos de especial interese para a comunidade investigadora como son a listaxe completa de formas ortográficas diferentes presentes no CORGA e o lexicón xeral utilizado polo etiquetador XIADA. Ambos os dous poden obterse cunha licenza de uso libre para facilitar e difundir o seu emprego en diferentes proxectos en http://corpus.cirp.es/corga e http://corpus.cirp.es/xiada, respectivamente.

Os sistemas e recursos relacionados con este proxecto destínanse ás persoas interesadas no estudo da lingua galega actual nos diferentes eidos, fornecéndoos con ferramentas que lles permitan, por unha banda, obter datos de diversa índole relacionados co emprego da lingua e, pola outra, desenvolver ferramentas de análise do galego cada vez máis sofisticadas.

O Centro Ramón Piñeiro

O CRPIH é un organismo dependente da Consellería de Cultura e Educación que se ocupa de levar adiante e de difundir proxectos de investigación lingüística, literaria, histórica e antropolóxica centrados en Galicia. Actualmente, as súas liñas de traballo xiran arredor da lingüística aplicada, a literatura medieval, a recuperación de publicacións literarias ou a identidade colectiva dende un punto de vista antropolóxico.

Gabinete de Comunicación da Xunta de Galicia, 2015-06-30

Actualidad

Foto del resto de noticias (radio-na-biblio.jpg) O programa Radio na Biblio, que vai polo noveno ano en funcionamento, chega este curso a 245 centros de ensino que contan cun laboratorio de radio no que traballan as competencias vencelladas á alfabetización mediática, lingüísticas ou de expresión escrita e oral, entre outros. Con nove cursos en marcha, trátase dun programa consolidado que aproveita a posta en marcha dunha emisora de radio na biblioteca para traballar habilidades e destrezas e que permite o tratamento de contidos curriculares mediante metodoloxías activas e innovadoras que facilitan a aprendizaxe. Ademais, as actuais tecnoloxías da información e da comunicación facilitan o uso da radio como ferramenta pedagóxica de gran alcance para a difusión dos proxectos e iniciativas do centro educativo.
Foto de la tercera plana (aitor-martinez.jpg) Tivo lugar a na cerimonia de entrega dos XVIII Premios Nacionais de Artesanía 2025, na que resultaron premiadas dúas candidaturas galegas. O artesán Aitor Martínez López de Arbina (Tomiño), especializado en tornería de madeira, resultou gañador na categoría Produto e a Fundación Artesanía de Galicia obtivo o recoñecemento na categoría Promociona para Entidades Públicas polo seu proxecto 'Artesanía no Prato'.

Notas

O encontro 'Tecnoloxía en galego: resultados de ILENIA– Proxecto Nós' serviu para dar a coñecer os resultados dos últimos tres anos de traballo do Proxecto Nós no marco de ILENIA, unha iniciativa orientada a avanzar en recursos e capacidades en tecnoloxías lingüísticas, en particular para as linguas do Estado. Datos, casos de uso e ferramentas abertas de tradución automática, síntese de voz e modelos lingüísticos en galego déronse a coñecer neste foro que se desenvolveu no Centro de Estudos Avanzados.
O Centro de Arte Fundación Maria José Jove (FMJJ) en colaboración con Normal, o Espazo de Intervención Cultural da Universidade da Coruña (UDC), celebran hoxe xoves a terceira edición do encontro Dentro–Fora, que se enmarca no programa de residencias artísticas que ambas as institucións desenvolven conxuntamente.
PUBLICIDAD
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
HOMENAXES EGERIA
PUBLICACIONES