Notas de prensa

Presentada a versión 4.0 do Corpus de Referencia do Galego Actual

O Corpus de Referencia do Galego Actual (CORGA) que abrangue dende 1975 ata a actualidade, ten como obxectivo fornecer datos para o estudo da lingua galega actual dende múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica ou comunicativa, entre outras. A versión 4.0 presentada este xoves, consta de 43.162.364 palabras ortográficas (51.451.088 elementos gramaticais).

Presenta ademais utilidades como a recuperación de información pola modalidade inventario, o recoñecemento automático mediante regras lingüísticas dos apreciativos en -iño, os elativos en -ísimo, e unha boa parte das formas con gheada, ou a posibilidade de realizar estudos dende a perspectiva de xénero: ben tendo en conta as formas con grafías innovadoras para a linguaxe inclusiva, ben atendendo á discriminación dos resultados en función do sexo do autor. Trátase dunha “ferramenta potente, flexible, amigable e tamén innovadora, de suma utilidade para extraer datos da lingua galega actual”, explicou María Sol López Martínez, investigadora principal do proxecto xunto a Guillermo Rojo.

Este corpus documental atópase integrado por distintos tipos de textos representativos da lingua galega actual que están codificados na linguaxe estándar XML (eXtensible Markup Language). A codificación practicada afecta principalmente á información bibliográfica e á estruturación do documento, e posibilita realizar consultas, con ou sen expresións regulares, por palabra completa, parte dunha palabra ou varias palabras ou partes, contiguas ou non, segundo diversos criterios que poden combinarse dependendo das necesidades do usuario: período temporal, área temática, tipo de documento, ou parte do documento, entre outras.

O corpus enriqueceuse coa etiquetaxe automática de todos os documentos que o integran, e mais coa incorporación de transcricións ortográficas de programas de radio nas que se aliña o texto coa voz, co que na recuperación de información é posible reproducir o fragmento sonoro que corresponde ao resultado que se amosa.

A presente aplicación facilita a obtención de datos lingüísticos mediante unha ferramenta de consulta que dá cabida ás diferentes aproximacións de busca: palabras ortográficas, elementos gramaticais, clases de palabras, etiquetas, trazos morfolóxicos, lemas ou hiperlemas. Sobre estes datos, o sistema permite extraer as frecuencias simples e completas, visualizar a información recuperada en forma de concordancias ou obter o inventario dos elementos solicitados para a totalidade do corpus ou para cada un dos parámetros clasificatorios (lustro, medio, orixe, xénero, subtipo de documento, área temática ou sexo do autor). Engádese ademais nesta versión a posibilidade de procurar nunha obra específica e por un certo autor ou polo sexo deste e, así mesmo, ofrécese un sistema de consulta da nómina de autores e obras que conforman o corpus e mais unha primeira versión para a procura de coaparicións.

Universidade de Santiago de Compostela, 2022-02-10

Actualidad

Foto del resto de noticias (20250704-ue.jpeg) EuroPCom, a Conferencia Europea de Comunicación Pública, é a maior reunión anual de expertos en comunicación pública de Europa organizada polo Comité Europeo das Rexións en colaboración coa Comisión Europea, o Parlamento Europeo, o Consello, o Banco Europeo de Investimentos, o Comité Económico e Social Europeo e a Organización para a Cooperación e o Desenvolvemento Económicos. O evento ofrece unha plataforma para explorar as últimas tendencias, iniciativas e ideas no ámbito da comunicación pública. O director xeral de Relacións Exteriores e coa Unión Europea, Jesús Gamallo, participou nesta Conferencia organizada polo Comité Europeo das Rexións, e celebrada baixo o lema 'Máis alá das palabras. Unha historia de confianza'.
Foto de la tercera plana (rapa-bestas-sabucedo.jpg) O Diario Oficial de Galicia publica hoxe a declaración de Ben de Interese Cultural da Rapa das Bestas de Sabucedo por considerar acreditado o seu valor sobranceiro como patrimonio inmaterial do pobo galego, ao tratarse dunha das festas máis antigas de Galicia que conta, como mínimo, con tres séculos de historia. Este recoñecemento supón a aplicación de inmediato do réxime de tutela da Lei de Patrimonio Cultural e, polo tanto, o maior nivel de protección. Esta distinción, que se suma á de Festa de Interese Turístico Internacional acadada en 2007, chega tras o visto e prace a este decreto por parte do Consello da Xunta este pasado luns, 30 de xullo, e logo de completarse o expediente administrativo, no que constan os dous informes preceptivos dos órganos consultivos favorables.

Notas

Os días 24 e 25 de setembro terá lugar o I Congreso Transnacional do Campus Auga da Xuventude Investigadora (Aquaxi´25). A cita nace “co propósito de ofrecer un espazo de diálogo e difusión de resultados de investigación, promovendo o intercambio de coñecementos, a aprendizaxe compartida e a creación de redes de colaboración entre a nova xeración científica”. Aquaxi´25 celebrarase no edificio Politécnico do campus de Ourense e está organizado polo Campus Auga.
Galicia xa conta co seu 'retrato xenético' máis preciso ata a data, logo de que persoal investigador da USC e do Instituto de Investigación Sanitaria teña desenvolvido un estudo pioneiro de secuenciación completa do xenoma sobre unha mostra representativa da poboación galega. O traballo achega unha base fundamental para entender o diagnóstico xenético de enfermidades, o deseño de estratexias de medicina personalizada e o descubrimento de variantes xenéticas con relevancia clínica.
PUBLICIDAD
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
HOMENAXES EGERIA
PUBLICACIONES