Notas de prensa

O Corpus de Referencia do Galego Actual supera os 45 millóns de palabras e xa recoñece a gheada e o seseo

O CORGA chegou á súa versión 4.1 acadando un total de 45.665.649 palabras ortográficas (54.737.277 elementos gramaticais), o que supón dous millóns e medio máis de vocábulos que os que incorporaba a versión 4.0, presentada a comezos de 2022. Trátase dun 'corpus pequeno pero cunha rica codificación, o cal contrasta con corpus noutras linguas de miles de millóns de palabras construídos a partir de Internet, pero cunha escasa codificación', explica a profesora da USC María Sol López Martínez, codirectora do proxecto xunto a Guillermo Rojo, profesor emérito da USC.

CORGA está coordinado, na súa parte lingüística, por Eva María Domínguez Noya e, na súa parte informática, por NLPgo Technologies S.L.

O CORGA é un corpus documental aberto que abrangue cronoloxicamente dende 1975 ata a actualidade, cuxo obxectivo é fornecer datos para o estudo da lingua galega actual dende múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica, discursiva, etc, e a súa mellora realízase de xeito continuo no marco do convenio entre o Centro Ramón Piñeiro para a Investigación en Humanidades a través da Secretaría Xeral da Lingua e a Universidade de Santiago de Compostela. Con este corpus é posible, por exemplo, identificar a partir de que ano se empeza a utilizar unha determinada palabra ou cando deixa de empregarse de forma cotián por cambios tecnolóxicos ou sociais, entre outros, ou localizar bibliografía que trate dun determinado tema.

Esta nova versión presenta utilidades innovadoras coma a recuperación de información pola modalidade inventario ou un dicionario de frecuencias que ten en conta o índice de dispersión, co que achega resultados moito máis relevantes sobre a frecuencia do léxico. Así mesmo, facilita o recoñecemento de formas con gheada e seseo e a fai posible realizar estudos variados dende a perspectiva de xénero: tendo en conta o emprego da linguaxe inclusiva non binaria directa, atendendo á discriminación dos resultados en función do sexo da persoa autora ou interlocutora ou habililitando cruzamentos entre o sexo dunha persoa autora e o dos personaxes.

Ademais póñense á disposición da comunidade dúas novas ferramentas no Etiquetador/Lematizador do Galego Actual XIADA: na sección Demostración, calquera persoa pode etiquetar morfosintacticamente arquivos de texto sen necesidade de instalar programas, sen ter que se rexistrar e sen precisar coñecementos técnicos e na pestana Flexionador accédese a un flexionador verbal e nominal que proporciona os elementos do paradigma, asociados sempre a unha etiqueta morfosintáctica e con indicacións sobre a súa normatividade. A maiores, o flexionador conéctase co CORGA, de xeito que se poden observar os elementos do paradigma en múltiples contextos reais de uso.

En síntese, indica María Sol López, o sistema CORGA-XIADA “é unha ferramenta potente, flexible, amigable e tamén innovadora, de suma utilidade para extraer datos da lingua galega actual”.

Universidade de Santiago de Compostela (USC), 2024-06-28

Actualidad

Foto del resto de noticias (filmoteca-20251103.jpg) O cinema arxentino volve ser protagonista da programación da Filmoteca de Galicia, que este mes recibirá as cineastas María Aparicio e Lucía Seles con motivo das retrospectivas que lles dedica. Tamén visitará a sede da cinemateca da Xunta na Coruña o director do Buenos Aires Festival Internacional de Cine Independiente, Javier Porta Fouz, para presentar unha copia restaurada de Nueve reinas, ademais de coñecidos nomes do noso audiovisual nas novas entregas da sección Off Galicia, do ciclo Espello Video Cine e da sesión inaugural do 20º aniversario do programa educativo Cinema en Curso. A nova carteleira mensual inclúe, así mesmo, varias proxeccións do Cormorán Film Fest, as últimas de Centenario Maurice Pialat e as películas que cada ano selecciona a Asociación Amigos da Ópera coincidindo coa súa Temporada Lírica, entre outras citas.
Foto de la tercera plana (dependencia-02.jpg) O presidente da Xunta, Alfonso Rueda, informou de que o Consello da Xunta aprobou hoxe a sinatura do convenio do nivel acordado para 2025 entre a Consellería de Política Social e Igualdade e o Instituto de Maiores e Servizos Sociais (Imserso) destinado ao sistema de atención á dependencia das comunidades autónomas e que, no caso de Galicia, ascende a 105 millóns de euros sufragados entre o Estado e a Xunta, só tres máis que os asignados o exercicio pasado. Tal e como informou Rueda, Galicia recibirá algo máis de 52 millóns de euros, grazas a que a Xunta cumpre con éxito os obxectivos recollidos neste acordo: diminución da lista de agarda, mellora na calidade dos servizos, etc.

Notas

Neste 2025 está a celebrarse o Ano Internacional da Ciencia e a Tecnoloxía Cuánticas, coincidindo co centenario da publicación, en 1925, dalgúns dos artigos que sentaron as bases da mecánica cuántica, coa conseguinte revolución da nosa comprensión do mundo natural. Co gallo desta efeméride, a Semana da Ciencia do Instituto Galego de Física de Altas Enerxías (IGFAE), centro mixto da USC e a Xunta de Galicia, achégase desde perspectivas moi diversas a esta disciplina, esencial para o desenvolvemento da física moderna.
A aparición de mutacións fármaco resistentes constitúe un grave problema na loita contra os microorganismos patóxenos. Os métodos actuais, baseados na análise de resistencia xenotípica, non permiten predicir os cambios evolutivos, provocando a ineficacia dos tratamentos. Facer fronte á fármaco resistencia é o obxectivo do proxecto Preres, Predicting protein evolutionary trajectories toward resistance against antiretroviral treatments.
PUBLICIDAD
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
HOMENAXES EGERIA
PUBLICACIONES