O Corpus de Referencia do Galego Actual supera os 45 millóns de palabras e xa recoñece a gheada e o seseo
O CORGA chegou á súa versión 4.1 acadando un total de 45.665.649 palabras ortográficas (54.737.277 elementos gramaticais), o que supón dous millóns e medio máis de vocábulos que os que incorporaba a versión 4.0, presentada a comezos de 2022. Trátase dun 'corpus pequeno pero cunha rica codificación, o cal contrasta con corpus noutras linguas de miles de millóns de palabras construÃdos a partir de Internet, pero cunha escasa codificación', explica a profesora da USC MarÃa Sol López MartÃnez, codirectora do proxecto xunto a Guillermo Rojo, profesor emérito da USC.

CORGA está coordinado, na súa parte lingüÃstica, por Eva MarÃa DomÃnguez Noya e, na súa parte informática, por NLPgo Technologies S.L.
O CORGA é un corpus documental aberto que abrangue cronoloxicamente dende 1975 ata a actualidade, cuxo obxectivo é fornecer datos para o estudo da lingua galega actual dende múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica, discursiva, etc, e a súa mellora realÃzase de xeito continuo no marco do convenio entre o Centro Ramón Piñeiro para a Investigación en Humanidades a través da SecretarÃa Xeral da Lingua e a Universidade de Santiago de Compostela. Con este corpus é posible, por exemplo, identificar a partir de que ano se empeza a utilizar unha determinada palabra ou cando deixa de empregarse de forma cotián por cambios tecnolóxicos ou sociais, entre outros, ou localizar bibliografÃa que trate dun determinado tema.
Esta nova versión presenta utilidades innovadoras coma a recuperación de información pola modalidade inventario ou un dicionario de frecuencias que ten en conta o Ãndice de dispersión, co que achega resultados moito máis relevantes sobre a frecuencia do léxico. Asà mesmo, facilita o recoñecemento de formas con gheada e seseo e a fai posible realizar estudos variados dende a perspectiva de xénero: tendo en conta o emprego da linguaxe inclusiva non binaria directa, atendendo á discriminación dos resultados en función do sexo da persoa autora ou interlocutora ou habililitando cruzamentos entre o sexo dunha persoa autora e o dos personaxes.
Ademais póñense á disposición da comunidade dúas novas ferramentas no Etiquetador/Lematizador do Galego Actual XIADA: na sección Demostración, calquera persoa pode etiquetar morfosintacticamente arquivos de texto sen necesidade de instalar programas, sen ter que se rexistrar e sen precisar coñecementos técnicos e na pestana Flexionador accédese a un flexionador verbal e nominal que proporciona os elementos do paradigma, asociados sempre a unha etiqueta morfosintáctica e con indicacións sobre a súa normatividade. A maiores, o flexionador conéctase co CORGA, de xeito que se poden observar os elementos do paradigma en múltiples contextos reais de uso.
En sÃntese, indica MarÃa Sol López, o sistema CORGA-XIADA “é unha ferramenta potente, flexible, amigable e tamén innovadora, de suma utilidade para extraer datos da lingua galega actual”.
Universidade de Santiago de Compostela (USC), 2024-06-28
Actualidad

O conselleiro do Mar, Alfonso Villares, defendeu unha reforma da PolÃtica Pesqueira Común (PPC) para que esta se adapte ás necesidades da cadea mar-industria galega. Esta reforma debe incluÃr unha rexionalización da normativa europea e, por tanto, ter en conta as propostas e participación proactiva das autoridades rexionais na futura toma de decisións que se leven a cabo en Bruxelas neste senso. Asà o expuxo este martes na reunión mantida ao máis alto nivel polo Comisario de Pesca e Océanos, Costas Kadis, co ministro de Agricultura, Pesca e Alimentación, Luis Planas, os responsables das comunidades autónomas do ramo, e as entidades representantes do sector pesqueiro, acuÃcola e das mulleres.

O presidente da Xunta, Alfonso Rueda, informou de que o Executivo autonómico aprobou hoxe 'solicitar formalmente un informe ao Consello Consultivo de Galicia' sobre 'as posibilidades legais' do traspaso das competencias para xestionar os permisos de traballo das persoas doutros paÃses. O obxectivo é avaliar a posibilidade de asumir esta función en tres áreas concretas: as autorizacións iniciais para que unha persoa estranxeira poida traballar na comunidade, os permisos para traballos de tempada e os de larga estancia por motivos de estudos ou formación.
Notas
O Teatro Principal acollerá entre o 5 e 16 de maio as cinco representacións que integran o programa da XVI Mostra Internacional de Teatro Universitario de Pontevedra (Miteu), que permitirá coñecer tanto as montaxes das aulas e grupos dos tres campus da UVigo, como dous espectáculos chegados de Portugal e México. Promovida pola VicerreitorÃa do campus, coa colaboración do Concello, trátase dunha mostra con entrada gratuÃta.
'Vida, biografÃas, bioficcións' é o tÃtulo do primeiro simposio que organiza a Cátedra RosalÃa de Castro da USC, que botou a andar este mes de abril con varias iniciativas culturais. O encontro desenvólvese ata o 30 de abril no Salón de Graos da Facultade de FiloloxÃa da USC. O simposio estrutúrase en tres paneis e catro mesas redondas, ademais de dúas conferencias.