Noticias

O Centro Ramón Piñeiro presenta a nova versión do Corpus Documental do Galego Actual

Presentouse no Pazo de San Roque a nova versión do Corpus Documental do Galego Actual, unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades representativa do uso lingüístico do galego actual. O Centro ten entre as súas finalidades fundacionais o deseño e o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das tecnoloxías da información e da comunicación, e o do CORGA é un dos proxectos de investigación que se centran en darlle cumprimento a este obxectivo. O CORGA é un corpus documental desenvolvido por medio dun convenio de colaboración coa USC, e integrado por distintos tipos de textos: xornais, semanarios, revistas, ensaios e textos de ficción.

O secretario xeral de Política Lingüística, Valentín García, participou esta mañá no Pazo de San Roque, na presentación da nova versión do Corpus Documental do Galego Actual (CORGA 3.2.), unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades (CRPIH) representativa do uso lingüístico do galego actual.

Valentín García recordou que o Ramón Piñeiro, centro de investigación dependente da Consellería de Cultura e Turismo, “ten entre as súas finalidades fundacionais o deseño e o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das tecnoloxías da información e da comunicación” e que “o do CORGA é un dos proxectos de investigación que se centran en darlle cumprimento a este obxectivo”.

Na presentación da versión 3.2. do CORGA, o representante da Xunta estivo acompañado por Manuel González, coordinador científico do CRPIH; Marisol López, directora da Área de Lingüística do CRPIH e do proxecto CORGA; Guillermo Rojo, investigador colaborador do Ramón Piñeiro; Eva Domínguez e Mario Barcala, responsables, respectivamente, da coordinación lingüística e informática do proxecto.

Nova versión 3.2.

O CORGA é un corpus documental desenvolvido no CRPIH, por medio dun convenio de colaboración coa USC, e integrado por distintos tipos de textos -xornais, semanarios, revistas, ensaios e textos de ficción (novela, relato curto e teatro)- que abrangue temporalmente desde o ano 1975 ata a actualidade e que está codificado no estándar XML (eXtensible Markup Language). A amplitude de documentos que o configuran e os criterios empregados na súa selección permiten considerar este corpus representativo do uso lingüístico do galego actual.

O corpus da versión ampliada -accesible no enderezo http://corpus.cirp.gal/corga-, foi enriquecido automaticamente coa lematización e etiquetaxe morfosintáctica dos seus textos e contén 40.178.271 palabras ortográficas (48.184.012 elementos gramaticais) pertencentes maioritariamente a distintos tipos de textos escritos, mais tamén inclúe 25 horas de transcricións ortográficas de programas de radio nas que se aliña o texto coa voz.

As principais novidades que mostra fronte á versión anterior son a visualización da información recuperada en forma de expresións coincidentes, de xeito que os resultados iguais se reducen a un, e a presentación, a modo de dicionario de frecuencias, de listaxes personalizadas relativas a formas, etiquetas, lemas e hiperlemas mediante os parámetros lingüísticos e clasificatorios dispoñibles no sistema. Estas funcionalidades veñen completar as que xa se deron a coñecer na versión 3.1. do CORGA, agora ampliada.

Facilidade de consulta

A flexibilidade e potencialidade da aplicación de consulta permite empregar nunha mesma procura comodíns, operadores booleanos, sensibilidade a acentos ou maiúsculas e variables clasificatorias dos documentos combinándoos cos distintos tipos de modalidade de busca, por palabras ortográficas ou elementos gramaticais, ben sucesivos ben descontinuos, e mesmo reducir os resultados a expresións coincidentes ou obter frecuencias personalizadas de formas, lemas, etiquetas etc., o que converte o CORGA nunha ferramenta moi útil para extraer datos da lingua galega actual de tipo léxico, gramatical, terminolóxico, fraseolóxico, ou discursivo.

Para etiquetar e lematizar automaticamente os documentos do CORGA, a fin de dar un salto cualitativo na recuperación de información e formular consultas utilizando información gramatical, empregouse o XIADA, un etiquetador estatístico de alta precisión cuxa versión 2.7., tamén mellorada, está á disposición pública.

R., 2019-12-16

Actualidad

Foto del resto de noticias (economia-porcentaxe.jpg) O presidente da Xunta, Alfonso Rueda, anunciou hoxe que a Xunta destinará un total de 270 millóns de euros a paliar os efectos do conflito en Oriente Medio na nosa comunidade. Durante a sesión de control no Pleno do Parlamento de Galicia en resposta ás preguntas dos grupos parlamentarios, o titular do Goberno galego lembrou, ao respecto da situación en Oriente Medio, que o Consello da Xunta xa analizou hai dúas semanas 'os primeiros impactos' e que Galicia foi 'a primeira comunidade autónoma en falar cos clústeres'. Nesta liña, o presidente anunciou que o vindeiro Consello autorizará 'un plan de máis de 150 millóns' para atender aos sectores afectados, que se sumará aos máis de 120 millóns que suporá para Galicia financiar as iniciativas do Goberno central a este respecto.
Foto de la tercera plana (escenasdocambio-2026.png) Para a edición de 2026, chegan desde o outro lado do Atlántico La Cura e El Vacío (ambas estreas en España), nas que o coreógrafo cubano Julio César Iglesias dirixe á prestixiosa Compañía Colombiana de Danza Contemporánea. Tamén a conferencia escénica Arder Épica (Cap. 1) na que o artista brasileiro Reinaldo Ribeiro constrúe unha nova memoria colectiva a partir das cinzas que deixou o incendio do Museo Nacional do Brasil en 2018. Forma parte tamén da programación a instalación inmersiva Hecatombe II: Movementos e rituais para a renovación do mundo, da colombiana de orixe indíxena Martha Hincapié Charry, que rescata saberes ancestrais de líderes nativos das primeiras nacións americanas.

Notas

A National Aeronautics and Space Administration, NASA, confirmaba o pasado martes de xeito oficial que o 1 de abril será a primeira data na que se intentará lanzar desde o Centro Espacial Kennedy de Florida Artemis II, a primeira misión lunar tripulada desde 1972. 'Podo confirmar que todo está en orde e non hai ningún impedimento para o lanzamento de Artemis, se as condicións meteorolóxicas o permiten', afirmou a viceadministradora e responsable de exploración espacial da axencia espacial estadounidense, Lori Glanze.
A iniciativa, que este ano desenvolve a súa terceira edición, está promovida por CLARIAH-GAL, o nodo galego de CLARIAH-ES, infraestrutura que reúne especialistas de diferentes institucións do Estado español co obxectivo de impulsar o desenvolvemento de recursos, ferramentas e metodoloxías dixitais para a investigación en humanidades, artes e ciencias sociais, no marco dos consorcios europeos CLARIN e DARIAH.
PUBLICIDAD
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
HOMENAXES EGERIA
PUBLICACIONES