Noticias

O Centro Ramón Piñeiro presenta a nova versión do Corpus Documental do Galego Actual

Presentouse no Pazo de San Roque a nova versión do Corpus Documental do Galego Actual, unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades representativa do uso lingüístico do galego actual. O Centro ten entre as súas finalidades fundacionais o deseño e o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das tecnoloxías da información e da comunicación, e o do CORGA é un dos proxectos de investigación que se centran en darlle cumprimento a este obxectivo. O CORGA é un corpus documental desenvolvido por medio dun convenio de colaboración coa USC, e integrado por distintos tipos de textos: xornais, semanarios, revistas, ensaios e textos de ficción.

O secretario xeral de Política Lingüística, Valentín García, participou esta mañá no Pazo de San Roque, na presentación da nova versión do Corpus Documental do Galego Actual (CORGA 3.2.), unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades (CRPIH) representativa do uso lingüístico do galego actual.

Valentín García recordou que o Ramón Piñeiro, centro de investigación dependente da Consellería de Cultura e Turismo, “ten entre as súas finalidades fundacionais o deseño e o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das tecnoloxías da información e da comunicación” e que “o do CORGA é un dos proxectos de investigación que se centran en darlle cumprimento a este obxectivo”.

Na presentación da versión 3.2. do CORGA, o representante da Xunta estivo acompañado por Manuel González, coordinador científico do CRPIH; Marisol López, directora da Área de Lingüística do CRPIH e do proxecto CORGA; Guillermo Rojo, investigador colaborador do Ramón Piñeiro; Eva Domínguez e Mario Barcala, responsables, respectivamente, da coordinación lingüística e informática do proxecto.

Nova versión 3.2.

O CORGA é un corpus documental desenvolvido no CRPIH, por medio dun convenio de colaboración coa USC, e integrado por distintos tipos de textos -xornais, semanarios, revistas, ensaios e textos de ficción (novela, relato curto e teatro)- que abrangue temporalmente desde o ano 1975 ata a actualidade e que está codificado no estándar XML (eXtensible Markup Language). A amplitude de documentos que o configuran e os criterios empregados na súa selección permiten considerar este corpus representativo do uso lingüístico do galego actual.

O corpus da versión ampliada -accesible no enderezo http://corpus.cirp.gal/corga-, foi enriquecido automaticamente coa lematización e etiquetaxe morfosintáctica dos seus textos e contén 40.178.271 palabras ortográficas (48.184.012 elementos gramaticais) pertencentes maioritariamente a distintos tipos de textos escritos, mais tamén inclúe 25 horas de transcricións ortográficas de programas de radio nas que se aliña o texto coa voz.

As principais novidades que mostra fronte á versión anterior son a visualización da información recuperada en forma de expresións coincidentes, de xeito que os resultados iguais se reducen a un, e a presentación, a modo de dicionario de frecuencias, de listaxes personalizadas relativas a formas, etiquetas, lemas e hiperlemas mediante os parámetros lingüísticos e clasificatorios dispoñibles no sistema. Estas funcionalidades veñen completar as que xa se deron a coñecer na versión 3.1. do CORGA, agora ampliada.

Facilidade de consulta

A flexibilidade e potencialidade da aplicación de consulta permite empregar nunha mesma procura comodíns, operadores booleanos, sensibilidade a acentos ou maiúsculas e variables clasificatorias dos documentos combinándoos cos distintos tipos de modalidade de busca, por palabras ortográficas ou elementos gramaticais, ben sucesivos ben descontinuos, e mesmo reducir os resultados a expresións coincidentes ou obter frecuencias personalizadas de formas, lemas, etiquetas etc., o que converte o CORGA nunha ferramenta moi útil para extraer datos da lingua galega actual de tipo léxico, gramatical, terminolóxico, fraseolóxico, ou discursivo.

Para etiquetar e lematizar automaticamente os documentos do CORGA, a fin de dar un salto cualitativo na recuperación de información e formular consultas utilizando información gramatical, empregouse o XIADA, un etiquetador estatístico de alta precisión cuxa versión 2.7., tamén mellorada, está á disposición pública.

R., 2019-12-16

Actualidad

Foto del resto de noticias (educacion-infantil-.jpg) Galicia reforza por terceiro curso consecutivo o seu liderado na taxa de escolaridade de 0 a 3 anos e achégase ao 65 %, máis de 15 puntos por riba da media de España, segundo os últimos datos oficiais que vén de publicar hoxe o Ministerio de Educación, Formación Profesional e Deportes. Deste xeito, Galicia segue sendo a comunidade autónoma onde máis familias poden acudir a unha escola infantil totalmente gratuíta. As cifras oficiais revelan que Galicia rexistrou no curso 2024-2025 unha taxa do 64,3 % de escolarización, máis de catro puntos por riba do 60,6 % acadado no período anterior. Esta porcentaxe mantén á comunidade ao nivel dos países con maiores índices de benestar en Europa, como Suecia ou Dinamarca.
Foto de la tercera plana (veran.jpg) No marco do Plan de Actuacións da Xunta de Galicia fronte aos posibles efectos das altas temperaturas sobre a saúde, vénse de activar o nivel 1 de alerta a diversas áreas da comunidade autónoma por episodio de calor. Meteogalicia informa que a partir da xornada do venres 27, as altas presións volverán localizarse ao norte da península Ibérica, achegando unha masa de aire moi cálida de orixe norteafricana. Isto fará que as temperaturas experimenten significativos ascensos, tanto nos valores mínimos como nos máximos. Este ascenso de temperaturas comezará a notarse desde ese mesmo día, cando en moitos puntos de Galicia se superarán os 30ºC, e mesmo os 35ºC, en puntos do interior.

Notas

A Universidade de Santiago acolleu o acto de constitución da Rede Española de Filosofía da Intelixencia Artificial, que nace con vocación interdisciplinar e transversal ao integrar máis de cen investigadoras e investigadores de todo o Estado interesados nos aspectos ontolóxicos, conceptuais, epistemolóxicos, éticos, políticos e sociais da IA. A sesión constitutiva tivo lugar na propia Facultade, cuxo decano Xavier Donato é promotor desta iniciativa que fixará a súa sede en Compostela e que organizará o primeiro congreso nacional de filosofía da IA.
Do 26 ao 28 de setembro, o concello ourensán de Lobios acollerá o Xurés 2025, que aglutina a celebración do IV Seminario Internacional de Educación Social, a IV Convivencia Profesional e Interuniversitaria da Educación Social e o festival musical Xurés Son. A cita, o maior encontro internacional de profesionais da educación social, está promovida polo Colexio de Educadoras e Educadores Sociais de Galicia e coordinada pola Facultade de Educación e Traballo Social da UVigo.
PUBLICIDAD
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
HOMENAXES EGERIA
PUBLICACIONES