Notas de prensa

Na procura de miles de voces que lle aprendan á tecnoloxía a entender e falar galego

Que unha persoa galegofalante poida interactuar co mundo dixital na súa lingua precisa do desenvolvemento da tecnoloxía que o faga posible e para que esta tecnoloxía entenda e fale galego son necesarias gravacións de voces (datasets), que permiten adestrar os algoritmos de intelixencia artificial que usan os axentes conversacionais por voz, en dominios como, por exemplo, a saúde ou os trámites administrativos, que resultan especialmente necesarios no caso das persoas maiores ou con algunha discapacidade.

Nun informe que presentaron as investigadoras do Centro de Investigación en Tecnoloxías de Telecomunicación, atlanTTic da UVigo, Carmen García Mateo e Laura Docío Fernández, no marco da súa participación no proxecto europeo ELE (European Language Equality), púxose de manifesto que aínda queda moito por facer para que as tecnoloxías da fala en galego funcionen igual de ben que o fan noutras linguas nas que si se dispoñen de moitos recursos, como por exemplo o inglés.

É neste contexto no que nace falAI, un proxecto desenvolvido por atlanTTic e a empresa Balidea, que ten o obxectivo de recoller voces en galego que permitan xerar ferramentas de interacción co mundo dixital en galego. Co cancelo #A30frases, o centro de investigación e a empresa procuran a participación do maior número de persoas posible, que de xeito anónimo, graven a súa voz lendo 30 frases, indicadas a través da plataforma falai.balidea.com, coas que se compoñerá un corpus lingüístico que permita adestrar un asistente conversacional por voz. O proxecto foi presentado publicamente este mediodía no edificio Redeiras da UVigo, nun acto presidido polo alcalde de Vigo, Abel Caballero, e no que tamén participaron a vicerreitora de Comunicación e Relacións Institucionais, Mónica Valderrama; a investigadora principal do proxecto, Laura Docío e o director xeral de Balidea, Lorenzo Rodríguez.

Valderrama asegurou que “para a institución este proxecto é un auténtico orgullo”, ademais dun exemplo da colaboración público-privada e do compromiso das enxeñarías coa lingua. Pola súa banda, o director xeral de Balidea referiuse a falAI como un “fito importante tecnoloxicamente e por ser en galego, porque non hai ningunha tecnoloxía en galego”, razón pola que “sumará moito á tecnoloxía a fala”. Mentres, Abel Caballero felicitou aos promotores da iniciativa e emprazou ás e aos vigueses e viguesas e aos habitantes da área metropolitana e do sur de Galicia en xeral a participar no proxecto que permitirá “ que o diálogo que estamos mantendo de forma permanente coas máquinas, responda na nosa propia lingua e co noso propio acento”, dixo Abel Caballero.

Voces anónimas, diversas e con finalidade investigadora

“Temos o obxectivo de acadar 6000 participantes, cumprindo ademais os criterios de que 30 horas de gravación correspondan a persoas de máis de 50 anos; 10 horas correspondan a cada provincia e cun equilibrio de xénero de 40-60% ”, explica Laura Docío Fernández, investigadora principal de falAI, do Departamento de Teoría do Sinal e Comunicacións da Escola de Enxeñaría de Telecomunicación da UVigo. Docío, xunto á catedrática do mesmo departamento, Carmen García Mateo, e ao tamén investigador e persoal do departamento de I+D+i de Balidea, Andrés Piñeiro Martín, conforman o equipo que está a desenvolver falAI. “O único requisito que deben cumprir as persoas que queiran participar no proxecto é que sexan maiores de idade. Canta maior diversidade de voces teñamos mellor”, sinala Docio, que sinala que as voces se recollerán de forma anónima, “non se recollen datos persoais sensibles que poidan identificar ás persoas participantes. Ademais, estas voces estarán dispoñibles con fins de investigación no ámbito das tecnoloxías da fala”, detalla a investigadora de atlanTTic.

Ademais de recadar voces que falen en galego, que permitirán xerar datasets neste idioma en dominios como a saúde ou os trámites administrativos, falAI tamén ten o obxectivo de facer un estudo que sirva de guía no deseño e posta en marcha de axentes conversacionais por voz en linguas con baixos recursos, con dasets moi limitados en canto ao número de horas de gravacións dispoñibles e á cantidade doutros recursos lingüísticos. “Un punto importante tamén é o deseño destes conxuntos de datos (que frases gravar, o seu número, como medir e validar a calidade das gravacións de forma automática… ) para poder adestrar os algoritmos de aprendizaxe que usan os axentes conversacionais por voz e utilizalos en escenarios con poucos recursos, como poden ser linguas minoritarias como o croata, danés, checo, búlgaro. etc.”, explica Laura Docío.

As orixes do proxecto

O proxecto falaAI enmárcase dentro da colaboración que as investigadoras de atlanTTic, Laura Docío e Carmen García Mateo teñen en marcha coa empresa Balidea desde hai dous anos e que se formalizou coa concesión dunha axuda da Xunta de Galicia para o desenvolvemento da tese de doutoramento de Andrés Piñeiro no campo dos axentes conversacionais por voz en galego, en particular en aplicacións onde a poboación obxectivo sexa xente maior.

O equipo de investigación, conformado por personal de Balidea e as investigadoras da UVigo, tamén acadou 22.500€ de financiamento nunha convocatoria aberta do proxecto europeo European Language Equality-ELE para a contribución na Strategic research, innovation and implementation agenda for achieving full digital language equality in Europe by 2030 (SRIA). Na convocatoria seleccionáronse nove proxectos e un deles foi o presentado por Balidea, e no que ía como parte do equipo de traballo a UVigo, titulado Building E2E spoken-language understanding systems for virtual assistants in low-resources scenarios. “O proxecto ten como un dos seus obxectivos a realización dun estudio sobre o deseño e posta en marcha de axentes conversacionais por voz en linguas de baixos recursos lingüísticos. A experiencia gañada con falAI é fundamental para a realización deste estudo”, explica Docío.

Universidade de Vigo, 2023-02-20

Actualidad

Foto del resto de noticias (mitec-42-2025.jpg) A Mostra Internacional de Teatro Cómico e Festivo de Cangas presentou hoxe a programación da súa 42ª edición, que se celebrará entre os días 22 de xuño e 6 de xullo no Auditorio Municipal Xosé Manuel Pazos Varela, así como nas rúas e noutros espazos da vila do Morrazo, que acollerán 26 espectáculos e un nutrido programa de actividades lúdicas e sectoriais. O certame, organizado desde 1984 pola Asociación Cultural Xiria, é un dos poucos festivais de teatro europeos cuxo principal selo de identidade é a comedia, unha marca consolidada e referente da produción escénica deste xénero en calquera das súas vertentes: negra, branca, xestual, contemporánea, circense, dramática, musical e, dende hai máis dunha década, tamén na danza.
Foto de la tercera plana (musica-clasica.jpg) A praza Conde de Fontao de Foz será o enclave elixido para a actuación extraordinaria do festival o 31 de xullo con La Carroza Del Real, mentres que o destacado pianista Denis Kozhukhin abrirá oficialmente o ciclo de concertos o 12 de agosto na Fortaleza de Alfoz. O 13 de agosto a Real Filharmonía de Galicia e o Coro da Comunidade de Madrid realizarán o primeiro concerto sinfónico-coral no que interpretarán o Réquiem de Mozart na Catedral de Mondoñedo. A clausura do XII Festival Bal y Gay será co barítono galego Borja Quiza, o 21 de agosto, no Teatro Pastor Díaz de Viveiro, cita na que tamén participarán o pianista Javier Carmena e a mezzosoprano Andrea Rey, nunha proposta que mesturará as raíces galegas e españolas.

Notas

Afondar no papel que a evidencia científica pode e debe xogar nas decisións políticas e na implantacións de políticas públicas foi o obxectivo central da conferencia impartida pola presidenta do Consejo Superior de Investigaciones Científicas, Eloísa del Pino, na UVigo. Sustentar as actuacións públicas na ciencia, defendeu Del Pino, posibilita en primeiro termo 'ser eficiente cos recursos, porque sabes que é máis probable que unha política funcione, aínda que non é unha garantía de éxito'.
A Sociedade Europea de Biomateriais recoñeceu cun dos seus premios europeos de doutoramento Julia Polak 2025 a Ana Iglesias Mejuto e Miguel Pereira Silva, que realizaron a súa tese de doutoramento en iMATUS da USC. O galardón distingue persoal investigador novo que completou un doutoramento de excelencia no ámbito dos biomateriais e a enxeñería de tecidos, valorando tanto a calidade da súa investigación como a súa formación internacional.
ACTUALIDAD GALICIADIGITAL
Blog de GaliciaDigital
PUBLICIDAD
HOMENAXES EGERIA
PUBLICACIONES