O Centro Ramón Piñeiro presenta a nova versión do Corpus de Referencia do Galego, que permite recoñecer formas con seseo

21 Xuño 2024

O Pazo de San Roque en Santiago acolleu este venres 21 de xuño a presentación da versión 4.1 do Corpus de Referencia do Galego Actual (CORGA), unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades e representativa do uso lingüístico do galego actual. Esta nova versión ten como unha das súas principais novidades a de permitir o recoñecemento de formas coas de seseo.

Na cita participou o secretario xeral da Lingua, Valentín García, quen puxo en valor este recurso informático polo seu carácter “potente, flexíbel, amigábel e tamén innovador” e que considerou “de suma utilidade” para extraer datos da lingua galega actual. De igual xeito, salientou que facilitar estudos desde múltiples perspectivas e investigación “cada vez máis amplas e variadas”.

O secretario xeral da Lingua lembrou que se trata dun corpus documental aberto a través de Internet que abrangue cronoloxicamente desde 1975 ata a actualidade. Ten como obxectivo, segundo concretou, o de “fornecer datos para o estudo da lingua galega actual” desde múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica ou comunicativa.

Valentín García salientou o valor da actualización do Corpus xa que con este “novo paso” amplíase a un total de 45.665.649 as palabras ortográficas (54.737.277 elementos gramaticais), o que supón “un corpus pequeno pero cunha rica codificación”. Neste senso, considerou de relevancia estas cifras, xa que asegurou que “contrastan con corpus noutras linguas de miles de millóns de palabras construídos a partir de Internet, pero cunha escasa codificación”.

Ademais do recoñecemento de formas con seseo, o secretario xeral da Lingua apuntou que esta ferramenta presenta utilidades innovadoras como un dicionario de frecuencias que ten en conta o índice de dispersión, “co que nos achega resultados moito máis relevantes sobre a frecuencia do léxico”, enxalzou.

Tamén dixo que este recurso permite xa desde a última versión recoñecemento de formas con gheada ou a posibilidade de realizar estudos variados desde a perspectiva de xénero, tendo en conta o emprego da linguaxe inclusiva e atendendo á discriminación dos resultados en función do sexo do autor e/ou interlocutor e habilitando cruzamentos entre o sexo dun autor e o sexo dos personaxes.

Outros artigos

Martes con mais calor e sol e sen cambios nas próximas semanas

Durante o martes agárdanse ceos despexados en xeral. Posibilidade dalgún banco de néboa illado en zonas de interior. As temperaturas mínimas experimentarán un lixeiro ascenso, quedando as máximas sen cambios repetindo valores do luns. Os ventos soprarán do nordés,...

+

Unha muller faleceu logo de ser atopada inconsciente na auga en Muros

Foi rescatada por unha mariscadora e, malia os intentos por reanimala, os servizos sanitarios só puideron confirmar o seu pasamento. Minutos despois das 14:15 horas, os xestores do 112 Galicia tiveron constancia dos feitos por vez primeira, a través dunha chamada de...

+

Publicidade

Revista en papel

Opinión

“Vergüenza o sinvergüenza”. José Antonio Constenla

“Vergüenza o sinvergüenza”. José Antonio Constenla

Desvergonzado es aquel “que habla u obra con desvergüenza”, y también elque “no muestra vergüenza por cometer acciones que se reputan inmorales”. Yvergüenza es la “turbación del ánimo ocasionada por la conciencia de algunafalta cometida, o por alguna acción deshonrosa...

“Para desfrutar dela”. Luís Celeiro

“Para desfrutar dela”. Luís Celeiro

As festas de verán en Galicia son ledicia, festa, música e baile, verbena e fartura. Pola mañáé outra cousa, os traballadores teñen que respectar o horario e andar dereitiños cara aolugar do traballo. Ou cara ao ordenador que espera coa lámpada acendida e co disco...