X hits on this document

87 views

0 shares

0 downloads

0 comments

7 / 28

8

zulú

               0

s/es

9

crisis

               0

                 0     

10

patrón

               0

-

-

-

11

patron

-

a

es

s

12

aprendiz

               0

a

-

s

13

aprendic

-

-

es

-

Los tipos 5, 11 y 13 responden a lexemas existentes sólo para las formas de plural.

Si bien algunos fenómenos como el anteriormente descrito permiten ser sistematizados con exhaustividad, otros presenten paradigmas bastante más complejos, aún tratándose de fenómenos de naturaleza aparentemente no muy diferente, como por ejemplo el caso del diminutivo. Naturalmente que es preciso restringir las expectativas de análisis a aquella casuística que tiene probabilidades altas de aparecer en un texto especializado (ver apartado 5).

El paso siguiente en el proceso de análisis de un término como ‘ordenador de quinta generación’ es el de concebir el sintagma como una unidad lexemática compleja, un multi-word unit.  El traductor humano sabe que ‘ordenador de quinta generación’ es un término complejo porque se corresponde con un único concepto, porque aparece recurrentemente en el texto, y porque cumple determinadas restricciones sintácticas como la ausencia de determinante en el sintagma nominal modificador5. La recurrencia y la carencia de determinante pueden ser detectadas por el ordenador. La existencia del concepto, sin una base de conocimiento, no.

Reconocer la existencia de MWU en los primeros estadios del análisis permite obviar el análisis de las relaciones sintácticas entre el núcleo y sus modificadores y evitar los problemas de sobregeneración de resultados que podrían surgir en el caso de que se produjera algún tipo de ambigüedad estructural6, es decir, que el programa considerara la posibilidad de que el sintagma preposicional dependiera de más de un núcleo en la oración (en nuestro ejemplo ‘de quinta generación’ puede ser considerado modificador de ‘ordenadores’ o de ‘aparición’.) En el caso de que el MWU no fuera identificado como tal, el programa analizaría la secuencia según los constructores previstos para el análisis del léxico simple. Una de las estrategias propuestas, una vez que el término ha sido detectado como término complejo, es la de unir los constituyentes mediante guiones bajos, y otorgar la categoría del núcleo y todas sus propiedades al nuevo lexema, léase

5 Ver los criterios para identificar un término en Cabré, M.T. (1992)

6 La ambigüedad es connatural al lenguaje humano. Otros tipos de ambigüedad son la referencial (‘sacó la mosca de la sopa y se la comió’ –la mosca o la sopa), la léxica (polisemia) y la funcional (‘pan para comer’ –para ser comido, ‘gafas para leer’ –*para ser leídas).

Document info
Document views87
Page views87
Page last viewedTue Dec 06 12:26:19 UTC 2016
Pages28
Paragraphs363
Words12419

Comments