X hits on this document

94 views

0 shares

0 downloads

0 comments

12 / 28

1500 nuevos términos por año académico.

Las áreas de trabajo son, básicamente, técnicas y científicas, pero no se excluye la posibilidad de que otro tipo de áreas temáticas puedan ser representadas. Los alumnos escogen el área temática libremente, acogiéndose, si lo desean, a las propuestas de los profesores de nuestra universidad que se prestan como asesores. Cada término está orientado temáticamente a través de tres ejes: el área temática, el título del trabajo (el cual indica el nivel máximo de especifidad) y el código de la UNESCO que más se ciña a ese nivel de especifidad.

La definición de esta base de conocimiento se ha realizado en el entorno MultiTerm para Windows, y pretende ser una plataforma para representar la información léxica de modo jerarquizado y relacionado. En su día se escogió este programa por haber sido acordado como estándar por la Coordinadora Interuniversitaria para la Normalización Lingüística e Informática (CINLI) de los países de habla catalana.

Para establecer una base de conocimiento multilingüe hemos partido de cuatro criterios: relatividad conceptual, atomización del conocimiento, exclusión de la gramática y navegación conceptual.

Cuando se comparan distintas lenguas se están comparando sistemas conceptuales diferentes, lo cual presenta una dificultad en la búsqueda de equivalencias léxicas. Debemos aceptar, pues, la relatividad de nuestro propio sistema y sustituir el ideal de biunivocidad y exactitud por un sistema plural, para que, a ser posible, ningún sistema conceptual ejerza de director de orquesta. Cada tema tiene como lengua de referencia aquella en la que cuenta con mayor refinamiento conceptual.

La información debe representarse en la forma más atomizada posible. Esto puede provocar que la información contenida en la definición y/o el contexto sea repetida en un campo particularizado (por ejemplo color, forma, etc.). Pero, precisamente, la finalidad de la atomización del conocimiento es evitar caer en la trampa lingüística de la paráfrasis definitoria. Esto puede ser importante cuando queremos representar y comparar terminologías de culturas distantes. Además, aunque la estructura de campos semánticos (unos 50) no es un conjunto completo ni perfecto, una información atomizada puede facilitar el tratamiento y la utilización de la información si se pretende integrar la base de datos en un sistema de procesamiento más amplio, como pueda ser un sistema de TA.

Las cuestiones gramaticales no atañen a la base de datos, la cual se centra en la estructura conceptual. Esto significa, por ejemplo, que los nombres predicativos y los verbos son considerados sinónimos conceptuales. Así, ejecución y ejecutar son dos índices para el mismo concepto. Se adjunta información sobre la categoría gramatical de cada denominación; así se indica género femenino en los sustantivos de lenguas flexivas como silla o mesa, pero se dejará abierto en los demás casos para que pueda flexionar según la gramática de la lengua en cuestión.

La flexibilidad en la representación de la información de la que BACUS hace gala también afecta al nivel monolingüe. Por ejemplo: podemos recoger un concepto constituido por la expresión ejecutar un programa, pero este término complejo también puede ser representado si creamos una entrada para programa y la relacionamos con otra entrada correspondiente al concepto ejecutar a través de un determinado campo que indique el tipo de relación verbo-objeto existente (el campo 'argument of'). Esta última representación es preferible, porque todos los conceptos que tengan a programa como hiperónimo pueden quedar asimismo relacionados con ejecutar a través de las relaciones cruzadas.

El léxico no se compone sólo de denominaciones que vinculan la realidad con los conceptos, sino también de relaciones interléxicas que configuran una red de familias. Estas

Document info
Document views94
Page views94
Page last viewedFri Dec 09 11:44:54 UTC 2016
Pages28
Paragraphs363
Words12419

Comments