5 de mayo de 2015

Introducción

  • Introducción
Problemas
  • Problemas / Estructura del léxico
Objetivos
  • Objetivo / Hiperónimos
Hipótesis
  • Hipótesis / Teoría
Metodología
  • Método 
Problema 1
  • Definición
Problema 2
  • Componentes
Problema 3
  • Estructura
Lexicología
  • Léxico universal
Lexicografía
  • Diccionario universal
Lingüística computacional
  • Lingüística computacional / Computador
Metadata
  • Volumen léxico
  • A-Z
------------------------------
Colección de palabras
Introducción

En Español Internacional encuentra los últimos adelantos de la lingüística, recopilados de cuatro lenguas modernas, español, francés, holandés e inglés, que pretenden dar respuesta a los interrogantes más importantes relacionados con la lengua y el pensamiento humano.

La lengua es una habilidad natural del hombre que sirve para expresar el pensamiento organizado en frases. Los dos componentes básicos de la lengua son el léxico, o conjunto total de palabras, y la sintaxis, o conjunto de reglas para combinarlas y modificarles el sentido (gramática). Esto quiere decir que no significa lo mismo el hombre ataca al perro que el perro ataca al hombre, aunque sean exactamente las mismas cinco palabras.

La gramática se ha estudiado extensivamente desde Panini. En esta área de la lingüística todo está copado, lo único que falta es escribir las gramáticas de las lenguas que todavía no tienen escritura (etnolingüística).

Pero el léxico, que es el componente más importante de la lengua, es prácticamente desconocido. Por ejemplo, en el artículo de la lengua de la enciclopedia brilla por su ausencia, aparece dentro de la terminología de la semántica.

Existen dos métodos para organizar todas las palabras del léxico. El primer método es el orden alfabético, que sirve para facilitar la búsqueda de las palabras por medio de la escritura, como en los diccionarios tradicionales, pero no tiene en cuenta el significado. Y el segundo sistema es el temático, como en los tesauros, que sirve para estimular la escritura porque las palabras están ordenadas según el contexto, por ejemplo, en un artículo se agrupa el vocabulario de una carrera de caballos en un hipódromo, caballo, jockey, carrera, apuesta, veloz, etc. (Roget 1852).

Pero ninguno de los dos sistemas permite conocer la estructura del léxico. El diccionario mental en el cerebro no tiene organizadas las palabras en orden alfabético porque la memoria funciona por asociación de ideas. Como tampoco almacena todas las ideas presentes en un contexto en el mismo campo semántico, como el sustantivo caballo, el verbo apostar y el adjetivo veloz.
J. Trier (1894–1970) es el autor de la teoría de los campos semánticos (1931), que define como conjuntos de palabras agrupadas por relaciones de significado en un marco conceptual específico, que sirven para expresar una visión del mundo.

La teoría de los campos semánticos tiene diversas aplicaciones, aunque su mayor hito es haber sido la precursora de la lingüística cognitiva. A pesar del artículo escueto de la Wikipedia, que la desconoce por completo.
La teoría de Trier es la base de esta investigación que intenta determinar, delimitarordenar los campos semánticos para desvelar la estructura del léxico.

El mayor reto de la lingüística en el siglo XXI es descubrir la estructura del lenguaje natural para aplicarlo al lenguaje computacional. El léxico es el mayor obstáculo para la inteligencia artificial, falta mucho para que un robot entienda el significado de la palabra mano.

F. Cuéllar Moyano
Profesional en Lenguas Modernas (U. de los Andes, 1997)
Máster en Lengua y Literatura Española (U. de Ámsterdam, 2007)
------------------------------ 
Problemas
¿Cómo se estructura el léxico?
Llevamos 24 siglos haciéndonos la misma pregunta que sigue sin resolver.

Según Aristóteles (384–322 a. C.), la lengua tiene lógica, las palabras se generan por analogíade manera regular y sistemática, como zoología, zoólogozoológicoornitología, ornitólogo, ornitológico.

La estructura del léxico siempre ha intrigado a los grandes pensadores. Desde Aristóteles, filósofo griego (384–322 a. C.), se ha tratado de encontrar la estructura del léxico pero la labor ha sido infructuosa debido al volumen que comprende más de 80.000 palabras, con miles de acepciones o significados diferentes de la misma palabra. Por ejemplo, la palabra mano contiene 36 acepciones y unos 250 modismos, significa que podría estar presente en 36 campos semánticos, sin incluir las expresiones idiomáticas.
El lexicólogo que intente asignar a todas las palabras un campo semántico enfrenta tres problemas: definirlos, delimitarlos y ordenarlos. La existencia de estos problemas indica que el vocabulario no está hecho de campos semánticos definidos donde cada palabra tiene un lugar fijo (Jackson y Zé Amvela 2006).
  • ¿Cuáles son los campos semánticos?
  • ¿Cuáles son sus componentes?
  • ¿Cómo se ordenan los campos semánticos?
Los tres problemas se podrían resumir de la siguiente manera:
  • Problema 1 / Definición
  • Problema 2 / Componentes
  • Problema 3 / Estructura
------------------------------ 

Objetivo

El objetivo principal de esta investigación es establecer los hiperónimos de todos los campos semánticos con el fin de delimitar el léxico de cada una de las áreas del conocimiento humano.  

Otros objetivos son:
  • Delimitar los campos semánticos.
  • Estandarizar las definiciones de cada campo semántico.
  • Ubicar las palabras en cada campo semántico.
  • Ordenar los campos semánticos.
  • Establecer los hiperónimos de cada campo semántico.
De acuerdo a esta teoría, la única forma de delimitar los campos semánticos es por medio de los hiperónimos. Para establecer los límites se asume que todas las palabras son objeto de estudio en un área del conocimiento humano, por ejemplo, las palabras basura, gracias, hueco y prostituta, son estudiadas por algún científico en su propia disciplina.

De esta manera cada palabra tiene un lugar fijo en el vocabulario y se determina el número exacto de sinónimos, hipónimos y cohipónimos.
------------------------------
Las palabras se almacenan por categorías
Hipótesis

La teoría de la semántica estructural es utilizada por Cuéllar como telón de fondo para formular su hipótesis sobre la estructura del léxico.

Esta investigación se basa en la hipótesis de que el léxico está estructurado en campos semánticos claramente definidos y delimitados, por tanto, todas las palabras tienen un lugar único y fijo dentro de la jerarquía del léxico.
  • Los campos semánticos están claramente definidos y delimitados.
  • Todas las palabras se pueden clasificar en algún campo semántico.
  • Los campos semánticos se ordenan por hiperónimos.
Los campos semánticos se ordenan dentro de una jerarquía léxica basada en la subordinación del significado.
La estructura del léxico no es subjetiva ni intuitiva, como se ha creido hasta ahora. Anteriormente, los lexicólogos ordenaban los campos semánticos a su parecer. El primer campo semántico para Roget (1852) es la ginecología, comienza con el parto (Medicina), y para Casares (1942), un siglo después, es Dios (Teología), que en la estructura de Cuéllar aparece de último por ser el más abstracto de todos.

No me parece lógico empezar a ordenar el léxico con un tema tan abstracto como la teología. Estoy seguro que esas no son las primeras palabras que aprende un niño.
------------------------------
Metodología

Muestra
Para esta investigación se desarrolló un método de análisis lexicológico porque no existe ninguno.

Las palabras se analizan desde el punto de vista léxico, de acuerdo a los diez campos semánticos establecidos.

Se hizo uso de la etimología para poder comparar el léxico de las lenguas romances y germánicas.

De ahora en adelante es posible cuantificar y ordenar de manera alfabética y cronológica cada campo semántico.
------------------------------
Problema 1

¿Cuáles son los campos semánticos?
No existe una definición precisa de los campos semánticos, ni tampoco se han podido delimitar. Los autores que hablan de campos semánticos, como E. Coseriu, B. Pottier, J. Lyons y J. Greimas, han insistido en la necesidad metodológica de fijarles límites. Este es el mayor problema que todavía no sea resuelto de manera satisfactoria.

Aristóteles clasificó en el Organon el conocimiento humano en diez categorías, cada una asociada a una clase gramatical (sustantivo, adjetivo, verbo, adverbio). Él pensaba que la naturaleza de la mente determina que todos los seres humanos tengan las mismas experiencias conceptuales.

Así como Aristóteles escogió diez categorías, Cuéllar clasificó las palabras en diez campos semánticos, un número arbitrario que se basa en el volumen léxico establecido en esta investigación.

El léxico de una lengua se puede clasificar en diez campos semánticos.
Los campos semánticos se definen de acuerdo a los hiperónimos, por ejemplo, mueble es el hiperónimo del diseño industrial (interiorismo).

Estos son los 34 campos semánticos registrados en los diccionarios de la investigación. Algunos campos semánticos son inexistentes en los diccionarios de español, como el diseño textil o la cosmética, a pesar de que el volumen léxico es mayor al de la astronomía o la veterinaria.
Con los campos semánticos claramente delimitados se pueden analizar todas las palabras de una lengua desde el punto de vista lexicológico. Por ejemplo, el verbo escarbar pertenece a cuatro campos semánticos diferentes.
  • 1. Rayar o remover repetidamente la superficie de la tierra, ahondando algo en ella, según suelen hacerlo con las patas el toro, el caballo, la gallina, etc. (zoología)
  • 2. Mondar, limpiar los dientes o los oídos sacando la suciedad introducida en ellos. (medicina)
  • 3. Avivar la lumbre, moviéndola con la badila. (ingeniería)
  • 4. Inquirir curiosamente lo que está algo encubierto y oculto, hasta averiguarlo. (derecho)
 ------------------------------
Problema 2
¿Cuáles son sus componentes?
La principal dificultad radica en escoger las palabras fundamentales de cada campo semántico. El campo semántico de muchas palabras parece evasivo, no se sabe si el tomate debe ser asignado a la fruticultura o la horticultura, si el tractor pertenece a la ingeniería mecánica o a la agricultura o, finalmente, si el sabor es un término de la medicina o de la gastronomía.

Este problema se presenta porque las definiciones son inconsistentes y no siguen un patrón regular ni sistemático, algunas palabras se definen con sinónimos y otras con explicaciones. La definición de chimpancé no se parece a la de saraguate ni a las definiciones de los otros miembros del campo semántico de la primatología.

Además, las definiciones tienen errores de marca que ubican las palabras en los campos semánticos inapropiados, los países equivocados y el uso y la época desactualizados. Pueda ser que todos los miembros del campo semántico de la retórica estén marcados con el dominio, pero no ocurre lo mismo con la arqueología, la sociología o la antropología. Y es imposible esperar que los términos asociados al turismo, la cosmética o el folclor tengan una marca especial.

¿Cuáles son los hiperónimos del derecho?
Lista de hiperónimos

Para delimitar los diez campos semánticos se necesitan 105 hiperónimos. Esto quiere decir que cada palabra tiene únicamente un lugar dentro de la estructura del léxico.
Con los avances de la ciencia se podrá comprobar si esta jerarquía léxica corresponde con el mapa semántico en el área del lenguaje del cerebro.
------------------------------
Problema 3
¿Cómo se ordenan los campos semánticos?
Estructura del léxico
La estructura del léxico es completamente desconocida. Hasta ahora no se ha podido descubrir la jerarquía de los campos semánticos, por ejemplo, se desconoce si la zoología precede a la paleontología, o viceversa.
El orden de las palabras refleja la estructura del léxico. Las palabras se agrupan por relaciones de significado en grandes estructuras llamadas campos semánticos.
La jerarquía léxica es el orden en que se subordina un campo semántico respecto a otro por medio de un hiperónimo. Por ejemplo, para definir el campo semántico de la medicina es necesario definir primero la zoología, porque el hombre es una clase de animal.

El léxico se ordena de acuerdo al significado del hiperónimo. En la estructura del léxico se ubican primero las palabras de significado más concreto, seguidas de las más abstractas.
Todas las lenguas modernas comparten los mismos hiperónimos, por ejemplo, el campo semántico de la música se define con los hiperónimos canto, instrumento y baile.

¿La gastronomía es un arte o una ciencia?
El léxico de la gastronomía es básicamente concreto. Sin embargo, en la Wikipedia la gastronomía todavía figura entre las artes, aunque no se estudia en ninguna escuela de artes ni los gastrónomos son artistas.

Después de determinar la cantidad de campos semánticos se ordenan de acuerdo al significado, del campo semántico más concreto al más abstracto. La jerarquía está determinada por el hiperónimo materia.
------------------------------
Ciencias (Wikipedia) 
Léxico universal
 
Los campos semánticos son un reflejo de la realidad que corresponde a las áreas del conocimiento humano. La hipótesis de esta teoría formula que cada una de las palabras forma parte de la terminología de algún especialista.

Cuéllar propone la teoría del léxico universal, un vocabulario compuesto de préstamos léxicos comunes a todas las lenguas del mundo, como las palabras café, califa y camello, donde las palabras locales son meras creaciones de la etimología popular, como adelita, alaraco y caneisito.

El léxico universal es el léxico compuesto por los préstamos léxicos comunes a todas las lenguas, como las palabras melodía, piano o ballet, contrario al léxico local, que se compone de palabras que se usan exclusivamente en una lengua y tienen muy pocas probabilidades de pasar a otras lenguas, como los términos españoles tonada, guitarrazo o panderetólogo.

A partir de ahora se puede analizar el léxico de manera más eficiente porque se pueden predecir con certeza las palabras presentes en el léxico de las todas las lenguas modernas.
---------------------------

¿Se puede editar un diccionario universal?
Diccionario universal

Cuéllar propone la creación de un diccionario universal que contenga todos los préstamos léxicos comunes que forman parte del léxico universal, como los elementos de la tabla periódica, las unidades de medida en física, las eras geológicas o los periodos prehistóricos.

Estas palabras forman parte del patrimonio léxico universal, es necesario catalogarlas.

El diccionario universal es un diccionario etimológico que contiene todas las palabras del léxico universal, con una definición estándar y la fecha de registro en cada una de las lenguas.

Si un lexicógrafo quisiera compilar un diccionario universal, debería empezar con el adjetivo aarónico o con el sustantivo aaronita, que son las dos primeras palabras usadas por todas las lenguas del mundo para definir el vocabulario de la Biblia. Para Cuéllar estas son realmente las dos primeras palabras de la lengua universal.
  1. aarónico adj (al. / esp. / fr. / hol. / ing. 1821 / it.)
  2. aaronita m, f (al. / esp. / fr. / hol. / ing. / it.) 
No es un sueño imposible de alcanzar, el Diccionario etimológico de la zoología de Cuéllar tiene registrados todos los mamíferos ungulados, con nombre común y nombre científico. La misma metodología se puede aplicar al resto de los animales, a las plantas y a todos los componentes del léxico universal.
------------------------------ 
¿Se debe codificar el léxico?
Lingüística computacional

El léxico universal se compone de las palabras que están presentes en todas las lenguas del mundo, como las palabras camello, delfín, elefante, león y tigre. Estas palabras son patrimonio lingüístico de la humanidad, forman parte del léxico técnico de cualquier lengua donde se estudie zoología.

La próxima etapa es codificar cada una de las palabras recolectadas con un código de barras para que cualquier robot entienda sin confundirse por las acepciones. De esta manera, el robot interpreta un número en vez del significado de una idea.
En esta codificación se numera cada una de las acepciones con una letra minúscula y los nombres propios con una letra mayúscula.

Botánica
  • 3.1 botánica
  • 3.1 planta
  • 3.1.1 árbol
  • 3.1.11 abedul
  • 3.1.12 abeto
  • 3.1.41 planta textil
  • 3.1.411 abacá (Musa textilis) / planta
  • 3.1.411a abacá / fibra
  • 3.1.411b abacá / tejido
------------------------------------

¿Cuántas palabras tiene un campo semántico?
Volumen léxico

El volumen léxico de esta investigación se estableció después de clasificar por campos semánticos las 80.000 palabras del Diccionario de uso del español (Moliner 1998).

A partir de ahora es fácil determinar con estadísticas, de manera científica, el número de palabras que pertenecen a cada campo semántico, por ejemplo, se puede comparar el volumen léxico de la ficología con el de la heráldica.

Un campo semántico tiene en promedio 760 palabras. La botánica es el campo semántico más extenso de la lengua humana y la minería es el más breve.
------------------------------ 
¿Cuántas palabras tiene cada campo semántico en cada letra?
A-Z

El objetivo de este capítulo es contabilizar las palabras que pertenecen a cada campo semántico de acuerdo a cada una de las letras del alfabeto para determinar el volumen léxico de manera precisa y establecer las similitudes y diferencias.

Primero, con este método estadístico se puede predecir el volumen léxico de un campo semántico específico. Por ejemplo, se presentan 170 palabras aproximadamente en cada campo semántico por la letra A, la química se encuentra por encima del promedio y las matemáticas por debajo. Si quisiera investigar el léxico del ruso ya tengo una idea por donde empezar.

Como se puede observar, las plantas dominan la primera letra del alfabeto y los calificativos predominan en la psicología, mientras que la música es el campo semántico con más adverbios. 

Número de palabras

La botánica es el campo semántico más extenso de la letra A, cuenta con más de 500 palabras. Mientras que la astronomía posee únicamente 6 palabras.

A
  • 555 Botánica
  • 393 Medicina
  • 284 Gastronomía
  • 238 Geografía
  • 214 Química
  • 213 Antropología
  • 211 Psicología
  • 205 Lingüística
  • 197 Zoología
  • 163 Derecho (promedio)
  • 140 Historia
  • 129 Ornitología
  • 111 Literatura
  • 107 Agronomía
  • 99 Música
  • 95 Matemáticas
  • 87 Filosofía
  • 73 Cosmética
  • 6: Astronomía
Adjetivos
  • 59 Psicología
  • 35 Gastronomía
  • 32 Lingüística
  • 27 Filosofía
  • 26 Antropología
  • 15 Agronomía
  • 11 Música
Verbos
  • 60 Gastronomía
  • 32 Agronomía
  • 30 Antropología
  • 16 Lingüística
  • 11 Música
Adverbios
  • 12 Música
  • 6 Astronomía
  • 2 Economía
  • 0 Física
Epónimos
  • 163 Epónimos
B
  • 213 Gastronomía
  • 114 Música
  • 57 Geografía
  • 45 Antropología
  • 27 Lingüística
  • 18 Matemáticas
------------------------------
Lingüística
------------------------------
Bibliografía
Cuéllar Moyano, F. Lexicología [en línea]. Bogotá: Español Internacional, 2009. Disponible en: http://espanolinternacional.blogspot.com/ [día de mes de 2015].

Referencias

Guiraud, P. La semántica. Bogotá: Fondo de Cultura Económica, 1997.
Jackson, H. y E. Zé Amvela. Words, Meaning and Vocabulary, An Introduction to Modern English Lexicology. Londres: Continuum, 2006.

Kipfer, B. A. The Order of Things: Hierarchies, Structures, and Pecking Orders. Nueva York: Workman, 2008.

Martínez de Sousa, J. Diccionario de lexicografía práctica. Barcelona: Biblograf, 1995.
Moliner, M. Diccionario de uso del español, 2ª ed. Madrid: Gredos, 1998.
Mortureux, M-F. La lexicologie entre langue et discours, 2ª ed. París: Armand Colin, 2008.
Palmer, F. R. Semantics, 2ª ed. Cambridge (Inglaterra): Cambridge University Press, 2004.
© 2007 Español Internacional