26 de abril de 2015

Lexicología y lexicografía

Lexicología
  • Léxico / Vocabulario
  • Lexema
  • Neologismo
Fraseología
  • Fraseología / Frase
  • Colocación / Firth
  • Modismo
  • Paremiología / Refrán
Lexicografía
  • Diccionario
  • Entrada
  • Definición
  • Acepción
  • Fórmula
  • Marca
  • Macroestructura
  • Tesauro / Roget
  • WordNet / Miller
  • Diccionario portátil / Battaner
  • Metadata
------------------------------

Diccionario estructural (Cuéllar 2013)
Introducción 
 
La lexicología es el área de la lingüística teórica que estudia el léxico o conjunto total de palabras de una lengua.

La lexicología estudia el origen, la formación, el significado, la composición y la estructura de las palabras. Se basa en la etimología, la gramática y la semántica.

Para los ingleses la lexicología es la semántica léxica o semántica estructural.
 
Lexicología teórica
  • Lexicología / Palabras, Neologismos, Campos semánticos 
  • Fraseología / Colocaciones, Modismos
    · Paremiología / Refranes 
Lexicología práctica
  • Lexicografía / Diccionarios, Enciclopedias
La lexicología un campo prácticamente inexplorado que causa mucho interés por las aplicaciones futuras que tiene en la enseñanza de idiomas (lingüística pedagógica), la traducción (lingüística aplicada), los computadores y la robótica (lingüística computacional).
 
La lingüística computacional es el área de la lingüística práctica que estudia la aplicación de los computadores al análisis de la lengua, por medio de lenguajes de programación como el Java, el C++ y el Fortran.

Según el antropólogo Lévi-Strauss, la lingüística estructural, aquella que estudia los campos semánticos, es la ciencia piloto de todas las ciencias sociales.

Holanda es uno de los pocos países del mundo que cuenta con un instituto de lexicología, dedicado exclusivamente a investigar las palabras. Se trata del Instituto para Lexicología Holandesa, situado en Leiden.
------------------------------

¿Cuántas palabras tiene una lengua?
Léxico
 
El léxico es el conjunto total de palabras de una lengua.

Se calcula que el número total de palabras de una lengua es de dos millones, son tantas que no caben en ningún diccionario y tampoco tiene sentido realizar una obra de tal magnitud. El léxico general de una lengua es de 500.000 palabras, incluido el vocabulario común y el técnico. El vocabulario básico comprende 7.000 a 15.000 palabras, que son los términos más frecuentes y conocidos por todos los hablantes. Pero el número de palabras que conoce un hablante adulto es de 1.500, un escritor utiliza cerca de 5.000 a 8.000 términos y una persona muy culta tiene un léxico de unas 15.000 palabras.

Es difícil saber el número real de palabras que contienen los diccionarios porque cada uno las cuenta de manera diferente. Los diccionarios contabilizan como entradas las variaciones ortográficas (jilguero, silguero), las abreviaturas (TNT, ISBN), los prefijos (re–), los sufijos (–ito), los elementos compositivos (ornito–, –logo), las colocaciones (ave fría) y los nombres propios de personas y de lugares (Pero, América, Guinea). Además, los diccionarios cuentan una misma palabra como dos entradas distintas cuando cambia el género (mirlo, mirla) o el número (barba, barbas).

Por ejemplo, el Diccionario de la lengua española (RAE 2014) incluye más de 93.000 artículos en la última edición (23ª). Es la edición más prolífica que se haya publicado hasta ahora.

El conjunto total de unidades léxicas del lenguaje y de reglas para la formación de palabras se denomina léxico mental, que es una estructura innata en un área específica del cerebro donde se almacena toda la información de las palabras. Según Bacon, el léxico mental es un léxico abstracto que forma parte de la gramática universal, o conjunto de reglas que gobiernan todas las lenguas del mundo y permite que los niños aprendan cualquier lengua materna sin dificultad.

Vocabulario
 
Ejemplo
Vocabulario básico
 
águila, pato, loro
Vocabulario especializado
técnico
palomera, reclamo
 
científico
ornitología
 
humanista
animalidad

Vocabulario
Mientras que el vocabulario es una selección de palabras, llamadas vocablos, que se usan en un momento determinado, como el vocabulario de una carrera de caballos en el hipódromo: caballo, apuesta, favorito, meta, rápido, etc.

De acuerdo al uso de las palabras el vocabulario se clasifica en vocabulario básico, que se compone de palabras de uso frecuente, necesarias para describir la vida diaria, como águila, pato y chorlito, y en vocabulario especializado, que se compone de palabras técnicas, usadas únicamente por especialistas en un campo específico, como palomera y reclamo. Mientras que el vocabulario técnico es de origen popular, el vocabulario científico es de origen latino o griego, como ornitología, ornitólogo y ornitológico. Por otra parte, el vocabulario humanista se compone de términos abstractos, como animalidad.

De acuerdo al origen de las palabras el vocabulario se clasifica en vocabulario patrimonial y extranjero. El vocabulario patrimonial se compone de palabras que provienen de tres lenguas, dos indoeuropeas, que son el latín (águila), el íbero (bruja), y una lengua aislada, que es el celtíbero (garza). El celtíbero es una lengua indoeuropea derivada del celta francés, o galo, con elementos íberos.

Y el vocabulario extranjero se compone de palabras que provienen de otras lenguas, como el griego, el inglés o el francés, llamadas extranjerismos o préstamos léxicos.

------------------------------
Lexema

Unidad
 
Ejemplo
Lexema
palabra
gaviota
Morfema
prefijo
des, re
 
sufijo
ito, illo
 
raíz
ornito, avi
Lexía
colocación
pavo real

Unidades léxicas
El léxico se compone de tres clases de unidades: las palabras (lexemas), las partículas menores que las palabras (morfemas) y las frases o secuencias de palabras (lexías).

Un lexema es la unidad básica utilizada para estudiar el léxico, como ave, nido o piar. Se diferencia de la palabra gramatical porque agrupa todas las variaciones en un solo término, por ejemplo, casa es un lexema que incluye el plural, mientras que en gramática casa y casas son dos palabras diferentes, una en singular y la otra en plural.

El análisis lexicológico incluye únicamente las unidades léxicas mayores que la palabra, como las lexías (fraseología) y los refranes (paremiología).
------------------------------
¿Cuáles son las palabras de moda?
Neologismo

Un neologismo es una palabra nueva en el léxico de una lengua, como blog o tuit.
------------------------------
¿Cuáles son las frases del léxico?
Fraseología
 
La fraseología es el área de la lexicología que estudia las frases o expresiones fijas que forman parte del léxico, como las colocaciones, los modismos y los refranes (lexías).

Una lexía es una secuencia de palabras que se debe memorizar en bloque, como historia natural (colocación), acostarse con las gallinas (modismo) y No todo lo que brilla es oro (refrán).
------------------------------

¿Cuántas palabras tiene un lexema?
Colocación

Una colocación es un conjunto de palabras que adquiere significado propio y se vuelve parte del léxico, como oso pardo, que es una especie de oso (Ursus arctos), mientras que un oso café es cualquier oso de este color.

En las colocaciones se puede deducir el significado por los componentes, como gallina de Guinea o levantamiento de pesas.

La idea de que "una palabra se caracteriza por la compañía que mantiene" fue popularizada en 1957 por Firth.
------------------------------
¿Qué es un modismo?
Modismo

Un modismo es una expresión fija de una lengua, cuyo significado no se deduce de las palabras que la componen, por ejemplo, colgar la tolla, que equivale a renunciar.

Una expresión es una frase que no se puede modificar, por ejemplo, no se puede cambiar la conjugación del verbo, como en Te conozco bacalao por *Te conocí bacalao.

Antes del 2014 las locuciones tenían en el diccionario la categoría gramatical de frase, una categoría gramatical nueva que no pegó. La pregunta es cómo descubrieron los lexicógrafos que no eran frases sino locuciones verbales (modismos).
  • ser una abeja fr: ser muy astuto, en Colombia, coloquial (esp. 2014)
  • soltar la mosca fr: dar o gastar dinero a disgusto, aflojar la mosca (coloquial)
------------------------------
¿Qué es un refrán?
Paremiología
 
La paremiología es el área de la fraseología que estudia los refranes. Un refrán es una frase de sabiduría popular que se transmiten de generación en generación, con el fin de ahorrar tiempo sin necesidad de usar tanta palabrería, como No todo lo que brilla es oro.
 
------------------------------
Análisis lexicológico

En la definición de la palabra naturaleza no figuran los hiperónimos ser vivo ni tierra en ninguna de las acepciones.

Naturaleza
  • 1. Principio generador del desarrollo armónico y la plenitud de cada ser, en cuanto tal ser, siguiendo su propia e independiente evolución. (filosofía)
  • 2. Conjunto de todo lo que existe y que está determinado y armonizado en sus propias leyes. (filosofía)
  • 3. Virtud, calidad o propiedad de las cosas. (filosofía)
  • 4. Instinto, propensión o inclinación de las cosas, con que pretenden su conservación y aumento. (biología)
  • 5. Fuerza o actividad natural, contrapuesta a la sobrenatural y milagrosa. (filosofía)
  • 6. Especialmente en las hembras, sexo (‖ condición orgánica). (biología)
  • 7. Origen que alguien tiene según la ciudad o país en que ha nacido. (derecho)
  • 8. Cualidad que da derecho a ser tenido por natural de un pueblo para ciertos efectos civiles. (derecho)
  • 9. Privilegio que se concede a los extranjeros para gozar de los derechos propios de los naturales. (derecho)
  • 10. Especie, género, clase. (biología)
  • 11. Cualidad de los seres humanos no modificada por la educación. (filosofía
  • 12. Complexión o temperamento de cada individuo. (psicología)
    · 12. Complexión o temperamento de cada individuo. (cosmética)
  • 13. Señorío de vasallos o derecho adherido a él por el linaje. (derecho)
  • 14. Esc. y Pint. natural. (arte)
  • 15. Rel. En la teología cristiana, estado natural del hombre, anterior al estado de gracia. (teología)
Además, el orden de las acepciones es al azar, no siguen una secuencia lógica, están intercaladas, excepto las dos últimas que están organizadas por campos semánticos.

Es seguro que un escolar va a quedar decepcionado cuando busque esta palabra en el diccionario.
------------------------------
LEXICOGRAFÍA
Diccionario más antiguo que existe (Babilonia, 1700 a. C.)
La lexicografía es el área práctica de la lexicología que estudia los diccionarios

Lexicografía
La lexicografía no es ajena a las corrientes de investigación lingüística. En la elaboración de un diccionario se utilizan las teorías y los métodos de análisis lingüístico imperantes, como el estructuralismo.
 
La Universidad de la Sabana ofrece la primera maestría en lingüística panhispánica con una línea de investigación en el campo de la lexicografía panhispánica. La Sabana se convierte en pionera de la lengua española al tomar en cuenta todas las variedades del español.


La lexicografía no es un área de la lingüística  
H. Bergenholtz y S. Tarp (2009), profesores del Centro de Lexicografía de la Universidad de Aarhus (Dinamarca), afirman que la lexicografía no es un área de la lingüística porque el diccionario es un invento que sirve para satisfacer las necesidades humanas, contrario a la lengua que es innata.

El objetivo del V Congreso de Lexicografía Hispánica de Madrid (2012) era actualizarse en los últimos aportes de la morfología, la sintaxis, la semántica y la pragmática en la compilación de diccionarios. Pero Tarp, el conferencista invitado, no se refirió a ninguno de los temas de interés porque supuestamente la lexicografía no era un área de la lingüística. Se salió por la tangente y dejó a los asistentes con los crespos hechos.

Así que la misión de los lexicógrafos daneses es descubrir el área del conocimiento humano a la que pertenece la lexicografía porque Tarp, obviamente, nunca lo mencionó.
-----------------------------
Diccionario de uso del español (Moliner 1998)
Diccionario
Un diccionario es un libro que contiene una selección de palabras del vocabulario actual de una lengua. Es una selección de carácter sincrónico, realizada por un lexicógrafo o una comisión lexicográfica, en un lugar y un momento histórico determinado.

En el diccionario aparecen las palabras en orden alfabético para encontrar más rápido una palabra, sin tener en cuenta el significado, por eso, es muy raro ver dos palabras seguidas que pertenezcan al mismo campo semántico
Los diccionarios se hacían antiguamente para enseñar, se usaban en las clases de idiomas como un recurso pedagógico, comparable al ábaco en las matemáticas o al diapasón en la música. En el siglo XV se perdió el carácter didáctico y se convirtió en un instrumento de erudición.

Sumer

Los sumerios inventaron el diccionario en la antigua Mesopotamia, actual Irak (3100 a. C.).

Las Listas léxicas (1000 a. C.) son glosarios ordenados por temas que incluyen los nombres de los árboles, carrizos, vasijas, pieles, metales, aves, peces, textiles, alimentos y bebidas, como también terminología legal y nombres geográficos (topónimos).

En esta época aparecen las glosas, o explicaciones de palabras difíciles en textos literarios, algunas con sinónimos o traducción de palabras individuales, y las citas literarias, entre la etimología y la explicación.
 
A pesar de la larga tradición de la lexicografía todavía se encuentra en estado incipiente si se compara con las otras áreas de la lingüística. En la edición del diccionario poco ha cambiado en más de cinco mil años, la única innovación que ha sufrido este concepto alfabético, aparte del cambio de medio tecnológico, de la piedra al papel y del papel al computador, ha sido el ordenamiento de las palabras en campos semánticos.

España

El Diccionario de Autoridades de la Real Academia de la Lengua Española (RAE), impreso entre 1726 y 1739, siguió el modelo normativo de la Academia Francesa que había publicado en 1694 el primer Diccionario de la Academia.

El mayor logro de la Academia es el Nuevo Tesoro Lexicográfico, un recurso lexicográfico de fácil acceso, rápido y práctico, que no dispone ninguna otra lengua moderna. Gracias a la colaboración de esmerados académicos, diseñadores y técnicos que participan en su adecuación.

------------------------------
¿Cómo se llaman las palabras de un diccionario?
Entrada

Los palabras del diccionario se llaman artículos, entradas o lemas.
  • Lema / oro
  • Afijo / auro–, criso–, –ado
  • Lexía / botón de oro
El análisis lexicográfico incluye las unidades léxicas mayores y menores que la palabra, como las lexías (fraseología) y los afijos (morfología).
 
El español es la única lengua moderna que no tiene una entrada independiente para la palabra médico y músico.
------------------------------
Definición
Definición estándar
Una definición es una sola frase formalizada que puede sustituir al término definido en un contexto determinado.

La regla es que las palabras se definen con otras de la misma categoría gramatical, por ejemplo, un sustantivo siempre se define con una frase nominal y un verbo con una frase verbal. Las otras categorías gramaticales se definen con frases que funcionan de la misma manera que la palabra definida.

Según Aristóteles (384–322 a. C.), una definición lógica se compone del género y de la especie, por ejemplo, en una silla es un mueble para sentarse, el género es silla y para sentarse es la especie, que la diferencia del resto de los muebles.

Se presentan dos clases de definiciones, la definición propia y la definición impropia. La definición propia puede ser perifrástica, cuando se define el término con un hiperónimo seguido de una frase, como en cóndor que es un ave carroñera que vive en América, o sinonímica, cuando se define el término con un sinónimo, como alegre por feliz.
  • definición perifrástica: el caso más característico es un enunciado que encabeza un hiperónimo del término definido, al que modifican cuantas notas semánticas, situadas en orden de mayor a menor relevancia, son necesarias para individualizar este de aquellos otros que están situados en lugar comparable de su campo de significado (RAE 2001).
La definición impropia incluye la categoría gramatical, por ejemplo, ay es una interjección usada para expresar la sorpresa.

Definiciones cíclicas
Algunas definiciones son cíclicas. El principio fundamental de una definición es que no debe contener la palabra que define para que no se convierta en un círculo vicioso.
  • barreno: varilla de hierro o de cobre que sirve para formar el oído en el taco de un barreno.
  • instar: Apretar o urgir la pronta ejecución de algo.
  • radical: Se dice de cada uno de los fonemas que constituyen el radical de una palabra.
  • urgir: Instar o precisar a su pronta ejecución o remedio.
  • voz: Sonido particular o tono correspondiente a las notas y claves, en la voz de quien canta o en los instrumentos.
Excepto en una colocación, pero ahí no aparece.
  • aguja capotera f: la más gruesa que usan las costureras
Definiciones redundantes

Algunas definiciones son redundantes, usan un sinónimo de la misma definición.
  • colibrí: pájaro americano, insectívoro, de tamaño muy pequeño ‖ 2. pájaro mosca.
Las acepciones no deben ser sinónimos de las definiciones porque remiten a la misma palabra y se vuelven cíclicas.
Definiciones incompletas
Ciertas definiciones son incompletas, por ejemplo, en cierta ave palmípeda no sabemos cuál es porque existen más de 150 especies de aves anseriformes palmípedas, además, de las aves palmípedas que existen en otros órdenes, como el de las caradriformes.
  • castañero m: cierta ave palmípeda.
Una especie que se define sin el lugar donde habita es imposible de reconocer.

Definiciones erróneas
Unas definiciones son completamente erróneas.
  • buharro m: corneja (ave rapaz).
  • chulo m: zopilote, en Colombia.
  • colirrojo m: pájaro de la misma familia que el tordo, con la cola y sus coberteras dorsales de color castaño rojizo.
  • corconera m: ánade de color negruzco que abunda en las costas del mar Cantábrico.
  • guala f: ave palmípeda, con el pico verdoso, el plumaje rojo oscuro, y blanco por el pecho.
  • loro m: papagayo, ave, y más particularmente el que tiene el plumaje con fondo rojo.
  • músculo m: Órgano compuesto principalmente de fibras contráctiles.
  • piuquén m: especie de avutarda, mayor que la europea, de color blanco, menos la cabeza, que es cenicienta, así como los cuchillos de las alas, y negras las primeras guías. La cola es corta y tiene 18 plumas blancas. Se alimenta de hierbas y no se reproduce hasta los dos años. Es mansa, se domestica con facilidad y su carne es comestible.
  • tenca f: Arg. y Chile. Alondra de tres colas.
Definiciones desactualizadas
En uno de los capítulo de los Simpsons Mr. Burns quiere enviar un telegrama a Siam.

Algunas definiciones están completamente desactualizadas. Entre ellas encontramos, nada nás y nada menos, que el avestruz, el ave más grande y visible todas.
  • afronegrismo: Préstamo de una lengua del África negra.
  • alionín: nombre de diversas especies de pájaros de la familia de los Páridos.
  • avestruz: ave del orden de las Estrucioniformes, su única especie actual. En anteriores clasificaciones zoológicas se incluía en las llamadas Corredoras. Llega a los dos metros de altura y es la mayor de las aves actuales. Tiene dos dedos en cada pie, piernas largas y robustas, cabeza y cuello casi desnudos, el plumaje suelto y flexible, negro en el macho y gris en la hembra, y blancas en ambos las remeras y timoneras. Habita en África y en Arabia.
  • cefo: Mamífero cuadrumano, originario de Nubia, de unos seis decímetros de largo, sin contar la cola, y con el cuerpo rojo, menos la nariz, que es blanca.
  • ganga: ave del orden de las Columbiformes, algo mayor que la tórtola y de aspecto semejante, gorja negra, con un lunar rojo en la pechuga, y el resto del plumaje, variado de negro, pardo y blanco.
  • guacamaya: desus. guacamayo. U. en América Central, Colombia, México y Venezuela.
  • latinoamericano: Se dice del conjunto de los países de América colonizados por naciones latinas, es decir, España, Portugal o Francia.
  • mito: ave paseriforme de la familia de los Páridos, con plumaje blanco, negro y rosado y larga cola blanca y negra. Es común en España y vive en los bosques, donde construye nidos cerrados de forma inconfundible.
  • ortega: ave del orden de las Columbiformes, muy parecida en aspecto, tamaño y demás características a la ganga. Es común en España y corre más que vuela.
  • teratología: Estudio de las anomalías y monstruosidades del organismo animal o vegetal.
Algunas definiciones son completamente erróneas y desactualizadas.
  • danta f: Am. Cen. Pájaro de unos tres decímetros de longitud, de plumaje negro azulado y pecho rojizo y sin plumas, pero con un cordoncillo carnoso. Tiene un copete o penacho que se prolonga hasta la extremidad del pico. Vive en las selvas oscuras y su voz parece un mugido débil.
  • picazuroba f: ave gallinácea, semejante en el tamaño, forma y plumaje a la tórtola, pero con el pico y los pies de color negro rojizo, el pecho carmesí, y el vientre encarnado. Se encuentra en América desde el Brasil hasta los Estados Unidos.
  • tajá f: Ant. Especie de pájaro carpintero.
Definiciones repetidas
Otras definiciones son completamente innecesarias.
  • grigallo m: ave gallinácea mayor que la perdiz y bastante semejante al francolín. Tiene el pico negro, el cuerpo pardo negruzco, cuatro plumas negras en las alas, y las demás blancas por la base, las patas casi negras y cuatro dedos en cada pie. La hembra tiene el plumaje rojizo, jaspeado de pardo amarillento.
  • garcilla f: garza pequeña (esp. 2001
  • rabihorcado m: ave palmípeda, propia de los países tropicales, de tres metros de envergadura y uno aproximadamente de largo, con cola ahorquillada, plumaje negro, algo pardo en la cabeza y cuello y blanquecino en el pecho, pico largo, fuerte y encorvado por la punta, buche grande y saliente, cuerpo pequeño, tarsos cortos y vestidos de plumas, y dedos gruesos, con uñas fuertes y encorvadas. Anida en las costas y se alimenta de peces, que coge volando a flor de agua.
Este problema se presenta por carecer de nombres científicos en latín.
Definiciones curiosas
Otras palabras son muy curiosas, como calcomanía.
Calcomanía (1992)
  • 1. Entretenimiento que consiste en pasar de un papel a objetos diversos de madera, porcelana, seda, estearina, etc., imágenes coloridas preparadas con trementina.
  • 2. Imagen obtenida por este medio.
  • 3. Papel o cartulina que tiene la figura, antes de transportarla
Calcomanía (2014)
  • 1. Procedimiento que consiste en pasar de un papel a objetos diversos de madera, porcelana, seda, etc., imágenes coloridas preparadas con trementina. La calcomanía no figura entre las bellas artes.
  • 2. Imagen obtenida por este medio.
  • 3. Papel o cartulina que contiene la figura, antes de transportarla
Hiperónimos
El español es la única lengua que define un sustantivo con un pronombre, un error craso en lexicografía.
Ausencia de hiperónimo

Algunas definiciones carecen de hiperónimos, sobre todo, las más importantes.
  • cuerpo m: Aquello que tiene extensión limitada, perceptible por los sentidos.
Y, ¿qué es aquello?
  • aquello pron. dem. Designa lo que espacial o temporalmente está lejos de la persona que habla y de la persona con quien se habla. U. las formas m. y f. c. adj. y c. s.
Entonces la definición de cuerpo sería:
  • cuerpo m: lo que espacial o temporalmente está lejos de la persona que habla y de la persona con quien se habla que tiene extensión limitada, perceptible por los sentidos.
Doble hiperónimo

Algunas definiciones tienen dos hiperónimos.

Se supone que una definición no puede contener dos hiperónimos, o es agua o es pescado. Por ejemplo, una tarja es un escudo y una pieza de la armadura a la vez. Son dos acepciones diferentes, tal como las registra Moliner.
  • tarja f: escudo grande que cubría todo el cuerpo ‖ pieza de la armadura que cubría el hombro izquierdo como defensa de la lanza contraria
A veces se peca por defecto y otras, por exceso.
------------------------------
¿Qué es una acepción?
Acepción
Una acepción es un significado diferente del original que adquiere una palabra, como la pluma del ave y la pluma de escribir.
-----------------------------
Fórmula

Muchas palabras se definen con fórmulas o definiciones propias del diccionario, como dícese de.

En el 2001 se introdujeron en el diccionario algunos cambios en las fórmulas para definir las categorías gramaticales, como los adjetivos.

Abreviaturas
  • fr. francés
  • fr. frase
  • germ. germánico
  • germ. germanía
Adjetivos
  • adj: dícese de (1992)
  • adj: se dice (2001)
------------------------------
Marca
¿Dónde se usan las palabras?
Una marca indica el lugar donde se debe usar una palabra.

Las marcas de uso son importantísimas, aunque están ausentes en la mayoría de los españolismos. Un estudiante extranjero puede cometer una barbaridad por este descuido del diccionario.

Por ejemplo, España es el único país hispanohablante donde culo no es vulgar. O sea, que puede decir me duele el culo en una comida formal, delante de su abuela y no pasa nada.
------------------------------
¿Cómo se ordenan las entradas?
Macroestructura
La macroestructura de un diccionario es la sucesión de artículos independientes (lemas), ordenados de manera que se puedan encontrar fácilmente con un método de búsqueda establecido (algoritmo).

De acuerdo a la macroestructura los diccionarios se clasifican en semasiológicos y onomasiológicos.
  • Diccionario semasiológico / Diccionario académico, bilingüe, etimológico>
  • Diccionario onomasiológico / Diccionario ideológico, analógico, tesauro, estructural
Un diccionario semasiológico presenta las palabras en orden alfabético, va de la palabra al concepto. En cambio los tesauros ordenan las palabras por temas, van del concepto a la palabra.

En el primer caso el usuario desconoce el significado de la palabra que busca, mientras que en el segundo caso conoce el significado de la palabra pero quiere ampliar el vocabulario relacionado con el término, como los sinónimos o antónimos.

Por otra parte, la entrada típica de un diccionario estructural es el hiperónimo, es decir, que va del concepto al campo semántico. En este caso se conoce el significado de la palabra y sus sinónimos pero se quiere determinar el lugar que ocupa dentro de la estructura del léxico.
------------------------------
Tesauro

Tesauro de Roget 
P. M. Roget es el autor del Tesauro (1852), primer diccionario que contiene las palabras clasificadas de acuerdo a las ideas: El presente trabajo intenta cumplir, respecto al inglés, el sueño anhelado de todas lenguas; principalmente, poseer una colección de palabras que no estén organizadas alfabéticamente como aparecen en los diccionarios, sino de acuerdo a las ideas que ellas expresan.


Roget se basó en la taxonomía botánica, dividió el léxico en seis áreas principales, subdivididas progresivamente hasta completar 1.075 categorías semánticas.
  • ave: aves de corral (fowl), pajarito (birdie), pajarito (dicky-bird), amigos alados (feathered friends), ave bebé (baby bird), aves de corral voladoras (fowls of the air), pollo (chick)
Sin embargo, los campos semánticos permanecen ilimitados, cualquier palabra se puede adicionar, por ejemplo, Roget incluyó términos como amigos alados y ave bebé en la entrada de ave, que son dos colocaciones inexistentes en los diccionarios ingleses.  

Los tesauros son diccionarios de gran utilidad para los escritores, periodistas, traductorespedagogos y aficionados a los crucigramas.
Sin embargo, los tesauros son de un valor limitado para los lexicólogos, conducen a un callejón sin salida porque no contienen información sobre las relaciones de significado entre los lexemas individuales y porque mezclan palabras que pertenecen a diferentes ámbitos regionales, sociales o profesionales.
------------------------------

Diccionario de sinónimos
G. Miller (1985) propone en WordNet ordenar el léxico por pares de sinónimos, como carro y coche, relacionados en familias de palabras (Universidad de Princeton).
  • carro: ascensor, funicular, ambulancia, sala de ventas, alquilar, etc.
Miller reproduce el mismo error de Roget al tratar de organizar el léxico por familias de palabras sin tener en cuenta los campos semánticos. Una  teoría que no tiene futuras aplicaciones, según los investigadores de la Univerisdad de Stanford.

Alexander Geyken hace exactamente lo mismo en LexikoNet, la versión alemana que agrupa todos los hipónimos bajo el mismo hiperónimo, por ejemplo, mezcla el atleta con el anciano (persona), el diablo con la diosa (ser fabuloso) y el tsunami con los Juegos Olímpicos (evento). La confusión se refleja en los dos últimos términos porque ninguno de los dos se define con el hiperónimo evento.

Wordnik (2009) es otro diccionario electrónico que incluye los hiperónimos, aunque para ellos individuo, alguien, alma y mortal son hiperónimos de león.

Los diccionarios electrónicos actuales repiten los mismos errores que aparecen en los diccionarios impresos, como el Wiktionary (2002).
------------------------------

Diccionario portátil
Según Battaner (2012), presidenta de la Asociación Española de Estudios Lexicográficos (AELEX), los diccionarios deben incluir más información lingüística: Hacer una nueva edición de diccionario es adaptar una edición antigua y poner cuatro palabras neológicas nuevas (sic). Lo que se necesita hoy es un diccionario con una información lingüística, que el usuario de ese diccionario pueda seleccionar la información que necesita; unos, una información, por ejemplo, más sintáctica; otros, una información más semántica; otros, palabras muy frecuentes; otros, palabras no tan frecuentes. Un diccionario de tamaño más portable (sic) y tal, para aprender a escribir mejor. 
------------------------------

¿Cuántas palabras tiene un diccionario?
Metadata

La metadata es el área de la lexicografía que estudia los datos extralingüísticos de las palabras o información adicional que tienen los términos, además del significado y del uso.

Esta información se emplea para obtener estadísticas. De ahora en adelante se puede analizar el léxico de manera científica, por ejemplo, se puede determinar el volumen léxico de cada campo semántico.

Número de palabras del alfabeto (27 letras)
  • A: 8.000 palabras (10%)
  • B: 4.000 palabras (5%)
  • C: 10.000 palabras (13%)
  • D: 4.000 palabras (5%)
  • E: 6.000 palabras (7%)
  • F: 1.600 palabras (2%)
  • G: 3.200 palabras (4%)
  • H: 3.200 palabras (4%)
  • I: 3.200 palabras (4%)
  • J: 800 palabras (1%)
  • K: 56 palabras
  • L: 3.200 palabras (4%)
  • M: 4.800 palabras (6%)
  • N: 2.400 palabras (3%)
  • Ñ: 58 palabras
  • O: 2.400 palabras (3%)
  • P: 8.000 palabras (10%)
  • Q: 317 palabras
  • R: 4.000 palabras (5%)
  • S: 4.000 palabras (5%)
  • T: 4.000 palabras (5%)
  • U: 400 palabras
  • V: 2.400 palabras (3%)
  • W: 40 palabras
  • X: 40 palabras
  • Y: 140 palabras
  • Z: 400 palabras
*Total estimado: 77.451 palabras

Las cifras y los porcentajes se basan en el número de páginas que hay por cada letra.
------------------------------
Lingüística
------------------------------
Bibliografía
Cuéllar Moyano, F. Diccionario etimológico de la lingüística: Lexicología y lexicografía [en línea]. Bogotá: Español Internacional, 2011. Disponible en: http://espanolinternacional.blogspot.com/ [día de mes de 2015].

Referencias

Jackson, H. y E. Zé Amvela. Words, Meaning and Vocabulary, An Introduction to Modern English Lexicology. Londres: Continuum, 2006.

Kipfer, B. A. The Order of Things: Hierarchies, Structures, and Pecking Orders. Nueva York: Workman, 2008.

Martínez de Sousa, J. Diccionario de lexicografía práctica. Barcelona: Biblograf, 1995.

Mortureux, M-F. La lexicologie entre langue et discours, 2ª ed. París: Armand Colin, 2008.

Serna M., J. A. Cómo definir correctamente las palabras. Bogotá: Idioma, 2005.
© 2007 Español Internacional