Embeddings
Representación de un texto como un vector numérico de cientos o miles de dimensiones. Permite que la IA mida el significado de una frase y compare similitudes semánticas.
Definición completa
Los **embeddings** son la traducción matemática del lenguaje. Cualquier fragmento de texto (una palabra, una frase, un párrafo, una ordenanza completa) se convierte en un vector — una lista de números — que captura su significado semántico.
Dos textos con significado parecido tendrán vectores cercanos en el espacio matemático, aunque las palabras sean distintas. Ejemplo: "puedo aparcar mi coche aquí" y "está permitido estacionar" tendrán embeddings muy similares.
Pueblania usa embeddings para [[rag]]:
1. Cuando se carga una ordenanza, cada párrafo se convierte en embedding y se guarda en una **base vectorial** (Qdrant).
2. Cuando un vecino pregunta algo, la pregunta también se embebe.
3. El sistema busca los párrafos cuyos embeddings están más cerca semánticamente de la pregunta.
4. Esos párrafos relevantes se pasan al LLM como contexto para que redacte la respuesta.
Sin embeddings, la búsqueda solo encontraría coincidencias literales de palabras.
Ejemplos prácticos
- La pregunta "¿puede haber barbacoas en agosto?" encuentra la ordenanza que habla de "uso del fuego en zonas de alto riesgo durante meses estivales" gracias a la similitud semántica.
- Una FAQ tradicional habría fallado porque las palabras "barbacoas" y "agosto" no aparecen literalmente en la ordenanza.
Términos relacionados