Encontrar coincidencias bajo una taxonomía es un problema con el que nos enfrentamos más de lo que creemos. Cuando buscamos una entidad dentro de un mapeo de catálogo, tendemos a hallar grandes desafíos para revisar lo que escribió el usuario y compararlo con la entidad que el usuario desea encontrar.
Algunos modelos tienden a basarse en Partial and full match. Estos modelos son fáciles de implementar y pueden ser funcionales, pero también pueden generar una experiencia de usuario frustrante, sobre todo cuando los usuarios no conocen el dominio de la taxonomía. En particular, no admiten:
- Errores tipográficos del usuario (descartes de coincidencias parciales).
- Sinónimos (pueden ser demasiado específicos dentro de un dominio).
- Acrónimos (utilizados sin contexto puede generar errores en coincidencias).
- Hipónimos e hiperónimos (que modelan una relación semántica más compleja que los sinónimos).
Los enfoques más recientes utilizan modelos de ML de última generación para procesar consultas *raw*, extrayendo información y modelándola como un embedding para permitir la búsqueda en un espacio vectorial que, a través de la frecuencia y el conocimiento de las correlaciones, logra modelar la semántica. Este enfoque es una gran herramienta pero la mayoría de las veces, no hace frente a la restricción del modelo presentada anteriormente, y la representación semántica comienza a perder significado en dominios muy específicos y complejos.
Para mejorar el motor de busqueda modelado en el dominio no es necesario un mayor esfuerzo, y los beneficios en la calidad de la recuperación de información puede ser un factor diferencial en el éxito del producto.
En esta charla vamos a presentar:
- Un estudio de caso sobre cómo un catálogo de moda se puede modelar como una taxonomía.
- Que relaciones se deben tener en cuenta al modelar una taxonomía y cómo hacerlo en un índice de Elasticsearch.
- Cómo se pueden usar los embeddings para complementar nuestra búsqueda,cuando el Elastic Model no representa la realidad.
- Cómo estructurar las consultas para favorecer la búsqueda del usuario al mismo tiempo que intenta comprender y modelar de manera inteligente qué más podría haber intentado buscar el usuario.
- Ejemplos de código de esta implementación, incluido el índice en Elastic y su consulta.
Chequea las búsquedas laborales de Nerdearla en https://nerdear.live/jobs-2022 !
0 Comments