ViewTube

Skip

Búsqueda en taxonomías: modelar correctamente un dominio usando Elasticsearch.

173 views

Nerdearla

30.8K subscribers

Mon, 24 Oct 2022 00:00:00 GMT

Tags

NLP

Semantic Search

Word Embeddings

Encontrar coincidencias bajo una taxonomía es un problema con el que nos enfrentamos más de lo que creemos. Cuando buscamos una entidad dentro de un mapeo de catálogo, tendemos a hallar grandes desafíos para revisar lo que escribió el usuario y compararlo con la entidad que el usuario desea encontrar. Algunos modelos tienden a basarse en Partial and full match. Estos modelos son fáciles de implementar y pueden ser funcionales, pero también pueden generar una experiencia de usuario frustrante, sobre todo cuando los usuarios no conocen el dominio de la taxonomía. En particular, no admiten: - Errores tipográficos del usuario (descartes de coincidencias parciales). - Sinónimos (pueden ser demasiado específicos dentro de un dominio). - Acrónimos (utilizados sin contexto puede generar errores en coincidencias). - Hipónimos e hiperónimos (que modelan una relación semántica más compleja que los sinónimos). Los enfoques más recientes utilizan modelos de ML de última generación para procesar consultas *raw*, extrayendo información y modelándola como un embedding para permitir la búsqueda en un espacio vectorial que, a través de la frecuencia y el conocimiento de las correlaciones, logra modelar la semántica. Este enfoque es una gran herramienta pero la mayoría de las veces, no hace frente a la restricción del modelo presentada anteriormente, y la representación semántica comienza a perder significado en dominios muy específicos y complejos. Para mejorar el motor de busqueda modelado en el dominio no es necesario un mayor esfuerzo, y los beneficios en la calidad de la recuperación de información puede ser un factor diferencial en el éxito del producto. En esta charla vamos a presentar: - Un estudio de caso sobre cómo un catálogo de moda se puede modelar como una taxonomía. - Que relaciones se deben tener en cuenta al modelar una taxonomía y cómo hacerlo en un índice de Elasticsearch. - Cómo se pueden usar los embeddings para complementar nuestra búsqueda,cuando el Elastic Model no representa la realidad. - Cómo estructurar las consultas para favorecer la búsqueda del usuario al mismo tiempo que intenta comprender y modelar de manera inteligente qué más podría haber intentado buscar el usuario. - Ejemplos de código de esta implementación, incluido el índice en Elastic y su consulta. Chequea las búsquedas laborales de Nerdearla en https://nerdear.live/jobs-2022 !

ViewTube

Recommended videos

Búsqueda en taxonomías: modelar correctamente un dominio usando Elasticsearch.

0 Comments