Multimodal Search

Algo así era el nombre(tut turut tuuu, tut turut tuuu.mp3) de un archivo mp3 que había en la compu de un amigo, le pregunte quién la cantaba y me dijo que una mujer, lo cual fue todo un reto para la evaluación del acervo musical, finalmente la tarareó y fue inmediato era ode to my family de Cramberries(saludos amigo). Busqué “tut turut tuuu, tut turut tuuu” en google y me sorprendí al ver la cantidad de resultados que obtuve(métrica: si no te aparece ningún resultado en google), si bien habían traslapes de las palabras con otros idiomas tuve la agradable sorpresa de encontrar preguntas en foros con la misma dinámica aunque no tantas como para esperar un onomatopeya.google.com.

Leyendo un poco más del tema a éste problema se le conoce como multimodal search y es el de realizar búsquedas donde el query no es texto, sino una imagen, sonidos, un fragmento de una canción, un video… uno por uno o en actuando todos en conjunto. El reto está en obtener/construir los descriptores(información con las características) tanto de la muestra como de la base de datos para poder compararlos adecuadamente y no estar en el problema de las peras con manzanas, además no es solo cuestión de reconocer la firma, también esta la situación de poder inferir relaciones y obtener resultados similares.

Algunos ejemplos de buscadores multi modo:

Google, Bing: obviamente con las imágenes
ISearch Project
Wolfram Alpha

Saben de otros?

Links

categorías

links

newsletter

contacto

hola

desarrollo

Links

Posts relacionados

Similares

De la categoría: dev++

Favoritos