Aprendizaje de múltiples instancias de Distribuciones

Aprendizaje de múltiples instancias de Distribuciones

Gary Doran, Soumya Ray; 17(128):1-50, 2016.

Resumen

Proponemos un nuevo marco teórico para analizar el entorno de aprendizaje de instancia múltiple (MIL). En MIL, se proporcionan ejemplos de entrenamiento a un algoritmo de aprendizaje en forma de conjuntos etiquetados, o «bolsas», de instancias. Las aplicaciones de MIL incluyen la predicción de relaciones de estructura cuantitativa 3D-actividad para el descubrimiento de fármacos y la recuperación de imágenes basadas en contenido para la búsqueda en la web. El objetivo de un algoritmo es aprender una función que etiqueta correctamente nuevas bolsas o una función que etiqueta correctamente nuevas instancias. Proponemos que las bolsas se traten como distribuciones latentes a partir de las cuales se observan muestras. Mostramos que es posible aprender funciones precisas de etiquetado de instancias y bolsas en esta configuración, así como funciones que clasifican correctamente bolsas o instancias bajo suposiciones débiles. Además, nuestros resultados teóricos sugieren que es posible aprender a clasificar de manera eficiente utilizando enfoques de aprendizaje «supervisados» tradicionales y bien estudiados. Realizamos una amplia evaluación empírica que apoya las predicciones teóricas que conlleva el nuevo marco. El marco teórico propuesto conduce a una mejor comprensión de la relación entre el IM y la configuración de aprendizaje supervisado estándar, y proporciona nuevos métodos para aprender de los datos del IM que son más precisos, más eficientes y tienen propiedades teóricas mejor entendidas que los algoritmos específicos del IM existentes.

&copia JMLR 2016. (editar, beta)

Deja una respuesta

Tu dirección de correo electrónico no será publicada.