1 / 28

CLASIFICACIÓN NO SUPERVISADA

CLASIFICACIÓN NO SUPERVISADA. CLASIFICACION. IMPORTANCIA PROPÓSITO METODOLOGÍAS TIPOS DE CLASIFICACIÓN. IMPORTANCIA. CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL EN UN AMPLIO ESPECTRO DE DISCIPLINAS CIENTÍFICAS QUE SE EXTIENDE DE LAS CIENCIAS BÁSICAS A LA INGENIERÍA

fleur
Télécharger la présentation

CLASIFICACIÓN NO SUPERVISADA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CLASIFICACIÓN NO SUPERVISADA

  2. CLASIFICACION • IMPORTANCIA • PROPÓSITO • METODOLOGÍAS • TIPOS DE CLASIFICACIÓN

  3. IMPORTANCIA CLASIFICAR HA SIDO, Y ES HOY DÍA, UN PROBLEMA FUNDAMENTAL EN UN AMPLIO ESPECTRO DE DISCIPLINAS CIENTÍFICAS QUE SE EXTIENDE DE LAS CIENCIAS BÁSICAS A LA INGENIERÍA OTRAS DENOMINACIONES: • TAXONOMÍA • ANÁLISIS DE CONGLOMERADOS • RECONOCIMIENTO DE PATRONES

  4. PROPÓSITO HACER UNA PARTICIÓN DE UN CONJUNTO DE OBJETOS EN CLASES O CATEGORÍAS ÉSTAS SE CONSTRUYEN DE MODO QUE UN OBJETO EN UNA CLASE DADA ES SIMILAR A CUALQUIER OTRO DE SU MISMA CLASE, Y OBJETOS EN DISTINTAS CLASES TIENDEN A SER DIFERENTES.

  5. CADA OBJETO ES OBSERVADO MEDIANTE UN CONJUNTO DE VARIABLES CUANTITATIVAS QUE REFLEJAN SUS CUALIDADES FUNDAMENTALES. OBSERVACIÓN: CONJUNTO DE VALORES DE p VARIABLES ASOCIADO A CADA OBJETO. CLASIFICAR: AGRUPAR UN CONJUNTO DE n OBSERVACIONES, CUYAS CARACTERÍSTICAS ESTÁN DADAS POR p VARIABLES, BASÁNDOSE EN LAS SEMEJANZAS QUE EXISTAN ENTRE SÍ.

  6. METODOLOGÍAS • ANÁLISIS ESTADÍSTICO MULTIVARIADO ANÁLISIS CLUSTER ANÁLISIS DISCRIMINANTE • CARACTERÍSTICAS NÚCLEO DE LOS PROCESOS CLASIFICATORIOS DESARROLLADO EN LA PRIMERA MITAD DE ESTESIGLO SE IMPLEMENTAN EFICIENTES ALGORITMOS EN LAS ÚLTIMAS DÉCADAS DEBIDO AL DESARRO-LLO DEL COMPUTADOR

  7. COMPUTACIÓN EMERGENTE • REDES NEURONALES • PERCEPTRÓN MULTICAPA • MAPAS AUTO-ORGANIZATIVOS • LÓGICA DIFUSA CARACTERÍSTICAS MUY EFICIENTES ANTE DATA COMPLEJA NO EXIGEN CONOCIMIENTO PREVIO DEL TIPO DE DISTRIBUCIÓN

  8. DIVISIÓN FUNDAMENTAL DE LOS MÉTODOS DE CLASIFICACIÓN • CLASIFICACIÓN SUPERVISADA SE CONOCE LA CLASE A LA CUAL PERTENECECADA PATRÓN DE LA MUESTRA • CLASIFICACIÓN NO SUPERVISADA LA MUESTRA ES NO CONTROLADA, NO EXISTE UNACLASIFICACIÓN PREVIA DE LAS OBSERVACIONES

  9. CLASIFICACIÓN NO SUPERVISADA DEFINICIÓN: AGRUPAR UN CONJUNTO DE n OBJETOS, DEFINIDOS POR p VARIABLES, EN c CLASES, DONDE EN CADA CLASE LOS ELEMENTOS POSEAN CARACTERÍSTICAS AFINES Y SEAN MÁS SIMILARES ENTRE SÍ QUE RESPECTO A ELEMENTOS PERTENECIENTES A OTRAS CLASES

  10. PROPÓSITOS • GRAFICAR GRUPOS AFINES, COMO ES EL CASO DE LOS DENDROGRAMAS DE LAS TAXONOMÍAS. • CLASIFICAR, SIMPLEMENTE, INFORMACIÓN ABUNDANTE Y COMPLEJA • HALLAR EL NÚMERO C DE CLASES ADECUADO • ENCONTRAR SUBCLASES DENTRO DE CLASES NATURALES • INTERPRETAR LOS PATRONES ANALIZANDO LAS CAUSAS INTRÍNSECAS DE LA FORMACIÓN DE LOS MISMOS

  11. APLICACIONES • Mercadeo • Resultados de búsquedas Web • Segmentación de imágenes • Sistemas de recomendación

  12. OBJETIVOS DUALES EN LA OBTENCIÓN DE UNA CLASIFICACIÓN ÓPTIMA • MINIMIZAR LAS DESVIACIONES ENTRE LAS OBSERVACIONES QUE PERTENECEN AL MISMO GRUPO • MAXIMIZAR LAS DISTANCIAS ENTRE LOS CENTROS DE LOS GRUPOS

  13. DISPERSIÓN DE UNA CLASE DEFINICIÓN: SE LLAMARÁ SWJ, DISPERSIÓN EN LA CLASE J, A LA SUMA DE LAS DISTANCIAS AL CUADRADO DE CADA OBSERVACIÓN Xi AL CENTRO mj DE LA CLASE (J) QUE LA CONTIENE mj

  14. CRITERIO DE OPTIMIZACIÓN MINIMIZAR LA SUMA DE LAS DISPERSIONES DE LAS CLASES:

  15. DISPERSIÓN TOTAL: INDICADOR, R2 m MIDE LA BONDAD DE LA CLASIFICACIÓN

  16. ¿CUÁNTAS PARTICIONES SON POSIBLES? EL NÚMERO DE PARTICIONES DE UN CONJUNTO DE n ELEMENTOS EN c CLASES ESTÁ DADO POR LOS NÚMEROS DE STIRLING DE SEGUNDA CLASE : N C PARTICIONES 8 3 966 12 4 611.501 15 4 42.355.950 20 5 749.206.090.500 POR EJEMPLO: ES IMPRÁCTICO HALLAR EL ÓPTIMO CALCULANDO EXHAUSTIVAMENTE EL VALOR DE PW PARA CADA PARTICIÓN

  17. MÉTODOS DE CLASIFICACIÓNNO SUPERVISADA • ANÁLISIS DE CONGLOMERADOS • BASADOS EN CENTROIDES • JERÁRQUICOS • BASADOS EN DISTRIBUCIONES • BASADOS EN DENSIDAD • MAPAS AUTO-ORGANIZATIVOS

  18. MÉTODOS DIRECTOS CARACTERÍSTICAS: • CALCULAN LAS DISTANCIAS DE LAS OBSERVACIONES A POSIBLES CENTROS DE LAS CLASES, PARA LUEGO MODIFICAR ESTOS ÚLTIMOS SIGUIENDO EL CRITERIO DE OPTIMIZACIÓN • NO HACEN USO DE LAS DISTANCIAS ENTRE LOS ELEMENTOS • EL NÚMERO DE CLASES SE FIJA DE ANTEMANO • PRINCIPALMENTE USADO CUANDO N ES GRANDE (N >5000, POR EJEMPLO)

  19. ALGORITMO ITERATIVO DEEVOLUCIÓN DE LOS CENTROS “K-MEANS” ETAPAS: • UBICACIÓN DE LOS CENTROS INICIALES DE LAS CLASES • ASIGNACIÓN DE LAS OBSERVACIONES A LA CLASE MÁS CERCANA • DETERMINACIÓN DE LOS NUEVOS CENTROS DE LAS CLASES • VERIFICAR SI SE CUMPLE ALGUNO DE LOS CRITERIOS DE FINALIZACIÓN DEL ALGORITMO

  20. DETERMINACIÓN DEL NÚMERO DE CLASES CENTROS FINALES

  21. K-means

  22. K-mean en una imagen

  23. DETERMINACIÓN DEL NÚMERO ÓPTIMO DE CLASES R2 NO SE OBTIENE UN BENEFICIO SIGNIFICATIVO POR DESGLOSAR EN MAS DE 4 CLASES .8 .7 .6 .5 ÓPTIMO .4 .3 .2

  24. A B C D E ALTURA MÉTODOS JERÁRQUICOS PROPÓSITO: • DADO UN CONJUNTO INICIAL DONDE CADA ELEMENTO ES UNA CLASE, CREAR UN ARBOL JERÁRQUICO AGRUPANDO EN CADA ETAPA LAS DOS CLASES UBICADAS A MÍNIMA DISTANCIA, ÉSTA INDICA LA ALTURA SOBRE EL ÁRBOL

  25. CARACTERÍSTICAS • CLASIFICAN A PARTIR DE LA MATRIZ DE DISTANCIA ENTRE LAS OBSERVACIONES • NO SE FIJA EL NÚMERO DE CLASES • SE DETERMINA EL NÚMERO ÓPTIMO DE CLASES A PARTIR DEL ÁRBOL JERÁRQUICO • APROPIADOS SÓLO SI EL TAMAÑO DEL CONJUNTO ES PEQUEÑO, EN CUYO CASO SON MÁS EFICICIENTES QUE LOS MÉTODOS DIRECTOS

  26. DISTANCIAS A DISTINGUIR ENTRE ELEMENTOS • EUCLÍDEA • ESTANDAR • MAHALANOBIS • MANHATTAN • COSENO ENTRE CLASES • DISTANCIA MÍNIMA • DISTANCIA MÁXIMA • DISTANCIA PROMEDIO • DISTANCIA PROTOTIPO (CENTROIDE) • MÍNIMA VARIANZA

  27. CLASIFICACIÓN NO SUPERVISADA DISTANCIA DE VUELOS ENTRE CIUDADES

More Related