1 / 85

Cláudia Rita de Franco Orientador: Adriano Joaquim de Oliveira Cruz Março/2002

Novos Métodos de Classificação Nebulosa e de Validação de Categorias e suas Aplicações a Problemas de Reconhecimento de Padrões. Cláudia Rita de Franco Orientador: Adriano Joaquim de Oliveira Cruz Março/2002. Problemas Abordados. Validação de Categorias

neka
Télécharger la présentation

Cláudia Rita de Franco Orientador: Adriano Joaquim de Oliveira Cruz Março/2002

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Novos Métodos de Classificação Nebulosa e de Validação de Categorias e suas Aplicações a Problemas de Reconhecimento de Padrões Cláudia Rita de Franco Orientador: Adriano Joaquim de Oliveira Cruz Março/2002

  2. Problemas Abordados • Validação de Categorias • Descobrir o número e a disposição das categorias que melhor representam o problema • Reconhecimento de Padrões • Identificar e classificar padrões recorrentes nos dados

  3. Índice • Estudo Realizado • Categorização • Classificação • Validação de Categorias • Propostas • EFLD • ICC • Sistema ICC-KNN

  4. Estudo Realizado  Categorização  Classificação  Validação de Categorias

  5. Categorização • Processo de particionar um conjunto de amostras em subconjuntos (categorias) • Dados similares entre si por suas características • Disposição Espacial • Categoria definida pela proximidade das amostras – Distância • Partições Rígidas e Nebulosas

  6. Classificação • Técnica que associa amostras a classes previamente conhecidas • Rígida e Nebulosa • Supervisionados • MLP  treinamento • Não supervisionados • K-NN e K-NN nebuloso  sem treinamento

  7. Reconhecimento de Padrões • Reconhecimento de Padrões + Categorização  Sistema Estatístico Não paramétrico de Reconhecimento de Padrões • Estatístico  avalia a similaridade dos dados através de medidas matemáticas • Não-Paramétrico  sem conhecimento prévio da distribuição das amostras

  8. Identificação de Características Denominação de Características Dados de Treinamento Taxa de erro Extração de Características Classificador Dados de Teste Categorização Validação de Categorias Sistema Estatístico Não-Paramétrico de Reconhecimento de Padrões

  9. Métodos de Categorização • Não-Hierárquicos • Dados distribuídos pelo número de categorias pré-definido • Critério é otimizado • Minimização da variação interna das categorias

  10. Métodos de Categorização • Hierárquico  1ª Abordagem • Cada ponto é um centro de categoria • Cada 2 pontos mais próximos são fundidos em uma categoria • Número de categorias desejado é atingido • Hierárquico  2ª Abordagem • Uma categoria contém todas as amostras • Critério é utilizado para dividí-la no número de categorias desejado

  11. Métodos de Categorização • Rígidos • Cada amostra pertence a uma única categoria • Nebulosos • Cada amostra pertence a todos os agrupamentos com diferentes graus de afinidade • Grau de inclusão

  12. Métodos de Categorização  k-Means  K-NN e K-NN nebuloso FCM  FKCN GG GK

  13. Métodos de Categorização • K-Means e FCM • Distância Euclidiana  Hiperesferas • Gustafson-Kessel • Distância de Mahalanobis  Hiperelipsóides • Gath-Geva • Distância de Gauss  superfícies convexas de formato indeterminado

  14. Rede Kohonen de Categorização Nebulosa FKCN • Método de Categorização Nebuloso não supervisionado • Distância Euclidiana • Categorias hiperesféricas • Converge mais rápido que FCM • Forte tendência a convergir para mínimos locais • Categorias pouco representam as classes

  15. K-NN e K-NN nebuloso • Métodos de Classificação • Classes identificadas por padrões • Classifica pelos k vizinhos mais próximos • Conhecimento a priori das classes do problema • Não se restringe à uma distribuição específica das amostras

  16. Classe 2 Classe 1 Classe 3 w4 w2 w5 w3 w13 w9 w14 w1 w10  w8 w7 w6 w11 w12 Classe 4 Classe 5 K-NN Rígido

  17. Classe 2 Classe 1 Classe 3 w2 w4 w5 w13 w9 w1 w14 w3 w10  w8 w7 w6 w11 w12 Classe 4 Classe 5 K-NN Nebuloso

  18. Medidas de Validação

  19. Medidas de Validação • Usadas para encontrar o número ideal de categorias que melhor representa o espaço amostral • Número de classes desconhecido • Número de classes  Número de categorias

  20. Medidas de Validação • Aplicadas a partições geradas por um método de categorização • Estima qualidade das categorias geradas • Rígidas ou Nebulosas

  21. Coeficiente de Partição – F • Medida de Validação Nebulosa • Maximizar – 1/c  F  1 • Diretamente influenciada pelo • Número de categorias e Sobreposição das classes

  22. Compacidade e Separação – CS • Medida de Validação Nebulosa • Minimizar – 0  CS   • Avalia diferentes funções objetivo

  23. Compacidade e Separação – CS • Mede: • O grau de separação entre as categorias • A compacidade das categorias • Não sofre influência da sobreposição das categorias • Maior taxa de acertos dentre as medidas de validação estudadas

  24. Discriminante Linear de Fisher - FLD • Medida de Validação Rígida • Mede a compacidade e a separação entre as categorias • Matriz de Espalhamento entre Classes – SB • Matriz de Espalhamento Interno – SW

  25. Discriminante Linear de Fisher - FLD • Critério J – Maximizado 

  26. Indicadores de Validade • Calculam o grau de separação entre as categorias • Menor a sobreposição das categorias  melhor a categorização obtida • MinRF, MaxRF e MinNMMcard

  27. Propostas  EFLD  ICC  Sistema ICC-KNN

  28. EFLD

  29. EFLD • Extended Fisher Linear Discriminant • Extensão do Discriminante Linear de Fisher • Capacidade de validar categorias rígidas e nebulosas

  30. EFLD • Matriz Estendida de Espalhamento entre Classes • mieé o centróide da categoria i  e

  31. EFLD • Matriz Estendida de Espalhamento Interno • Matriz Estendida de Espalhamento Total  

  32. EFLD • Conclusão • Espalhamento total do sistema é independente da natureza das partições se o somatório dos graus de inclusão dos pontos em cada categoria é igual a 1  Constante

  33. EFLD • Critério de Fisher Estendido • Determinante – limite em relação ao número de pontos de cada categoria • Traço – mais rápido de calcular • Sem limitações de número de pontos

  34. EFLD – Otimização • Matrizes de Espalhamento – geradas pelo produto de um vetor coluna por seu transposto • Traço – quadrado do módulo do vetor gerador

  35. EFLD – Otimização • Soma dos traços das matrizes SBe e SWe é constante • sTe é calculado uma única vez • sBe é mais rápido de calcular que sWe

  36. EFLD – Otimização • O critério de Fisher J pode ser reescrito como • Vantagem – cálculo mais rápido • Melhor número de categorias - Maximizar 

  37. EFLD – Aplicação • Três classes com 500 pontos cada • X1 – (1,1), (6,1), (3,5, 7) com Std 0,3 • X2 – (1,5, 2,5), (4,5, 2,5), (3,5, 4,5) com Std 0,7 • Aplicar FCM para m = 2 e c = 2 ...6

  38. EFLD – Aplicação • Para classes sobrepostas, Je, como J, erra alta sobreposição  baixa confiabilidade • Comportamento análogo ao FLD

  39. EFLD – Aplicação Alocação errônea dos centros Mínimo local = Ponto médio do conjunto de pontos Je extremamente pequeno = 9,8010 x 10-5

  40. ICC

  41. ICC – Inter Class Contrast • EFLD • Cresce conforme o número de partições cresce • Cresce com a sobreposição das classes  Atinge um valor máximo para um falso número ideal de categorias

  42. ICC • Avalia um espaço particionado rígido ou nebuloso • Analisa: • Compacidade das categorias • Separação das categorias • Maximizar

  43. ICC • sBe – estima a qualidade da alocação dos centros das categorias • 1/n – fator de escala • Compensa a influência do número de pontos no termo sBe

  44. ICC • Dmin – distância Euclidiana mínima entre os centros das categorias • Neutraliza o comportamento crescente de sBe evitando o máximo valor de ICC para uma número de categorias superior ao ideal • 2 ou mais categorias representam uma classe – Dmin decresce abruptamente

  45. ICC • – Raiz do número de categorias • Evita o máximo valor de ICC para uma número de categorias inferior ao ideal • 1 categoria representa 2 ou mais classes • Dmin aumenta

  46. ICC – Aplicação Nebulosa • Cinco classes com 500 pontos cada • Sem sobreposição de classes • X1 – (1,2), (6,2), (1, 6), (6,6), (3,5, 9) Std 0,3 • Aplicar FCM para m = 2 e c = 2 ...10

  47. ICC – Aplicação Nebulosa • Cinco classes com 500 pontos cada • Alta sobreposição de classes • X1 – (1,2), (6,2), (1, 6), (6,6), (3,5, 9) Std 0,3 • Aplicar FCM para m = 2 e c = 2 ...10

More Related