1 / 12

Mineração de dados

Mineração de dados. Exercícios sobre classificação. O que deveria ser feito, na fase de preparação de dados, para aplicar o método ID3 para classificação com os dados abaixo?.

Télécharger la présentation

Mineração de dados

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mineração de dados Exercícios sobre classificação

  2. O que deveria ser feito, na fase de preparação de dados, para aplicar o método ID3 para classificação com os dados abaixo?

  3. O que deveria ser feito, na fase de preparação de dados, para aplicar o método k-NN para classificação com os dados abaixo?

  4. O que deveria ser feito, na fase de preparação de dados, considerando uma rede neural backpropagation para classificação usando os dados abaixo?

  5. O que deveria ser feito, na fase de preparação de dados, considerando o uso do algoritmo naïve bayes e os dados abaixo?

  6. Considere o seguinte conjunto de treino, em que cada exemplo é definido por três atributos (A,B,C) e a classe X. Sabendo que: • Entropia (S) = - (p+ log2 p+ + p- log2 p-) • Ganho (S, A) = Entropia (S) -  ((|Sv| / |S|) * Entropia (Sv)), onde Sv = subconjunto de S para um valor do atributo At |Sv| = número de elementos de Sv |S| = número de elementos de S a) Qual a incerteza (entropia) associada ao conjunto de treino inicial? b) Qual o Ganho de Informação para cada um dos atributos? (log2 1=0, log2 0,5=-1, log2 0,25=-2 , log2 0,75=-0,415, log2 0,333=-1,585, log2 0,667=-0,585) c) Face a este resultado, qual seria a árvore de decisão obtida para este conjunto de treino, construída de acordo com o critério de maximização do ganho de informação?

  7. Dada a árvore de decisão abaixo, que regras seriam geradas pelo algoritmo C4.5?

  8. Considerando os dados de treino abaixo e o algoritmo C4.5, quais seriam os intervalos de decisão considerados para o atributo Peso? Peso <= 65 e peso > 65 Qual a árvore de decisão gerada?

  9. Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo naive Bayes, considerando os dados de treino abaixo e sabendo que P( E1 |H ).P( E2 | H)... .P(En | H).P(H ) P(H|E)= P( E1 ).P( E2)... .P(En)

  10. Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo e k=1.

  11. Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo, k=3, e a seguinte tabela de distâncias para o atributo Z1:

  12. lágrimas reduzida normal astigmat. 1 sim não prescrição 2 miopia hipermetr. 4 3 Complete a árvore de decisãocolocando no lugar dos números das folhas, a classe, de forma a minimizaroserros de classificação. Faça a matriz de confusãocorrespondente.

More Related