1 / 20

Microagragação

Microagragação. Nielsen Castelo Damasceno 2013. Sumário. Introdução SDC Microagregação Medida de perda de informação Algoritmo MDAV Aplicação da microagregação Referências. Introdução. Informações estatística é um bem fundamental nas sociedades modernas.

ezhno
Télécharger la présentation

Microagragação

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Microagragação Nielsen Castelo Damasceno 2013

  2. Sumário Introdução SDC Microagregação Medida de perda de informação Algoritmo MDAV Aplicação da microagregação Referências

  3. Introdução • Informações estatística é um bem fundamental nas sociedades modernas. • Serviços de estatísticas divulgam • Microdados • Dados tabulares • Macrodados • Necessidade da clarificação das informações e a confidencialidade dos dados.

  4. SDC • Controle de divulgação estatística (CDE) ou em inglês StatisticalDisclosureControl(SDC). • Minimizar os risco de divulgação sem alterar de forma significativa os dados. • Oferecer o máximo de informações possível à sociedade e minimizar o risco da divulgação. • Métodos de mascaramento ou anonimização. • Métodos perturbativos • Métodos não perturbativos

  5. Perturbativos Servem para modificar os valores das variáveis de identificação ou confidenciais. Variáveis confidenciais: salário, religião, filiação política, estado de saúde.

  6. Não Perturbativos Não alteram os valores da variáveis. Domingo-Ferrer e Torra (2001) proporão uma redução de detalhe no conjunto de dados originais.

  7. Microdados Informações individuais associado a uma pessoa, família ou empresa. As variáveis existentes em um arquivo de microdados individuais são: sexo, idade, ocupação, país de nascimento No caso de microdados de uma empresa: atividade econômica, número de empregados, etc.

  8. Tipos de arquivos de microdados

  9. Microagregação Para Domingo-Ferrer e Torra (2001), na microagregação os registros são agrupados em pequenos grupos, de pelo menos k. Para um dado registro em vez de publicar a variável original , publica-se a média dos valores de do grupo ao qual pertence. Método: Permitem a divulgação do conjunto de microdados se, nos registros correspondentes ao grupo de k ou mais indivíduos não houver nenhum indivíduo dominante. E se k é o valor limite. Os grupos devem ser o mas homogéneos possível.

  10. Microagregação • Grupos: • Fixo • Variável • Mateo-Sanz e Domingo-Ferre (1999) optaram investigar métodos de microagregação de conjunto de dados homogéneos. • Hansen e Mukherjee (2003) optaram por grupos fixo. • Os grupos devem ser o mas homogéneos possível.

  11. Microagregação Dado um conjunto de microdados com variáveis contínuas e registros (indivíduos), em que um registro particular pode ser visto como, , são variáveis. São formados grupos com indivíduos no i-ésimo grupo, e representa o j-ésimo registro do i-ésimo grupo. média do registro do i-ésimo grupo. média do conjunto de indivíduos.

  12. Medida de perda de Informação Maior a homogeneidade do grupo, menor a perda da informação. Maior a homogeneidade do grupo, menor é a soma dos quadrados.

  13. Microagregação • Domingo-Ferrer e Sebé (2006) disseram que microagregação pode ser modelado como um problema de clusters. • Objetivo: agrupar dados em grupo de dimensão igual a ke o mais homogêneo possível. • Dados parâmetros k: • Particionar os registros X em grupos de registros de pelo menos n registro cada. • Substituir cada registro pelo centroide do grupo para obter um conjunto de dados mascarado X’.

  14. Microagregação • Conjunto de idade de 9 respondentes. • Microagregados com .

  15. Microagregação • Medida de perda de Informação

  16. Algoritmo MDAV • MDAV (MaximumDistancetoAverage Vector)

  17. Microagregação • Exemplo proposto por Domingo-Ferrer et al (2006)

  18. Microagregação • Exemplo proposto por Domingo-Ferrer et al (2006)

  19. Microagregação • Exemplo proposto por Domingo-Ferrer et al (2006)

  20. Referências • Domingo-Ferrer, J., Martínez-Ballesté J., Mateo-Sanz, Sebé F. (2006), ‘Efficient multivariate data-oriented microaggregation’, The VLDB Journal, Springer-Verlag. • Aggawal C. C., Yu S. P (2008), ‘Privacy-Preserving Data Mining: Models and Algorithms’, Spring, New York. • M. Solé, V. Muntés-Mulero, J. Nin, (2012), Efficientmicroaggregationtechniquesforlargenumerical data volumes, Int. J. Inform. Secur. 11 (4) 253–267. • C. Panagiotakis, G. Tziritas, (2013), Successivegroupselection for microaggregation,IEEETrans. Knowl. Data Eng. 25 (5) 1191–1195.

More Related