1 / 27

Social  Query

Social  Query. André (arrr@cin.ufpe.br) Jacinto (jfsr@cin.ufpe.br). Roteiro  . Motivação  Social Query Aardvark Conclusão Referências. Motivação. Necessidade de informações mais relevantes . “Data de nascimento de Albert Eistein ?”

whitby
Télécharger la présentation

Social  Query

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Social  Query André (arrr@cin.ufpe.br) Jacinto (jfsr@cin.ufpe.br)

  2. Roteiro   • Motivação  • Social Query • Aardvark • Conclusão • Referências

  3. Motivação • Necessidade de informaçõesmaisrelevantes. • “Data de nascimento de Albert Eistein?” • “Do you have any good babysitter recommendations in. Palo Alto for my 6-year-old twins? I'm looking for somebody that won't let them watch TV.” • Realização de consultas com graumaior de contextualização (linguagem natural) • Questõessemrespostasna web

  4. Social Query • O que é Social Query? • É um tipo de consulta de web que leva em conta o Social Graph da pessoa que realiza a consulta.  • Trazem opiniões dos usuários dos serviços e não apenas dos provedores.

  5. Social Query x Traditional Web Search • Traditional Web Search • Consultas por palavras chaves • Baseado no library paradigm • A relevância é determinada através da análise do texto de cada documento ou a estrutura de links dos documentos. • Confiança baseada na autoridade • Ex: Google, Bing, Search.com

  6. Social Query x Traditional Web Search • Social Search • Consultas por linguagem natural • Baseado no village paradigm • Busca por pessoas  • Confiança baseada na intimidade • Ex: Aardvark

  7. Aardvark - O que é? • Mamífero africano • (aarde, "terra", e vark, "porco“) • Mecanismo de busca social  • Baseado no village paradigm • Perguntas em linguagem natural • Informação nas pessoas, não em documentos • Consultas subjetivas: • Opinião • Conselho • Experiência • Recomendações • Serviço adquirido pelo Google em 2010 • Aardvark foi desligado em setembro de 2011

  8. Aardvark - Funcionamento básico

  9. Aardvark - Componentes Os principais componentes do Aardvark são: • Crawler e Indexer • Query Analyzer • Ranking Function • User Interface

  10. Aardvark - Iniciação do Usuário • Indexação de informação de amizade e filiação • Conectar a uma rede social existente (Facebook/LinkedIn) • Importar lista de contatos de alguma conta • Convidar amigos manualmente • Informação é armazenada no Social Graph • Indexação dos tópicos sobre os quais o novo usuário tem algum nível de conhecimento/experiência • O próprio usuário acredita ser experiente • Outros usuários confiam na opinião do usuário • Página estruturada de perfil (Topic Parser) • Conta na qual o usuário posta atualizações (Topic Extractor) • Comportamento do usuário ao usar o Aardvark • Informação é armazenada no Forward Index • Inverted Index é obtido a partir do Forward Index

  11. Aardvark – A vida de uma consulta Esquemático da arquitetura do Aardvark

  12. Aardvark – O modelo • Score de relevância (dependente de consulta): • Score de qualidade (independente de consulta): • A função de pontuação (composição das duas probabilidades acima citadas):

  13. Aardvark – Social Crawling • Engenhos de busca necessitam de uma base de conhecimento abrangente. • Traditional web search • O conhecimento está contido no documentos e páginas da rede. • Uso de web crawlers em larga-escala. • Social search • O conhecimento contido nas pessoas. • Método de aquisição de conhecimento a criação de uma boa experiência para os usuários, com isso, permanecerão ativos e inclinados a convidar seus amingos.

  14. Aardvark – Indexando pessoas • Desafio: Selecionar o usuário correto para responder uma dada pergunta de um outro usuário. • Questões para indexação: • Dado um usuário • Quais tópicos ele é capaz de responder? • As quais usuários ele está conectado?

  15. Aardvark – Indexando pessoas • Quais os tópicos ele é capaz de responder? • Fontes de informação: • Usuários são solicitados a fornecer pelo menos três tópicos que eles acreditam ter conhecimento; • Amigos de um usuário são encorajados a fornecer alguns tópicos que eles confiam na opinião do usuário; • Aardvark analisa tópicos a partir de perfis online dos usuários (caso fornecido). • Aardvark automaticamente extrai tópicos de textos não estruturados encontrados em páginas ou blogs, caso sejam providos. • Aardvark automaticamente extrai tópicos de mensagens de atualização do status (twitter, facebook) e a partir das mensagens que eles enviam a outros usuários no próprio sistema do Aardvark. • Não é uma fonte de resposta, mas um indicador de quais tópicos o usuário provavelmente é capaz de dar novas respostas.

  16. Aardvark – Indexando pessoas • As quais usuários ele está conectado? • Fontes de informação: • Conexão social (amigos em comum, filiação …) • Similaridade demográfica. • Similaridade de perfil (Filmes favoritos …) • Similaridade de vocabulário • Conversão (frequência de troca mensagens) • Verbosidade (tamanho médio das mensagens) • Educação (uso do “Obrigado!“)

  17. Aardvark – Analizando perguntas • Objetivo: Entender a perguntapara que esta possa ser enviada apropriadamente para os usuários que têm interesse e possuam conhecimento para respondê-la. • Filtragem • Classificadores de perguntassãoexecutados • NonQuestionClassifier • InappropriateQuestionClassifier • TrivialQuestionClassifier • LocationSensitiveClassifier • Ranking de tópicosespecíficosparauma dada pergunta

  18. Aardvark – O algoritmo de ranking • Realizado pelo Mecanismo de Roteamento • Determina uma lista ordenada de usuários que devem ser contactados para responder uma pergunta • Os principais fatores determinantes do ranking: • Topic Expertise • Connectedness • Availability • A lista de candidatos que sobreviveram ao processo de filtragem é retornada ao Gerente de Conversa.

  19. Aardvark – Interface do Usuário • Vários canais de comunicação: • SMS, Email, iPhone, Twitter • Interfaces leves e de simples interação. • Conversação é restrita • Encoraja os usuários a responderem • Cuidado para não sobrecarregar usuários

  20. Aardvark – Interface do Usuário

  21. Aardvark – Interface do Usuário • Usuário pode tentar responder questões ainda não respondidas. • Pessoas se sentem motivados a responder.

  22. Aardvark – Análise do sistema • Disponível em versão beta em Março de 2009 • Dados de Outubro de 2009: • O número de usuários cresceu de 2.272 para 90.361 • Total de 225.047 perguntas • Total de 386.702 respostas

  23. Aardvark – Análise do sistema • Aaardvark é ativamente usado: • 50.526 usuários (55.9% do total) geraram conteúdo • 66.658 usuários (73.8% do total) são passivamente engajados • Média de volume de consultas é 3.167 consultas por dia • Média de consultas mensais emitidas por usuários ativos é 3.1 • Usuários móveis são particularmente ativos • Usuários de dispositivos móveis são mais ativos que usuários desktop • Perguntas são altamente contextualizadas • Em engenhos de busca tradicionais: 2.9 palavras • No aardvark é de 18.6 palavras

  24. Aardvark – Análise do sistema • Perguntas são respondidas rapidamente • 57.2% das perguntas receberam sua primeira resposta em menos de 10 minutos • 87.7% das perguntas receberam pelo menos uma resposta • As perguntas recebem, em média, 2.08 respostas

  25. Aardvark – Análise do sistema • Respostas são de alta qualidade • As respostas do aardvark são abrangentes e concisas • A quantidade média de palavras em uma resposta é 22.2 • 9.1% das respostas incluem uma conexão para hipertextos • 70.4% das respostas foram pontuadas como bom • 14.1% foi pontuada como OK • 15.5% foi pontuada como ruim

  26. Conclusão • Os mecanismos tradicionais de busca na web sempre retornam um documento, porém nem sempre suprem a necessidade de informação do usuário. • Mecanismos de busca social suprem a necessidade de informação do usuário, garantindo bons resultados em contextos específicos.

  27. Referências • Horowitz and S.D. Kamvar. 2010. The Anatomy of aLarge-Scale Social Search Engine. April, 2010. • A. Banerjee and S. Basu. A Social Query Model forDecentralized Search. In SNAKDD, 2008.  • Aardvark Social Search Engine: http://vark.com/ • Google Acquires Aardvark: http://techcrunch.com/2010/02/11/google-acquires-aardvark-for-50-million/

More Related