Avatar

Dissertação de mestrado "RetweetPatterns: deteção de padrões espácio-temporais de retweets"

11 Junho 2014
Sem comentários

Screenshot 2014-06-06 12.17.03

 

Título: “RetweetPatterns: deteção de padrões espácio-temporais de retweets”

Autor: Tomy Antunes Rodrigues

Orientadores: Carlos Manuel Milheiro de Oliveira Pinto Soares (PhD) e Dino Ienco (PhD)

Curso: MIEIC – FEUP

Resumo:
As redes sociais estão cada vez mais presentes no dia a dia das pessoas, o Twitter e o Facebook são aquelas que mais se destacam. Revelando desta forma serem fontes de informação valiosas. Estas diferentes fontes de informação podem ser analisadas a fim de extrair conhecimento das mesmas (como por exemplo o comportamento dos utilizadores face a certos acontecimentos). Para lidar com essas fontes de informação, a área de Data Mining fornece técnicas interessantes que podem ser usados para extrair padrões úteis a partir destes dados. Este estudo orientado ao twitter terá desta forma como foco principal a identificação de padrões de retweets sendo um retweet o ato de re-publicar algo que foi postado no Twitter. O principal objetivo deste trabalho passa assim por perceber como é que a informação se propagou ao longo do tempo e caracterizar esse fenômeno pela extração e análise de padrões. Para extrair padrões de retweets usamos técnicas anteriormente desenvolvidas, como a Ferramenta GetMove.
A ferramenta GetMove foi desenvolvido durante a tese de doutoramento do Dr. Phan Nhat Hai e permite extrair diferentes tipos de padrões espácio-temporais. O GetMove estuda desta forma o comportamento de grupos de objetos em movimento (clusters) durante um tempo definido. O objetivo desta tese passa assim pela adaptação desta ferramenta para analisar dados do twitter. A fim de obter os grupos de objectos (clusters) necessários para a extracção de padrões, utilizou-se a abordagem desenvolvida na ferramenta TweeProfiles desenvolvida por Tiago Cunha. O objetivo desta ferramenta é identificar perfis de tweets (ou seja, clusters tendo em conta a dimensão temporal, espacial, social e de conteúdo). Em termos de resultados finais, a ferramenta foi concebida de forma intuitiva, tentando permitir ao utilizador uma percepção rápida e fácil dos resultados obtidos .
Por fim quantos aos dados utilizados como estudo de caso referem-se a tweets extraídos durante a manifestação no Brasil durante o período de 21/06/2013 a 17/07/2013.

Websitehttp://tomyantunesrodrigues.weebly.com/dissertaccedilatildeo.html

Texto integral: disponível no repositório da UP

 



Sem comentários