Avatar

Dissertação de mestrado “TweeProfiles3: Visualização de Padrões Espácio-Temporais no Twiter”

29 Março 2015
Sem comentários

Título: “TweeProfiles3: Visualização de Padrões Espácio-Temporais no Twiter”

Autor: André Maia

Orientadores: Prof. Carlos Soares (FEUP)

CursoMestrado Integrado em Engenharia Electrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto

Resumo (PT):
Com o advento das redes sociais, uma grande quantidade de dados do utilizador foi gerada. Desde há alguns anos, os investigadores e as empresas aperceberam-se do valor associado a estas enormes quantidades de dados e dando origem ao desenvolvimento de algoritmos e ferramentas para extrair padrões e para os usar.
O TweeProfiles é uma ferramenta de clustering que permite analisar os dados dos tweets sob múltiplas dimensões: espacial, temporal, conteúdo e social. O objetivo foi o desenvolvimento de uma aplicação web para identificação de padrões em mensagens no Twitter. Até agora, foram de- senvolvidas duas extensões para este projeto, TweeProfiles2 e Olhó-Passarinho. Ambos realizam agrupamento sobre os dados do Twitter, mas com características únicas: o TweeProfiles2, processa dados em tempo real, e Olhó-Passarinho que acrescentou à dimensão de conteúdo as imagens. Todo o trabalho realizado no TweeProfiles até esta dissertação foi essencialmente técnico e cientí- fico com o objetivo de conceber e prototipar soluções para os desafios envolvidos. Por esta razão, ainda não foi possível fazer uma avaliação da ferramenta numa aplicação do mundo real. O ob- jectivo desta dissertação é dar um primeiro passo neste sentido, em que o domínio de aplicação é o jornalismo.
Para atingir este objectivo, começámos por fazer um levantamento dos requisitos específicos desse domínio de aplicação. Com base nesses requisitos e numa avaliação do estado do TweeProfiles2, foram realizadas algumas tarefas de manutenção e desenvolvimento para consolidar a ferramenta. Para além da resolução de alguns problemas na implementação existente, esta consolidação teve por objetivos melhorar tanto a recolha de dados como a interação com o utilizador, aspetos essen- ciais para podermos passar o sistema para produção. O mecanismo de recolha de dados foi substi- tuido pelo SocialBus. O SocialBus é uma ferramenta de recolha, processamento e armazenamento de dados de redes sociais, em particular do Twitter. Em relação à interação com o utilizador, foi re- alizado um inquérito com pessoas experientes em jornalismo, a fim de entender as necessidades e desejos de uma plataforma como o TweeProfiles3. Foi implementado um processo de visualização adequado para o fluxo de dados, usando vários widgets para melhor representar toda a informaçao. O sistema foi desenvolvido tendo em conta o estado da arte dos projetos nesta área e os resultados obtidos do estudo do utilizador, para podermos dar um passo em frente.
A utilidade da ferramenta desenvolvida para o jornalismo foi avaliada com base num teste de us- abilidade. Apesar de ter sido realizado com um pequeno conjunto de utilizadores, este teste serviu para atingir os objetivos do projeto, nomeadamente, fazer uma primeira avaliação da utilidade da ferramenta TweeProfiles numa aplicação real. Os resultados obtidos permitiram não só as suas potencialidades como questões a melhorar.

Abstract (EN):
With the advent of social networking, a lot of user-specific, voluntarily provided data has been generated. A few years ago, researchers and companies noticed the value that lied within those enormous amounts of data and developed algorithms and tools to extract patterns from those data and to use them.
TweeProfiles is a clustering tool that analyses tweets over multiple dimensions: spatial, temporal, content and social. The goal was to develop a web application to identify patterns in Twitter posts. So far, there have been two extensions to this project, TweeProfiles2 and Olhó-Passarinho. Both perform clustering over Twitter data but with unique features: TweeProfiles2 processes real-time data and Olhó-Passarinho integrated the analysis of images in the content dimension.
All work in TweeProfiles, up to this dissertation, was essentially technical and scientific in order to design and prototype solutions for the challenges identified. For this reason, it has not yet been possible to evaluate the tool in a real-world application. The aim of this work is a first step in this direction, in which the application domain is journalism.
To achieve this goal, we started by making a survey of the specific requirements of this appli- cation domain. Based on these requirements and an assessment of the state of TweeProfiles2 some maintenance and development activities were carried out to consolidate it. In addition to solving some problems, this consolidation aimed to improve both the data collection process as well as user interaction, essential aspects in order to switch the system to production. The data collection mechanism has been replaced by the SocialBus platform. SocialBus is a tool for the collection, processing and storage of data from social networks, namely Twitter. Regarding the interaction with the user, an investigation with a small group of experienced people in journalism were surveyed, in order to understand the needs and desires for a platform such as TweeProfiles3. A visualization process suitable for data streaming was designed, using multiple widgets to better represent all the information. The system was developed taking into account the state of the art projects in this area and the results obtained from the user study, in order to move the tool one step forward.
The usefulness of the developed tool for journalism was evaluated based on a usability test. Al- though it was carried out with a small set of users, it was sufficient to achieve the objectives of the project. In particular it enabled a first assessment of the usage of TweeProfiles in a real application, identifying not only its potential as well as issues that need improvement.

Texto integral: Repositório Aberto UP



Sem comentários