Avatar

Dissertação de Mestrado sobre Pesquisa em Imagens de Capas de Jornais

5 Agosto 2013
Sem comentários

Gazeta

Tiago Varela, estudante finalista do MIEIC da FEUP, defendeu com sucesso, no passado dia 18 de Julho (2013), a dissertação de mestrado intitulada “Information Extraction and Search in Newspapers and Magazines Front Pages”. Este trabalho foi realizado em colaboração com o SAPO e focou-se no desenvolvimento de um sistema de pesquisa sobre uma coleção de imagens de capas de jornais.

Neste trabalho foi desenvolvido um método de extração de palavras, que se foca especificamente em recuperar informação de imagens de capas de jornais atuais. Este método tenta dividir o problema do reconhecimento de caracteres presentes em toda a capa, no subproblema de reconhece-los em regiões delimitadas da capa. Para validar a eficácia do método foi criada uma plataforma de testes adequada ao estudo. Para isso, foi anotado manualmente o texto presente em 35 capas de jornais, sendo isso usado como base de comparação entre o método implementado e o uso apenas de software de reconhecimento de caracteres aplicado a toda a capa. Aqui o método desenvolvido obteve um aumento de 8,62 pontos percentuais na precisão de deteção de caracteres em relação ao teste base de usar apenas o software de reconhecimento de caracteres em toda a capa. Foi também desenvolvido para este estudo um protótipo de um arquivo de jornais online, chamado Gazeta. Este protótipo permite pesquisar por palavras e obter as capas que contêm essas palavras, mostrando também um gráfico com o número de ocorrências dessas palavras ao longo de um período de tempo.

O texto integral da dissertação ficará disponível em breve no Repositório da Universidade do Porto.



Sem comentários