Verbetes 3

22 Dezembro 2014
Sem Comentários
O Verbetes tem como principal objectivo a extracção automática de micro biografias de entidades (pessoas, organizações, eventos) a partir de textos disponíveis na web (notícias, wikipedia). Este projecto começou a ser desenvolvido há aproximadamente 1 ano, e tem actualmente dois casos de uso com sucesso: o Voxx e o Mundo Visto Daqui Interactivo.

Pretende-se que o verbetes seja melhorado em duas frentes: (i) aumentar a sua cobertura, de forma a ser possível identificar um maior número de descritores das micro biografias das entidades; e (ii) extraír outros tipos de entidades como organizações e eventos. Paralelamente, espera-se ainda que sejam melhorados os processo de validação das entidades e micro-biografias, com o objectivo de garantir a qualidade dos dados.

Do ponto de vista científico, o Verbetes nasceu de uma pergunta para a qual não havia uma resposta imediata: Como extraír de forma automática os cargos e profissões de personalidades públicas mencionadas nas notícias? Neste momento, oos desafios científicos em causa visam a extracção e classificação automática de entidades, a desambiguação de entidades e a criação de métodos automáticos de validação e avaliação dos dados extraídos.

Espera-se no final ter sido possível criar um sistema capaz de extraír de forma automática micro biografias de entidades a partir de textos disponíveis na web, bem como publicar um conjunto de serviços web de acesso público para a pesquisa de entidades e respectivas micro biografias.

Responsável: Luís Sarmento

Instituição: FEUP

APIs online: services.sapo.pt

Atividade deste projeto:

Sem Comentários


Deixar um comentário