Notícias

-->
Semi-Automatic Creation of a Reference News Corpus for Fine-Grained Multi-Label Scenarios
sapo labs

Semi-Automatic Creation of a Reference News Corpus for Fine-Grained Multi-Label Scenarios

J. Teixeira, L. Sarmento and E. Oliveira Third Workshop on Intelligent Systems and Applications in 6ª Conferência Ibérica de Sistemas e Tecnologias de Informação (CISTI), June 2011, Chaves, Portugal Abstract: In this paper we tackle the problem of creating a reference …

18 Jul
0
‘twazn me!!! ;(’ Automatic Authorship Analysis of Micro-Blogging Messages
sapo labs

‘twazn me!!! ;(’ Automatic Authorship Analysis of Micro-Blogging Messages

Sousa-Silva, R.; Laboreiro, G.; Sarmento, L.; Grant, T.; Oliveira, E. & Maia Proceedings of the 16th International Conference on Applications of Natural Language to Information Systems (NLDB 2011), July 2011, Alicante, Spain Abstract: In this paper we propose a set of stylistic markers for automatically attributing authorship to micro-blogging messages. The proposed markers include highly personal and idiosyncratic editing options, such as ‘emoticons’, interjections, punctuation, abbreviations and other low-level features. We evaluate the ability of these features to help discriminate the authorship of Twitter messages among three authors. For that purpose, we train SVM classifiers to learn stylometric models for each author based on different combinations of the groups of stylistic features that we propose. Results show a relatively good-performance in attributing authorship of micro-blogging messages (F = 0.63) using this set of features, even when training the classifiers with as few as 60 examples from each author (F = 0.54). Additionally, we conclude that emoticons are the most discriminating features in these groups.

18 Jul
0
LxMLS – Lisbon Machine Learning School
bjunior@gmail.com

LxMLS – Lisbon Machine Learning School

A LxMLS é a primeira edição de uma escola avançada no tópico de Aprendizagem Automática (Machine Learning). Esta área engloba um conjunto de técnicas que visa dotar máquinas (computadores) com capacidade para efectuar, de forma “inteligente”, tarefas de decisão, de reconhecimento, de previsão, etc. Em particular, este ano daremos especial destaque à Web e a tecnologias da linguagem. Para isso, vamos contar com a presença de investigadores de topo, provenientes de várias universidades e empresas de referência, que irão leccionar tópicos avançados nestas áreas. A escola tem ainda uma forte componente laboratorial, que permitirá aos alunos experimentar os conceitos apresentados nas aulas teóricas. Na sua primeira edição, a LxMLS vai contar com cerca de 150 participantes de diferentes nacionalidades, e de diversos campos da sociedade (estudantes, professores e profissionais da área), o que é por nós considerado um grande sucesso. A ideia de organizar a LxMLS surgiu duma vontade comum de parte dos organizadores, João Graça, André Martins e Luís Sarmento, regressados dos EUA onde estiveram em formação, de partilhar algumas das experiências e conhecimento adquirido com estudantes de doutoramento em Portugal que não tiveram hipótese de passar algum tempo no estrangeiro. Depois de alguns contacto com o Prof. Fernando […]

17 Jul
0
Projeto Ferramenta para o Planeamento de Itinerários Turísticos – Universidade de Aveiro
bjunior@gmail.com

Projeto Ferramenta para o Planeamento de Itinerários Turísticos – Universidade de Aveiro

Estudos recentes sobre o turismo têm sido marcados por discussões sobre os novos turismos em que os actuais modelos de viagem estão tendencionalmente no fim de ciclo, pelo que existe uma procura incessante de novas soluções (modelos de viagens) mais adequados aos gostos e exigências dos tempos actuais, ou seja, adaptáveis aos novos padrões de comportamento caracterizados pela diversidade, pela mobilidade e pela escolha. Nesse sentido, pretende-se desenvolver um sistema para pesquisar informação sobre os recursos turísticos numa dada região (por exemplo: monumentos, museus, praias, festividades, espectáculos ou restaurantes), e auxiliar na elaboração de itinerários turísticos adaptados ao perfil dos utilizadores (turistas), tendo em atenção, por exemplo, as suas preferências culturais ou opções de carácter económico. Responsável: Professor Helder Zagalo

15 Jul
0
Dissertação do MIEIC sobre Caracterização de Pesquisas de Saúde em Motores de Pesquisa Generalistas
sapo labs

Dissertação do MIEIC sobre Caracterização de Pesquisas de Saúde em Motores de Pesquisa Generalistas

No passado dia 5 de Julho, Daniela Dias, estudante do Mestrado Integrado em Engenharia Informática e Computação, defendeu com sucesso a dissertação intitulada “Caracterização de Pesquisas de Saúde em Motores de Pesquisa Generalistas”. Este trabalho foi desenvolvido em colaboração com …

13 Jul
0
Internet e Web Development – Academia de Verão
sapo labs

Internet e Web Development – Academia de Verão

Teve hoje lugar a sessão de "Internet e Web Development", destinada a alunos do 10º, 11º e 12º anos que participaram no programa P4 (Produção para Media Social – Web 2.0  ) Academia de Verão™, organizada pela Universidade de A…

12 Jul
0
Dissertação do MIEIC sobre Caracterização de Pesquisas Web em Portugal
sapo labs

Dissertação do MIEIC sobre Caracterização de Pesquisas Web em Portugal

Rui Ribeiro, estudante finalista do MIEIC, defendeu com sucesso, no passado dia 5 de Julho, a dissertação intitulada “Characterization of Portuguese Web Searches”. Este trabalho de dissertação foi realizado em colaboração com o SAPO, e focou-se na análise de uma …

7 Jul
0
New presentation at Euro ITV 2011
sapo labs

New presentation at Euro ITV 2011

Here is the presentation our group had today in the Future TV workshop inEuroITV 2011 – Lisbon. We discuss in a conceptual approach how can SocialiTV features and an IPTV platform be integrated in public places where users experience TV collectiv…

29 Jun
0
Novo serviço Sapo Listas / SemanticLists
bjunior@gmail.com

Novo serviço Sapo Listas / SemanticLists

O Sapo Listas / SemanticLists é um serviço web que disponibiliza listas palavras agrupadas em função de determinadas categorias, tais como profissões, tipos de organizações, nacionalidades, etc. Associado a cada elemento da lista (i.e. palavra) pode estar associado um conjunto aberto de propriedades em estilo chave – valor, que depende essencialmente do uso que se pretende dar a cada lista. O Sapo Listas / SemanticLists foi pensado para poder dar suporte a tarefas de processamento de linguagem e extracção de informação, e já é usado actualmente noutros projectos como o Verbatim/Voxx e o Verbetes. O Sapo Listas / SemanticLists tem três serviços base (disponíveis nos URLs apresentados): Get Lists Info – retorna o nome das listas que temos disponíveis, a tag e uma breve descrição de cada uma; Get Words – retorna, para uma dada lista (no exemplo a lista de profissões), as palavras associadas e as suas respectivas propriedades (neste caso propriedades gramaticais); Get Lists From Word – para uma dada palavra passada como argumento (“word”), retorna a ou as listas que contêm essa palavra. Este serviço retorna a informação em formato JSON (default) ou XML, consoante o argumento passado em “format”, como se encontra exemplificado aqui. No caso de […]

21 Jun
0
1st SAPO Data Challenge – Final Results
bjunior@gmail.com

1st SAPO Data Challenge – Final Results

The First Data Challenge First of all, we wish to thanks all challengers for their effort. We hope that this has been a good opportunity for working with real data (real data is nasty!) and to learn more about this type of prediction problems. We know that the problem was relatively hard: it was more than simply predicting missing points from a single time-series, given a few others data points from that time-series.  In fact, the challenge was to predict several complete time-series based on the behavior of other series. Twenty six participants hailing from nine countries came forward to face this 1st SAPO Data Challenge. Seven of our challengers provided their mighty predictions. We evaluated the results according to two metrics: Cumulative Absolute Error Cumulative Relative Error And we computed three rankings, one for each of these metrics, and another combining the results of both. Here are the results. 1. Ranking based on Cumulative Absolute Error Run CAE 1. nick_ruiz_3.tsv 102534 2. nick_ruiz_2.tsv 102554 3. nick_ruiz_1.tsv 103504 4. diogo_costa_3.tsv 104152 5. diogo_costa_2.tsv 104926 6. jose_santos_1.tsv 107211 7. diogo_costa_1.tsv 109789 8. luis_marujo_3.tsv 111236 9. luis_marujo_1.tsv 111431 10. filipe_rodrigues_3.tsv 112272 11. filipe_rodrigues_1.tsv 113110 12. filipe_rodrigues_2.tsv 116703 13. fabio_pedrosa_rr.tsv 127600 14. jose_santos_3.tsv 135568 […]

20 Jun
0
Projeto SPotTED – Social web Public healTh Event Detection – Universidade de Aveiro
bjunior@gmail.com

Projeto SPotTED – Social web Public healTh Event Detection – Universidade de Aveiro

O aumento de conteúdos gerados por utilizadores, através das plataformas de redes sociais, blogs e micro-blogs, veio criar diversas oportunidades. Esses conteúdos têm vindo a ser aproveitados através de várias abordagens em diferentes áreas. Na área da saúde, alguns trabalhos científicos foram já apresentados, tirando partido dos comentários e posts em serviços como o Twitter (http://twitter.com/) [1] ou de pesquisas efectuadas em motores de busca da internet [2,3], para detectar eventos e/ou epidemias. Um tema especialmente focado têm sido os surtos de gripe (influenza). Existem também serviços activos, como o “Global Public Health Intelligence Network” (http://www.phac-aspc.gc.ca/gphin/), criado pela “Public Health Agency of Canada”, que identifica, filtra e publicita potenciais focos de doença, tendo por base uma análise de fontes noticiosas e sítios web. Neste contexto, o projecto aqui proposto tem como objectivo a detecção de eventos na área da saúde, tendo como base a análise das pesquisas executadas pelos utilizadores e das entradas em serviços de blog e micro-blog (‘posts’), em língua portuguesa. Um evento é caracterizado como um aumento, estatisticamente relevante, do número de pesquisas e/ou posts sobre um determinado tema da área da saúde (p.ex. doenças, sintomas). Espera-se pois que através deste projecto seja criado um conjunto de […]

15 Jun
0
Projeto SapoMed – Aplicação móvel para controlo da ingestão de medicação – Universidade da Beira Interior
bjunior@gmail.com

Projeto SapoMed – Aplicação móvel para controlo da ingestão de medicação – Universidade da Beira Interior

A aplicação é entendida como um diário de ajuda e controlo à ingestão de medicamentos, que controla e gere toda a medicação prescrita com o objetivo principal de prevenir erros de medicação. Cada utilizador através do SapoMed, instalado no seu smartphone ou tablet, encontrará uma lista de medicamentos que contém toda a medicação prescrita, interagindo com o utilizador através de sons, e alertas de vibração. A aplicação possui um “centro de emergência”, que no caso de um erro de medicação, uma mensagem de texto e/ou e-mail é enviado para um número de emergência ou ainda é efetuada uma chamada de emergência para esse mesmo número, que pode ser um profissional de saúde ou um familiar. A característica única que a destinge das demais aplicações do género é o uso da câmara do dispositivo móvel que captura o código de barras da caixa do medicamento e acesso à base de dados do Infarmed, retirando toda a informação do medicamento automaticamente. Assim, os idosos com dificuldades em usar os seus dedos para inserir informações de um determinado medicamento, têm ao seu dispor uma solução simples e eficaz. Responsável: Joel Rodrigues

15 Jun
0