Avatar

LxMLS – Lisbon Machine Learning School

17 Julho 2011
Sem comentários

A LxMLS é a primeira edição de uma escola avançada no tópico de Aprendizagem Automática (Machine Learning). Esta área engloba um conjunto de técnicas que visa dotar máquinas (computadores) com capacidade para efectuar, de forma “inteligente”, tarefas de decisão, de reconhecimento, de previsão, etc. Em particular, este ano daremos especial destaque à Web e a tecnologias da linguagem. Para isso, vamos contar com a presença de investigadores de topo, provenientes de várias universidades e empresas de referência, que irão leccionar tópicos avançados nestas áreas. A escola tem ainda uma forte componente laboratorial, que permitirá aos alunos experimentar os conceitos apresentados nas aulas teóricas.

Na sua primeira edição, a LxMLS vai contar com cerca de 150 participantes de diferentes nacionalidades, e de diversos campos da sociedade (estudantes, professores e profissionais da área), o que é por nós considerado um grande sucesso.

A ideia de organizar a LxMLS surgiu duma vontade comum de parte dos organizadores, João Graça, André Martins e Luís Sarmento, regressados dos EUA onde estiveram em formação, de partilhar algumas das experiências e conhecimento adquirido com estudantes de doutoramento em Portugal que não tiveram hipótese de passar algum tempo no estrangeiro. Depois de alguns contacto com o Prof. Fernando Pereira (Google) surgiu a hipótese de organizar uma escola de Verão sobre o assunto em Lisboa. Desde logo se juntaram a este esforço outros professores (Prof. Mário Figueiredo, IST), bem como laboratórios de investigação (o Instituto de Telecomunicações e o laboratório L2F do INESC-ID de Lisboa) e instituições privadas, tais como o SAPO e a Priberam.

Qual o objectivo e a quem se dirige?

O principal objectivo da LxMLS é proporcionar um ambiente rico para a partilha de conhecimentos e experiências na área da Aprendizagem Automática. A escola dirige-se sobretudo a alunos de mestrado e doutoramento (em Portugal ou no estrangeiro), mas inclui também profissionais oriundos do meio industrial que têm interesse em conhecer o potencial inovador das técnicas de aprendizagem automática. Ao conseguir juntar alguns dos melhores investigadores da área procurou-se com esta escola atingir uma densidade de formação que dificilmente se conseguiria numa única instituição de ensino universitária em Portugal ou no estrangeiro.

Qual a sua importância no contexto da sociedade actual?

A Aprendizagem Automática é cada vez mais uma área chave na sociedade actual. Todos os dias utilizamos motores de pesquisa, redes sociais, tecnologias de tradução automática, onde se faz um uso intensivo destas técnicas. À medida que a sociedade caminha para uma maior produção e consumo de dados, surge uma necessidade crescente de automatizar todo um conjunto de processos que dificilmente poderiam ser executados por humanos. Há inúmeros casos de sucesso em que as máquinas nos assistem de forma inteligente em processos de tomada de decisão. Mesmo em tarefas consideradas muito difíceis, como tradução automática de texto ou reconhecimento de voz. Na realidade, todas as grandes empresas de tecnologias de informação, sem excepção, fazem uso abundante de técnicas de aprendizagem automática. Por isso, esta escola contribui para um aumento das competências nesta área estratégica, o que a médio prazo poderá ter impacto económicos importantes.

Qual a sua importância científica?

Para lá da sua vertente “tecnológica”, a área de Aprendizagem Automática tem tido um papel crucial noutras áreas científicas, como a Biologia Molecular ou a Medicina, contribuindo para várias descobertas importantes. Por outro lado, os aspectos teóricos fundamentais (a chamada Teoria da Aprendizagem) estão intrinsecamente ligados a domínios como a Ciência Computacional, a Estatística e a Optimização Numérica. A Aprendizagem Automática tem portanto contribuído para uma “fertilização cruzada” de todas estas disciplinas, pelo que a sua importância científica é inquestionável. Neste sentido, a LxMLS reveste-se de particular importância, porque permitirá a todos os participantes aproximarem-se do estado-da-arte na área. Cerca de 50% dos participantes pertence a instituições universitárias portuguesas, pelo que esperamos contribuir para um aumento significativo do potencial científico nesta área em Portugal. Temos esperança que os impactos desta escola se irão fazer sentir positivamente na qualidade e quantidade de trabalhos científicos que virão a ser produzidos a médio prazo em Portugal.

Como se vai desenvolver a iniciativa este ano?

Este ano o tema é “Learning for the Web”. A Web é um ambiente particularmente atraente para a utilização de técnicas de aprendizagem automática: primeiro, porque a existência de uma enorme quantidade de dados e a necessidade de processá-los automaticamente introduz novos paradigmas. Depois, a própria estrutura social da Web traz novos desafios científicos que nunca foram investigados. Finalmente, há enorme variedade de tarefas que lhe estão associadas, desde um simples detector de “spam” até a um sofisticado sistema de tradução automática. Para além disto, a Web é um ambiente ruidoso que dificulta o processamento automático, na medida em que é um ambiente aberto e dinâmico (estão sempre a aparecer novos conteúdos e ligações). Levanta por isso muitos desafios às técnicas de Aprendizagem Automática, cuja possibilidades de resolução nos parecem particularmente motivadoras para os participantes da LxMLS.

Do ponto de vista organizativo, a LxMLS vai ser dividida em três tipos de sessões. Durante as manhãs teremos sessões teóricas, em que serão apresentados os conceitos fundamentais de Aprendizagem Automática. Depois  teremos sessões laboratoriais onde, através de exercícios práticos, os alunos terão possibilidade de experimentar os conceitos em problemas concretos. No final da tarde, teremos palestras mais curtas em que se abordarão casos práticos de utilização destas técnicas.

Planeamos também vários eventos sociais, pois sabemos de experiência própria que estes momentos mais informais são fundamentais na troca de ideias e no estabelecimento de ligações para projectos futuros.

Que mais-valias pode representar para o país?

Esperamos que a LxMLS possa ter um impacto muito positivo a médio prazo, não só em termos de produção científica (através da rede de conhecimentos que irá potenciar), mas também em termos do investimento que poderá ser feito nesta área de investigação. Trata-se de uma área com uma grande importância estratégica e com muitas oportunidades de inovação a nível global. Por isso, com a LxMLS queremos também atrair o interesse do meio industrial e estreitar o fosso que separa as empresas e as universidades. Há muitas oportunidades de colaboração a esse nível que podem ser explorados, com ganhos para ambas as partes. Alguns destes objectivos já foram atingidos: primeiro, porque conseguimos envolver na organização deste evento algumas empresas portuguesas do sector das tecnologias de informação (a Priberam e o Sapo); segundo, porque cerca de 10% dos participantes da escola vêm da indústria. A tudo isto há a juntar o facto de termos tido uma afluência notável: temos cerca de 150 participantes, que é o dobro das nossas previsões mais optimistas.

Que oradores e investigadores de relevo, a nível nacional e internacional, vão participar? Que mais valias trazem a Portugal?

Vamos ter nove oradores no total, cada qual especialista reconhecido numa área particular.

Na parte da manhã dos tutoriais, temos o Prof. Koby Crammer, do Israel Institute of Technology (Technion), o qual trabalha sobretudo na área de aprendizagem estatística online, o Prof. Noah Smith, da Universidade de Carnegie Mellon (EUA),  especialista em processamento estatístico de linguagens naturais, o Dr. Slav Petrov, investigador do Google (Nova Iorque, EUA), cujo trabalho é ligado à sintaxe e à aprendizagem semi-supervisionada, o Prof. Xavier Carreras da Universidade Politécnica da Catalunha, especialista em aprendizagem discriminativa de modelos estruturados, o Prof. Jason Eisner, da Universidade de Johns Hopkins (EUA), perito em sintaxe, morfologia e algoritmos de programação dinâmica.

Na parte da tarde para as palestras mais práticas teremos o Prof. Miles Osborne, da Universidade de Edimburgo (Reino Unido), o qual trabalha em tradução automática estatística, social media e computação paralela em grande escala, o Prof. Mário Figueiredo (do Instituto Superior Técnico e do Instituto de Telecomunicações), referência na área de Aprendizagem Estatística, nomeadamente em modelização esparsa e compressed sensing, o Prof. Phil Blunsom, da Universidade de Oxford (Reino Unido), especialista em tradução automática e o Dr. João Graça, do INESC-ID (Lisboa), especialista em aprendizagem não supervisionada.

Como se pode ver, estes oradores cobrem um conjunto muito vasto de assuntos e a sua presença simultânea na escola será certamente uma grande mais-valia para todos os presentes.

Que assuntos vão abordar?

Durante as aulas da manhã, o objectivo é cobrir os tópicos fundamentais: teoria da decisão, classificação, modelos generativos e discriminativos, aprendizagem em batch e online, aprendizagem de modelos estruturados (sequências e árvores) e aprendizagem não supervisionada.

Durante as aulas da tarde serão cobertas aplicações concretas como social media, tradução automática estatística, aprendizagem em redes, aprendizagem na Web, e aprendizagem com informação a priori.

Que sessões de laboratório se vão realizar?

Vão-se realizar aulas de laboratório todos os dias, e estas irão cobrir os temas dos tutoriais da manhã. O enfoque destas sessões será em quebrar a natural barreira existente entre a teoria e a prática. Desta forma os alunos terão que implementar os métodos apreendidos, lidar com as dificuldades técnicas comuns destes métodos e aplicar a problemas reais, por exemplo classificação de sentimentos. O principal objectivo destas aulas é que depois da escola de Verão os alunos se sintam confortáveis em aplicar estes métodos aos seus problemas do dia a dia, sabendo com que problemas terão de lidar e como resolvê-los.

O programa completo pode ser consultado em LxMLS.



Sem comentários