Seminários do Grupo de Banco de Dados e Imagens

    Programa de Pós-Graduação em Ciência da Computação - UFU

1° Semestre de 2013



sss

Seminários de Banco de Dados e Imagens


 Responsável : Sandra de Amo

Local : Sala 1B132
Terças-feira de 16:30 às 18:00h

Cronograma dos Seminários
Participantes
 
Docentes

Denise Guliato
Bruno Travençolo
Anderson Rodrigues dos Santos
Marcelo Keese Albertini
Daniel Abdala
Marial Camila Barioni
Humberto Razente

Doutorandos

Ernani de Melo - Trabalho em Andamento  
Marcos Roberto Ribeiro - Pesquisa Bibliográfica

Mestrandos

Cleiane Gonçalves - Trabalho Avançado
Juliete Ramos -  Trabalho em Andamento 
Jaqueline Papini - Trabalho em Andamento  
Daniela - Trabalho Avançado
Walter Silva - Ouvinte
Emilia Nogueira  - Ouvinte

Graduação
                                                                                      
Home


Seminários


Dia Apresentador Categoria Titulo
       Resumos
    
21/05/2013 Marcelo Keese Albertini Palestra docente Aprendizado Automático de Funções de Distância Resumo
04/06/2013 Anderson R. dos Santos Palestra docente
Mapeamento de Interações Proteína-proteína comuns a Bactérias do Grupo CMNR e Análise de Interações de Subgrafos.  
Resumo
11/06/2013 Jaquelini Papini Trabalho em Andamento Mineração de Preferências em Fluxo de Dados
Resumo
18/06/2013 Marcos Roberto Ribeiro Pesquisa Bibliográfica Linguagens de Consultas sobre Data Streams
Resumo
25/06/2013 Humberto Razente Palestra docente Construção de métodos de acesso métricos baseados em particionamento de bolas Resumo
02/07/2013 Daniela Justiniano de Sousa Trabalho Avançado - Preparo para a defesa Desenvolvimento de Algoritmos para Análise de Imagens de Padrões da Expressão Gênica da Drosophila Melanogaster.  
09/07/2013 Prof. João Gama
University of Porto (Portugal) and Researcher at LIAAD-Inesc Tec
Palestrante Internacional convidado
Distributed data stream mining

Resumo

Slides






Resumos


Aprendizado Automático de Funções de Distância - Prof. Marcelo Keese Albertini


Choosing a distance function is one of the first and most important steps for a successful machine learning process. However, finding a good function usually demands extensive experimentation and knowledge of specialists about the most important characteristics of the training data and underlying phenomena. Distance metric learning aims to generalize side-information, which represent specialist's knowledge, in order to systematically obtain good distance functions. In this presentation, we will introduce an algorithm which uses pairwise relationships that describe if training data are similar or dissimilar in order to earn Mahalanobis distances.


Mapeamento de Interações Proteína-proteína comuns a Bactérias do Grupo CMNR e Análise de Interações de Subgrafos.  - Prof. Dr. Anderson dos Santos

Na pesquisa por proteínas bacterianas com potencial de utilização para confecção de drogas, vacinas e diagnóstico, o knock-out auxilia na descoberta da função e importância de uma proteína, permitindo-nos definir a relação da mesma como, por exemplo, essencial para a sobrevivência ou para a instauração de uma patogenia em um hospedeiro. Nessa mesma linha de pesquisa, a utilização da Vacinologia Reversa permite identificar proteínas que são exportadas e criam a primeira frente de interação entre uma bactéria e seu hospedeiro. Experimentos sobre o nível de expressão proteica vêm corroborar com esses dados e permitir uma seleção de alvos mais confiáveis contra uma patógeno. Na escolha de alvos pode-se considerar também relações entre proteínas como: (i) seus genes estão fisicamente próximos em um cromossomo; (ii) seus genes estão fundidos de modo facilitar a produção e interação de seus produtos proteicos; (iii) evoluem conjuntamente; (iv) são expressas conjuntamente; (v) existem no mesmo local subcelular; (vi) estão associados à mesma função molecular; e (vii) participam do mesmo processo biológico. Estas características de pares de proteínas que interagem são exemplos comumente utilizados para determinar relações de interação proteína-proteína (do inglês Protein-Protein Interaction ou PPI), tema da pesquisa a ser realizada pelo professor Anderson R. Santos na Universidade Federal de Uberlândia.


Mineração de Preferências em Data Streams - Jaqueline Papini

O cenário tradicional de mineração de preferências, conhecido como cenário batch, tem sido amplamente estudado na literatura nos últimos anos. Entretanto, a natureza dinâmica dos problemas de mineração de preferências exige cada vez mais soluções que se adaptam rapidamente a mudanças. A principal razão disto é que frequentemente as preferências do usuário não são estáticas, e podem evoluir com o tempo. Neste trabalho, nós introduzimos formalmente o problema de mineração de preferências contextuais no cenário de data stream. Preferências contextuais tem sido estudadas recentemente na literatura e alguns métodos para mineração deste tipo especial de preferências tem sido propostos no cenário batch. Além da formalização do problema de mineração de preferências contextuais no cenário de stream, nós propomos duas estratégias para resolver adequadamente esse problema. Como uma primeira tentativa de avaliar estas estratégias, nós implementamos uma delas - a estratégia gulosa, e mostramos sua eficiência através de um conjunto de experimentos usando dados reais. 

Linguagens de Consultas sobre Data Streams - Marcos Roberto Ribeiro 

Com o crescente volume de dados produzido pela sociedade, a comunidade de banco de dados tem se preocupado cada vez mais em como processar estes dados para retornar informações úteis. Duas linhas de pesquisas que tem despertado grande interesse dos pesquisadores são os fluxos de dados e linguagens de consultas com suporte a preferências.Os fluxos de dados são sequências de dados potencialmente infinitas e com atualização constante como por exemplo monitoramento de dados financeiros. As consultas com suporte a preferências tentam obter os dados que melhor atendam as preferências especificadas.Neste seminário as principais pesquisas que abordam o processamento de consultas sobre fluxos de dados e linguagens de consulta com suporte a preferências são revisadas. Propostas de trabalhos ligadas ao processamento de consultas sobre fluxos de dados considerando preferências dinâmicas e preferências temporais são levantadas. Consultas com preferências dinâmicas são consultas cujas preferências podem mudar ao longo do tempo. Consultas com preferências temporais exploram a informação de tempo inerente aos fluxos de dados para obter o resultado.

Construção de métodos de acesso métricos baseados em particionamento de bolas - Prof. Dr. Humberto Razente

Várias técnicas de busca para grandes coleções de dados multimídia são realizadas em espaços métricos com o apoio de estruturas de dados conhecidas como métodos de acesso métrico (metric access methods). Entre esses métodos, destaca-se a M-tree, que resulta em uma estrutura balanceada, dinâmica, baseada em páginas de disco de tamanho fixo e com construção bottom-up. Nesta apresentação serão apresentados algoritmos de construção e de busca por similaridade nessas estruturas, bem como experimentos que demonstram a eficiência desses métodos.

Distributed Data Stream Mining - Prof. João Gama -  University of Porto - Portugal 

The phenomenal growth of mobile and embedded devices coupled with their ever-increasing computational and communications capacity presents an exciting new opportunity for real-time, distributed intelligent data analysis in ubiquitous environments. In these contexts centralized approaches have limitations due to communication constraints, power consumption (e.g. in sensor networks), and privacy concerns. Distributed online algorithms are highly needed to address the above concerns.  The focus of this talk is on distributed stream mining algorithms that are highly scalable, computationally e cient and resource-aware. These features enable the continued operation of data stream mining algorithms in highly dynamic mobile and ubiquitous environments.


João Gama is one of the world experts in data streams. He is Associate professor at the University of Porto and researcher at LIAAD-Inesc Tec. He served as PI in several FCT projects in learning adaptive systems. He published more than 110 papers in major International conferences and journals, served as PC chair at ECML05, DS09, ADMA09, and Conference Chair at IDA11.He co-organized a series of workshops on learning from data streams in conjunction with ECML-PKDD, KDD, SAC and ICML. He is member of the editorial board of MLJ, DAMI, NGC, and PAI and he is author of a recent book in Knowledge Discovery from Data Streams.(retirado de http://www.amda.icmc.usp.br/mlkdd2013/index.php/short-courses)