Sessão Temática 1

A importância do tratamento estatístico na descoberta de
conhecimento em bancos de dados na agricultura

Stanley Robson de Medeiros Oliveira (EMBRAPA/Feagri-UNICAMP)

Recentes avanços em software e hardware têm facilitado sobremaneira a coleta, organização e tratamento de grandes bancos dados na agricultura. Um dos grandes desafios tem sido transformar dados em informação e informação em conhecimento. Através de modelos de predição, modelos de decisão por árvore de decisão, e técnicas estatísticas para discriminação e classificação, é possível desvendar comportamentos e prever tendências por meio de descobertas e análises de padrões significativos no volume de dados armazenados. Nesse processo de descoberta de conhecimento, os principais desafios encontrados são: 1) o ruído presente nos dados; 2) o grande número de variáveis; e 3) o número não-balanceado de observações (instâncias) no atributo classe (variável dependente). O objetivo dessa palestra é demonstrar os benefícios do tratamento estatístico no processo de descoberta de conhecimento no domínio agropecuário, tais como: melhora na performance de algoritmos de classificação, simplificação dos modelos de predição e melhor entendimento sobre os resultados encontrados.