O Data Mining mudou o mundo da análise no bom sentido e para sempre.
Partilhamos mais um caso de sucesso de um projecto conjunto entre a StatSoft e uma Biofarmacêutica. Esta empresa produz vacinas, seguindo os mais rigorosos padrões para produção e embalagem.
Problema
Numa fase importante da produção, em que se obtinha um dos ingredientes ativos da vacina, ocorriam perdas - scrap, de 30% por lote. Este facto representava um prejuízo de biliões de dólares: custo de oportunidade, perda de tempo e recursos correspondendo a várias semanas de trabalho, perdas de material e a prejuízos na área da logística.
O problema estava ainda agravado devido à complexidade do processo:
- Extensa série de processos inter-relacionados.
- Grande quantidade de matérias-primas provenientes de distintos fornecedores e lotes.
-
Parâmetros de produção com padrões indesejáveis.
Gráfico do problema

Recursos da organização
- Equipa de engenheiros, muitos deles especializados em bioquímica, com conhecimento aprofundado do processo de produção desde as matérias-primas ao produto final e respectiva comercialização.
-
Dados históricos das falhas no processo.
Tentativas de resolução por parte da organização
- Sessões de brainstorming para resolver problemas de qualidade através diversos métodos de engenharia, pesquisa de matérias-primas e variáveis associadas aos parâmetros indesejáveis.
- Desenho experimental para ajustar pequenas quantidades de matérias-primas com variáveis do processo de produção.
Esta abordagem permitiu efectuar algumas melhorias, mas não conseguiu resolver os problemas, impactos e custos associados.
Metodologia implementada com o STATISTICA Data Miner
O primeiro passo foi definir e agregar os dados relevantes para o processo, tendo como informação os últimos 12 meses de dados dos processos de fabricação que incluíam:
- Características das matérias-primas.
- Parâmetros do processo ao longo das unidades operativas, lote a lote.
- Qualidade do produto, com base nas características críticas à qualidade que eram criteriosos para o avanço ou o desperdício ou scrap dos lotes.
Após recolha dos dados relevantes a nossa equipa, reuniu-se com a equipa de engenharia.
Foi recolhida informação referente:
- Fatores que se podiam e não podiam controlar.
- Fatores fáceis e difíceis de controlar.
- Fatores com controlo dispendioso.
Diversos tipos de modelos de data mining foram aplicados para determinar os que melhor se ajustavam aos dados.
São testadas várias metodologias para assegurar que se chega a um modelo adequado. Uma parte dos dados é escolhida aleatoriamente e é deixada de fora do processo de ajustamento sendo apenas usada para validação - avaliação da capacidade preditiva dos modelos.
Finda a etapa acima, procedeu-se à revisão dos parâmetros mais importantes.
A revisão dos parâmetros normalmente gera surpresa nas equipas de campo, porque um parâmetro que parecia pouco importante pode revelar-se extremamente decisivo para o processo de melhoria dos processos.
Gráfico dos parâmetros mais importantes

Resultados
Com base nas conclusões obtidas através do processo de data mining, a organização pôde avaliar, validar e utilizar a informação e prever uma redução da taxa de desperdício ou scrap por lote de 30% para 5%!
Vantagens do data mining
Os métodos de data mining são realmente eficazes na modelação de grandes quantidades de parâmetros, uma situação típica na produção.
Empresas que adoptem estas técnicas obterão benefícios claros e a curto prazo.
Nota final
Data mining é um termo amplamente utilizado para uma grande variedade de técnicas de análises, assim como termos de "modelagem preditiva" ou "análise avançada".

