ABSTRACT
Resumo Introdução: realizar a predição de doenças relacionadas ao trabalho é um desafio às organizações e ao poder público. Com as técnicas de aprendizado de máquina (AM), é possível identificar fatores determinantes para a ocorrência de uma doença ocupacional, visando direcionar ações mais efetivas à proteção dos trabalhadores. Objetivo: predizer, a partir da comparação de técnicas de AM, os fatores com maior influência para a ocorrência de dermatite ocupacional. Métodos: desenvolveu-se um código em linguagem R e uma análise descritiva dos dados e identificaram-se os fatores de influência de acordo com a técnica de AM que demonstrou melhor desempenho. O banco de dados foi disponibilizado pelo Serviço de Dermatologia Ocupacional da Fundação Oswaldo Cruz e contém informações de trabalhadores que apresentaram alterações cutâneas sugestivas de dermatite ocupacional no período de 2000-2014. Resultados: as técnicas com melhor desempenho foram: neural network, random forest, support vector machine e naive Bayes. As variáveis sexo, escolaridade e profissão foram as mais adequadas para os modelos de previsão de dermatite ocupacional. Conclusão: as técnicas de AM possibilitam predizer os fatores que influenciam a segurança e a saúde dos trabalhadores, os parâmetros que subsidiam a implantação de procedimentos e as políticas mais efetivas para prevenir a dermatite ocupacional.
Abstract Introduction: to predict work related diseases is a challenge for organizations and the governmental authorities. By means of machine learning (ML) techniques it is possible to identify factors that determine the occurrence of an occupational disease, aiming at taking more effective actions to protect workers. Objective: to predict, by comparing ML techniques, the factors which highly influence the occurrence of occupational dermatitis. Methods: we developed a code in R language and a descriptive analysis of the data and identified the influence factors according to the ML technique that presented the best performance. The database was made available by the Occupational Dermatology Service of Oswaldo Cruz Foundation and assembles information of the workers who experienced cutaneous alterations suggestive of occupational dermatitis between 2000-2014. Results: the techniques which presented the best performance were: neural network, random forest, support vector machine, and naive Bayes. Sex, schooling, and profession were the most adequate variables for the occupational dermatitis prediction models. Conclusion: ML techniques allowed to predict the factors that influence the workers' safety and health, as well as the parameters that subsidize the procedures implementation, and the most effective policies to prevent occupational dermatitis.