Technology Blogs by Members
Explore a vibrant mix of technical expertise, industry insights, and tech buzz in member blogs covering SAP products, technology, and events. Get in the mix!
cancel
Showing results for 
Search instead for 
Did you mean: 
fmroque10
Explorer


Segmentación de las horas de ausencia de Recursos Humanos por enfermedad y temporada de año con SAP HANA Machine Learning


¿Cuántas horas de ausencia por caso se producen con mayor frecuencia y cuál es la enfermedad? Enfoque para tratar el mayor número de bajas breves con la prevención de las enfermedades que las provocan. 


Introducción

Este artículo se basa en el libro de SAP PRESS "Segmentación de datos mediante K-Means y SAP HANA PAL" Enlace al libro: https://www.sap-press.com/data-segmentation-using-k-means-and- sap-hana-pal_5153 / # utm_source = 2003 & utm_medium = other & utm_campaign = Autor

El análisis tradicional de horas de ausencia podría supervisar solo las cinco o diez causas principales de enfermedades. Pero podríamos tener varios segmentos de horas ausentes. Podríamos tener un escenario en el que varios casos de solo una o dos horas de ausencia podrían sumar una gran cantidad de horas totales debido a enfermedades específicas. Otro escenario es tener pocos casos pero con una gran cantidad de horas de ausencia. Nuestro desafío es investigar la propagación de las causas de las horas de ausencia para enfocarnos en enfermedades específicas para casos especiales. Por ejemplo, podemos solicitar medicina preventiva y programar consultas médicas fuera del horario laboral.

Para este análisis, podemos utilizar la biblioteca de análisis predictivo de SAP Hana aplicada para la agrupación estadística mediante Machine Learning. Con esta función de SAP Hana, podemos encontrar los diferentes segmentos de casos de horas ausentes y meses por enfermedades estacionales.

La agrupación de estadísticas toma una gran cantidad de puntos de datos y encuentra los segmentos que comparten valores similares. También da la información del número ideal de grupos. En la figura 1 tenemos horas ausentes donde es difícil encontrar los segmentos de los datos.

Después de ejecutar la función, el grupo segmenta las horas ausentes, el rango de horas para cada segmento y el número de casos por segmento. Ver figuras 2, 3 y 4.

Queremos identificar el número de segmentos de días ausentes por caso. Por ejemplo, podríamos tener un segmento de un grupo de casos ausentes de dos horas.

La suma de todas estas horas ausentes podría llegar a 50 horas al mes. La causa de este grupo podría ser el comportamiento mental. Podemos aplicar una estrategia preventiva de salud mental y reducir estos casos de ausencia de dos horas. Este enfoque podría ser más rápido y económico que las enfermedades a largo plazo como las enfermedades circulatorias.

 

El gráfico de análisis convencional muestra el número de horas de ausencia por mes indicando la causa de la enfermedad, como se muestra en la Figura 1.

Podemos anotar las principales enfermedades y meses en este cuadro:

1) Infecciosa y parasitaria durante los meses tres, cuatro y seis.

2) Parásito en sangre durante el tercer mes.

3) Circulatorio para el mes doce.

4) Sistema nervioso durante el séptimo mes.

Luego tenemos varias enfermedades con menos de cincuenta horas de ausencia al mes.




Figura 1: Horas ausentes por enfermedad y meses

 

Al aplicar la función de estadísticas del grupo de la biblioteca de análisis predictivo de SAP HANA al conjunto de 718 registros de datos, la función devuelve:

1) El número óptimo de clasificación de grupo para el número de horas ausentes es cinco. Ver figura 2.

2) El número total de horas ausentes por grupo. Ver figura 2.

3) Número de casos por grupo. Ver figura 3.

4) Número mínimo y máximo de horas de ausencia por grupo. Ver figura 4.



Figura 2: Número de horas de ausencia por grupo.

 



Figura 3: Número de casos para cada grupo.

 

A partir de la biblioteca de análisis predictivo de SAP HANA utilizando la función de agrupación de estadísticas, podemos concluir estos hechos que no están claros en gráficos convencionales como la Figura 1, donde solo vemos el número de horas ausentes por enfermedad.

1) Los grupos con más horas y casos son uno y cinco. Ver figuras 2 y 3.

2) Los grupos con más horas acumuladas y casos de ausencias son uno y cinco. Sin embargo, el rango de horas de ausencia por caso en el grupo uno está entre cero y cinco. El rango para el grupo cinco es de siete y dieciséis horas de ausencia. Ver figura 4. Eso significa que hay muchos casos únicos en el grupo uno (450 casos) y el grupo cinco (210 casos), en los que las horas de ausencia están entre cero y dieciséis por caso. Hay un rango bajo en comparación con el grupo cuatro que está entre 104 y 120 horas de ausencia. Veremos esos casos a continuación.

 



Figura 4: Horas de ausencia mínima y máxima para cada grupo.

La figura 5 nos muestra las 10 principales enfermedades que generan un mayor número de casos y horas de ausencia. Estos son los grupos uno y cinco. Aún que el rango de horas ausentes está entre 0 y 16, estas enfermedades crean que varios empleados pidan permiso para ausentarse del trabajo. Ejemplos de estas causas son:

1) Donación de sangre

2) Orejas

3) infecciones

4) consulta médica

Hacer una mejor programación para la donación de Blook y la consulta médica podría mejorar la cantidad de horas ausentes y aumentar la productividad.



Figura 5: Top 10 de enfermedades que provocan más cantidad de casos.

 

Por otro lado, vemos que los rangos más altos de horas de ausencia se encuentran en los grupos tres y cuatro. Ver figura 4. Estos grupos también tienen menos casos de demanda de horas ausentes. Ver figura 3. Eso significa que estos casos se concentran en pocas personas.

Las 10 enfermedades principales en la Figura 6 para estos casos muestran estas causas de horas de ausencia:

1) sistema circulatorio

2) Sangre y sistema circulatorio infecciosos



Figura 6: Las 10 enfermedades principales para el número más bajo de casos pero el rango más alto de horas de ausencia.

 

Esta información muestra que pocos empleados tienen una enfermedad a largo plazo que exige varias horas de ausencia.

Biblioteca de análisis predictivo de SAP Hana

Para este análisis, podemos utilizar la biblioteca de análisis predictivo de SAP Hana aplicada para la agrupación estadística mediante Machine Learning. Con esta función de SAP Hana, podemos encontrar los diferentes segmentos de cantidad y pesos que tenemos en las entregas de nuestros productos a clientes y meses de demanda pico y pronóstico estacional.

La agrupación de estadísticas requiere una gran cantidad de puntos de datos y encuentra los segmentos que comparten valores similares. También da la información del número ideal de grupos. En la figura XXX tenemos varias cantidades para productos donde es difícil determinar los segmentos de los datos.

Después de ejecutar la función, los segmentos de grupo para los datos están en las Figuras 2, 3 y 4.

La estructura de la biblioteca de análisis predictivo de SAP Hana se muestra en la Figura XX. El requisito previo de conocimiento para ejecutarlo son estadísticas básicas (mediana, desviación estándar), lenguaje de consulta y limpieza de datos para Big Data.

Los requisitos funcionales son:

1) Cree tablas para los parámetros de entrada. Ejemplo: tabla con la fuente de datos y el número de grupos que queremos para la segmentación.

2) Tablas para almacenar los resultados de la función. Los resultados son:

-El segmento asignado para cada registro de los datos de entrada.

-El punto medio o centroide de cada segmento.

-La distancia al punto medio o centroide de cada registro. El caso ideal de que cada punto tenga la distancia más cercana a su punto promedio.

 



Figura 7. Estructura de la función de agrupación de SAP HANA

 

Conclusión :

Tenemos un clúster con el mayor número de horas ausentes, rango de horas bajo (entre 0 y 16) pero con un gran número de casos. Las enfermedades que causan estas horas ausentes son:

-infeccioso

-sistema nervioso

-ojos infecciosos

y muchas consultas médicas y donaciones de sangre.

Entonces, podemos reducir las horas de ausencia programando mejor la consulta médica y la donación de sangre. Además, aplicando medicina preventiva para infecciones.
Labels in this area