Data Science

Queridos amigos, es un placer volver a estar con todos vosotros por este medio tan apreciado y querido por todos nosotros. Iba a escribir un artículo, que me parece interesante a la par que importante, sobre por qué se debe incluir la figura de data science en las empresas bajo el paraguas de outsourcing; pero no quería dejar pasar por alto que releyerais algún artículo de los que publicamos hace tiempo. Sin ir más lejos y por la acogida que tuvieron entre vosotros me gustaría remarcar estos dos:

Sin más dilación, hoy me gustaría hablaros de por qué es tan importante tener la figura de data science en vuestras empresas y los motivos por los que, en la mayoría de las ocasiones, debería estar cubierta mediante outsourcing.

La subcontratación de servicios

Entrando en la cuestión que nos ocupa, la figura de la subcontratación de servicios aporta los ya consabidos beneficios a las empresas que los demandan.

La pregunta es qué puedo subcontratar, cuándo debo subcontratar y hasta qué momento debo subcontratar. Las respuestas pueden tener una componente subjetiva, pero también las hay absolutamente objetivas. En este artículo vamos a hacer una reflexión sobre por qué subcontratar la labor de data science en las empresas.

Hace ya unas décadas, determinados servicios administrativos se subcontrataban supuestamente porque no aportaban demasiado valor y estaban muy estandarizados. Era mejor entregar dicho trabajo a profesionales que realizaban este trabajo de una forma más ágil y a un menor importe que si se realizase dentro de la empresa. El asunto que normalmente pasaba por alto era la clave del porqué se subcontrataba. Cuando mantenías una conversación con directores que habían decidido subcontratar, el final de su argumento para apostar por este sistema era: “subcontratamos y nos dedicamos a lo que es nuestro negocio”. Por lo cual, temas como el escaso valor y la estandarización de dichas actividades dejaban de tener tanto peso y la realidad es que la empresa se dedica a lo que de verdad se dedica. Luego entran factores como el coste que daría una respuesta de hasta cuándo debo mantener una subcontratación.

Factores que se ocultan bajo la subcontratación

Si agrupamos los factores que normalmente se ocultan bajo un tema de una subcontratación de calidad encontraríamos:

  • Personal especializado.
  • Realizan labores con programas concretos y dedicados a esa finalidad.
  • Su labor puede ser realizada para empresas de todos los sectores con poca o escasa adaptación.
  • La actividad no es crítica para el negocio, por lo cual, no tiene por qué ser controlada por la propia dirección de la sociedad, sino que será controlada por la dirección de la empresa que presta los servicios de contratación.

En los tiempos actuales, las empresas cuentan con un sinfín de datos, muchas de las cuales ni siquiera conocen que los tienen o cómo obtenerlos. Las empresas no se dedican a analizar esos datos, debido a que esa actividad no forma parte de su negocio. En muchas ocasiones, desconocen qué relación guardan estos datos y cómo aplicarlos, es decir, cómo tendrían que depurarlos para que ofrezcan información.

La mayoría de las actividades productivas, estratégicas, comerciales o de marketing, por no decir financieras, logísticas, administrativas se basan en un correcto análisis de datos para la toma de decisiones correctas. El no uso de esta información conlleva a la toma de decisiones erráticas.

Motivos por los que subcontratar la función del data science

Desde hace unos años y, en estos momentos con mayor motivo, es cuando consideramos que determinadas empresas deberían tener la función de data science subcontratada por los siguientes motivos:

  • Se requiere un personal cualificado y especializado. El perfil de estos profesionales suele ser caro en relación con el resto de la plantilla.
  • Las labores son automatizables, por lo que no precisa de la jornada laboral completa para realizar su trabajo.
  • A medida que el experto en esta materia conoce más la empresa (del mismo o diferentes sectores) puede realizar mejores análisis. Por lo cual, es mejor que trabaje para diferentes proyectos.
  • El software es específico con un gran conocimiento subyacente que es mejor trabajar con éste a nivel de equipo.

En nuestra opinión, las empresas y los diferentes agentes con los que se relaciona toman decisiones basadas en sistemas computacionales (aunque sea viendo la comparativa de vídeos) por eso es conveniente que se analice todas las fuentes de datos y se transformen en información mediante técnicas adecuadas.

Desde hace algún tiempo, al menos por Audalia Nexia, han pasado diferentes proveedores contando que hacen análisis de datos en su trabajo; pero gran parte de ellos no saben claramente ni qué técnicas deberían usar.

Volviendo al tema que nos ocupa, simplemente sin entrar en temas de aprendizaje de máquinas ni otros temas relacionados con el data science, que ya los abordaremos, en el apartado de extracción de conocimiento (minería de datos, data mining) es la disciplina que trata de extraer conocimiento de datos que pueden estar albergados en sistemas de Big Data o no. Los datos suelen ser heterogéneos, de mala calidad, no tratados, sesgados, etc. Por lo cual, procede previamente su depuración, concepto que en gran medida se olvida y así salen los análisis.

El data mining

El data mining no deja de ser una disciplina que nos permite extraer patrones, normalmente ocultos, en una ingente cantidad de datos heterogéneos y de calidad dudosa a través de algoritmos.

El motivo de su importancia en las empresas es que nos permite predecir, a través de modelos, comportamientos y, a su vez, nos permite mediante técnicas de clasificación investigar el pasado.

Las principales técnicas de data mining son:

  • Regresión lineal (todo tipo de modelos, hasta sistemas de ecuaciones).
  • Regresión logística.
  • Análisis de series temporales (todo tipo de modelos sofisticados).
  • Clasificación mediante la reducción de muchas variables en unas pocas que expliquen comportamientos. Esto se suele realizar mediante un análisis de componentes principales.
  • Generación de clusters.
  • Métodos de selección mediante scoring.
  • Econometría espacial, la cual nos permite establecer modelos autorregresivos de localizaciones.

Como os comentaba, este apasionante mundo es utilizado por las grandes empresas (auditoras, telcos, financieras, logísticas, fabricantes, consultoras, etc.) El no contar con personal capaz de desarrollar modelos que nos permitan anticiparnos, clasificar o estudiar el pasado para tomar decisiones nos hace perder competitividad en el mercado.

Conclusión

Os lo decía al principio, a mi entender, es el momento de contar con este perfil a través de la subcontratación de proyectos por todas las ventajas comentadas.

Audalia Nexia, va a realizar una serie de conferencias sobre análisis de datos, por lo que para nosotros es muy importante saber vuestra opinión, así que os podéis dirigir al siguiente link  para que nos ayudéis a elegir qué temas queréis que abordemos:

  1. Explicación de todos los temas comentados de forma breve y con algún ejemplo.
  2. Alguno de los puntos antes comentados.

Esperamos veros pronto en nuestras charlas de análisis de datos.

* Antonio Pérez es Socio en el Área de Advisory