¿Cómo decidir qué proyectos de ciencia de datos hacer?
En 2019, cada organización tiene una estrategia de datos. Pero ¿Qué la hace especial?
Todos sabemos cómo se ve el fracaso. Los recursos se invierten, los equipos se forman, el tiempo pasa, pero no se consigue nada. Nadie necesariamente puede decir por qué pasa; Siempre es la culpa de otra persona, etc.
Es más difícil distinguir la diferencia entre un éxito modesto y la excelencia. De hecho, en la ciencia de los datos pueden parecer muy similares durante tal vez un año. Después de varios años, sin embargo, una excelente estrategia producirá de manera evidente resultados más valiosos.
Tanto las estrategias mediocres como las excelentes comienzan con una serie de experimentos e inversiones que conducen a proyectos de datos. Después de unos años, algunos de estos proyectos funcionan y están en camino a la producción.
En la estrategia mediocre, uno o dos de estos proyectos pueden incluso tener un ROI claro para el negocio. Normalmente, estos proyectos serán algún tipo de automatización para ahorrar costos, o aplicar el aprendizaje automático a un proceso existente para mejorar su eficiencia o rendimiento. Esto se parece mucho al éxito, y puede ser suficiente, pero se está perdiendo las ventajas únicas de una excelente estrategia de datos.
En una excelente estrategia, se han desarrollado más proyectos de datos y su desarrollo fue sorprendentemente rentable. Además, el proceso de construcción de los primeros proyectos inspira nuevas ideas de proyectos. En una excelente estrategia, los proyectos incluirán automatización y mejoras de eficiencia y rendimiento, pero también incluirán proyectos e ideas para la generación de nuevos ingresos y negocios completamente nuevos impulsados por sus activos de datos únicos. Los equipos de datos trabajan bien juntos, se basan en el trabajo de los demás y colaboran sin problemas con sus socios comerciales. Hay una visión clara de cómo puede verse el futuro de la empresa impulsado por el aprendizaje automático, y todos están trabajando juntos para lograrlo.
Construyendo una excelente estrategia de datos
La elaboración de una estrategia de datos requiere muchos actores en la mesa, incluidos los expertos en datos, el liderazgo tecnológico y los expertos en negocios y en la materia. También requiere apoyo de liderazgo que va más allá de solo querer marcar una casilla de “machine learning”.
Aquí es cómo la mayoría de las empresas deciden qué proyectos de datos perseguir, que solo es una receta para la estrategia de datos mediocre. La gerencia identifica un conjunto de proyectos que le gustaría ver construido y crea el diagrama de de priorización: un eje representa el valor de un proyecto dado para el negocio y el otro eje representa su complejidad o costo de desarrollo estimados. A cada proyecto se le asigna un lugar en el cuadro, y la administración asigna los recursos limitados de la empresa a los proyectos que creen que serán los más económicos y que tengan el mayor valor comercial.
Esto no está mal, pero tampoco es óptimo. Una excelente estrategia de datos se mueve más allá de una evaluación directa de cada proyecto de forma aislada para considerar algunas dimensiones adicionales.
Primero, una excelente estrategia de datos incluye un núcleo organizativo bien coordinado. Se basa en una inversión en tecnología centralizada y en valores predeterminados bien seleccionados y coordinados para la arquitectura de las aplicaciones de datos. Esta centralización de valores predeterminados permite que cada aplicación tome decisiones diferentes si es necesario, al tiempo que mantiene la máxima compatibilidad en toda la organización y la flexibilidad en el tiempo de forma predeterminada.
Por ejemplo, cada línea de negocios tenía una pila de tecnología diferente y un grupo de TI independiente, lo que conllevaba desafíos relacionados con la integración de datos que ya existían y diferentes arquitecturas para todas las inversiones futuras. Centralizar esta práctica fue clave para su éxito continuo.
En segundo lugar, una excelente estrategia de datos es específica a corto plazo y flexible a largo plazo. Sabemos bastante acerca de cómo serán las capacidades de machine learning del mañana, pero menos acerca de cómo serán las capacidades del próximo año. Solo podemos adivinar lo que será posible en cinco años. Del mismo modo, el panorama empresarial se está transformando, lo que lleva a una nueva competencia y nuevas oportunidades. Las organizaciones que participan en ciclos de planificación de cinco años perderán las oportunidades que surgen mientras tanto. Una estrategia excelente es aquella que es adaptable y se considera un documento vivo.
Las mejores estrategias son fuertes en convicción direccional, pero flexibles en los detalles. Desea saber dónde quiere terminar, pero no necesariamente predefinir cada paso que necesita tomar para llegar allí.
Finalmente, una excelente estrategia de datos tiene en cuenta una visión clave: los proyectos de ciencia de datos no son independientes entre sí. Con cada proyecto completado, sea exitoso o no, usted crea una base para construir proyectos posteriores más fácilmente y a un menor costo.
Elegir entre proyectos de ciencia de datos
Aquí es cómo se ve la selección de proyectos en una empresa con una excelente estrategia de datos: primero, la compañía recopila ideas. Este esfuerzo debe extenderse lo más ampliamente posible en toda la organización, en todos los niveles. Si solo ves ideas buenas y obvias en tu lista, preocúpate, esa es una señal de que te estás perdiendo el pensamiento creativo. Una vez que tenga una lista grande, filtre por la plausibilidad técnica de una idea. Luego, cree el diagrama de dispersión descrito anteriormente, que evalúa cada proyecto según su costo / complejidad relativa y el valor para el negocio.
Ahora se pone interesante. En su diagrama de dispersión, dibuje líneas entre proyectos potencialmente relacionados. Estas conexiones existen donde los proyectos comparten recursos de datos; o donde un proyecto puede permitir la recopilación de datos útil para otro proyecto; o donde el trabajo fundacional en un proyecto también es trabajo fundacional en otro. Este enfoque reconoce las realidades de trabajar en tales proyectos, como el hecho de que la construcción de un proyecto precursor hace que los proyectos sucesores sean más rápidos y más fáciles (incluso si el precursor falla). Los costos de recopilar datos y construir componentes compartidos se amortizan en todos los proyectos.
Este enfoque hace que los proyectos de mayor valor, aquellos que quizás hubieran parecido demasiado ambiciosos, se vean menos como un empuje agresivo y costoso. En cambio, revela que tales proyectos pueden ser más eficientes y más seguros para proceder que otros proyectos de menor valor que parecían atractivos en un análisis ingenuo.
Dicho de otra manera, una excelente estrategia de datos reconoce que los proyectos son incompatibles entre sí, y que los costos de los proyectos cambian con el tiempo a la luz de otros proyectos emprendidos (y también de las nuevas tecnologías). Esto permite una planificación más precisa y puede ampliar las capacidades de la organización más de lo esperado. Puede revisar este proceso de planificación trimestralmente, lo que está en línea con la rapidez con la que las tecnologías de aprendizaje automático están cambiando.
Actualmente estamos en un momento de desarrollo de machine learning, inteligencia artificial y datos donde la tecnología no se comercializa y no es del todo obvio dónde invertir. Las empresas con excelentes estrategias de datos tendrán más probabilidades de elegir bien.
Articulo Original: HBR