Introducing G2.ai, the future of software buying.Try now

El papel de los científicos de datos y lo que vimos en Rev 3

27 de Junio de 2022
por Matthew Miller

El mundo está lleno de conferencias, luces brillantes, sillas relativamente cómodas y caras amigables. Añade algo de comida decente y tendrás una experiencia genial en general.

El mes pasado, tuve el placer de asistir a Rev 3 de Domino Data Lab en la Gran Manzana, que no decepcionó. Además de la camaradería y los regalos, aprendí sobre las actualizaciones de sus productos y el espacio más amplio de aprendizaje automático (ML), que compartiré aquí.  

La ciencia de datos no es lo que solía ser

Cuando uno considera la historia de la ciencia de datos, siempre surgen dos cosas: 

  • Datos
  • Computación

La historia básica es la siguiente: el auge de la inteligencia artificial (IA) como un método tecnológico para obtener información de los datos y generar predicciones fue impulsado por un aumento significativo en los datos producidos y métodos de computación más grandes y baratos.

Inicialmente, las herramientas se centraban en crear algoritmos para ajustar esos datos y producir resultados sensatos. No se pensaba mucho en la reproducibilidad y la sistematización. El lema era "lanza algo a la pared y ve si se pega". Sin embargo, los tiempos están cambiando...   

MLOps al rescate

Se acabaron los días desordenados. Ahora, la noción de operacionalización del aprendizaje automático (MLOps) está en plena vigencia. MLOps fomenta una cultura y práctica que busca unificar el desarrollo de sistemas de aprendizaje automático y la operación de sistemas de aprendizaje automático. A través de software de operacionalización de IA y aprendizaje automático (MLOps), las empresas pueden ser sistemáticas en sus esfuerzos de IA al monitorear y mantener sus modelos. Con esta tecnología, pueden obtener visibilidad en sus proyectos de aprendizaje automático, poner sus modelos en producción y entender cómo se desempeñan.

MLOps está ayudando a abordar los dos mayores desafíos relacionados con la IA: los datos y la computación. De hecho, cuando revisamos los temas mencionados anteriormente para el producto MLOps mejor calificado en G2, Databricks Lakehouse Platform, encontramos que los datos son un aspecto mencionado a menudo de la tecnología, como se ve a continuación.

Una instantánea de los temas populares mencionados relacionados con Databricks Lakehouse Platform

¿Cómo está ayudando MLOps a tomar el control de los datos y la computación?

Con MLOps, las empresas pueden asegurar una conexión estrecha y clara entre sus datos y modelos. Domino Data Lab había anunciado su asociación con la empresa de gestión de datos Snowflake en enero de 2021, y elaboraron sobre el fortalecimiento de esa conexión en Rev 3 (mayo de 2022) con Domino 5.2. Su relación dio un paso más en junio de 2022 con la inversión de Snowflake en Domino Data Lab para unir modelos de ML y datos en la nube en una sola plataforma. Con Domino 5.2, los usuarios pueden acceder al monitoreo autónomo del rendimiento del modelo en la Nube de Datos de Snowflake. 

Stig Pedersen, jefe de ciencia de datos CoE en Topdanmark, señala

“La integración de Domino con Snowflake Data Cloud ayuda a nuestro equipo a centrarse en la ciencia de datos, no en los complicados requisitos regulatorios de datos, con eficiencias mejoradas, como descubrir rápidamente el desvío del modelo para minimizar el impacto potencial en el negocio de predicciones subóptimas.”

Además, anunciaron su nueva capacidad IntelliSize. Esta característica ayuda a las empresas a gestionar sus costos y carga operativa recomendando el tamaño óptimo para un entorno. Con esta función de optimización de costos, los equipos de TI y los líderes empresariales pueden asegurar que se utilice la cantidad justa de computación y almacenamiento para la tarea en cuestión.

Estas integraciones y características ayudan a unir los datos y la ciencia de datos, permitiendo que la tecnología se enfoque en los datos para que los científicos de datos puedan centrarse en la ciencia de datos.

Lee ahora: Tendencias de Datos en 2022

¿Qué es la ciencia de datos de todos modos?

Además de las actualizaciones de características anunciadas, Rev 3 tuvo algunas grandes ideas de alto nivel de líderes de la industria, como Cassie Kozyrkov (científica jefe de decisiones en Google), quien habló sobre hacer que la ciencia de datos sea útil. Su charla estuvo llena de grandes ilustraciones, metáforas y chistes, pero una que destacó fue su analogía con la cocina.

Cocinar no es un trabajo de un solo objeto. Tiene múltiples ingredientes, utensilios y pasos, al igual que la ciencia de datos. Si fuéramos a comparar, sería: 

  • Datos=ingredientes
  • Algoritmos=electrodomésticos
  • Modelos=recetas
  • Predicciones=platos

No podemos olvidar o descuidar ninguno de estos componentes clave. Al fomentar la colaboración y la innovación, las empresas pueden desbloquear el poder de sus datos y talento.

Lee más: Cómo Elegir una Plataforma de Ciencia de Datos y Aprendizaje Automático Adecuada para tu Empresa

Deja de llamarlas habilidades blandas

Otro punto clave perspicaz de la charla de Kozyrkov fue su discusión sobre lo que sucede cuando las herramientas se vuelven más fáciles. A medida que los productos MLOps como Domino se vuelven más fáciles de usar y las tareas de ciencia de datos, como la preparación de datos, se automatizan, ¿dónde quedan los humanos involucrados? Un tema candente es el papel y lugar de las habilidades blandas o esas habilidades no técnicas que son tan útiles y tan humanas.

Kozyrkov comentó: 

“No las llames habilidades blandas, llámalas las más difíciles de automatizar.”

Este es un gran lugar para terminar. A medida que pensamos en la evolución de estas plataformas, cómo los datos y los modelos se están acercando más, y cómo la computación se está volviendo cada vez más fácil de optimizar, debemos estar constantemente pensando:

¿Cuál es el lugar de un humano en el proceso?

¿Quieres aprender más sobre Plataformas de MLOps? Explora los productos de Plataformas de MLOps.

Matthew Miller
MM

Matthew Miller

Matthew Miller is a former research and data enthusiast with a knack for understanding and conveying market trends effectively. With experience in journalism, education, and AI, he has honed his skills in various industries. Currently a Senior Research Analyst at G2, Matthew focuses on AI, automation, and analytics, providing insights and conducting research for vendors in these fields. He has a strong background in linguistics, having worked as a Hebrew and Yiddish Translator and an Expert Hebrew Linguist, and has co-founded VAICE, a non-profit voice tech consultancy firm.