Development Workflows for Data Scientists. O’Reilly Media, 2017
GitHub se asoció con O’Reilly Media para examinar cómo los equipos de análisis de datos de varias organizaciones están mejorando la forma en que definen, aplican y automatizan los flujos de trabajo basados en servicios de datos.
- Definición de la estructura y las funciones del equipo
- Preguntas interesantes
- Examen de trabajos previos
- Recolección, exploración y modelado de datos
- Prueba, documentación e implementación de códigosde producción
- Comunicación de los resultados
Este informe esclarecedor muestra cómo, a pesar de que el ritmo de cambio es rápido y el deseo por el conocimiento y la visión de los datos es cada vez mayor, las disciplinas duales de ingeniería de software y la ciencia de los datos están a la altura de la tarea.
The field of data science has taken all industries by storm. Data scientist positions are consistently in the top-ranked best job listings, and new job opportunities with titles like data engineer and data analyst are opening faster than they can be filled. The explosion of data collection and subsequent backlog of big data projects in every industry has lead to the situation in which “we’re drowning in data and starved for insight.”