¿Cuál es el papel de la creatividad en la ciencia de datos?

Desde mi conocimiento muy limitado en este campo, la creatividad juega un papel extremadamente importante. Me gustaría citar dos de estos casos.

1. Ingeniería de características: es el arte de crear más variables en un conjunto de datos determinado basado en el conocimiento de su dominio combinando dos o más variables de alguna manera, o tal vez alterando sus variables de tal manera que el algoritmo de aprendizaje automático que desea El uso puede extraer el máximo de ellos. Su creatividad se pone a prueba cuando tiene que analizar cómo algunas variables interactúan en la vida real y se relacionan con el impacto que los cambios tienen en el entorno. Una variable de ingeniería de características extremadamente buena también podría ser la diferencia entre un buen modelo de ciencia de datos y uno excelente.

2. Visualización: bien. Entonces aplicaste los algoritmos más complejos y creaste conjuntos enormes y finalmente llegaste a algunas conclusiones. ¿Ahora necesita explicar sus resultados a otros? ¿Cómo lo harías tú? ¿Sería suficiente un simple gráfico de barras o un gráfico circular? ¿La infografía que cree atraerá visualmente a los demás? ¿Sería capaz de comprender lo que has hecho fácilmente? Aquí es donde su creatividad entra en escena.

1) Plantear preguntas útiles sobre el espacio del problema que los datos pueden responder. 2) Diseñar técnicas para reducir la dimensionalidad / ruido / sesgo y responder esas preguntas. 3) Aprender el espacio del problema lo suficiente como para identificar las restricciones en los datos para que conozca las limitaciones inherentes (el conjunto de características, sesgo, ruido, dependencia entre las características, contexto, etc., etc.).

Es lo que me atrajo al campo, junto con el desafío y el creciente cuerpo de conocimiento.