Mundo Fintech

Data Scientist o Científico de Datos

TMSourcing

Por Jesús Armando Tapia

“Sin datos, sólo eres otra persona más dando su opinión”. 

-W. Edwards Deming.

La cita anterior pertenece a uno de los primeros científicos de datos, mejor conocido por sus aportaciones a los procesos de calidad y mejora continua del siglo XX.

Desde el punto de partida del estudio de la estadística, la física y las matemáticas, sus propuestas iniciales han quedado como precedentes de lo que hoy conocemos como la Ciencia de Datos, la cual se expondrá a continuación junto con sus generalidades, ayudando a una mejor comprensión de los datos e información.

Muy lejos del levantamiento de datos, antes de la llegada de la informática, hacia la década de 1990, con la llegada de internet, además a los campos disciplinares antes mencionados, se le sumarán poco a poco, conceptos novedosos como minería de datos (data mining), aprendizaje automático (machine learning) y analítica predictiva, este último campo es tan vasto que, efectivamente, ya se usa en distintas industrias con mucho éxito, particularmente en la industria FinTech.

/*! elementor – v3.6.5 – 27-04-2022 */ .elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=”.svg”]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}

Los datos, como tal, no sirven de mucho, especialmente, cuando no están estructurados, es decir, pueden existir enormes cantidades de estos, hoy conocido como Macrodatos o Big Data, sin embargo, sin cierto orden, prácticamente no reportan mucha utilidad, entonces lo primero que se necesita, para su tratamiento hacia una explotación efectiva, es la estructura u orden, de manera que puedan ser tabulados, sorteados, ponderados y eventualmente presentados, para su análisis.

Estos pueden estar incompletos, por lo que, sin datos suficientes, aquí demuestra su relevancia la analítica predictiva, donde con solo una porción, se pueden llegar a modelar, inferir o hacer pronósticos y proyecciones de tendencias, que permiten a estos programas tomar ventaja de una pequeña parte, para llegar a escenarios, o bien, predecir sucesos de manera muy efectiva, con la aplicación de estas técnicas, mejor conocidas bajo este concepto.

El término Ciencia de Datos es tan reciente como este mismo siglo, en el que muchas veces se ha buscado sobre simplificarla, explicándolo como una rama de la estadística especializada y aplicada, sin embargo, con el avance y desarrollo de la computación, ha sido necesaria una clasificación aparte, para centrar sus áreas de enfoque en investigaciones multidisciplinarias, modelos, métodos y computación con datos, pedagogía, evaluación de herramientas y teoría.

En la última década, con la llegada del Internet de las Cosas (IoT) y Blockchain, además de las aplicaciones más tradicionales, como en mercadotecnia y gobernanza, la explosión de fuentes de datos, hacen aún más valiosa y urgente el constante y rápido análisis de estos, para tomar decisiones mejor informadas, de manera que, no hay duda de que muchas organizaciones, particularmente las grandes empresas de tecnología las han explotado, con resultados a la vista.

Blockchain y el sector FinTech, proponen y aprovechan el uso continuo de estas herramientas, para añadir mayor seguridad y confianza, mediante la garantía e integridad de datos, previniendo actividades maliciosas, realizando predicciones mediante el análisis predictivo y en tiempo real, de los datos, mejorando también la gestión y el poder compartir esta información con total transparencia, cuando así puede ser conveniente y necesario.

Todo esto es posible, gracias a la formación de nuevos perfiles de profesionales polivalentes, mejor conocidos como Científicos de Datos, quienes recopilan, procesan y extraen desde distintas fuentes, modelan, visualizan e imaginan, como la información puede ser propuesta y presentada a los profesionales de otras áreas, para entregar conclusiones que aporten valor a los procesos de las organizaciones que no cuentan con estas especializaciones, complementándose.

Siguiendo el método científico, estos profesionales primero obtienen una serie de extracciones de datos, sin importar su fuente y volumen, acto seguido, depuran información, eliminando todo lo que pudiera llegar a generar sesgos en los resultados, el equivalente a refinarlos o remover el polvo de la paja, posteriormente, se someten a tratamiento de análisis estadísticos, mediante modelos de regresión, inferencias y pruebas de hipótesis, diseñando experimentos alternativos complementarios y se generan reportes visuales con los resultados relevantes.

Por supuesto, todo lo que se ha explicado hasta ahora y previamente, es muy simplificado, sin embargo, como mencionaba en su artículo Thomas H. Davenport publicado en el 2012 en su artículo: Data Scientist: The Sexiest Job of the 21st Century (El Científico de Datos: El trabajo más atractivo del Siglo 21), la demanda de estos profesionales se considera cercana a los 490,000 a nivel mundial (hacia 2018), sin embargo, conforme avanza la computación, la actualización constante será una necesidad para todos, sin que se prescinda de estos mismos.

Con la computación cuántica, junto con una explosión exponencial constante de los volúmenes de datos, y apoyándonos de los mecanismos de Inteligencia Artificial (AI), estos permitirán acelerar estos análisis, con apoyo de algoritmos de precisión, facilitando algunas de las tareas antes expuestas, no obstante, lo anterior, aterrizar todo esto, para hacer comprensible, útil y aprovechable, será parte de las tareas aún pendientes de los Científicos de Datos en los siguientes años.

Por último, pero no menos importante, es considerar el perfil de lo que necesitan los profesionales para incursionar en esta área de especialización; una gran capacidad de aprendizaje, creatividad y capacidad para establecer trabajo estrecho y colaborativo entre distintas áreas funcionales, además de ser un buen comunicador, junto con conocimientos científicos, matemáticos y estadísticos, así como programar o codificar, creando hipótesis, comprender y comparar distintos modelos, jugando con distintos escenarios y el poder de resolver varios cálculos de manera simultánea, convenciendo a los líderes de negocio del éxito de sus ideas y visión.

Fuentes

  • Deming, W. Edwards (1993). The New Economics for Industry, Government, and Education. Boston: MIT Press. ISBN 0262541165.
  • «¿Qué es un Data Scientist?». inLab FIB. 20 de mayo de 2015. Consultado el 8 de octubre de 2018.
  • Peter Drucker (2012). Data Scientist: The Sexiest Job of the 21st Century. Harvard Business Review.

Jesus Armando Tapia Gallegos

CEO & Owner en Acambaro, con más de 25 años de experiencia en áreas de manufacturas electrónicas, productos de cuidado de la belleza y operaciones en servicios de infraestructura, en las industrias de telecomunicaciones, tecnologías de información y servicios al cliente.

Previous slide
Next slide
A %d blogueros les gusta esto: