Nuevos cursos (Master MiB)

Todo tipo de profesional necesita competencias en el área de los datos, lo que en general denominamos data literacy, y el espectro de profesiones cada vez más amplio e híbrido.

Lo sabemos desde hace tiempo y, por ello, desde la UOC ofrecemos diferentes programas académicos (que van desde un doctorado hasta un grado que hemos lanzado hace poco y tendrá su primera edición en Febrero 2019 como contaba Teresa Sancho, directora académica, hace muy poco). Parte de nuestro esfuerzo es revisar de forma continua todas nuestras asignaturas con el objetivo de mejorar el aprendizaje. Una tarea continua y progresiva de carácter semestral y, de vez en cuanto, de profundo calado cuando introducimos nuevos temas relevantes para la industria.

Dado el éxito que han tenido nuestro enfoque de cursos independientes (y con posibilidad de ampliar al master correspondiente), en este semestre ampliamos nuestra oferta. De tres opciones pasamos a cuatro, añadiendo la opción de aprender conceptos y técnicas vinculadas a minería de datos.

De forma que nuestra oferta de cursos queda:

De nuevo, esperamos que estos cursos faciliten el proceso de aprendizaje a nuestros futuros estudiantes y ampliemos la familia UOC.

Posted in Business Analytics, Data Literacy, Data Mining, MIB, UOC | Tagged , , , | Leave a comment

Emponderando al paciente

El pasado fin de semana tuve la oportunidad de participar en el proyecto Top4ELA de la Fundación Francisco Luzón, apoyado por Samsung España.

Como probablemente ya sabéis, la fundación es una organización independiente, sin ánimo de lucro y dedicada por completo a la mejora de las condiciones con las que viven los pacientes con Esclerosis Lateral Amiotrófica (ELA) y sus familiares. Su visión se fundamenta en el conocimiento, la innovación, la promoción y el apoyo.

¿Qué es ELA?

La Esclerosis Lateral Amiotrófica es una enfermedad neurodegenerativa rápidamente progresiva, caracterizada por una pérdida gradual de las neuronas motoras (o motoneuronas) superiores e inferiores.

Por la desaparición de las neuronas motoras en sus diferentes localizaciones (corteza cerebral, tronco del encéfalo y médula), los pacientes sufren atrofia muscular y la parálisis que generan múltiples problemas en todas las funciones básicas hasta que mueren.

¿Qué es Top4ELA?

Es una iniciativa que ha reunido profesionales de diferentes ámbitos tecnológicos: desde la inteligencia artificial hasta la realidad aumentada pasado por robótica y fabricación digital. El objetivo principal fue explorar los problemas vinculados con la ELA y determinar cómo la tecnología podía ser útil. La iniciativa no era proponer escenarios a largo plazo sino identificar acciones a corto plazo y sobretodo realistas.

¿Qué paso durante el fin de semana de Top4ELA?

May Escobar, directora general de la Fundación Francisco Luzón, María Bestué, neuróloga y Carlos García Espada, socio director de Everis y enfermo de ELA desde 2007 prepararon una sesión de introducción rápida, precisa y en detalle sobre la ELA.

Tras esta introducción, cogió la batuta Mario López de Ávila que coordinó el proceso de trabajo: identificación de problemas (dónde podíamos aportar), creación de equipos y progresión de los proyectos.

En mi caso, como os podéis imaginar, el problema a trabajar fue la fragmentación de la información. En mi equipo tuve la oportunidad de trabajar con grandes profesionales como María Bestué, Ana Jiménez Castellanos (CDS en LeadsOrigins) y Javier López, CTO as a Service. Todo un lujo y un placer colaborar con ellos.

Abordando el problema

El problema de la fragmentación del dato no es nuevo para ninguna organización. La creación de silos departamentales y como ya indica Ana en su post de resumen de la jornada viene de largo. Desafortunadamente con la existencia de 17 sistemas de información en España este problema se agrava significativamente.

Un paciente de ELA (y en general cualquier paciente) puede tener información dispersa en sistemas de diferentes centros, especialidades y autonomías (y si es mi caso, en diferentes países).

A la solución del problema se le ha dado un nombre: historia clínica integrada. Y aunque tenemos nombre, aún dista de estar implementada porque en esencia requiere una coordinación de múltiples actores (hospitales, clínicas, agencias, políticos, doctores, pacientes,…), integrar datos de diferentes sistemas de información (en diferentes formatos), gestionar información personal muy sensible (y que debe ser protegida para evitar malos usos),…

Y muchas iniciativas han ido en esta dirección. Y aún estamos en ello.

Cambio de enfoque: emponderar al paciente

Nuestro equipo se dio cuenta que no tenía sentido recorrer los mismos caminos andados. Es necesario proponer otros escenarios. Y afortunadamente el gobierno de datos (tema del que hablamos recurrentemente) nos abre la puerta a revisar este problema desde otra perspectiva.

¿Quién es el propietario de la información? ¿Quién debería controlar el acceso? ¿Quién debería tener acceso a toda su información? Y si nos hemos equivocado… y si, en realidad, debemos convertir al paciente en el dueño de sus datos.

Imaginemos que el usuario tiene un sistema en el que recopila su historial clínico (informes), sus datos personales y familiares,… así como cualquier otro información generada del paciente (como la que se puede generar con Apple Watch). Imaginemos que pudiera ser el paciente el que invitara a cualquier doctor (colegiado, claro) a revisar su historial (en lugar de tener de explicarlo). Es decir, articulamos la solución para que bascule alrededor del paciente y no alrededor de la administración pública y sus satélites.

Sin duda alguna, existe tecnología para crear esta solución (y, de hecho, potenciarla con machine learning) para revolucionar el ámbito de eHealth, tema relevante en la UOC, por lo que desarrollar esta iniciativa consiste más en encontrar quién lidera la iniciativa.

¿Nos ponemos?

Posted in Data Governance, eHealth, Machine learning | Tagged , , | 1 Comment

Disrupción en el Cloud con Autonomous Data Warehouse & Analytics

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 23 de octubre de 2018 en Madrid sobre soluciones autónomas para data warehouse y analytics en la nube.

Esta ponencia fue a cargo de Jordi Trill, Big Data y Core Tech Business Development Manager en Oracle.

Hay un concepto que ha entrado con fuerza en todos los sectores de actividad. Se trata de “Autónomo”. En el sector del automóvil lo hemos asumido y entendido todos con facilidad. Los vehículos autónomos superan la idea de tener “algunos automatismos” (por ejemplo, luces que se encienden solas al entrar en un túnel) y, mediante la incorporación de técnicas de machine learning e inteligencia artificial, consiguen una integración con la información del entorno y permiten su funcionamiento sin conductor.

En el sector de las tecnologías de la información, Oracle está liderando esta tendencia. Los nuevos servicios autónomos en el Cloud de Oracle van más allá de contar con funciones automáticas y permiten que determinadas soluciones, utilizando inteligencia artificial, se auto gestionen, minimizando los posibles errores inducidos por la acción humana.

La empresa está poniendo en marcha toda una serie de servicios autónomos. Lógicamente, dado el liderazgo de Oracle en gestión del dato, y la relevancia que ocupa como centro de la economía digital, los primeros servicios autónomos en el mercado están relacionados con la Base de Datos (en concreto Oracle Autonomous Data Warehouse Cloud) y con la analítica con Oracle Autonomous Analytics Cloud.

El dato es la base del negocio de nuestros clientes. Pero ¿Cómo conectarlo, integrarlo, almacenarlo, procesarlo, visualizarlo y analizarlo? La próxima generación de la base de datos resuelve estos problemas de una forma ágil, rápida y elástica. La solución ofrece una automatización total basada en el aprendizaje automático y elimina los errores humanos, al evitar la necesidad de ajustes manuales. Así, la base de datos se autorepara, se autosecuriza y se autogestiona.

Con la automatización incorporada en todos los niveles para realizar las tareas de mantenimiento, las empresas pueden ahora usar sus valiosos recursos de TI para concentrarse en extraer más valor de los datos que actualmente administran para influir directamente en las oportunidades y resultados comerciales.

A continuación, os dejamos la grabación de la ponencia completa así como el PDF.

¡Esperamos que la disfrutéis!

Posted in Big Data, Business Analytics, Data, data analytics, Evento, UOC D^2 | Tagged , , | Leave a comment

Casos de uso del Data Science para una Smart city

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 23 de octubre de 2018 en Madrid sobre casos de uso de la ciencia de datos aplicados a una ciudad inteligente.

Esta ponencia fue a cargo de María Medina, data scientist en PiperLab y co-organizadora de la comunidad PyLadies Madrid.

La ponencia se divide en dos partes. En la primera, se habla de un caso de uso para predecir la contaminación de Madrid. En PiperLab hemos desarrollado un modelo de predicción que ofrece información en tiempo real, así como predicciones sobre los niveles de contaminación de la capital. El modelo está especialmente dirigido a los ciudadanos y las empresas de transporte y logística, de tal forma que puedan prever restricciones de tráfico. El modelo de predicción no sólo se nutre con los datos procedentes de las estaciones de contaminación instaladas y distribuidas por toda la ciudad, sino que también se mejora mediante datos externos como la meteorología, datos de tráfico o datos de calendario (festivos, puentes locales o nacionales…).

En la segunda parte de esta ponencia se habla de la predicción de envíos de paquetes empleando Big Data y Machine Learning. El modelo de predicción de expediciones consiste en un modelo de previsión de demanda tanto de salidas como de llegadas de expediciones de todas las unidades de negocio de SEUR. Se realiza esta previsión a nivel bultos y kilos, para todas las unidades de negocio, El modelo incorpora datos históricos, internos de SEUR y datos externos como meteorología, calendarios, eventos especiales o datos poblacionales, imprescindibles para alcanzar este nivel de acierto en el contexto de una paquetera de última milla y la vinculación de su producción al e-commerce.

A continuación, os dejamos la grabación de la ponencia completa.

¡Esperamos que la disfrutéis!

Posted in Big Data, Data, Data Science, Evento, Machine learning, UOC D^2 | Tagged , , | Leave a comment

Todo el Big Data es igual

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 23 de Octube de 2018 en Barcelona cuyo nombre es “Todo el Big Data es igual “.

Esta ponencia fue a cargo de Guillem Borrell. Que mejor que él mismo para presentarse: “Doctor en Ingeniería Aeroespacial y programador en Python (entre otros) desde antes que la analítica estuviera de moda. Después de pasar un tiempo por la industria aeroespacial me doctoré en la ETSI Aeronáuticos UPM donde utilicé Python para entender un poco más la turbulencia. Tras un par de años desarrollando un motor para riesgos financieros aterricé en Kernel Analytics donde soy Team Lead“.

Nos podemos encontrar hoy en día cientos de herramientas en decenas de lenguajes de programación distintos para realizar todo tipo de cargas analíticas. Desde leer un petabyte de datos desde un sistema de ficheros tolerante a fallos a entrenar una red neuronal. Encima, cada seis meses aparece una herramienta nueva que que no nos queda más remedio que entender. Sin embargo, si nos fijamos bien en el funcionamiento de Hadoop, Spark, Pandas, Hive, Impala, Pig, Storm, Dask, Ray, Tensorflow… los conceptos clave se reducen a unos pocos. Esta charla es un pequeño viaje para entender estos conceptos, cómo las herramientas más populares no son más que interpretaciones de estas pocas ideas y una reflexión de cómo estos conocimientos nos ayudan a utilizarlas mejor.

A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación.

¡Esperamos que la disfrutéis!

Posted in Big Data, UOC D^2 | Tagged , | Leave a comment

Cuando las cosas van mal… es que falta gobierno

La experiencia suele generar una especie de sexto sentido. En el ámbito del análisis de datos, puede guiarnos a intuir que los datos presentados no son correctos, o todo lo contrario, que las piezas encajan.

Cuando las cosas van mal (en este contexto, quiere decir que no podemos tomar decisiones fundamentadas en los datos), puede ser por diferentes motivos. Por ejemplo, algunos motivos de los múltiples que podemos listar incluyen:

  • Se desconocen las fuentes de datos relevantes para la decisión a tomar.
  • Las fuentes de datos disponibles no generan confianza.
  • No existen un lenguaje común y transversal de conceptos de negocio (por ejemplo, qué se entiende por cliente)
  • No hay un control del dato (cómo se genera, cómo se captura, cómo se enriquece, cómo se almacena, cómo se usa y analiza, cómo se presenta,…).
  • No se sabe para qué y por qué.
  • No existe una clara inversión y responsabilidad respecto las iniciativas de datos, y las inversiones o bien no son las adecuadas o bien no producen los efectos deseados.

En esencia, cuando las cosas van mal… es que falta gobierno (de datos). De este tema hemos hablando varias veces (la última no hace mucho).

Este es un tema que últimamente me ronda mucho la cabeza y me alegra que, por fin, se inicie el capítulo de España de DAMA. Es sin duda alguna, muy buenas noticias, excelentes desde mi punto de vista. Compartir buenas prácticas y experiencia entre empresas es absolutamente para evitar caer una y otra vez en los errores.

Venía yo pensando en esto, (en el tema de cuan necesario es el gobierno para nuestras iniciativas analíticas), regresando a concentrarme en el trabajo, cuando he sido asaltado violentamente por un delincuente juvenil justo enfrente de la sede de policía después de que éste saliera de su última denuncia. Afortunadamente no ha pasado nada grave.

Este triste hecho me he hecho reflexionar de la situación del país en el que vivo (Reino Unido, aunque no el único como venimos observando últimamente). Por un lado, invirtiendo en iniciativas de reconocimiento facial para ayudar al cuerpo policial con más o menos fortuna o acierto (en Londres, que no la ciudad en la que vivo), y por otro, en la profunda recesión (por lo que viene de camino) que afecta a múltiples ayuntamientos principalmente en los servicios al ciudadano (en todos los sentidos). A menor inversión, en los últimos cinco años se ha incrementado la inseguridad de ciudadano, incluso a plena luz del día, y enfrente de la estación de policía principal de la ciudad.

En cierta medida, hay un paralelismo con el gobierno del dato. No se tiene claro, por ejemplo, cuáles son los activos de valor (las personas). No se ha asignado un presupuesto adecuado para su cuidado, su protección,… y cuando sucede alguna cosa, la única respuesta es: no podemos hacer nada. No hay propiedad, no hay control, no hay procesos definidos…

Me repito. En esencia, cuando las cosas van mal… es que falta gobierno (y en este caso no solo de datos).

Posted in Data Governance | Tagged | 2 Comments

Desde la UOC seguimos apostando por la ciencia de datos

Datos y más datos. ¿Qué puedo contar en este foro que no sepáis? En el momento en
que demos valor al dato, tendremos oro…

Desde la Universitat Oberta de Catalunya, y de acuerdo con su misión fundamental de ofrecer formación a lo largo de la vida, se sigue perfilando una oferta formativa en esta línea.

El objetivo es formar personas que puedan utilizar conjuntos de datos de tipología diversa con la finalidad de abordar problemas complejos, que apliquen su experiencia técnica para dar soluciones creativas. Además, serán profesionales que trabajarán colaborativamente en equipos multidisciplinares, con capacidad crítica en el análisis y la interpretación de resultados, y facilidad comunicativa en diferentes contextos. Así, proporcionaremos las competencias profesionales con un perfil interdisciplinar y poliédrico: matemáticas, informática y creatividad.

Contenidos como álgebra lineal numérica, optimización, programación probabilística, machine learning, deep learning, redes complejas, bases de datos y big data proporcionarán la base científica de estos nuevos profesionales, sensibles a su aplicación en ámbitos concretos (salud, educación, agricultura, industria 4.0), creativos y orientados a resultados.

Para ello, se propone una oferta formativa que integra un grado en Ciencia de Datos Aplicada orientado a la profesión (a partir de febrero), un máster en ciencia de datos generalista para personas con formación científico-técnica, y una línea de posgrado en inteligencia de negocio de corta duración. Cada una de ellas tiene una estructura y una propuesta metodológica ágil y flexible, que da respuesta a las necesidades y expectativas de empresas, instituciones y administración pública.

Teresa Sancho Vinuesa. Doctora ingeniera en Electrónica y licenciada en Matemáticas. Es profesora del área de Matemáticas de los Estudios de Informática, Multimedia y Telecomunicación de la UOC, y miembro del grupo de investigación LAIKA (Learning Analytics for Innovation and Knowledge Application in Higher Education).

Posted in Anuncios, Data Science | Tagged | 4 Comments

The Datathon Challenge

Otro mes, otro datathon. En este caso de Novartis y en colaboración con Eurecat. Os remitimos la información del evento en castellano y catalán.

Català

The Datathon Challenge (Barcelona, 1-2 desembre 2018) acollirà els millors Data Scientists experts en visualització de dades i problemes de predicció per resoldre un repte Big Data enfocat a l’anàlisi predictiu i l’AI, aplicats al pronòstic i assignació de recursos en una gran empresa del sector farmacèutic.

Se celebrarà els dies 1-2 de desembre de 2018 a Barcelona al Valkiria Hub Space (C/ Pujades, 126. 08005 Barcelona).

Hi haurà 7.000 € per als 3 millors equips! 

  • 1er PREMI: Electric Scooters + cash (total valor per equip: 4.000€)
  • 2on PREMI: Sports Watches + cash (total valor per equip: 2.000€)
  • 3er PREMI: Drones + cash (total valor per equip: 1.000€)

Aquesta setmana hem obert la convocatòria per participar, més informació AQUÍ.

https://godatathon.com/

A nivell de perfil de participants  es busquen equips de 1 a 4 persones formats per:

  • Data Scientists amb coneixements en visualització de dades, assignació de recursos i problemes de predicció.
  • Que tinguin experiència en paquets d’anàlisi de dades com Python, scykit learn, Matlab, R, etc.

Apunteu-vos! Segur que serà interessant.

Castellano

The Datathon Challenge (Barcelona, ​​1-2 diciembre 2018) acogerá los mejores Data Scientists expertos en visualización de datos y problemas de predicción para resolver un reto Big Data enfocado al análisis predictivo y la AI, aplicados al pronóstico y asignación de recursos en una gran empresa del sector farmacéutico.

Se celebrará los días 1-2 de diciembre de 2018 en Barcelona en Valkiria Hub Space (C / Pujades, 126. 08005 Barcelona).

Habrá 7.000 € para los 3 mejores equipos!

  • 1er PREMIO: Electric Scooters + cash (total valor por equipo: 4.000 €)
  • 2º PREMIO: Sports Watches + cash (total valor por equipo: 2.000 €)
  • 3er PREMIO: Drones + cash (total valor por equipo: 1.000 €)

Esta semana hemos abierto la convocatoria para participar, más información AQUÍ.

https://godatathon.com/

A nivel de perfil de participantes se busca equipos de 1 a 4 personas formados por:

  • Data Scientists con conocimientos en visualización de datos, asignación de recursos y problemas de predicción.
  • Que tengan experiencia en paquetes de análisis de datos como Python, scykit learn, Matlab, R, etc.

Apuntaos! Seguro que será interesante!

Posted in Datathon | Tagged | Leave a comment

De cuando la filosofía rescató a la inteligencia artificial

La inteligencia artificial tiene el potencial de transformar la sociedad como la conocemos. Al mismo tiempo genera múltiples cuestiones éticas a discutir. Este es un tema (inteligencia artificial, ética e incluso reglas) que ya hemos tratado, pero que sigue dando mucho juego.

Por ello hoy os emplazamos a leer directamente el artículo que ha publicado Diego Miranda Saavedra, profesor colaborador en el Master de Inteligencia de Negocio y Big Data, publicado en El País, Retina cuyo título es:

De cuando la filosofía rescató a la inteligencia artificial

¡Disfrutad de la lectura!

Posted in Artificial Intelligence, Retina | Tagged , | Leave a comment

Data Governance: hay que ponerse las pilas

Business Intelligence pasó de moda (y eso que se sigue fracasando en su implementación en cuotas simplemente espectaculares – que van del 60% al 90%- y nosotros seguimos apostando erre que erre que también es fundamental), Big Data ya es para empresas caducas – lo dijo Gartner –  (y nos encontramos con porcentajes similares de fracaso) y ahora en el hype de Data Science nos encontramos con lo mismo (aunque en esta fase va a costar confesar que no es oro todo lo que reluce, lo hacemos solo en petit comité).

Y aunque esta es la situación de cara a la galería, es bueno que ya se empiece a hablar de las barreras fundamentales que existen en las empresas para generar valor (que son múltiples y variadas, y dan para múltiples entradas). No es que me guste poner el dedo en la llaga (a veces, sí), pero llevo toda la semana hablando de estos temas con otros expertos y con mis estudiantes en sesiones, foros, cafés, comidas y demás. Sí, convertirse en un profesional que genera valor a partir del dato (sea cual sea la posición dentro del espectro de profesiones – desde la calidad del dato hasta el científico del dato) es muy interesante (ya lo dijo Davenport, pero ahora con automated machine learning le entró el pánico (1)). Y lo comento, en general, por la confusión que se ha generado con la profesión – como si el científico del dato tuviera que ser ultraboy, un ser mitológico y omnipotente que cubre en profundidad todas las disciplinas y es capaz de responder a todas las preguntas).

Entre ellas destaca de forma muy significativa: muchas empresas nunca han considerado el dato como un activo (y era o bien desconocido, ignorado o premeditado). Y ahora, que el dato (y las capacidades vinculadas a la generación del valor) se ha convertido en una palanca de negocio, se han encontrado que no están en una situación de partida adecuada. Y que muchas de sus iniciativas, se encallan, se retrasan, nunca suceden o simplemente se convierte en utopías.

Así que toca convertir el dato en un activo de valor. Y esto no es un tema solo de BI, Big Data o Data Science. Esto es Data Governance. Para nada sexy. Ya hemos hablado antes en Informatica++ (aquí y aquí) y en este foro (aquí).

Es necesario reconocer que todas nuestras iniciativas de análisis van a estar condicionadas por la calidad del dato, y que no se trata de una iniciativa puntual sino dentro de un marco mucho más amplio de planificación, vigilancia y gestión del dato. Y está claro que este ámbito es amplio puesto que en dicha gestión debemos considerar la seguridad, la privacidad y el compliance con la regulación (temas que tratamos en nuestro programa).

Así que es necesario primero reconocer la enfermedad, y luego empezar a trabajar en ello. Sin duda hay que ponerse las pilas.

(1) Aquí tenemos la automatización de todo el proceso. Algo a tener en cuenta para los profesionales en este campo que van a tener de aprender los límites de este enfoque. Algo que parece que muchos (en su emoción) están olvidando y la interpretabilidad (algo de lo que hablaré en breve en datanatives en Berlín).

Posted in Big Data, Chief Data Officer, Data Governance, Data Science | Tagged , , , | 6 Comments