Cuando las cosas van mal… es que falta gobierno

La experiencia suele generar una especie de sexto sentido. En el ámbito del análisis de datos, puede guiarnos a intuir que los datos presentados no son correctos, o todo lo contrario, que las piezas encajan.

Cuando las cosas van mal (en este contexto, quiere decir que no podemos tomar decisiones fundamentadas en los datos), puede ser por diferentes motivos. Por ejemplo, algunos motivos de los múltiples que podemos listar incluyen:

  • Se desconocen las fuentes de datos relevantes para la decisión a tomar.
  • Las fuentes de datos disponibles no generan confianza.
  • No existen un lenguaje común y transversal de conceptos de negocio (por ejemplo, qué se entiende por cliente)
  • No hay un control del dato (cómo se genera, cómo se captura, cómo se enriquece, cómo se almacena, cómo se usa y analiza, cómo se presenta,…).
  • No se sabe para qué y por qué.
  • No existe una clara inversión y responsabilidad respecto las iniciativas de datos, y las inversiones o bien no son las adecuadas o bien no producen los efectos deseados.

En esencia, cuando las cosas van mal… es que falta gobierno (de datos). De este tema hemos hablando varias veces (la última no hace mucho).

Este es un tema que últimamente me ronda mucho la cabeza y me alegra que, por fin, se inicie el capítulo de España de DAMA. Es sin duda alguna, muy buenas noticias, excelentes desde mi punto de vista. Compartir buenas prácticas y experiencia entre empresas es absolutamente para evitar caer una y otra vez en los errores.

Venía yo pensando en esto, (en el tema de cuan necesario es el gobierno para nuestras iniciativas analíticas), regresando a concentrarme en el trabajo, cuando he sido asaltado violentamente por un delincuente juvenil justo enfrente de la sede de policía después de que éste saliera de su última denuncia. Afortunadamente no ha pasado nada grave.

Este triste hecho me he hecho reflexionar de la situación del país en el que vivo (Reino Unido, aunque no el único como venimos observando últimamente). Por un lado, invirtiendo en iniciativas de reconocimiento facial para ayudar al cuerpo policial con más o menos fortuna o acierto (en Londres, que no la ciudad en la que vivo), y por otro, en la profunda recesión (por lo que viene de camino) que afecta a múltiples ayuntamientos principalmente en los servicios al ciudadano (en todos los sentidos). A menor inversión, en los últimos cinco años se ha incrementado la inseguridad de ciudadano, incluso a plena luz del día, y enfrente de la estación de policía principal de la ciudad.

En cierta medida, hay un paralelismo con el gobierno del dato. No se tiene claro, por ejemplo, cuáles son los activos de valor (las personas). No se ha asignado un presupuesto adecuado para su cuidado, su protección,… y cuando sucede alguna cosa, la única respuesta es: no podemos hacer nada. No hay propiedad, no hay control, no hay procesos definidos…

Me repito. En esencia, cuando las cosas van mal… es que falta gobierno (y en este caso no solo de datos).

Posted in Data Governance | Tagged | 2 Comments

Desde la UOC seguimos apostando por la ciencia de datos

Datos y más datos. ¿Qué puedo contar en este foro que no sepáis? En el momento en
que demos valor al dato, tendremos oro…

Desde la Universitat Oberta de Catalunya, y de acuerdo con su misión fundamental de ofrecer formación a lo largo de la vida, se sigue perfilando una oferta formativa en esta línea.

El objetivo es formar personas que puedan utilizar conjuntos de datos de tipología diversa con la finalidad de abordar problemas complejos, que apliquen su experiencia técnica para dar soluciones creativas. Además, serán profesionales que trabajarán colaborativamente en equipos multidisciplinares, con capacidad crítica en el análisis y la interpretación de resultados, y facilidad comunicativa en diferentes contextos. Así, proporcionaremos las competencias profesionales con un perfil interdisciplinar y poliédrico: matemáticas, informática y creatividad.

Contenidos como álgebra lineal numérica, optimización, programación probabilística, machine learning, deep learning, redes complejas, bases de datos y big data proporcionarán la base científica de estos nuevos profesionales, sensibles a su aplicación en ámbitos concretos (salud, educación, agricultura, industria 4.0), creativos y orientados a resultados.

Para ello, se propone una oferta formativa que integra un grado en Ciencia de Datos Aplicada orientado a la profesión (a partir de febrero), un máster en ciencia de datos generalista para personas con formación científico-técnica, y una línea de posgrado en inteligencia de negocio de corta duración. Cada una de ellas tiene una estructura y una propuesta metodológica ágil y flexible, que da respuesta a las necesidades y expectativas de empresas, instituciones y administración pública.

Teresa Sancho Vinuesa. Doctora ingeniera en Electrónica y licenciada en Matemáticas. Es profesora del área de Matemáticas de los Estudios de Informática, Multimedia y Telecomunicación de la UOC, y miembro del grupo de investigación LAIKA (Learning Analytics for Innovation and Knowledge Application in Higher Education).

Posted in Anuncios, Data Science | Tagged | 4 Comments

The Datathon Challenge

Otro mes, otro datathon. En este caso de Novartis y en colaboración con Eurecat. Os remitimos la información del evento en castellano y catalán.

Català

The Datathon Challenge (Barcelona, 1-2 desembre 2018) acollirà els millors Data Scientists experts en visualització de dades i problemes de predicció per resoldre un repte Big Data enfocat a l’anàlisi predictiu i l’AI, aplicats al pronòstic i assignació de recursos en una gran empresa del sector farmacèutic.

Se celebrarà els dies 1-2 de desembre de 2018 a Barcelona al Valkiria Hub Space (C/ Pujades, 126. 08005 Barcelona).

Hi haurà 7.000 € per als 3 millors equips! 

  • 1er PREMI: Electric Scooters + cash (total valor per equip: 4.000€)
  • 2on PREMI: Sports Watches + cash (total valor per equip: 2.000€)
  • 3er PREMI: Drones + cash (total valor per equip: 1.000€)

Aquesta setmana hem obert la convocatòria per participar, més informació AQUÍ.

https://godatathon.com/

A nivell de perfil de participants  es busquen equips de 1 a 4 persones formats per:

  • Data Scientists amb coneixements en visualització de dades, assignació de recursos i problemes de predicció.
  • Que tinguin experiència en paquets d’anàlisi de dades com Python, scykit learn, Matlab, R, etc.

Apunteu-vos! Segur que serà interessant.

Castellano

The Datathon Challenge (Barcelona, ​​1-2 diciembre 2018) acogerá los mejores Data Scientists expertos en visualización de datos y problemas de predicción para resolver un reto Big Data enfocado al análisis predictivo y la AI, aplicados al pronóstico y asignación de recursos en una gran empresa del sector farmacéutico.

Se celebrará los días 1-2 de diciembre de 2018 en Barcelona en Valkiria Hub Space (C / Pujades, 126. 08005 Barcelona).

Habrá 7.000 € para los 3 mejores equipos!

  • 1er PREMIO: Electric Scooters + cash (total valor por equipo: 4.000 €)
  • 2º PREMIO: Sports Watches + cash (total valor por equipo: 2.000 €)
  • 3er PREMIO: Drones + cash (total valor por equipo: 1.000 €)

Esta semana hemos abierto la convocatoria para participar, más información AQUÍ.

https://godatathon.com/

A nivel de perfil de participantes se busca equipos de 1 a 4 personas formados por:

  • Data Scientists con conocimientos en visualización de datos, asignación de recursos y problemas de predicción.
  • Que tengan experiencia en paquetes de análisis de datos como Python, scykit learn, Matlab, R, etc.

Apuntaos! Seguro que será interesante!

Posted in Datathon | Tagged | Leave a comment

De cuando la filosofía rescató a la inteligencia artificial

La inteligencia artificial tiene el potencial de transformar la sociedad como la conocemos. Al mismo tiempo genera múltiples cuestiones éticas a discutir. Este es un tema (inteligencia artificial, ética e incluso reglas) que ya hemos tratado, pero que sigue dando mucho juego.

Por ello hoy os emplazamos a leer directamente el artículo que ha publicado Diego Miranda Saavedra, profesor colaborador en el Master de Inteligencia de Negocio y Big Data, publicado en El País, Retina cuyo título es:

De cuando la filosofía rescató a la inteligencia artificial

¡Disfrutad de la lectura!

Posted in Artificial Intelligence, Retina | Tagged , | Leave a comment

Data Governance: hay que ponerse las pilas

Business Intelligence pasó de moda (y eso que se sigue fracasando en su implementación en cuotas simplemente espectaculares – que van del 60% al 90%- y nosotros seguimos apostando erre que erre que también es fundamental), Big Data ya es para empresas caducas – lo dijo Gartner –  (y nos encontramos con porcentajes similares de fracaso) y ahora en el hype de Data Science nos encontramos con lo mismo (aunque en esta fase va a costar confesar que no es oro todo lo que reluce, lo hacemos solo en petit comité).

Y aunque esta es la situación de cara a la galería, es bueno que ya se empiece a hablar de las barreras fundamentales que existen en las empresas para generar valor (que son múltiples y variadas, y dan para múltiples entradas). No es que me guste poner el dedo en la llaga (a veces, sí), pero llevo toda la semana hablando de estos temas con otros expertos y con mis estudiantes en sesiones, foros, cafés, comidas y demás. Sí, convertirse en un profesional que genera valor a partir del dato (sea cual sea la posición dentro del espectro de profesiones – desde la calidad del dato hasta el científico del dato) es muy interesante (ya lo dijo Davenport, pero ahora con automated machine learning le entró el pánico (1)). Y lo comento, en general, por la confusión que se ha generado con la profesión – como si el científico del dato tuviera que ser ultraboy, un ser mitológico y omnipotente que cubre en profundidad todas las disciplinas y es capaz de responder a todas las preguntas).

Entre ellas destaca de forma muy significativa: muchas empresas nunca han considerado el dato como un activo (y era o bien desconocido, ignorado o premeditado). Y ahora, que el dato (y las capacidades vinculadas a la generación del valor) se ha convertido en una palanca de negocio, se han encontrado que no están en una situación de partida adecuada. Y que muchas de sus iniciativas, se encallan, se retrasan, nunca suceden o simplemente se convierte en utopías.

Así que toca convertir el dato en un activo de valor. Y esto no es un tema solo de BI, Big Data o Data Science. Esto es Data Governance. Para nada sexy. Ya hemos hablado antes en Informatica++ (aquí y aquí) y en este foro (aquí).

Es necesario reconocer que todas nuestras iniciativas de análisis van a estar condicionadas por la calidad del dato, y que no se trata de una iniciativa puntual sino dentro de un marco mucho más amplio de planificación, vigilancia y gestión del dato. Y está claro que este ámbito es amplio puesto que en dicha gestión debemos considerar la seguridad, la privacidad y el compliance con la regulación (temas que tratamos en nuestro programa).

Así que es necesario primero reconocer la enfermedad, y luego empezar a trabajar en ello. Sin duda hay que ponerse las pilas.

(1) Aquí tenemos la automatización de todo el proceso. Algo a tener en cuenta para los profesionales en este campo que van a tener de aprender los límites de este enfoque. Algo que parece que muchos (en su emoción) están olvidando y la interpretabilidad (algo de lo que hablaré en breve en datanatives en Berlín).

Posted in Big Data, Chief Data Officer, Data Governance, Data Science | Tagged , , , | 4 Comments

Entrevista a Laia Subirats Maté

Reproducimos al entrevista a Laia Subirats Maté publicada en 2 Octubre, 2018 en el boletín a tutores de la UOC por Marian Antón.

Laia Subirats estudió Ingeniería de Telecomunicaciones por la Universidad Pompeu Fabra, un máster de Telemática por la Universitat Politècnica de Catalunya, y un doctorado de Informática por la Universitat Autònoma de Barcelona. Desde 2009 es investigadora en Eurecat – Centro Tecnológico de Cataluña, responsabilidad que compagina con la tarea de profesora colaboradora del Máster Universitario de Data Science (asignatura Tipología y ciclo de vida de los datos) así como directora de proyectos finales en el Master en Inteligencia de Negocio y Big Data en la UOC.

Actualización (26/10/2018): Laia ha sido escogida como una de las 100 mujeres más influyentes en España dentro de la categoría de Pensadoras y Expertas. ¡Nuestra más sincera felicitación desde EIMT!

Laia Subirats: «Los datos son muy valiosos por el conocimiento que pueden crear, pero hay que refinarlos para obtener de ellos el máximo valor»

Hace quince años conseguiste una de las mejores notas de la selectividad en el Vallès. ¿Cómo recuerdas aquel momento? 

Cuando me comunicaron la nota me puse muy contenta. Además de la ingeniería también me interesan otros campos como las ciencias naturales, sociales o las lenguas, así que fue un reconocimiento por las horas de estudio, y también por los profesores y compañeros que me ayudaron en el proceso de aprendizaje.

¿Tenías muy claro qué querías estudiar? ¿Por qué elegiste Ingeniería de Telecomunicaciones?

En la ESO pensaba que podía estudiar Ingeniería de Telecomunicaciones, y en el bachillerato ya lo tuve más claro con asignaturas como las matemáticas, la física y la electrotecnia. Me interesaba la ingeniería porque me gustaba ver su aplicación en el mundo real y veía un abanico amplio de aplicaciones y salidas profesionales.

Conseguiste dos premios de final de carrera. ¿Cumplieron tus expectativas los estudios?

Estoy contenta con el reconocimiento conseguido en los estudios, porque además de aprender conocimientos y de conocer gente, viví experiencias enriquecedoras como hacer una estancia en el CERN en Ginebra (Suiza) o hacer prácticas en una empresa.

Y ahora, además de profesora colaboradora de la UOC, ¿cómo es tu vida profesional? 

Trabajo en Eurecat – Centro Tecnológico de Cataluña y actualmente participo en proyectos de aprendizaje adaptativo y personalizado para mejorar la educación; también colaboro en diferentes actividades formativas del centro.

¿Es difícil compaginarlo con las tareas en la UOC?

Compaginarlo requiere esfuerzo pero el hecho de que la enseñanza sea virtual facilita poder realizarlo en cualquier momento del día o lugar. Normalmente aprovecho las primeras horas de la mañana, las últimas horas del día y los fines de semana.

¿Los datos son el nuevo oro del siglo XXI? ¿Por qué?

Sí, los datos son muy valiosos por el conocimiento que pueden crear. Tener datos de calidad es fundamental para obtener buenos modelos. Finalmente, igual que el oro, los datos hay que refinarlos para obtener su máximo valor.

¿Cuáles crees que son las salidas profesionales en este campo con más futuro?

Hay diferentes roles profesionales como ser un data scientist, data analyst, data engineer o data architect. Cada uno de estos roles tiene diferentes responsabilidades y conoce diferentes lenguajes de programación.

¿Continúa este sector teniendo muchos más profesionales hombres que mujeres?

Sí, la realidad es que hay más profesionales hombres.

¿Por qué crees que las chicas no están tan interesadas en las carreras técnicas?

Creo que el factor social es clave. Las mujeres nos encontramos ante una gran falta de estereotipos o estímulos que nos despierten el interés por desarrollar una carrera profesional en el mundo de las carreras técnicas.

¿Qué crees que se podría hacer para cambiar esa tendencia?

Es especialmente importante que las y los profesionales acerquen el sector a alumnos de escuelas e institutos, explicando sus experiencias. También hay que fomentar el espíritu vocacional animando a todo el mundo a estudiar lo que les guste, dejando de lado los prejuicios.

Posted in data analytics, personal uoc | Tagged , , , | Leave a comment

Cloudera & Hortonworks

Hemos hablado en el pasado sobre el mercado de datos y su evolución. Uno de los aspectos más interesantes era la gran proliferación de actores en él, frecuentemente asociado a que la mayoría de tecnologías de este mercado son open source.

Mientras en el mercado se popularizan nuevas componentes y/o fabricantes como Dremio (basado en Apache Arrow), Apache Carbon o Apache Airflow (en incubación), de repente nos encontramos con una noticia a destacar y comentar: Cloudera y Hortonworks anuncia que se fusionan (ver el anuncio aquí), dos de los principales actores en el mercado de plataformas basadas en Hadoop.

Aunque en el mercado ya habíamos observado ciertos movimientos de adquisición y fusión nada parecido a este movimiento. Y aunque puros competidores también se habían diferenciado en los últimos años. Por un lado, Hortonworks tenía una aproximación al mercado basada en open source, una monetización basada en servicios  de valor e últimamente un foco en IoT. Cloudera, por otro lado, combinaba en su plataforma elementos propietarios, con lo que aparte de los servicios, generaba dinero mediante la plataforma, y últimamente enfocada a Machine Learning.

Aunque pueda parecer sorprendente este movimiento, no deberíamos estar tan sorprendidos:

  • Aunque el interés por big data (y su combinación con machine learning) sigue siendo significativo, el mercado es demasiado fragmentado y, como sucedió en el pasado con la inteligencia de negocio, es natural que observemos fusiones y adquisiciones. Es de esperar que más sucedan y no solo entre vendedores.
  • Con la emergencia de más actores proporcionando soluciones de big data en la nube, el movimiento natural de las primeras plataformas empresariales ha sido también ofrecer estos servicios. En este sentido la propiedad y la capacidad de reducir los problemas de integración (coincidente en ambos fabricantes) ha dejado de tener tanta relevancia (al menos por ahora).

Parece claro, al menos en primera lectura, que la combinación de ambas plataformas puede generar sinergias positivas. Por un lado, el enfoque a machine learning de cloudera y, por otro, el de IoT por parte de Hortonworks.

A ver cómo responden los índices bursátiles mañana puesto que ambas empresas cotizaban y sobretodo los competidores. Será un último trimestre del año divertido sin duda alguna y una noticia muy interesante a discutir con los alumnos de nuestros programas académicos.

Posted in Big Data | Tagged , , | Leave a comment

UOC D^2 2018 – Madrid

Hace unos meses hicimos la primera de las sesiones del UOC Data Day (D^2) en Barcelona. Podéis revisar los videos de las sesiones aquí.

Volvemos con la edición del evento en Madrid que se celebrará el próximo 23 de Octubre. Como en anteriores ediciones es un evento gratuito enfocado a todas aquellas personas que tengan interés en las nuevas tecnologías relacionadas con los datos. Se llevaran a cabo charlas con académicos y profesionales apasionados por compartir conocimientos en este ámbito.

Eso sí, en esta edición hemos cambiado de localización y se realizará en el Auditorio tienda Telefónica Gran Vía 28 (Madrid) a partir de las 17:00.

El programa de esta edición consiste en:

17:00 – Bienvenida y presentación de la jornada

17:15 – Todo el Big Data es igual, por Guillem Borrell (Team Lead en Kernel Analytics)

17:45 – Casos de uso del data Science para una Smart city,  por María Medina (Data Scientist en PiperLab)

18:15 – Networking & Coffee

18:45 – Disrupción en el Cloud con Autonomous Data Warehouse & Analytics, por Jordi Trill (Big Data and Core Tech Business Development Manager en Oracle)

19:15 – Developing Technology for Healthcare, por Carmen Ruiz (Software Engineer en DeepMind Health)

19:45 – Q&A y clausura

Más información e inscripciones: https://symposium.uoc.edu/23305/detail/uoc-data-day-madrid-2018.html

¡Os esperamos en el UOC Data Day (D^2)!

Posted in Big Data, Business Analytics, Business Intelligence, Data Science, eHealth, UOC D^2 | Tagged , , , , | Leave a comment

Big Data Analytics Summit 2018

En verano, aunque la docencia se para, los académicos nos dedicamos a otras tareas. Por ejemplo, a finales de Julio, Teresa Sancho nos explicaba su estadía en Southampton en el blog informatica++.

En general aprovechamos para realizar estadías en otras universidades, avanzar investigación, mejorar y ampliar nuestros conocimientos, revisar cursos que impartimos,… y no solo para descansar y recuperar fuerzas para el siguiente semestre (que también es importante).

También aprovechamos para participar en eventos. De nuevo este año participo en el evento Big Data Summit en Perú (breve resumen anterior del año anterior) durante esta semana donde comparto escenario con profesionales de diferentes países. Más información aquí: http://bigdatasummit.pe/conferencia/

Si el año anterior estaba centrada mi participación más en la parte estratégica (es decir, orientación hacia convertirse en una empresa fundamentada en evidencias tema recurrente en este blog), en esta edición he querido hablar de aspectos de divulgación técnica en dos ponencias diferentes, una centrada en los sistemas de recomendación y otra en topological data analysis (ya que no solo de deep learning vive el hombre).

Espero encontrarme con caras conocidas, tener charlas interesantes como el año anterior y poder confirmar la evolución de Big Data y Analytics en Perú escuchando casos de empresas.

Posted in Big Data, Evento | Tagged , , | Leave a comment

Descifrar la red cerebral: el gran desafío de la neurociencia del S.XXI

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 16 de mayo de 2018 en Barcelona sobre cómo descifrar la red cerebral: el gran desafío de la neurociencia del S.XXI.

Esta ponencia fue a cargo de Eloy Martinez, investigador postdoctoral en el grupo ImaginEM (Hospital Clínic de Barcelona e IDIBAPS) y profesor colaborador de los Estudios de Informática, Multimedia y Telecomunicación de la UOC.

Uno de los desafíos más grandes para los neurocientíficos en el actual siglo es descifrar la red cerebral. El conocimiento de esta organización jerárquica que permite la transmisión de información de regiones interconectadas estructural y funcionalmente ha revolucionado el modo de detectar alteraciones no visibles por técnicas convencionales.A diferencia de nuestro genoma, que se haya fijado desde el momento de la concepción, la red cerebral cambia a lo largo de toda la vida a través de vivencias y aprendizajes. Por tanto, lejos de ser un sistema estático de elementos interconectados, el cerebro humano es un órgano dinámico que se desarrolla y cambia continuamente en respuesta a las demandas del entorno y nos hace individuos únicos y diferentes.

Si conseguimos descifrar la red cerebral y sus mecanismos conductuales, la neurociencia desempeñará un papel muy importante en su tarea de curar trastornos mentales y lesiones cerebrales.

A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación.

¡Esperamos que la disfrutéis!

Posted in Data, Data Science, eHealth, Evento, Machine learning, UOC D^2 | Tagged , , | Leave a comment