Entrevista a Laia Subirats Maté

Reproducimos al entrevista a Laia Subirats Maté publicada en 2 Octubre, 2018 en el boletín a tutores de la UOC por Marian Antón.

Laia Subirats estudió Ingeniería de Telecomunicaciones por la Universidad Pompeu Fabra, un máster de Telemática por la Universitat Politècnica de Catalunya, y un doctorado de Informática por la Universitat Autònoma de Barcelona. Desde 2009 es investigadora en Eurecat – Centro Tecnológico de Cataluña, responsabilidad que compagina con la tarea de profesora colaboradora del Máster Universitario de Data Science (asignatura Tipología y ciclo de vida de los datos) así como directora de proyectos finales en el Master en Inteligencia de Negocio y Big Data en la UOC.

Actualización (26/10/2018): Laia ha sido escogida como una de las 100 mujeres más influyentes en España dentro de la categoría de Pensadoras y Expertas. ¡Nuestra más sincera felicitación desde EIMT!

Laia Subirats: «Los datos son muy valiosos por el conocimiento que pueden crear, pero hay que refinarlos para obtener de ellos el máximo valor»

Hace quince años conseguiste una de las mejores notas de la selectividad en el Vallès. ¿Cómo recuerdas aquel momento? 

Cuando me comunicaron la nota me puse muy contenta. Además de la ingeniería también me interesan otros campos como las ciencias naturales, sociales o las lenguas, así que fue un reconocimiento por las horas de estudio, y también por los profesores y compañeros que me ayudaron en el proceso de aprendizaje.

¿Tenías muy claro qué querías estudiar? ¿Por qué elegiste Ingeniería de Telecomunicaciones?

En la ESO pensaba que podía estudiar Ingeniería de Telecomunicaciones, y en el bachillerato ya lo tuve más claro con asignaturas como las matemáticas, la física y la electrotecnia. Me interesaba la ingeniería porque me gustaba ver su aplicación en el mundo real y veía un abanico amplio de aplicaciones y salidas profesionales.

Conseguiste dos premios de final de carrera. ¿Cumplieron tus expectativas los estudios?

Estoy contenta con el reconocimiento conseguido en los estudios, porque además de aprender conocimientos y de conocer gente, viví experiencias enriquecedoras como hacer una estancia en el CERN en Ginebra (Suiza) o hacer prácticas en una empresa.

Y ahora, además de profesora colaboradora de la UOC, ¿cómo es tu vida profesional? 

Trabajo en Eurecat – Centro Tecnológico de Cataluña y actualmente participo en proyectos de aprendizaje adaptativo y personalizado para mejorar la educación; también colaboro en diferentes actividades formativas del centro.

¿Es difícil compaginarlo con las tareas en la UOC?

Compaginarlo requiere esfuerzo pero el hecho de que la enseñanza sea virtual facilita poder realizarlo en cualquier momento del día o lugar. Normalmente aprovecho las primeras horas de la mañana, las últimas horas del día y los fines de semana.

¿Los datos son el nuevo oro del siglo XXI? ¿Por qué?

Sí, los datos son muy valiosos por el conocimiento que pueden crear. Tener datos de calidad es fundamental para obtener buenos modelos. Finalmente, igual que el oro, los datos hay que refinarlos para obtener su máximo valor.

¿Cuáles crees que son las salidas profesionales en este campo con más futuro?

Hay diferentes roles profesionales como ser un data scientist, data analyst, data engineer o data architect. Cada uno de estos roles tiene diferentes responsabilidades y conoce diferentes lenguajes de programación.

¿Continúa este sector teniendo muchos más profesionales hombres que mujeres?

Sí, la realidad es que hay más profesionales hombres.

¿Por qué crees que las chicas no están tan interesadas en las carreras técnicas?

Creo que el factor social es clave. Las mujeres nos encontramos ante una gran falta de estereotipos o estímulos que nos despierten el interés por desarrollar una carrera profesional en el mundo de las carreras técnicas.

¿Qué crees que se podría hacer para cambiar esa tendencia?

Es especialmente importante que las y los profesionales acerquen el sector a alumnos de escuelas e institutos, explicando sus experiencias. También hay que fomentar el espíritu vocacional animando a todo el mundo a estudiar lo que les guste, dejando de lado los prejuicios.

Posted in data analytics, personal uoc | Tagged , , , | Leave a comment

Cloudera & Hortonworks

Hemos hablado en el pasado sobre el mercado de datos y su evolución. Uno de los aspectos más interesantes era la gran proliferación de actores en él, frecuentemente asociado a que la mayoría de tecnologías de este mercado son open source.

Mientras en el mercado se popularizan nuevas componentes y/o fabricantes como Dremio (basado en Apache Arrow), Apache Carbon o Apache Airflow (en incubación), de repente nos encontramos con una noticia a destacar y comentar: Cloudera y Hortonworks anuncia que se fusionan (ver el anuncio aquí), dos de los principales actores en el mercado de plataformas basadas en Hadoop.

Aunque en el mercado ya habíamos observado ciertos movimientos de adquisición y fusión nada parecido a este movimiento. Y aunque puros competidores también se habían diferenciado en los últimos años. Por un lado, Hortonworks tenía una aproximación al mercado basada en open source, una monetización basada en servicios  de valor e últimamente un foco en IoT. Cloudera, por otro lado, combinaba en su plataforma elementos propietarios, con lo que aparte de los servicios, generaba dinero mediante la plataforma, y últimamente enfocada a Machine Learning.

Aunque pueda parecer sorprendente este movimiento, no deberíamos estar tan sorprendidos:

  • Aunque el interés por big data (y su combinación con machine learning) sigue siendo significativo, el mercado es demasiado fragmentado y, como sucedió en el pasado con la inteligencia de negocio, es natural que observemos fusiones y adquisiciones. Es de esperar que más sucedan y no solo entre vendedores.
  • Con la emergencia de más actores proporcionando soluciones de big data en la nube, el movimiento natural de las primeras plataformas empresariales ha sido también ofrecer estos servicios. En este sentido la propiedad y la capacidad de reducir los problemas de integración (coincidente en ambos fabricantes) ha dejado de tener tanta relevancia (al menos por ahora).

Parece claro, al menos en primera lectura, que la combinación de ambas plataformas puede generar sinergias positivas. Por un lado, el enfoque a machine learning de cloudera y, por otro, el de IoT por parte de Hortonworks.

A ver cómo responden los índices bursátiles mañana puesto que ambas empresas cotizaban y sobretodo los competidores. Será un último trimestre del año divertido sin duda alguna y una noticia muy interesante a discutir con los alumnos de nuestros programas académicos.

Posted in Big Data | Tagged , , | Leave a comment

UOC D^2 2018 – Madrid

Hace unos meses hicimos la primera de las sesiones del UOC Data Day (D^2) en Barcelona. Podéis revisar los videos de las sesiones aquí.

Volvemos con la edición del evento en Madrid que se celebrará el próximo 23 de Octubre. Como en anteriores ediciones es un evento gratuito enfocado a todas aquellas personas que tengan interés en las nuevas tecnologías relacionadas con los datos. Se llevaran a cabo charlas con académicos y profesionales apasionados por compartir conocimientos en este ámbito.

Eso sí, en esta edición hemos cambiado de localización y se realizará en el Auditorio tienda Telefónica Gran Vía 28 (Madrid) a partir de las 17:00.

El programa de esta edición consiste en:

17:00 – Bienvenida y presentación de la jornada

17:15 – Todo el Big Data es igual, por Guillem Borrell (Team Lead en Kernel Analytics)

17:45 – Casos de uso del data Science para una Smart city,  por María Medina (Data Scientist en PiperLab)

18:15 – Networking & Coffee

18:45 – Disrupción en el Cloud con Autonomous Data Warehouse & Analytics, por Jordi Trill (Big Data and Core Tech Business Development Manager en Oracle)

19:15 – Developing Technology for Healthcare, por Carmen Ruiz (Software Engineer en DeepMind Health)

19:45 – Q&A y clausura

Más información e inscripciones: https://symposium.uoc.edu/23305/detail/uoc-data-day-madrid-2018.html

¡Os esperamos en el UOC Data Day (D^2)!

Posted in Big Data, Business Analytics, Business Intelligence, Data Science, eHealth, UOC D^2 | Tagged , , , , | Leave a comment

Big Data Analytics Summit 2018

En verano, aunque la docencia se para, los académicos nos dedicamos a otras tareas. Por ejemplo, a finales de Julio, Teresa Sancho nos explicaba su estadía en Southampton en el blog informatica++.

En general aprovechamos para realizar estadías en otras universidades, avanzar investigación, mejorar y ampliar nuestros conocimientos, revisar cursos que impartimos,… y no solo para descansar y recuperar fuerzas para el siguiente semestre (que también es importante).

También aprovechamos para participar en eventos. De nuevo este año participo en el evento Big Data Summit en Perú (breve resumen anterior del año anterior) durante esta semana donde comparto escenario con profesionales de diferentes países. Más información aquí: http://bigdatasummit.pe/conferencia/

Si el año anterior estaba centrada mi participación más en la parte estratégica (es decir, orientación hacia convertirse en una empresa fundamentada en evidencias tema recurrente en este blog), en esta edición he querido hablar de aspectos de divulgación técnica en dos ponencias diferentes, una centrada en los sistemas de recomendación y otra en topological data analysis (ya que no solo de deep learning vive el hombre).

Espero encontrarme con caras conocidas, tener charlas interesantes como el año anterior y poder confirmar la evolución de Big Data y Analytics en Perú escuchando casos de empresas.

Posted in Big Data, Evento | Tagged , , | Leave a comment

Descifrar la red cerebral: el gran desafío de la neurociencia del S.XXI

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 16 de mayo de 2018 en Barcelona sobre cómo descifrar la red cerebral: el gran desafío de la neurociencia del S.XXI.

Esta ponencia fue a cargo de Eloy Martinez, investigador postdoctoral en el grupo ImaginEM (Hospital Clínic de Barcelona e IDIBAPS) y profesor colaborador de los Estudios de Informática, Multimedia y Telecomunicación de la UOC.

Uno de los desafíos más grandes para los neurocientíficos en el actual siglo es descifrar la red cerebral. El conocimiento de esta organización jerárquica que permite la transmisión de información de regiones interconectadas estructural y funcionalmente ha revolucionado el modo de detectar alteraciones no visibles por técnicas convencionales.A diferencia de nuestro genoma, que se haya fijado desde el momento de la concepción, la red cerebral cambia a lo largo de toda la vida a través de vivencias y aprendizajes. Por tanto, lejos de ser un sistema estático de elementos interconectados, el cerebro humano es un órgano dinámico que se desarrolla y cambia continuamente en respuesta a las demandas del entorno y nos hace individuos únicos y diferentes.

Si conseguimos descifrar la red cerebral y sus mecanismos conductuales, la neurociencia desempeñará un papel muy importante en su tarea de curar trastornos mentales y lesiones cerebrales.

A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación.

¡Esperamos que la disfrutéis!

Posted in Data, Data Science, eHealth, Evento, Machine learning, UOC D^2 | Tagged , , | Leave a comment

¿Cómo estructurar un buen proyecto de Machine Learning?

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 16 de mayo de 2018 en Barcelona sobre cómo estructurar un buen proyecto de Machine Learning.

Esta ponencia fue a cargo de Anna Bosch Rué, VP Data Intelligence at Launchmetrics y profesora colaboradora de los Estudios de Informática, Multimedia y Telecomunicación de la UOC.

Durante la ponencia se explicará cómo construir un proyecto de machine learning exitoso proporcionando experiencia en el campo de la indústria que muchas veces solo se adquiere después de muchos años de trabajo. Las explicaciones, indicaciones y conclusiones son fruto de la experiencia, de líderes del sector, construyendo y poniendo en producción proyectos de machine learning y deep learning.

¿Cómo se diagnostican errores en un sistema de machine learning? ¿Como se priorizan las direcciones más prometedoras a seguir para reducir estos errores? ¿Cuando debemos entrenar una red neuronal propia? ¿Qué diferencia hay entre transfer learning y fine tuning y cuándo debemos aplicarlos? Intentaremos dar respuesta a todas estas preguntas y algunas más. Entenderemos también settings complejos de ML, como datos de entrenamiento y test no coincidentes, sobrepasar la predicción de un humano, etc Y daremos los insights necesarios para saber como aplicar end-to-end learning, transfer learning y multi-task learning.

Las indicaciones y conclusiones son especialmente relevantes para todos aquellos que quieran ser líderes en el campo de la Inteligencia Artificial y conocer como establecer la dirección correcta del trabajo así como los pasos a seguir.

A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación.

¡Esperamos que la disfrutéis!

Posted in Artificial Intelligence, Data, Data Science, Machine learning, UOC D^2 | Tagged , , , , | Leave a comment

Propagación de la mora en redes financieras

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 16 de mayo de 2018 en Barcelona sobre la propagación de la mora en redes financieras.

Esta ponencia fue a cargo de Jordi Nin, senior Data Scientist a BBVA Data & Analytics y profesor colaborador de los Estudios de Informática, Multimedia y Telecomunicación de la UOC.

El riesgo sistémico de las instituciones financieras y empresas sectoriales depende de sus interdependencias. La interconectividad de las redes financieras ha demostrado ser crucial para comprender la propagación de los valores predeterminados y una forma de evaluar el impacto de los eventos predeterminados únicos en todo el sistema. Aquí, aprovechamos la teoría de redes complejas para arrojar luz sobre los mecanismos detrás de la propagación predeterminada. Con datos reales de la compañía financiera BBVA, extraemos la red de transacciones cliente-proveedor entre más de 140000 empresas y sus flujos económicos. Proponemos un modelo computacional, basado en las probabilidades de contagio por defecto, que nos permita evaluar las principales estadísticas de difusión predeterminada a nivel individual y de sistema. Nuestros resultados muestran la exposición de diferentes sectores a las cascadas predeterminadas, y permiten una cuantificación y clasificación de los sectores en consecuencia. Esta información es relevante para proponer contramedidas a la propagación predeterminada en escenarios específicos.

A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación.

¡Esperamos que la disfrutéis!

Posted in Customer Analytics, Data, Data Science, Machine learning, Social Network Analysis, UOC D^2 | Tagged , , , | Leave a comment

Experiencias del uso de Kaggle en el entorno educativo superior

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 16 de mayo de 2018 en Barcelona sobre experiencias del uso de Kaggle en el entorno educativo superior.

Esta ponencia fue a cargo de Laia Subirats, data science researcher en Eurecat (Technology Centre of Catalonia) y profesora colaboradora de los Estudios de Informática, Multimedia y Telecomunicación de la UOC.

Kaggle es una plataforma donde data scientists compiten y producen modelos para predecir y describir los conjuntos de datos cargados por empresas y usuarios. Comprado en 2017 por Google, la comunidad de Kaggle tiene más de 536,000 usuarios registrados de más de 190 países. Entre los usuarios de Kaggle hay miembros del equipo ganador de Jeopardy de IBM Watson y del equipo que trabaja en DeepMind de Google. Muchos de estos investigadores publican artículos en revistas en función de su desempeño en estas competiciones.

Dentro del Máster de Data Science, en la asignatura “Tipología y Ciclo de Vida de los Datos” las profesoras Isabel Guitart, Mireia Calvo y yo misma hemos introducido Kaggle en los dos bloques principales de la asignatura. En el primer bloque los alumnos deben realizar un proyecto de web scraping del tema que deseen y deben describir y exportar los datos en el formato requerido por Kaggle. En el segundo bloque de la asignatura los alumnos deben analizar los datos bien de los datos generados del primer bloque de web scraping, o bien de una competición que haya activa de Kaggle. Se pide a los alumnos que utilicen Github para entregar las prácticas, para que así se familiaricen con esta plataforma de desarrollo web y para que tengan un portfolio de proyectos desarrollados en esta plataforma cuando acaben el máster.

A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación.

¡Esperamos que la disfrutéis!

Posted in Customer Analytics, Data, Docencia, Evento, Kaggle, UOC D^2 | Tagged , , , | Leave a comment

Ciclo Ciencias de Datos (IV)

Aquí tenéis la última cápsula formativa del Ciclo Data Science ofrecido por Alumni UOC sus socios Premium hará unos meses.

En esta ocasión, Bartek Skorulski, científico de datos Senior en el Programa Lidl Plus, nos explica, en el vídeo que encontraréis más abajo, cómo sobrevivir en el mundo del Data Science.

Data Science, guía de supervivencia

Sabremos qué supone Science en Data Science, cómo los experimentos generan aprendizaje, y si el Data Science puede contribuir a mejorar el mundo.

¡Esperamos os guste!

Posted in Big Data, Data Science, UOC Alumni | Tagged , , | Leave a comment

Tras GPDR, NIS

Cuando aún estamos en las primeras semanas del RGPD (GDPR en inglés), muchas empresas aún no tienen claros todos los aspectos y aún comentamos sobre los diferentes temas (por ejemplo, en esta noticia comentamos con Mònica Vilasau sobre el tema del Data Protection Officer – tanto en castellano como en catalán -), ha pasado por alto otra regulación que incluso se ha activado antes. Y que desde nuestro punto de vista también va a afectar profundamente a muchas empresas.

Estamos hablando de NIS, una directiva que hace referencia a la seguridad de redes y sistemas de información, creada en 2016 y puesta en marcha en mayo de 2018. El foco de esta ley es incrementar la resiliencia de los proveedores de infraestructuras críticas de servicios. Aspectos primordiales como electricidad, agua o transporte que cada vez más se apalancan sobre las tecnologías de información.

Si la RGDP está empujando la madurez y el gobierno del dato y tener una trazabalidad del dato de personas, esta regulación va a empujar en la misma dirección a los sistemas ciber-físicos poniendo atención al gobierno (de la seguridad), a la gestión de riesgos, a la trazabilidad de toda la cadena de suministro y al incremento del conocimiento y la formación.

Esta medida no solo afecta a cada país y a las empresas que ofrecen infraestructura crítica sino también a sus proveedores, por lo que de nuevo estamos ante una regulación de efectos mundiales.

Además ya estamos asistiendo a la emergencia de nuevas regulaciones vinculadas con el dato en otras áreas del mundo como es el caso de la nueva regulación del estado de California que persigue limitar la recopilación de datos.

Sin duda alguna, todas estas regulaciones van a afectar el despliegue de las tecnologías de información. Deberemos estar muy al tanto.

Posted in Data Governance, Data Security, Uncategorized | Tagged , , | Leave a comment