
Análisis forense de datos utilizando Spark, Zingg y Graphframes
About this event
⚠️ Por favor, no olvides indicar tu nombre completo y un documento identificativo (DNI, pasaporte, etc.) en la pregunta habilitada para ello en la inscripción. Será obligatorio presentar dicho documento el día del evento para poder acceder al espacio.
Queremos dar difusión al proyecto Apache más activo, Spark, que está cambiando el Big Data a gran velocidad. Las plataformas basadas en Hadoop y HDFS siguen vigentes pero el rendimiento y velocidad de las basadas en Spark hacen posibles nuevos usos y aplicaciones. Si estás en Madrid y te interesa Spark, este es el sitio para aprender y compartir intereses e ideas al respecto. Let's spark things up!
Agenda:
18:15 Presentación y bienvenida
18:30 Ángel Álvarez Pascua, Data Forensics with Spark, Zingg and Graphframes
19:30 Networking
Abstract:
Ángel Álvarez Pascua: Tus datos llevan una doble vida... y probablemente una triple. En esta sesión, jugaremos a ser detectives digitales utilizando Zingg para rastrear similitudes sospechosas y GraphFrames para mapear toda la red "criminal" de perfiles duplicados. Verás cómo pasar del "creo que son la misma persona" al "tengo la prueba en el grafo", todo esto sin que tu clúster de Spark sude la gota gorda.
Bio:
Ángel Álvarez Pascua
Source: meetup