MOOC de introducción al #BigData con Apache Spark para periodistas

El anglicismo ‘Big Data’, ha comenzado a introducirse de manera cotidiana en numerosos entornos sociales como el de la comunicación. Este término, como destacan desde la Cátedra Orange,  surge para denominar un fenómeno relacionado con la gran cantidad de datos generados en este nuevo ecosistema sociotecnológico denominado “sociedad de la información”. Este concepto se aplica especialmente al uso de aquellas tecnologías encargadas de recopilar, almacenar y procesar gran cantidad de datos en tiempo real y poder traducir las conclusiones extraídas de manera comprensible para la audiencia.

En este sentido, manejar este tipo de herramientas se ha convertio en algo fundamental para periodistas y comunicadores hoy en día. Para los interesados en profundizar en este ámbito la UC BerkeleyX pone en marcha el MOOC: «Introducción al Big Data con Apache Spark».

Apache Spark, es una plataforma de computación de código abierto para análisis y procesos avanzados, considerada la nueva estrella del Big Data por su rapidez. La velocidad de procesamiento es una cualidad especialmente relevante en el entorno del Big Data en donde se valoran especialmente la tres Vs: Volumen, Velocidad y Variedad.

En la UC BerkeleyX podemos encontrar toda la información sobre este MOOC (massive open online course) o cursos online abierto a un público masivo, para saber cómo aplicar e interpretar este tipo de datos utilizando programas específicos para ello.

datos-cursoSaber interpretar estos datos pone a nuestro alcance la posibilidad de hacer todo tipo de predicciones y diagnósticos de utilidad a la hora de tomar decisiones o informar de temas específicos. Este curso que comenzará en marzo, tendrá una duración de 5 semanas repartidas en 5/7 horas de clases semanales.

El MOOC será impartido por Anthony D. Joseph, profesor de Ingeniería Eléctrica y Ciencias de la Computación en la Universidad de Berkeley. Para la realización del curso se precisan conocimientos de programación y experiencia con Python, tal y como señalan en su web:

Todos los ejercicios usarán PySpark (parte de Apache Spark), pero la experiencia previa con Spark o la computación distribuida no es necesario. Los estudiantes pueden consultar este mini-cuestionario Python antes del curso y aprovechar este mini-curso Python si necesitan aprender Python o refrescar sus conocimientos de Python.

profeEl numero de estudiantes que deciden participar en este tipo de cursos en línea no ha dejado de aumentar. Como señalaba el Chronicle más de seis millones de personas se han apuntado a distintos MOOCs desde 2011.

Tambien puede interesarte el MOOC Periodismo para el cambio social que comenzará el 4 de marzo con una duración de 6 semanas repartidas en clases de 2 a 4 horas a la semana.

Si te interesa el tema puedes conseguir más información aquí.