Anonim

GaudiLab / Shutterstock

Hadoop, un marco de software de código abierto de Apache para almacenar y procesar grandes conjuntos de datos en grupos de máquinas, ha llegado a lo grande. Markets and Markets pronosticó en enero de 2017 que el mercado de Hadoop podría crecer a más de $ 40 mil millones para 2021. Esos pronósticos comienzan a parecer pesimistas, de hecho, ya que se pronostica que los mercados globales mejorarán de manera constante en 2018. Un informe de Forbes de 2018 proyectó que Hadoop y el mercado de big data crecerá a más de $ 99 mil millones para 2022 (lo que representa una enorme tasa de crecimiento proyectada del 28.5%).

Una cosa sigue siendo segura: el crecimiento a una escala tan enorme crea una necesidad urgente de que muchos profesionales de TI más capacitados desarrollen, administren y administren implementaciones de Hadoop.

Dado el tiempo suficiente y la inclinación por el tema, muchas personas en el campo sienten que puedes aprender lo que necesitas saber sobre Hadoop a través del autoestudio. Para esas personas, navegar por la gran cantidad de documentación en el sitio web de Apache Hadoop es un buen punto de partida. También puede descargar la versión de código abierto de Hadoop y aprovechar la oportunidad de girar algunos mandos y explorar Hadoop a su propio ritmo.

Los administradores y desarrolladores que prefieren una experiencia de aprendizaje más estructurada pueden aprovechar los cursos de capacitación en línea gratuitos diseñados para acelerarlo.

Capacitación en línea de Hadoop

Sin ningún orden en particular, aquí hay más de una docena de excelentes fuentes gratuitas para el entrenamiento de Hadoop.

Anteriormente Big Data University, CognitiveClass.ai ofrece más de 50 cursos sobre Hadoop, HBase, Pig, análisis de big data, SQL, IBM BLU, DB2 y más, todos disponibles a su propio ritmo.

También encontrará dos rutas de aprendizaje dedicadas al aprendizaje de los Fundamentos de Hadoop para principiantes y la Programación de Hadoop para profesionales de Hadoop más avanzados.

También ofrecen un amplio conjunto de laboratorios virtuales para ayudar a los estudiantes a practicar lo que aprenden. La mayoría de los cursos son en inglés, pero algunos están en japonés, español y ruso. BigDataUniversity todavía opera sitios web portugueses (.br) y mandarín (.cn).

2. Cloudera Essentials para Apache Hadoop

Cloudera tiene un curso de video en línea Cloudera Essentials for Apache Hadoop que se distribuye capítulo por capítulo. En la Universidad de Cloudera, encontrará capacitación de Hadoop dirigida a administradores, analistas de datos, desarrolladores de científicos de datos y profesionales de seguridad.

Su próximo paso podría ser tomar el curso de Introducción a Hadoop y MapReduce de tres lecciones, ofrecido a través de Udacity. Cloudera también tiene un banco de trabajo de análisis SQL llamado HUE, que está diseñado para ayudar a las empresas a crear sus propias consultas de autoservicio; también es una gran herramienta de aprendizaje para aquellos que conocen el entorno de Hadoop.

3. Coreservlets.com

Dispensando glamour y glamour, coreservlets.com proporciona una serie de tutoriales sobre el desarrollo de aplicaciones de big data con Hadoop entregado desde una interfaz basada en texto.

Cada sección del tutorial le permite seguir el uso de archivos PDF y / o diapositivas compartidas, pero también puede obtener máquinas virtuales descargables en algunos casos, así como ejercicios (con soluciones).

Coursera tiene una gran biblioteca de cursos que se ofrecen en colaboración con varias universidades líderes, como UC San Diego, Stanford, Duke y muchas más.

La política de la compañía establece que puede acceder a video conferencias y ciertas tareas no calificadas de forma gratuita en todos los cursos. Estas vistas previas le dan la oportunidad de decidir si desea comprar un curso (con un precio entre $ 29 y $ 99) y tal vez seguir completando un certificado.

En la última búsqueda, el motor Coursera obtiene 46 resultados para cursos que mencionan Hadoop, incluidos todo tipo de temas de big data y data science, junto con una clase de UCSD titulada Hadoop Platform and Application Framework.

5. edX

Al igual que Coursera, edX ofrece cursos de universidades conocidas, así como de empresas de alta tecnología y otros contribuyentes. En la página web principal, ingrese "hadoop" en el campo de búsqueda para ver lo que está disponible actualmente.

Puede auditar un curso de edX de forma gratuita y realizar todas las tareas y exámenes, pero solo los participantes pagos reciben un certificado de finalización. En la actualidad, edX ofrece siete cursos en Hadoop, todos los cuales incluyen cobertura del marco y la plataforma, y ​​tres de los cuales mencionan a Hadoop en el título del curso.

6. DeZyre

DeZyre le permite aprender sobre big data y Hadoop de expertos de la industria, obtener un mentor y completar proyectos … por una tarifa. Pero los tutoriales gratuitos de la compañía están disponibles para cualquier persona, en cualquier momento.

Explore la larga lista de tutoriales en la página Tutoriales de DeZyre y haga clic en cualquier cosa que despierte su interés, sin necesidad de registrarse. Hay más de 18 cursos en el sitio, de los cuales dos son gratuitos.

7. Hortonworks

Hortonworks tiene muchos cursos buenos de pago, así como capacitación y tutoriales gratuitos de Hadoop. Para la mayoría de los tutoriales, debe descargar e instalar Hortonworks Sandbox, y la compañía recomienda otros tutoriales como requisitos previos para asegurarse de que está listo para aprender de manera más eficiente.

Como creador de la tecnología Hadoop, Hortonworks ofrece una de las más completas y respetadas carteras de capacitación de Hadoop.

8. IBM developerWorks

IBM developerWorks ofrece tutoriales y herramientas gratuitas para análisis de big data, computación en la nube y otras categorías de alta tecnología, basadas en tecnologías de IBM. Por ejemplo, Choose IBM Open Platform para sus proyectos Hadoop y Spark explora su distribución Apache Hadoop y Apache Spark. En el camino, describe el propósito o la función de cada componente, como Spark, MapReduce, Sqoop y más.

Aunque es un poco largo en los dientes, Open Source Big Data for the Impatient es un tutorial sólido que lo guía a través de los fundamentos de Big Data y Hadoop. Tiene que descargar una imagen de Hadoop (se recomienda Cloudera) para trabajar con ejemplos de Hadoop, Hive, Pig, Oozie y Sqoop.

9. Hadoop-Online-Tutorials.com

El sitio de capacitación y tutoriales de Hadoop administrado por Anil Jain proporciona enlaces a capacitación de marca (por una tarifa), así como tutoriales en línea gratuitos e indicadores para libros recomendados sobre Hadoop.

Varios de los recursos gratuitos que Jain menciona se presentan en esta publicación de blog, pero encontrará otros aquí que definitivamente vale la pena ver.

10. Tecnologías MapR

MapR es el proveedor de una distribución líder de Apache Hadoop. Los cursos de capacitación de Hadoop a pedido de la compañía incluyen lecciones en video, laboratorios, ejercicios prácticos y más, y pueden conducir a la certificación como Administrador de clúster certificado de MapR (MCCA), Analista de datos (MCDA) o Desarrollador de Hadoop certificado (MCHD).

MapR actualmente ofrece Apache Hadoop Essentials, seis cursos diferentes de Cluster Administration, tres cursos Hadoop Developer y muchos más cursos a pedido que cubren HBase, MapR Streams, Apache Spark, Apache Drill y Apache Hive.

Explore la página de capacitación a pedido para obtener una lista completa de las ofertas de cursos.

11. Udacity

Udacity es bien conocido por su catálogo de cursos de capacitación en ciencia de datos, desarrollo web, ingeniería de software y sistemas operativos móviles construidos por los grandes seguidores de Silicon Valley como Facebook y Twitter, Cadence y muchos más. Ofrece cursos y materiales de curso gratuitos, pero debe inscribirse en un programa pago para obtener una credencial de Nanodegree.

Para ver todos los cursos gratuitos de un vistazo, vaya a la página Cursos y Programas de nanogrado y seleccione la casilla de verificación Cursos gratuitos en la sección Filtros. Actualmente, una búsqueda en Hadoop muestra tres clases: dos en Hadoop y otra en análisis en tiempo real con Apache Storm.

12. Udemy

Udemy ofrece más de 40, 000 cursos gratuitos y de pago en casi todo bajo el sol. Cuando llegue a la página de inicio, ingrese "Hadoop free" en el cuadro de búsqueda para ver lo que se ofrece actualmente.

Actualmente, encontrará más de 35 cursos que van desde cinco hasta más de 60 conferencias cada uno, dirigidos principalmente a niveles principiantes a intermedios. Todos hacen mención específica y detallada de Hadoop.

13. Academia virtual de Microsoft

El Microsoft Professional Program (MPP) ofrece una variedad de certificados en las áreas de big data y data science, entre otros temas también.

Los cursos ofrecidos incluyen Procesar Big Data con Azure HDInsight (que es la distribución Hadoop administrada por Microsoft que se ejecuta en la nube de Azure), Procesar datos en tiempo real con Azure HDInsight e Implementar análisis predictivos con Spark en Azure HDInsight. Para las pruebas calificadas y un certificado, se requiere una tarifa de $ 99.

14. YouTube

Como era de esperar, YouTube tiene una larga lista de videos de capacitación de Hadoop. Busque Hadoop en la página principal, analice los más de 100 resultados y seleccione algunos videos que se adapten a sus necesidades.

15. Grupo de usuarios de Hadoop en LinkedIn

También hay gran información sobre los recursos de capacitación de Hadoop intercambiados por miembros del grupo de usuarios de LinkedIn de Hadoop. Además, si visita LinkedIn Learning y realiza una búsqueda en Hadoop, al momento de este escrito aparecen no menos de 297 resultados. ¡Buena cosa!