Curs de Cloudera Developer Training for Apache Hadoop - Presencial / Virtual Castellà
1013 Persones estan visitant aquest curs
Preu 1.670 €
Sol·licita informació
Curs de Cloudera Developer Training for Apache Hadoop - Presencial / Virtual Castellà
Sol·licita informació
Informació del curs
Curs
Oficial / homologat
Presencial | On-line
Barcelona
28 hores
Preu 1.670 €
Descripció
El curs permetrà als alumnes aprendre a dissenyar potents eines de processament de dades per mitjà de l'ocupació d'Apache Hadoop.
PUE és Training Partner oficial de Cloudera, autoritzat per aquesta multinacional per impartir formació oficial en tecnologies Cloudera.
PUE està també acreditat i reconegut per realitzar serveis de consultoria i mentoring a la implementació de solucions Cloudera en l'àmbit empresarial amb el consegüent valor afegit en l'enfocament pràctic i de negoci del coneixement que es trasllada en els seus cursos oficials.
PUE és Training Partner oficial de Cloudera, autoritzat per aquesta multinacional per impartir formació oficial en tecnologies Cloudera.
PUE està també acreditat i reconegut per realitzar serveis de consultoria i mentoring a la implementació de solucions Cloudera en l'àmbit empresarial amb el consegüent valor afegit en l'enfocament pràctic i de negoci del coneixement que es trasllada en els seus cursos oficials.
Temari
- Introducció.
- Objectius de Hadoop.
Problemàtica tradicional en sistemes de gran escala.
Introducció a Hadoop.
Com resol Hadoop problemes.
- Hadoop: Conceptes bàsics i HDFS.
El projecte Hadoop i els seus components.
El sistema distribuït de fitxers de Hadoop HDFS (Hadoop Distributed File System).
- Introducció a MapReduce.
Descripció dels aspectes generals de MapReduce.
Exemple: WordCount.
Mappers.
Reducers.
- Clúster i Ecosistema Hadoop.
Descripció dels aspectes generals del clúster Hadoop.
Treballs i tasques Hadoop.
Altres components de l'Ecosistema Hadoop.
- Escriure un programa MapReduce en Java.
Conceptes bàsics d'APIs MapReduce.
Escriure Drivers MapReduce, mappers i Reducers en Java.
Accelerar el funcionament de Hadoop emprant Eclipse.
Diferències entre APIs MapReduce antigues i noves.
- Escriure programes MapReduce emprant Streaming.
Escriure programes mappers i Reducers emprant APIs Streaming.
- Unitat d'exercicis de programes MapReduce.
Els entorns de prova JUnit i MRUnit.
Testeig amb MRUnit.
Execució de testeig de profunditat en APIs Hadoop.
- Aprofundir en l'API de Hadoop.
Ocupació de la Classe ToolRunner.
Configuració i desactivació de tasques Map i Redueix.
Disminució de dades intermedis amb combinadors.
Accés programàtic a HDFS.
Ocupació de memòria cau distribuïda.
Ocupació de llibreries d'APIs Map, Redueix i Partition.
- Practica de desenvolupament de tècniques i trucs.
Estratègies de depurat per codi MapReduce.
Testeig local de codi MapReduce emprant LocalJobRunner.
Accés i escriptura de fitxers log.
Recuperació d'informació de treball amb comptadors.
Reutilització d'objectes.
Creació de treballs MapReduce Map, Redueix o Partition.
Treball en conjunt de tasques Redueix i Partition.
Determinació de nombre òptim de tasques redueix per una feina.
Escriure tasques Partition customitzades.
- Sortida i entrada de dades.
Creació customitzada d'implementacions writable i writable-Comparable.
Conceptes a considerar en l'ocupació de compressió d'arxius.
Implementació customitzada de formats d'entrada i sortida (InputFormats i OutputFormats).
- Algorismes comuns en MapReduce.
Classificació i recerca de grans conjunts de dades.
Computació de Term Frequency i Inverse Document Frequency.
Càlcul de Co-ocurrència de paraula.
Creació i modelatge d'ordres secundàries.
- Accés a conjunts de dades en treballs MapReduce.
Escriure accessos Map-Side.
Escriure accessos Redueix-Side.
- Integració de flux de treball de Hadoop en entorns empresarials existents.
Integració de Hadoop ien entorns existents.
Càrrega de dades en HDFS des RDBMS emprant Sqoop.
Administració de dades en temps real emprant Flume.
Accés HDFS des de sistemes fiables amb FuseDFS i HttpFS.
- Introducció a Hive, Imapala, i Pig.
Objectius de Hive, Impala, i Pig.
Descripció dels aspectes generals de Hive.
Descripció dels aspectes generals de Impala.
Descripció dels aspectes generals de Pig.
Elecció entre Hive, Impala, i Pig.
- Introducció a Oozie.
Descripció dels aspectes generals de Oozie.
Creació de fluxos de treball amb Oozie.
- Conclusió.
- Objectius de Hadoop.
Problemàtica tradicional en sistemes de gran escala.
Introducció a Hadoop.
Com resol Hadoop problemes.
- Hadoop: Conceptes bàsics i HDFS.
El projecte Hadoop i els seus components.
El sistema distribuït de fitxers de Hadoop HDFS (Hadoop Distributed File System).
- Introducció a MapReduce.
Descripció dels aspectes generals de MapReduce.
Exemple: WordCount.
Mappers.
Reducers.
- Clúster i Ecosistema Hadoop.
Descripció dels aspectes generals del clúster Hadoop.
Treballs i tasques Hadoop.
Altres components de l'Ecosistema Hadoop.
- Escriure un programa MapReduce en Java.
Conceptes bàsics d'APIs MapReduce.
Escriure Drivers MapReduce, mappers i Reducers en Java.
Accelerar el funcionament de Hadoop emprant Eclipse.
Diferències entre APIs MapReduce antigues i noves.
- Escriure programes MapReduce emprant Streaming.
Escriure programes mappers i Reducers emprant APIs Streaming.
- Unitat d'exercicis de programes MapReduce.
Els entorns de prova JUnit i MRUnit.
Testeig amb MRUnit.
Execució de testeig de profunditat en APIs Hadoop.
- Aprofundir en l'API de Hadoop.
Ocupació de la Classe ToolRunner.
Configuració i desactivació de tasques Map i Redueix.
Disminució de dades intermedis amb combinadors.
Accés programàtic a HDFS.
Ocupació de memòria cau distribuïda.
Ocupació de llibreries d'APIs Map, Redueix i Partition.
- Practica de desenvolupament de tècniques i trucs.
Estratègies de depurat per codi MapReduce.
Testeig local de codi MapReduce emprant LocalJobRunner.
Accés i escriptura de fitxers log.
Recuperació d'informació de treball amb comptadors.
Reutilització d'objectes.
Creació de treballs MapReduce Map, Redueix o Partition.
Treball en conjunt de tasques Redueix i Partition.
Determinació de nombre òptim de tasques redueix per una feina.
Escriure tasques Partition customitzades.
- Sortida i entrada de dades.
Creació customitzada d'implementacions writable i writable-Comparable.
Conceptes a considerar en l'ocupació de compressió d'arxius.
Implementació customitzada de formats d'entrada i sortida (InputFormats i OutputFormats).
- Algorismes comuns en MapReduce.
Classificació i recerca de grans conjunts de dades.
Computació de Term Frequency i Inverse Document Frequency.
Càlcul de Co-ocurrència de paraula.
Creació i modelatge d'ordres secundàries.
- Accés a conjunts de dades en treballs MapReduce.
Escriure accessos Map-Side.
Escriure accessos Redueix-Side.
- Integració de flux de treball de Hadoop en entorns empresarials existents.
Integració de Hadoop ien entorns existents.
Càrrega de dades en HDFS des RDBMS emprant Sqoop.
Administració de dades en temps real emprant Flume.
Accés HDFS des de sistemes fiables amb FuseDFS i HttpFS.
- Introducció a Hive, Imapala, i Pig.
Objectius de Hive, Impala, i Pig.
Descripció dels aspectes generals de Hive.
Descripció dels aspectes generals de Impala.
Descripció dels aspectes generals de Pig.
Elecció entre Hive, Impala, i Pig.
- Introducció a Oozie.
Descripció dels aspectes generals de Oozie.
Creació de fluxos de treball amb Oozie.
- Conclusió.
Destinataris
El curs està dirigit a desenvolupadors que volen aprendre a utilitzar Apache Hadoop per desenvolupar potents eines de processament de dades.
Requisits
Aquesta formació oficial està dissenyada per desenvolupadors amb una mica d'experiència en programació (preferiblement Java). No són necessaris els coneixements previs en Hadoop.
Necessites informació sobre cursos? Truca'ns al 900 293 573
Trucada gratuïta de dilluns a divendres de 9h a 20h
Durada
Dates de convocatòria a consultar
Objectius
Després de la finalització de la formació, el participant coneixerà:
Les tecnologies clau de Hadoop.
Com funciona HDFS MapReduce.
Com desenvolupar aplicacions MapReduce.
Com crear unitats de test (unit tests) per a aplicacions MapReduce.
Com utilitzar els combiners, partitioners, i la memòria cau distribuïda d'un MapReduce.
Millors pràctiques per al desenvolupament i depuració d'aplicacions MapReduce.
Com implementar l'entrada i sortida de dades d'aplicacions MapReduce.
Algorismes per a tasques comunes de MapReduce.
Com unir conjunts de dades en MapReduce.
Com s'integra Hadoop en el CPD.
Com utilitzar els algoritmes Machine Learning de mahout.
Com utilitzar Hive i Pig per al desenvolupament ràpid d'aplicacions.
Com crear grans workflows utilitzant Oozie.
Les tecnologies clau de Hadoop.
Com funciona HDFS MapReduce.
Com desenvolupar aplicacions MapReduce.
Com crear unitats de test (unit tests) per a aplicacions MapReduce.
Com utilitzar els combiners, partitioners, i la memòria cau distribuïda d'un MapReduce.
Millors pràctiques per al desenvolupament i depuració d'aplicacions MapReduce.
Com implementar l'entrada i sortida de dades d'aplicacions MapReduce.
Algorismes per a tasques comunes de MapReduce.
Com unir conjunts de dades en MapReduce.
Com s'integra Hadoop en el CPD.
Com utilitzar els algoritmes Machine Learning de mahout.
Com utilitzar Hive i Pig per al desenvolupament ràpid d'aplicacions.
Com crear grans workflows utilitzant Oozie.
Titulació obtinguda
Després de la realització del present curs oficial estarà capacitat per superar l'examen de certificació: Cloudera Certified Developer for Apache Hadoop (CCDH).
Promocions
FORMACIÓ BONIFICADA si es reuneixen els requisits
Horari
Curs de Cloudera Developer Training for Apache Hadoop - Presencial / Virtual Castellà
PUE
Campus i seus: PUE
PUE
Central: Avda. Diagonal 98-100
08019
Barcelona