Sale70 Sale70w Sale70m Hier klicken Sonderangebote Book Spring Store 2017 Cloud Drive Photos UHD TVs Learn More TDZ Hier klicken HI_PROJECT Mehr dazu Mehr dazu Shop Kindle AmazonMusicUnlimitedFamily BundesligaLive longss17

Kundenrezensionen

4,5 von 5 Sternen
2
4,5 von 5 Sternen
5 Sterne
1
4 Sterne
1
3 Sterne
0
2 Sterne
0
1 Stern
0

Derzeit tritt ein Problem beim Filtern der Rezensionen auf. Bitte versuchen Sie es später noch einmal.

am 6. Dezember 2013
Dieses Buch kann als die "Referenz-Bibel" für Hadoop bezeichnet werden, deshalb ist das Buch ein Muss für jeden ersthaften Hadoop-User...egal ob Anfänger oder Fortgeschrittener.

Was "Java ist auch eine Insel" für die allgemeine Java-Programmierung ist, ist diese Buch für Hadoop. Darüber hinaus werden auch noch optionale Tools und Addons wie Hive, Pig, Snoop usw. behandelt.
0Kommentar|War diese Rezension für Sie hilfreich?JaNeinMissbrauch melden
am 2. Juni 2015
Das Hadoop-Ökosystem ist im Laufe der Zeit erheblich gewachsen. Dieses Buch bietet einen Überblick über die wichtigsten Themen und Projekte des Frameworks. Neben einer Erläuterung der Grundlagen von Hadoop, insbesondere HDFS, YARN und MapReduce, werden Erweiterungen, wie z. B. HBase, Spark, Zookeeper, Avro uvwm. ausführlich behandelt.

Um dieses Buch allerdings mit Gewinn lesen zu können, sollte man das MapReduce-Paradigma schon kennen und auch mit Hadoop erste Erfahrungen gesammelt haben. Es ist kein Einsteigerbuch. Es ist allerdings auch kein endgültiges Profibuch, da oft nicht genügend in die Tiefe gegangen wird.

Was ich persönlich vermisse, ist ein Abschnitt “Hadoop in Practice”, in dem über Erfahrungen aus der Praxis berichtet wird. Hier sollten Tipps und “Best Practices” für Betrieb und Entwicklung behandelt werden. Wie sehen übliche Einsatzszenerien aus? Welche Probleme gibt es da? Wie verhalten sich unkomprimierte Dateien in der Regel bei der Performance? Welche Änderungen gibt es, wenn ich Komprimierung verwende? usw.

Denn das Buch liest sich stellenweise wie eine sehr lange Dokumentation. Auch gibt es viele überflüssige Tabellen, wie z. B. die Tabelle aller primitiven Datentypen von Hive. Als Entwickler benutze ich das Buch doch nicht als Referenz, dass kann ich schneller googlen als es im Buch nachzugucken.

Schade finde ich, dass das maschinelle Lernen, z. B. mit Mahout, gar nicht im Buch behandelt wird. Auch das Monitoring von Hadoop wird nur gestreift, hier wäre interessant, wie das z. B. mit Nagios, Ganglia, Puppet, Chef oder Ambari genutzt werden kann. Und heutzutage sollte Containerisierung mit Docker natürlich auch nicht fehlen.

Aber alles in allem ist es ein sehr umfangreiches Buch und mir haben die meisten Stellen gut gefallen, wie z. B. die Behandlung fehlerhafter Daten, Debugging und Profiling in Kapitel 6 oder die genaue Beschreibung des Aufrufs von MapReduce-Jobs in Kapitel 7.

Ich kann das Buch jedem mit den o.g. Grundkenntnissen empfehlen.
0Kommentar| 8 Personen fanden diese Informationen hilfreich. War diese Rezension für Sie hilfreich?JaNeinMissbrauch melden



Brauchen Sie weitere HilfeHier klicken