读了《Hadoop大数据挖掘从入门到进阶实战》这本书,进行了一点勘误和建议:
1、MapReduce可以简单介绍下其思想或计算模型
2、HBase介绍到关于列数据库时,可以介绍下列数据库,以及和行数据库的区别
3、故障转移时,会出现的问题可以描述下及其框架处理的方法
4、93页,Drill拼写少了一个l
5、155页,dns3错写为d3
6、210页,核实路径是否存在,这里的命令下的路径与异常的地方的路径不一致,感觉一致可能更好或者再多加一句描述。
7、245页,图8-17应该是错误,是图忘画还是指定的是图8-16?
8、257页,唯一表示应该是唯一标识。
9、298页,下面图10-13应该是图10-16。
10、基本的安装环境(JDK环境)建议不要重复,建议在书籍最后作为目录更加好。
11、33页中间一段话描述有误,应该说的是不使用Kafka而直接用Logstash出现的问题。
12、402页,缺少一个字“本”章。
出现这种问题都是很正常的,读完之后,觉得非常不错,毕竟是一本入门书籍,也是萝莉大佬这位朋友所做,事实求是,谈下我个人的看法。
如果你想从事大数据领域,这本书可以做为入门的资料,讲了很多大数据组件:Sqoop、Hadoop、HBase、Kafka、Drill、Flume、Spark等等,还有简单手把手教你怎么配环境、调试源码等非常实在的方式。
现在大数据领域出的技术实在太快太多了,有时会感慨“跟不上了”,由于现在的时代,爆炸式数据的飞快增长,技术日新月异,更新换代指数级增加,面对不同的场景,总有新的东西出现,来更加能够适应当前需求。所以,如果你一旦打算在大数据领域创出一片属于自己的天地,那么可以开始行动了,第一步就是要入门,之后就得靠自己深入的去学习和探究。正所谓:“师父领进门,修行靠个人”。
如果你对大数据领域感兴趣,那么这本书可以作为你的入门书,这本书是非常实在的教材,应该能学到不少东西的。这里附下京东购买链接,有意愿的可以购买下哦。
(帮朋友做下广告^_^)
这里推荐一个博主的一个技术微信公众号:搬运工来架构。感兴趣的可以扫最下面的二维码关注哦。