Hadoop MapReduce执行过程详解 https://my.oschina.net/itblog/blog/275294

参考: http://www.cnblogs.com/yjmyzz/p/how-to-remote-debug-hadoop-with-eclipse-and-intellij-idea.html
1. 单词统计

A: 设定环境变量:

B: 程序源码:

C: 执行配置: eclipse右键, run Configuration –> argments输入两行: 注意, 这两个是指向HDFS服务器, 参数是fs.defaultFS, 但要做变换,除非本机配置hosts映射, 如果input/words_01.txt文件没有,请先手动上传,然后/output/ 必须是不存在的,否则程序运行到最后,发现目标目录存在,也会报错,这个弄完后,可以在适当的位置打个断点,终于可以调试了.

D: run……

 

2. 分数求平均 http://snaile.blog.51cto.com/8061810/1564051

 

3. 求每年最高最低气温 https://my.oschina.net/itblog/blog/275294

4. 求Top N问题 http://blog.csdn.net/xiaojimanman/article/details/41117357, 多文件输出, 自定义文件或者文件夹输出

 

 

5. MapReduce二次排序 https://my.oschina.net/xiaoluobutou/blog/807362