hadoop求推荐好友-2度关系

原创
2018/05/16 01:36
阅读数 164
推荐好友
a -> b,c,d
b -> a,c,e
-------------
a-b     ab_cd
a-c     ac_bd
a-d     ad_bc

b-a      ba_ce
b-c      bc_ae
b-e      be_ac
-------------
b-> d
a-> e

已经直接可以排除ac是好友的情况了
~~~~~~~~~~~~~~~~~~~~~~~~~
不需要提前将相互关注的好友,只保留一条数据,因为即使是两条在reduce中已经set去重了
a b
b c
b a


map:
	key:主 value:从
	key:从 value:主
结果:a b ,b a, b c, c b,a b,b a
reduce:
	根据key,将values做笛卡尔积,得到的结果可能是二度关系(因为这里面包括已经是好友的情况)
结果:a c 
在经过一个mr去排除已经是好友的情况即可能ac已经是好友了
展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部