完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
一、前言 以微博为例,每个用户会发很多微博,其中包含了很多关键词信息。而这些关键词就是用户可能感兴趣的事物。我们需要用Hadoop MapperReduce计算出来。折旧引出了文档加权算法。其含义就是计算文档中某关键词的权重,我们使用该权重来判断某用户对某关键词的依赖程度。理想状况下,权重越高,用户越依赖于某关键词。其算法如下图所示。二、源数据 那么
|
|
|
|
只有小组成员才能发言,加入小组>>
2389 浏览 0 评论
8923 浏览 4 评论
36508 浏览 19 评论
4987 浏览 0 评论
24336 浏览 34 评论
1385浏览 2评论
1639浏览 1评论
2036浏览 1评论
1453浏览 0评论
398浏览 0评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-11-25 10:25 , Processed in 1.621336 second(s), Total 76, Slave 56 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号