完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
一、前言 以微博为例,每个用户会发很多微博,其中包含了很多关键词信息。而这些关键词就是用户可能感兴趣的事物。我们需要用Hadoop MapperReduce计算出来。折旧引出了文档加权算法。其含义就是计算文档中某关键词的权重,我们使用该权重来判断某用户对某关键词的依赖程度。理想状况下,权重越高,用户越依赖于某关键词。其算法如下图所示。二、源数据 那么
|
|
|
|
只有小组成员才能发言,加入小组>>
2072 浏览 0 评论
7639 浏览 4 评论
35322 浏览 18 评论
4668 浏览 0 评论
22775 浏览 34 评论
757浏览 2评论
1005浏览 1评论
1122浏览 1评论
3508浏览 0评论
889浏览 0评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-7-1 16:12 , Processed in 1.321562 second(s), Total 72, Slave 53 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191