尊龙用现金-尊龙用现金玩一下

知乎联合清华开放国内最大个性化推荐实际交互数据集 时间:2021-05-24   点击:  栏目:行业知识

5月21日,知乎联合清华大学对外敞开根据知乎的大规模富文本查询和尊龙用现金玩一下引荐数据集 ZhihuRec 。该数据集包含了知乎上的1亿个行为数据,是目前为止,国内用于个性化引荐的最大的实践交互数据集。

作为一个大型数据集,ZhihuRec具有交际化问答场景中的详细信息,覆盖了知乎10天内、79.8万用户、16.5万个问题、55.4万个答复、24万个作者、7万论题以及50.1万用户查找行为日志,保留了完好的用户交互、机遇和内容信息,且一切数据均经过脱敏处理。

该数据集可用于评价惯例top-N引荐、次序引荐和上下文感知引荐中的算法使用,还可用于集成查找和引荐以及带有负反馈的引荐。 此外,该数据集不只能够用于引荐研讨,还能够使用于用户建模,查找和引荐体系的组合以及其他风趣的主题。

个性化引荐技能现已广泛使用于购物、视频、阅览、交际等互联网场景。但敞开式大规模实在场景数据集非常罕有。ZhihuRec数据集的敞开,不只丰厚了敞开式大规模实在场景数据集的研讨样本,更填补了引荐体系中用户交互日志的空白。

知乎建立十年来,聚集了超越3 .53亿条内容,每天会新增超越2000万条创作和互动,为中文互联网贡献了名贵的文本财富。

2018年,知乎曾联合我国信息检索学术会议、清华大学计算机系信息检索课题组一起举办了 移动环境下常识共享平台上的内容引荐 大赛,初次在竞赛中敞开ZhihuRec数据集,招引了很多高校和企业技能团队参赛和重视。此次知乎联合清华大学将该数据集进一步丰厚并全面敞开,旨在经过更大规模的数据开源,为职业算法技能打破与演进供给更多数据和场景支撑。

特别提示:本网信息来自于互联网,意图在于传递更多信息,并不代表本网附和其观念。其原创性以及文中陈说文字和内容未经本站证明,对本文以及其间悉数或许部分内容、文字的实在性、完好性、及时性本站不作任何确保或许诺,并请自行核实相关内容。本站不承当此类著作侵权行为的直接职责及连带职责。如若本网有任何内容侵略您的权益,请及时联络咱们,本站将会在24小时内处理完毕。