多角度、真实用户标注,人大 & 华为推出可解释推荐数据集 REASONER
2023-05-16 13:06:13来源:ZAKER科技
机器之心专栏
机器之心编辑部
推荐算法的可解释性近年来受到工业界和学术界的广泛关注。尽管人们提出了很多模型,但如何合理地评价算法产生的推荐解释一直是人们讨论的焦点。
(资料图片仅供参考)
目前可解释推荐算法的评价有诸多限制,如解释的真值不是由真实用户标注,通常只基于单一的某个方面评估解释质量,评估策略难以统一等。
为了进一步推动可解释推荐领域的发展,来自中国人民大学和华为的研究者联合构建了一个新的可解释推荐数据集—— REASONER ( Real Users Labeled Multi-aspect Explanations for Explainable Recommendation ) 。
论文地址:https://arxiv.org/pdf/2303.00168.pdf项目主页:https://reasoner2023.github.io/
GitHub 地址:https://github.com/REASONER2023/reasoner2023.github.io
联系邮箱:reasonerdataset@gmail.com
该数据集构建于视频推荐场景,包含了多种推荐解释目的的真值,例如,增强推荐说服力、解释信息量以及用户满意度等。可广泛应用于可解释推荐、推荐系统纠偏以及基于心理学的推荐等领域。同时,该研究也开发了一个可解释推荐工具包,包含了十个知名的可解释推荐模型方便大家使用。
可解释推荐数据集
亮点介绍
REASONER 数据集具有以下几个亮点:
多模态的候选解释:用户可以根据自身偏好为每个推荐的视频选择文本解释或视觉解释。
多方面的解释真值:从推荐说服力、解释信息量和用户满意度三个方面提供推荐解释真值。
真实用户标注:数据集中的解释真值的标注者正是产生交互记录的人。
丰富的用户特征:该研究收集了参与用户的多方面的特征信息(已脱敏)。
数据集构建
数据集的构建主要有以下三步:
1. 搭建视频推荐平台,设计有关推荐可解释性的关键问题
推荐平台的元素
由于视频内容丰富,可以提供充足的解释候选项,该研究选择视频作为平台的推荐项目。考虑到较长的标注时间会降低用户的注意力,因此该研究将视频时长控制在三分钟以内。
该研究挑选了一些视频特征作为推荐解释的候选项,其中最重要的特征是标签和预览。标签提取于视频作者所附原始标签、观看者实时评论和看后评论,属于文本特征;预览是从视频中提取出最具代表性的五个画面,属于视觉特征。
为获得多方面的解释真值,该研究为标注者设计了一系列的问题:
Q1: 哪些特征是您想观看该视频的原因?(推荐说服力)
Q2: 哪些特征最能体现该视频的信息?(解释信息量)
Q3: 哪些特征您最感兴趣?(用户满意度)
Q4: 请根据您的喜好进行评分(范围 1~5)
Q5: 您怎样评价该视频?(对视频的详细观点)
2. 招募标注者使用上述平台,收集他们的行为和回答
数据集的完整标注过程如图所示:
Step1: 用户注册用户提供个人基础信息进行平台注册,并完成大五人格测试题。
Step2: 平台推荐
用户登录平台,系统为其随机推荐三个短视频。
Step3: 用户选择和观看之前问题回答
用户查看推荐视频的特征并选择是否想要观看该视频,若决定观看,则需回答让其选择观看该视频的特征(Q1),否则用户需要选择令其不想观看该视频的特征。
Step4: 观看视频
用户观看完整视频。
Step5: 观看之后问题回答
用户观看过视频后,进行评分和评价(Q4 和 Q5), 回答最能体现视频内容的特征(Q2)和最能反应用户兴趣的特征(Q3)。
每个用户需完成 Step1 一次,并重复 Step2~Step5 六次,因此,在完整的标注过程中,每位用户会接收到 18 个推荐视频并对其进行标注。
3. 数据质量控制
相比于图像识别、实体标注等传统标注任务中真值都是客观的,REASONER 数据集旨在收集用户主观的个性化的偏好,无严格对错之分,这给质量控制增添了难度。
为此,该研究精心设置了一系列的规则判断标注结果的合理性,并移除不合理的样本。规则的设计主要依据标注时间、不同问题的一致回答、同一问题的矛盾回答和不同问题的矛盾回答等方面。
数据集内容
REASONER 数据集包含了 2997 个用户,4672 个视频,6115 个标签以及 58000 多条用户与视频的交互记录,这些信息存储在下列文件中:
REASONER-Dataset │── dataset │ ├── interaction.csv │ ├── user.csv │ ├── video.csv │ ├── bigfive.csv │ ├── tag_map.csv │ ├── video_map.csv │── preview │── README.md
1. Interaction.csv 字段说明
2. user.csv 字段说明3. video.csv 字段说明4. bigfive.csv 说明标注人员需完成大五人格测试 ( Big Five Personality Test ) ,bigfive.csv 包含标注者对 15 个问题的回答,其中 [ 0, 1, 2, 3, 4, 5 ] 分别对应于 [ 完全不符合,大部分不符合,有点不符合,有点符合,大部分符合,完全符合 ] 。
5. tag_map.csv 字段说明
6. video_map.csv 字段说明7. preview 说明包含了每个视频的五个图片预览。
可解释推荐工具包
连同 REASONER 数据集,该研究还开发了一个可解释推荐算法工具包方便大家使用。该代码库提供了两类广泛研究的可解释推荐模型,分别是基于特征的可解释推荐模型和基于自然语言解释的推荐模型。
现有模型
1. 基于特征的模型
EFM from Yongfeng Zhang et al.: Explicit Factor Models for Explainable Recommendation based on Phrase-level Sentiment Analysis ( SIGIR 2014 ) .
TriRank from Xiangnan He et al.: TriRank: Review-aware Explainable Recommendation by Modeling Aspects ( CIKM 2015 ) .
LRPPM from Xu Chen et al.: Learning to Rank Features for Recommendation over Multiple Categories ( SIGIR 2016 ) .
SULM from Konstantin Bauman et al.: Aspect Based Recommendations: Recommending Items with the Most Valuable Aspects Based on User Reviews. ( KDD 2017 ) .
MTER from Nan Wang et al.: Explainable Recommendation via Multi-Task Learning in Opinionated Text Data ( SIGIR 2018 ) .
AMF from Yunfeng Hou et al.: Explainable recommendation with fusion of aspect information ( WWW 2019 ) .
DERM: 区别于以上基于矩阵分解的浅层模型,该研究实现了不同形式的深度可解释推荐模型 ( Deep Explainable Recommendation Models ) .
2. 基于自然语言解释的模型
Att2Seq from Li Dong et al.: Learning to Generate Product Reviews from Attributes ( ACL 2017 ) .
NRT from Piji Li et al.: Neural Rating Regression with Abstractive Tips Generation for Recommendation ( SIGIR 2017 ) .
PETER from Lei Li et al.: Personalized Transformer for Explainable Recommendation ( ACL 2021 ) .
快速使用
1. 下载源代码
git clone https://github.com/REASONER2023/reasoner2023.github.io.git
2. 快速运行
运行基于特征的模型:
python tag_predict.py --model= [ model_name ] --dataset= [ dataset ] --config= [ config_files ]
运行基于自然语言解释的模型:
python review_generate.py --model= [ model_name ] --dataset= [ dataset ] --config= [ config_files ]
适配 RecBole
RecBole ( 伯乐 ) 是一个基于 PyTorch 开发的统一、全面和高效的推荐算法框架,目前已有 2.6k star。REASONER 数据集已经有适配 RecBole 数据格式的版本,接下来该研究会将目前的可解释推荐算法工具包迁移到 RecBole 上,方便大家使用 RecBole 中丰富、便捷的各项功能。
展望
研究团队相信 REAONER 数据集将为可解释推荐领域带来以下新机会:
多方面的可解释推荐:通过 REASONER 数据集,人们可以同时考虑不同的解释方面,并学习更全面的可解释模型来为线上用户服务。
多模态的可解释推荐:在现实场景中,用户总是需要感知多模态信息。借助 REASONER 数据集,人们可以围绕多模态解释展开研究。
具有全面人物信息的可解释推荐:通过 REASONER 数据集,人们可以获取脱敏的用户信息,有助于很多方向的研究。例如,解释的公平性,以及利用用户特征增强解释预测的准确性。
推荐系统其他方向:推荐系统纠偏、基于心理学的推荐算法等。
Reference
[ 1 ] Xu Chen, Jingsen Zhang, Lei Wang, Quanyu Dai, Zhenhua Dong, Ruiming Tang, Rui Zhang, Li Chen and Ji-Rong Wen. REASONER: An Explainable Recommendation Dataset with Multi-aspect Real User Labeled Ground Truths Towards more Measurable Explainable Recommendation. arXiv preprint arXiv:2303.00168 ( 2023 ) .
[ 2 ] Zhao W X, Mu S, Hou Y, et al. Recbole: Towards a unified, comprehensive and efficient framework for recommendation algorithms [ C ] //Proceedings of the 30th ACM International Conference on Information & nowledge Management. 2021: 4653-4664.
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
责任编辑:hnmd003
相关阅读
-
大模型迎来「开源季」,盘点过去一个月那些开源的 LLM 和数据集
选自AheadofAI机器之心编译编译:杜伟、泽南开源的力量正在源源不断地影响着整个AI社区,无论是LLM还是数据
2023-05-16 -
微软和 ChatGPT 之父下注核聚变:2028 年用上核聚变商业发电
钛媒体App5月16日消息,微软日前表示已与核聚变初创公司HelionEnergy签订电力采购协议,将在2028年采购由该
2023-05-16 -
乐歌股份:将尽快进军学校学生桌椅,正研究智慧屏接入 ChatGPT 观点
多知网5月16日消息,智能升降家居品牌乐歌人体工学科技股份有限公司(以下简称乐歌股份)近日举行了投资者活
2023-05-16 -
你信吗?谷歌 AI 公司创始人称传统搜索引擎十年内将消亡
【CNMO新闻】近日,据CNMO了解,谷歌旗下人工智能子公司DeepMind联合创始人穆斯塔法·苏莱曼(MustafaSuley
2023-05-16 -
苹果 iPhone 15 系列初期备货量“不容乐观”,供应链普遍信心不足
苹果将会在今年秋天带来新一代iPhone15系列手机,目前相关准备工作正在进行当中。今年智能手机市场形势严峻
2023-05-16
相关阅读
-
多角度、真实用户标注,人大 & 华为推出可解释推荐数据集 REASONER
机器之心专栏机器之心编辑部推荐算法的可解释性近年来受到工业界和学术界的广泛关注。尽管人们提出了很多模
-
大模型迎来「开源季」,盘点过去一个月那些开源的 LLM 和数据集
选自AheadofAI机器之心编译编译:杜伟、泽南开源的力量正在源源不断地影响着整个AI社区,无论是LLM还是数据
-
微软和 ChatGPT 之父下注核聚变:2028 年用上核聚变商业发电
钛媒体App5月16日消息,微软日前表示已与核聚变初创公司HelionEnergy签订电力采购协议,将在2028年采购由该
-
乐歌股份:将尽快进军学校学生桌椅,正研究智慧屏接入 ChatGPT 观点
多知网5月16日消息,智能升降家居品牌乐歌人体工学科技股份有限公司(以下简称乐歌股份)近日举行了投资者活
-
全国人大常委会的职权主要有哪几个方面?国家立法权具体包括哪些内容?
全国人大常委会的职权,主要有以下几个方面:(一)、国家立法权。宪法规定;全国人民代表大会和全国人民代...
-
世界视讯!WPS AI 再发布新 AI 能力,覆盖文字、表格、PPT、PDF 四大办公组件
作者|邓咏仪编辑|苏建勋36氪获悉,5月16日,金山办公旗下的WPSAI正式对外展示了文字、表格、PPT、PDF四大办
-
ofo 创始人戴威在美国创业 开设 About Time Coffee 咖啡连锁店
ofo小黄车创始人戴威再次开始创业,这次选在美国。他开了一家名为AboutTimeCoffee的咖啡店,已经在纽约市中
-
ofo小黄车创始人赴美创业!ofo小黄车押金还能退回来吗?
ofo小黄车创始人赴美创业!ofo小黄车创始人戴威赴美创业:注册用户免费喝咖啡,估值2亿美元。5月16日,据...
-
对公银行开户要多久?对公银行开户需要带什么资料?
对公银行开户要多久?公司银行开户需要7天到15天左右。注册公司时,必须要开立银行基本户,公司的银行账...
-
余额宝银华货币基金a保本吗?余额宝三种基金哪个好?
余额宝银华货币基金a保本吗?银华多利宝货币a属于基金类产品。除了保本基金之外,所有基金都是不保本,也...
-
微信备用金怎么开通?微信备用金能提现吗?
微信备用金怎么开通?1、第一步打开微信,进去我的界面之后,点击支付2、第二步进去微信支付之后,点击微...
-
全球动态:为国家低碳城市赋能: 英威腾光伏助力常州打造多个工商业光伏电站
常州,你好!这座位于苏南拥有着3200多年历史的文化古城,时时在焕发新的生机。逆变每一缕阳光英威腾光伏行走
-
天天快消息!北京拟实施算力伙伴计划
北京商报讯(记者杨月涵)近日,北京出台《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征
-
针对弹性算力需求 北京拟建设统一的多云算力调度平台
利用政府统一入口,降低公有云采购成本,普惠中小企业,同时减少企业分别面对不同云厂商的沟通成本。针对弹
-
焦点消息!北京拟整合现有开源中文预训练数据集和高质量互联网中文数据
同时持续扩展高质量多模态数据来源,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,通过北
-
世界关注:我国首台国产化150兆瓦级大型冲击式转轮成功下线
中国经济网北京5月16日讯记者今日从东方电气集团东方电机有限公司获悉,东方电气自主研制的国内首台单机容
-
IDC:一季度中国平板电脑市场同比下降1.1%
证券时报e公司讯,国际数据公司(IDC)最新平板电脑季度跟踪报告显示,2023年第一季度,中国平板电脑市场出
-
中国人寿c账户怎么样?可以一次性把钱支出来吗? 焦点快报
中国人寿c账户旨在满足客户长期储蓄和风险保障的需要,与传统的储蓄方式不同,c账户的收益主要来自于固定利
-
中国人寿保险靠谱不?有哪些险种?
靠谱。 作为中国最大的保险公司之一,中国人寿保险具有广泛的服务网络和全面的保险产品线。截至2021年底,
-
全球简讯:华夏保险存钱可靠吗?存钱一年可以取吗?
可靠。 华夏保险作为中国大陆上市的一家股份制保险公司,具有较高的信誉度和业务水平。其推出的存钱型保险
-
要闻速递:北京印刷学院突发集体食物中毒,学生多次在食物中吃到蟑螂腿、铁丝、头发等异物
据国是直通车消息,15日下午,在北京印刷学院班级群中,多位学生反应在学校食堂用餐后出现上吐下泻的情
-
北京市今年将招聘乡村振兴协理员近500名
北京市将启动2023年乡村振兴协理员招聘工作,面向北京生源应届毕业生,计划招聘494人。报名时间从2023年5月
-
美财长耶伦:美国政府最早6月1日出现债务违约|全球热闻
从过去经验来看,如果等到最后时刻再提高政府债务上限将对企业和消费者信心带来“严重危害”,对美国政...
-
9个项目集中签约落户重庆影视城(江津白沙)-世界今亮点
9个项目涉及到了外景拍摄、数字摄影棚、影视道具库全产业链等诸多领域。这批影视产业项目将为白沙加快建设
-
无锡搭建养老"幸福圈" 今年将打造35个乡村睦邻点 世界热推荐
以“睦邻点”为中心,打造乡村养老“幸福圈”。据悉,无锡市今年将打造35个同类乡村“睦邻点”。
-
你信吗?谷歌 AI 公司创始人称传统搜索引擎十年内将消亡
【CNMO新闻】近日,据CNMO了解,谷歌旗下人工智能子公司DeepMind联合创始人穆斯塔法·苏莱曼(MustafaSuley
-
苹果 iPhone 15 系列初期备货量“不容乐观”,供应链普遍信心不足
苹果将会在今年秋天带来新一代iPhone15系列手机,目前相关准备工作正在进行当中。今年智能手机市场形势严峻
-
拆解报告:飞利浦 DLM3542N 无线麦克风
短视频平台的兴起,人们记录和分享生活的方式开始以视频为主,随之体积轻巧便携,用于提升视频音频质量的无
-
SpaceX 公理太空 Ax-2 私人航天任务将于 5 月 22 日发射,送四人到国际空间站停留八天 全球聚焦
品玩5月16日讯,据IT之家报道,NASA、SpaceX和AxiomSpace(公理太空)今天(美国时间5月15日)对Ax-2任务进
-
主板厂商新版 BIOS 或没有解决 AM5 主板问题,SoC 电压仍会超过 1.3V
由于芯片电压提高到不安全的水平,导致Ryzen7000X3D系列处理器可能会出现突然烧坏的情况。各大主板厂商在近
精彩推荐
阅读排行
精彩推送
- 叫“鹤”的城市房价都低?北京一...
- 平安电工:自我提示亏损,靠收购...
- 世界关注:热搜!马斯克收到法院...
- 全球热消息:重大发现!抗阿尔茨...
- 网约车要饱和了,比亚迪与广汽埃...
- 汽车服务工程专业介绍及就业方向...
- 每日焦点!中国太平人寿保险怎么...
- 焦点短讯!泰康保险可靠吗?怎么...
- 工地工伤保险赔偿标准是多少?多...
- 保险合同终止的原因有哪些?怎么...
- 养老保险跨省转移最新政策是什么...
- 当前要闻:复星联合健康增资屡败...
- 2023新财富500富人:4562亿,钟...
- 马斯克:荒谬 爱泼斯坦从未向我...
- 用户价值驱动的汽车电子电气架构...
- 通过软件平台赋能客户可扩展ADAS...
- AITO问界与能链智电达成战略合作...
- 全球热资讯!细节小幅调整,阿斯...
- 福禄双喜是什么保险?福禄双喜两...
- 微业贷贷款需要什么条件?微业贷...
- 华夏货币基金怎么样?华夏货币基...
- 焦点播报:辉瑞宣布全资子公司发...
- 让“带娃”不再难 未来我国每千...
- 多行一起下架“智能通知存款”产品
- 今日热议:倍谙基宣布完成逾3亿...
- 当前速递!华丽家族股价封死涨停...
- 全球资讯:华为 MateBook E ...
- 小冰宣布启动“ GPT 克隆人计...
- WPS AI 二次亮相 展示类微软 Copilot 能力
- 当前热文:生态融合 华为 Mate...