BERT之后这个新模型再次在11项NLP(自然语言处理)基准上打破纪录
- 机器之心
- 2018-12-24 20:03
自 BERT 打破 11 项 NLP 的记录后,可应用于广泛任务的 NLP 预训练模型就已经得到大量关注。最近微软推出了一个综合性模型,它在这 11 项 NLP 任务中超过了 BERT。目前名为「Microsoft D365 AI & MSR AI」的模型还没有提供对应的论文与项目地址,因此它到底是不是一种新的预训练方法也不得而知。
BERT 和微软新模型都采用了通用语言理解评估(GLUE)基准中的 11 项任务,并希望借助 GLUE 展示模型在广泛自然语言理解任务中的鲁棒性。其中 GLUE 基准并不需要知道具体的模型,因此原则上任何能处理句子和句子对,并能产生相应预测的系统都能参加评估。这 11 项基准任务重点衡量了模型在跨任务上的能力,尤其是参数共享或迁移学习的性能。
从微软新模型在 GLUE 基准的表现上来看,至少它在 11 项 NLP 任务中比 BERT-Large 更高效。这种高效不仅体现在 81.9 的总体任务评分,同时还体现在参数效率上。微软的新模型只有 1.1 亿的参数量,远比 BERT-Large 模型的 3.35 亿参数量少,和 BERT-Base 的参数量一样多。下图展示了 GLUE 基准排名前 5 的模型:
在「Microsoft D365 AI & MSR AI」模型的描述页中,新模型采用的是一种多任务联合学习。因此所有任务都共享相同的结构,并通过多任务训练方法联合学习。此外,这 11 项任务可以分为 4 类,即句子对分类 MNLI、QQP、QNLI、STS-B、MRPC、RTE 和 SWAG;单句子分类任务 SST-2、CoLA;问答任务 SQuAD v1.1;单句子标注任务(命名实体识别)CoNLL-2003 NER。
其中在句子对分类任务中,有判断问答对是不是包含正确回答的 QNLI、判断两句话有多少相似性的 STS-B 等,它们都用于处理句子之间的关系。而单句子分类任务中有判断语句中情感趋向的 SST-2 和判断语法正确性的 CoLA 任务,它们都在处理句子内部的关系。
在 SQuAD v1.1 问答数据集中,模型将通过问题检索段落中正确回答的位置与长度。最后在命名实体识别数据集 CoNLL 中,每一个时间步都会预测它的标注是什么,例如人物或地点等。
如下所示为微软新模型在不同任务中的得分:
目前微软新模型的性能还非常少,如果经过多任务预训练,它也能像 BERT 那样用于更广泛的 NLP 任务,那么这样的高效模型无疑会有很大的优势。
- 自然语言处理
相关文章
资讯
- 2024-12-21
第五届中国人工智能大赛成果发布会成功举办
- 2024-12-13
北京电信聚焦“上云用数” 推动国产算力应用与智算创新发展
- 2024-12-05
讯飞智作超拟人数字人功能全面开放,开启全民定制新潮流
- 2024-11-25
探索未来之路 激发AI创新 “天翼云·息壤杯”高校AI大赛北京区域赛开赛
- 2024-11-24
亚马逊向Anthropic追加40亿美元投资 加速人工智能创新与应用
- 2024-11-24
科大讯飞:拟推首期员工持股计划
- 2024-11-17
彰显青年风采 传承科学家精神 中国科技青年风采荟在浙江温州举行
- 2024-11-12
2024AI+研发数字(AiDD)峰会深圳站圆满收官!
- 2024-11-09
200余支队伍蓉城“百模论剑”,“人工智能+”全国性赛事报名倒计时3天
- 2024-10-19
三个老发明家献给盛世的礼物---“录味机”
- 2024-10-18
颠覆传统 新味十足 ——2024首届海南智能餐饮烹饪大赛成功举办
- 2024-10-18
首届中国智能锁科技创新大会:德施曼核心科技引领行业,发起科创基金
- 2024-10-18
ODC24 AI服务生态分论坛:全新智慧服务引擎 带动服务分发增长
- 2024-10-18
2024 OPPO开发者大会召开,以技术为基石共建AI智能体新生态
- 2024-10-12
中国移动发布“四驱两翼” 低空经济高质量发展能力体系
原创
荐读
-
5G+AR加持 晨星机器人掀起“智能化+人机交互”制造新趋势
2021世界制造业大会于11月22日在合肥落下帷幕。为期四天的大会中,作为向世界展示智能制造全面能力的窗口,联想展示了一系列让人惊喜的创新产品。现场展示的ThinkPad X1 Fold整体重量仅有1公斤,折叠起来之后的厚度大约为24毫米。当保持半开状态时,可以像拿本书一样握住,并且能同时运行两个应用程序。使用固定在中间的键盘之后,瞬间变...
-
智能手机竞争中失败,日本在联网汽车领域举步维艰
据外媒报道,在制造带有数字联网服务的汽车的竞争中,丰田汽车和日产汽车面临着被本土市场拖累的风险。与美国和欧洲的汽车消费者不同的是,日本消费者不愿意为这些联网功能和服务买单。结果就是:日本只有10%的汽车...
-
2020年河南省将推广应用3万台工业机器人
到2020年,推广应用3万台工业机器人,建设1000条智能生产线、300个智能车间、150个智能工厂……4月16日,在2018两岸智能装备制造郑州论坛上,河南省工信委发布了《2017年河南省智能制造白皮书》,河南智能制造的2020...