微信
手机版
网站地图

袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王

2019-04-05 07:54:11 投稿人 : admin 围观 : 158 次 0 评论

机器之心报导

从中学数学到高数微积分,咱们需求做很多数学题。常识点看懂了并不算懂,能解题才是王道。那么神经网络是不是也能了解数学题,并解出这些标题呢?由于从数据上来说,数学题也便是一刑床个序列罢了,神经网络说不定能将这个序列映射到正确的答袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王案。

为了促进这方面的研讨,DeepMind 近来发布了一个新式数据集,包含很多不同类型的数学问题(练习题等级),旨在调查模型的数学学习和代数推理才能。

数新月零犬据集地址:https://github.com/dee韦雪生下秦奋孩子pmind/mathematics_dataset

现在该数据集发布了 1.0 版,其每个模块包含 200 万(问题答案)对和 10000 个预生成测验样本,问题的长度限制为 160 字符,答案的长度限制为 30 字符。每个问题类型中的练习数据被分为「简单练习」、「中等练习难度」和「较难练习」三个等级。这答应经过课程来练习模型。

该数据集包含以下类别:

如下所示为该数据集的示例,其间 Question 是待处理的数学标题,Answer 伏喻夜是对应标题的解牛东文炮王。这些标题触及上述多种数学问题,且进行宽宽vozb了分级。

薄习
袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王
武界神刀 王乃康

图 1:数据集示例。

什么是神经网络的数学推导才能

深度学习在方式匹配、机器翻译、强化学习等范畴取得了巨大成功。可是,深度模型的稳健性和灵活性远不及人类。它们对生疏环境的泛化才能缺乏,且易受对立样本的影响。

人类智能差异于神经模型且优于后者的一个范畴是对「代数泛化」目标和实体的离散组合推理。人类在该范畴的泛化才能是杂乱、多面的,与双语翻译范畴的泛化有显着差异。例如,考虑以下数学问题(答案是 −长吉乡70x − 165):

为了处理这个问题,人类需求运用多种认知技能:

这个数据宁夏理工学院怎么样集项目提出了什么

该数袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王据集包含多种不同类型的数学问题。其动机是,模型假如不具备一些代数泛化才能刺青女,则很难处理多种数学问题(包含泛化)。

该范畴对神经架构剖析非常重要。该数据集除了供给很多问题以外,还有多个优势:数学供给了一个自洽的环境;不同问题类型的符号是相同的,这使得该数据集可以轻松扩展;在一个问题上学到的规矩和办法一般可用于其他问题。例如袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王,数字加法的规矩在哪里都是相同的,且可作为其他问题(如乘法、多项式加法)的「子程序」(subroutine)。可以履行常识搬迁的模型会在这个数据集上取得较好的功能,要想处理较难的问题,常识搬迁必不可少。

数学自身是一个风趣的范畴,虽然处理该数据会集校园等级数学问题的模型没有实践袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王运用,但它们可能会带来更强壮的模型,用于处理很多风趣新颖的数学问题。一般来韩国电影妈妈说,用于验证旨在捕捉算术/体系性推理新架构的试验一般来自数学范畴,而这并非偶然。因而 DeepMind 期望经过为此类模型供给大规模练习和评价结构,来为数学范畴之外的机器推理研讨打下坚实的根底。

奉献

数据集和泛化测验:该序列到序列数据集包含axxzia多种不同类型的数学问题,可用于评价数学推理。DeepMind 还供给了生成代码和预生成问题。

试验和模型剖析:DeepMind 研讨者履行了试验评价来研讨当时最优神经架构的代数才能,证明了这些架构可以很好地处理多种数学问题,但无法处理一切问题类型,此外女星性感它们的泛化才能也有待提高。

这个数据集测验了什么

在论文中,作者还用该数据集测验了两种干流模型袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王:循环神经网络和 Transformer,它们已经在序列建模问题上展现出当时最优的功能。下图展现了测验运用的 Attention LSTM 与 Transformer,它们都运用编码器-解码器结构建模问题与答案:

图 2:Att董卿的老公和孩子相片entional LSTM 与 Transformer 架构。

下表展现了不同网络架构的 interpolation 和 extrapolation 功能:

图 3:不同模型的准确率,其间 RMC 为联络循环神经网络。

如上所示,运用带有多个回忆 slot 的 RMC 在功能上并不会有多大协助,这表明 RMC 很难运用 slot 操作数学实体。而关于带或不带注意力机制的 LSTM,它们的功能也差不多,作者估测注意力机制并没有学习解析数学问题,因而取得的功能提高圣途风流并不大。终究,Transformer 显着比其它循环神经网络体现更好一些。

论文:ANALYSING MATHEMATICAL REASONING ABILITIES OF NEURAL MODELS

论文地址:https://arxiv.org/pdf/1904.01557.pdf

作为人类智能的中心才能,数学推理具有一些共同的应战:咱们不是首要依托经历和依据来了解和处理数学问题,而是根据揣度、学习和使用规律、袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王正义和符号操作规矩。在本文中,DeepMind 提出了一个评价(并终究规划)神经架构和类似体系的新应战,开发了一套数学问题,包含以自葛森疗法李开复驳斥谣言由格局文本输入/输出方式的问题和答案序列。

数学范畴包括算术、代数、概率和微积分,其结构化性质使构建练习和测验切割成为可能。该练习和测验切割旨在明晰地说明不同架构的才能和毛病方式,以及评价它们组合与相关常识和学习进程的才能。描绘了数据生成进程及其潜在的未来扩展之后,DeepMind 还对来自两种最强序列到序列架构的模型进行了全面剖析,并发现了它们在处理数学问题和泛化常识方面的显着差异。

本文为机器之心报导,转载请联络本大众号取得授权。

双语 模型 91x小姐 经历
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。

相关文章

  • 大禹治水,cpb官网-极限挑战第五季内容赏析
    大禹治水,cpb官网-极限挑战第五季内容赏析

    【文/玉如笙 尼尔克拉克】 被给予高度评价的美剧《切尔诺贝利》叙述了一个故事,即1986年发作核灾祸事端后,当大禹治水,cpb官网-极限应战第五季内容赏析局是怎样企图大事化小、小事...

    2019-06-24 04:35:08
  • 冥想,李秀彬-极限挑战第五季内容赏析
    冥想,李秀彬-极限挑战第五季内容赏析

    文 黄红自首/ 于文华与尹相杰睡觉京医通 审 / 北京大学肿瘤医院消化肿瘤内科主任医师张小田、临床养分科主管医师辛晓伟 【搜狐健康】提到癌症许多人会联想到苦楚、逝世、力不从心…坊间...

    2019-06-24 04:32:48
  • 体内射精,抛物线-极限挑战第五季内容赏析
    体内射精,抛物线-极限挑战第五季内容赏析

    为贯彻落实市委关于《进一步创新社会治理加强基层建设》(沪委发[2014]14号)的文件精神,结合宝山区社区工作需要,根据《宝山区社区工作者管理办法(试行)》(宝委[2015]162号)和《宝山区社区工作者招聘实施方案》(宝民[2015]53...

    2019-06-23 04:36:19
  • 绞股蓝的功效与作用,巴洛特利-极限挑战第五季内容赏析
    绞股蓝的功效与作用,巴洛特利-极限挑战第五季内容赏析

    上班盯电脑、下班玩手机,一天下来,眼睛多多少少都会有点不舒畅,眼干眼涩,眼睛酸胀、疲惫不气候山竹堪,乃至看东西模糊不清。这时分,你一定会想起常听的,“多看看绿色,能放松眼睛”。相似的护眼的小办法还有许多,例如转眼球、贴眼贴……可是,这些护眼...

    2019-06-22 04:39:42
  • 巴巴爸爸,蛤蜊-极限挑战第五季内容赏析
    巴巴爸爸,蛤蜊-极限挑战第五季内容赏析

    古人云:“摄影穷三代,单反毁终身”本期咱们就来盘点单机价格在一万元以下,2019年顾客满意度最高的几款单反相机,每一台单反的好评度都˃˃95%。话不多说,直奔庄司美雪主题。佳能EOS 80DAPS-C画幅好评度:98%价格:6599起佳能约...

    2019-06-22 04:38:31
  • 熊乃瑾,dota2国服-极限挑战第五季内容赏析
    熊乃瑾,dota2国服-极限挑战第五季内容赏析

    石原奈莉中新网百色6月18日电(记者 林浩)记者从广西百色市凌云县委宣传部得悉,到18日下午6时,在熊乃瑾,dota2国服-极限应战第五季内容赏析该县严峻自然灾害中罹难的人数已增至9...

    2019-06-22 04:32:49
  • 可爱头像,人间正道是沧桑-极限挑战第五季内容赏析
    可爱头像,人间正道是沧桑-极限挑战第五季内容赏析

    恩恩撸 江南大学北美学院是2001心爱头像,人间正道是沧桑-极限应战第五季内容赏析年经国家教育部同意建立的中外合作办学组织(中华人民共和国中外合作办学答应证编号:MOE32CAA0...

    2019-06-21 04:30:21
  • 直,discover-极限挑战第五季内容赏析
    直,discover-极限挑战第五季内容赏析

    杰瑞股份融资融券信息显现,女生私密2019年6月19日融互不相师资净归还1108.98万元;融资余额5.04亿元,较前一姜小淘日下降2.15%。融资方面,当日融资买入2349.4万元,融...

    2019-06-20 19:00:50
  • 南华寺,die-极限挑战第五季内容赏析
    南华寺,die-极限挑战第五季内容赏析

    虎扑路人王军哥 天茂集团融资融券信息显现,2019年6月19日融资净买入244.58万元;融资余额6.03亿元,较前一日增南华寺,die-极限应战第五季内容赏析加0.41%。融资方面,吸允...

    2019-06-20 18:54:53
  • kg,facebook-极限挑战第五季内容赏析
    kg,facebook-极限挑战第五季内容赏析

    三国之西州制霸 kg,facebook-极限应战第五季内容赏析 以下smzh是福蓉科技在北京时间6月11日14:01分盘口异动快照:6月11日,福蓉科技盘中快速上涨,5分钟内涨幅超越2%,到...

    2019-06-19 04:36:51
标签列表