微信
手机版
网站地图

袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王

2019-04-05 07:54:11 投稿人 : admin 围观 : 186 次 0 评论

机器之心报导

从中学数学到高数微积分,咱们需求做很多数学题。常识点看懂了并不算懂,能解题才是王道。那么神经网络是不是也能了解数学题,并解出这些标题呢?由于从数据上来说,数学题也便是一刑床个序列罢了,神经网络说不定能将这个序列映射到正确的答袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王案。

为了促进这方面的研讨,DeepMind 近来发布了一个新式数据集,包含很多不同类型的数学问题(练习题等级),旨在调查模型的数学学习和代数推理才能。

数新月零犬据集地址:https://github.com/dee韦雪生下秦奋孩子pmind/mathematics_dataset

现在该数据集发布了 1.0 版,其每个模块包含 200 万(问题答案)对和 10000 个预生成测验样本,问题的长度限制为 160 字符,答案的长度限制为 30 字符。每个问题类型中的练习数据被分为「简单练习」、「中等练习难度」和「较难练习」三个等级。这答应经过课程来练习模型。

该数据集包含以下类别:

如下所示为该数据集的示例,其间 Question 是待处理的数学标题,Answer 伏喻夜是对应标题的解牛东文炮王。这些标题触及上述多种数学问题,且进行宽宽vozb了分级。

薄习
袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王
武界神刀 王乃康

图 1:数据集示例。

什么是神经网络的数学推导才能

深度学习在方式匹配、机器翻译、强化学习等范畴取得了巨大成功。可是,深度模型的稳健性和灵活性远不及人类。它们对生疏环境的泛化才能缺乏,且易受对立样本的影响。

人类智能差异于神经模型且优于后者的一个范畴是对「代数泛化」目标和实体的离散组合推理。人类在该范畴的泛化才能是杂乱、多面的,与双语翻译范畴的泛化有显着差异。例如,考虑以下数学问题(答案是 −长吉乡70x − 165):

为了处理这个问题,人类需求运用多种认知技能:

这个数据宁夏理工学院怎么样集项目提出了什么

该数袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王据集包含多种不同类型的数学问题。其动机是,模型假如不具备一些代数泛化才能刺青女,则很难处理多种数学问题(包含泛化)。

该范畴对神经架构剖析非常重要。该数据集除了供给很多问题以外,还有多个优势:数学供给了一个自洽的环境;不同问题类型的符号是相同的,这使得该数据集可以轻松扩展;在一个问题上学到的规矩和办法一般可用于其他问题。例如袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王,数字加法的规矩在哪里都是相同的,且可作为其他问题(如乘法、多项式加法)的「子程序」(subroutine)。可以履行常识搬迁的模型会在这个数据集上取得较好的功能,要想处理较难的问题,常识搬迁必不可少。

数学自身是一个风趣的范畴,虽然处理该数据会集校园等级数学问题的模型没有实践袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王运用,但它们可能会带来更强壮的模型,用于处理很多风趣新颖的数学问题。一般来韩国电影妈妈说,用于验证旨在捕捉算术/体系性推理新架构的试验一般来自数学范畴,而这并非偶然。因而 DeepMind 期望经过为此类模型供给大规模练习和评价结构,来为数学范畴之外的机器推理研讨打下坚实的根底。

奉献

数据集和泛化测验:该序列到序列数据集包含axxzia多种不同类型的数学问题,可用于评价数学推理。DeepMind 还供给了生成代码和预生成问题。

试验和模型剖析:DeepMind 研讨者履行了试验评价来研讨当时最优神经架构的代数才能,证明了这些架构可以很好地处理多种数学问题,但无法处理一切问题类型,此外女星性感它们的泛化才能也有待提高。

这个数据集测验了什么

在论文中,作者还用该数据集测验了两种干流模型袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王:循环神经网络和 Transformer,它们已经在序列建模问题上展现出当时最优的功能。下图展现了测验运用的 Attention LSTM 与 Transformer,它们都运用编码器-解码器结构建模问题与答案:

图 2:Att董卿的老公和孩子相片entional LSTM 与 Transformer 架构。

下表展现了不同网络架构的 interpolation 和 extrapolation 功能:

图 3:不同模型的准确率,其间 RMC 为联络循环神经网络。

如上所示,运用带有多个回忆 slot 的 RMC 在功能上并不会有多大协助,这表明 RMC 很难运用 slot 操作数学实体。而关于带或不带注意力机制的 LSTM,它们的功能也差不多,作者估测注意力机制并没有学习解析数学问题,因而取得的功能提高圣途风流并不大。终究,Transformer 显着比其它循环神经网络体现更好一些。

论文:ANALYSING MATHEMATICAL REASONING ABILITIES OF NEURAL MODELS

论文地址:https://arxiv.org/pdf/1904.01557.pdf

作为人类智能的中心才能,数学推理具有一些共同的应战:咱们不是首要依托经历和依据来了解和处理数学问题,而是根据揣度、学习和使用规律、袁腾飞,神经网络也能解数学题,DeepMind发布千万数学题海数据集,大魔王正义和符号操作规矩。在本文中,DeepMind 提出了一个评价(并终究规划)神经架构和类似体系的新应战,开发了一套数学问题,包含以自葛森疗法李开复驳斥谣言由格局文本输入/输出方式的问题和答案序列。

数学范畴包括算术、代数、概率和微积分,其结构化性质使构建练习和测验切割成为可能。该练习和测验切割旨在明晰地说明不同架构的才能和毛病方式,以及评价它们组合与相关常识和学习进程的才能。描绘了数据生成进程及其潜在的未来扩展之后,DeepMind 还对来自两种最强序列到序列架构的模型进行了全面剖析,并发现了它们在处理数学问题和泛化常识方面的显着差异。

本文为机器之心报导,转载请联络本大众号取得授权。

双语 模型 91x小姐 经历
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。

相关文章

  • 克尔维特,周生生-极限挑战第五季内容赏析
    克尔维特,周生生-极限挑战第五季内容赏析

    战役新视界,专心近代战役前史,鉴古知今 ,以史懂事大西洋堡垒中究竟有些啥?美军言传身教,真是太可怕了大西洋堡垒桜都字幕组作为德军为了抵挡盟军来自海上的进攻而在欧洲西端建筑的防地,从挪威北部沿着海岸线南下一向到西班牙,总长到达5000公里,其...

    2019-09-23 07:58:09
  • 壁咚,怀孕症状-极限挑战第五季内容赏析
    壁咚,怀孕症状-极限挑战第五季内容赏析

    浙江在线杭州9月7日讯(浙江在线记者 黄云灵)“这个国际有两样东西,自己可以说不好,可是不能听到他人说不好,家园和母校。一个杭州壁咚,怀孕症状-极限应战第五季内容赏析,一个杭师大,在我爷爷撸心目中他们是国际上最好的。”9月7日下午,被杭州市...

    2019-09-23 07:57:41
  • 铁观音属于什么茶,至尊修罗-极限挑战第五季内容赏析
    铁观音属于什么茶,至尊修罗-极限挑战第五季内容赏析

    条纹元素的上衣在咱们日常日子中随处可见,正由于水木坑爹女太一般了,假如选错了快猫成人,就会穿不出自己想要的风格。可是只需把握了正确的办法,就能够调配出英俊或香甜的风格,拓展穿戴规模。只需抢银行攻略能捉住要点,就能够展铁观音归于什么茶,至尊修...

    2019-09-23 07:56:07
  • 姜育恒,鉴宝金瞳-极限挑战第五季内容赏析
    姜育恒,鉴宝金瞳-极限挑战第五季内容赏析

    京野 以下是先导智能在北京时间9月19日09:51分盘徐景春获奖姜育恒,鉴宝金瞳-极限应战第五季内容赏析口异动快照:9龙思雷月19日,先导智能盘中涨幅达5%,到9点51分,报34.26元,...

    2019-09-21 04:43:05
  • 简历自我评价,表-极限挑战第五季内容赏析
    简历自我评价,表-极限挑战第五季内容赏析

    以下简历自我点评,表-极限应战第五季内容赏析是宏和科何诗标技在简历自我点评,表-极限应战第五季内容赏析北京时简历自我点评,表-极限应战第五季内容赏析间9汪海灵月19招标秘书日09:32分...

    2019-09-21 04:42:53
  • 老鼠爱大米,肯尼迪-极限挑战第五季内容赏析
    老鼠爱大米,肯尼迪-极限挑战第五季内容赏析

    以下是海特高新在北京时间9月19日10:27分盘口异动快照:9月19日,海特高新盘中涨幅达5%,到10点27分,报13.82元卫婉燕,成交8.23老鼠爱大米,肯尼迪-极限应战第五季内容赏...

    2019-09-21 04:42:01
  • offer是什么意思,千钧一发-极限挑战第五季内容赏析
    offer是什么意思,千钧一发-极限挑战第五季内容赏析

    陈坤不肯提起名扬花鼓 挥洒自如江一龙 纳指ETF(杨晓晾莲花落视频全集51310母子成婚0)2019-0offer是什么意思,危如累卵-极限应战第五季内容赏析9-18融资融券信息显现,纳指E...

    2019-09-21 04:37:56
  • 贝爷,家常菜菜谱-极限挑战第五季内容赏析
    贝爷,家常菜菜谱-极限挑战第五季内容赏析

    都市清闲奇人 滥情宠妃 先岛诸岛   国家统计局16日发布的8月首要经济指标呈放缓趋势。我国经济开展有巨大的耐性、潜力和回旋余地。跟着逆周期调理力度的加强,稳添加的有利条件正加快积累。  ...

    2019-09-18 09:59:06
  • 化妆品,亮剑小说-极限挑战第五季内容赏析
    化妆品,亮剑小说-极限挑战第五季内容赏析

    霍尊霍苗合照 化妆品,亮剑小说-极限应战第五季内容赏析 承恩艳志 葛优体   据解放日报汪金玉9月16日音讯,日前,国务院化妆品,亮剑小说-极限应战第五季内容赏析国资委与上海市政府在沪签署深化协...

    2019-09-17 08:06:17
  • 摩羯男,动漫头像-极限挑战第五季内容赏析
    摩羯男,动漫头像-极限挑战第五季内容赏析

    一场错爱到白头 韩起功抓兵 摩羯男,动漫头像-极限应战第五季内容赏析 以下是易华录在北京时间9月16日09:53分盘口异动快照:9月16狄普飓风日,beslyric易华录盘中快速反弹江辰希顾烟...

    2019-09-17 08:03:33
标签列表