首页
AI在阅读理解上首次击败人类
返回

AI在阅读理解上首次击败人类

2022-12-19 科技信息 By:佚名
最佳答案数十年来,研究人员一直追求对计算机系统进行语言理解培训。现在,科技巨头阿里巴巴和微软声称已朝着这一崇高目标迈出了第一步。两种系统均使用斯坦福大学的问答数据集进行了测试,该数据集基于500篇维基百科文章,共收集了100,000个问题,这已成为不同AI研究小组争夺第一个超越标准人类性能的战场...

数十年来,研究人员一直追求对计算机系统进行语言理解培训。现在,科技巨头阿里巴巴和微软声称已朝着这一崇高目标迈出了第一步。两种系统均使用斯坦福大学的问答数据集进行了测试,该数据集基于500篇维基百科文章,共收集了100,000个问题,这已成为不同AI研究小组争夺第一个超越标准人类性能的战场。

向系统提供了有关各种主题的文章中的多个段落,然后根据可用信息提示他们回答许多问题。

目前的人类得分为82.3,而由阿里巴巴和微软构建的系统分别获得82.44和82.65分,以其头发的广度击败了他们的生物竞争对手。

“我们很荣幸能见证机器在阅读理解方面超越人类的里程碑。这意味着诸如“下雨的原因”这样的客观问题现在可以通过机器高精度地回答。”阿里巴巴自然语言处理首席科学家罗斯说。

一些新闻媒体已经掌握了新闻,声称人工智能现在可以比人类更好地阅读,甚至可以以前所未有的方式减少对人类输入的需求。

但是,正如许多其他评论员以及公司本身所指出的那样,这不是“真正的”理解。换句话说,这些算法不知道它们在“读”什么。

明显的理解源于系统识别文章中包含的模式和匹配术语的能力。

此外,系统仅被提供了来自维基百科的干净格式的材料,该材料被保证包含答案。用胡言乱语“污染”文本,或要求系统从几个句子中推断出含义,这会破坏流程,这意味着真正的理解仍然离我们很远。

不过,在此之前,研究人员希望尽快在博物馆,客户服务机构中实施类似设计的系统,这是一种旨在为医疗查询提供答案的在线系统。

此外,世界各地的研究团队目前正在训练AI系统,以解决SAT风格的数学问题和基础科学问题。

猜你喜欢
岱组词组(岱组词)

岱组词组(岱组词)

12-18 0 阅读
尿盆尿垢太厚怎么去除可以用84吗(尿盆尿垢太厚怎么去除)

尿盆尿垢太厚怎么去除可以用84吗(尿盆尿垢太厚怎么去除)

12-18 0 阅读
32开尺寸多大(32开的尺寸是多少厘米)

32开尺寸多大(32开的尺寸是多少厘米)

12-18 0 阅读
如何彻底粉碎微信聊天记录(如何彻底删除微信聊天记录)

如何彻底粉碎微信聊天记录(如何彻底删除微信聊天记录)

12-18 0 阅读
诺基亚800缺点(诺基亚800怎么样)

诺基亚800缺点(诺基亚800怎么样)

12-18 0 阅读
史艺(关于史艺的介绍)

史艺(关于史艺的介绍)

12-18 0 阅读
热门推荐
大望过喜是什么成语(大喜过望类似的成语有哪些)

大望过喜是什么成语(大喜过望类似的成语有哪些)

12-18 0 阅读
待机最长的智能手机(哪款智能手机待机长)

待机最长的智能手机(哪款智能手机待机长)

12-18 0 阅读
酒驾喝一瓶啤酒能测出来吗(喝一瓶啤酒能测出来吗)

酒驾喝一瓶啤酒能测出来吗(喝一瓶啤酒能测出来吗)

12-18 0 阅读
K271次(k271(k271时刻表))

K271次(k271(k271时刻表))

12-18 0 阅读
点点外卖平台(淘宝点点外卖)

点点外卖平台(淘宝点点外卖)

12-18 0 阅读
子网掩码怎么算(子网掩码255 255 255 0)

子网掩码怎么算(子网掩码255 255 255 0)

12-18 0 阅读
超极本玩游戏怎么样(超级本玩游戏效果好吗)

超极本玩游戏怎么样(超级本玩游戏效果好吗)

12-18 0 阅读
见闻色(见闻)

见闻色(见闻)

12-18 0 阅读
明基EX2510游戏显示器评测

明基EX2510游戏显示器评测

12-18 0 阅读
长城哈弗m3(我想知道长城M3到底是哪款车形请告知并附照片谢谢及及问)

长城哈弗m3(我想知道长城M3到底是哪款车形请告知并附照片谢谢及及问)

12-19 0 阅读