GPT-4得不到MIT学位，MIT研究团队回应「作弊」，但网友不买账-焦点滚动

发表于: 2023-06-28 07:07:18 来源：顶端新闻

编辑：蛋酱

避重就轻的解释，还是没能获得大家的认可。

几天前，一篇名为《Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models》的论文经历了一场舆论风波。

【资料图】

论文地址：https://arxiv.org/pdf/2306.08997.pdf

最初，研究团队从 MIT 的数学、电气工程和计算机科学 (EECS) 专业的课程问题、期中考试和期末考试中，整理出了一个包含 4550 个问题和解决方案的综合数据集，并让各种大语言模型去完成这个数据集的题目，得出了「GPT-4 几乎满分通过 MIT EECS 和数学本科考试」的结论。

这一结果很快被人指出不够严谨，还给出了多项证据和详尽的分析，表示数据集本身就有问题，用 GPT-4 自动打分的评价机制也很有问题：

「我们的批评主要是针对这项研究的方法和严谨性，而不是针对其内容。我们对大型语言模型实际解决麻省理工学院课程的能力没有任何意见，只是认为本文未能以科学严谨的方式证明这一点。」

面对扑面而来的质疑，研究团队在接下来的一周里却没有进行任何公开回应，没有承认，也没有道歉。

但在昨天，人们等到了来自几位教授（也是论文作者）署名的官方通报：

6 月 24 日，Armando Solar-Lezama（MIT EECS 教授和 CSAIL 首席运营官 / 副主任）、Tonio Buonassisi（MIT 机械工程教授）和 Yoon Kim（MIT EECS 和 CSAIL 助理教授）就该论文情况发表了公开声明。

声明内容如下：

6 月 15 日，Iddo Drori 在 arXiv 上发布了一篇与麻省理工学院几十门课程的考试和作业数据集相关的研究论文，他这样做没有得到其他合著者的同意，尽管已经被告知在发表前应该纠正的问题。我们中的一个人在周末旅行后，于 6 月 18 日星期天才知道这个帖子。

在处理这件事的过程中，我们发现，与 Drori 向我们和为该项目收集数据的学生所传达的信息相反，Drori 并没有得到所有导师的许可来收集构成论文主题的数据集的作业和考试题。其中一些涉及课程的导师，在论文出现在社交媒体上和 Drori 未经许可在网上发布数据样本时，才知道这个数据集的存在且其中包含了自己的课程材料。

这些都是正在通过机构渠道解决的严重问题，所以我们不愿意公开发表这样的声明，但我们觉得有必要解释为什么这篇论文不应该被发表而必须被撤回。我们已经要求 Drori 从 arXiv 撤回这篇论文，并且直接联系了 arXiv 解释了这个情况。

我们想强调的是，这篇论文中的所有学生作者都非常努力地工作，如果数据是在同意的情况下收集的，这本来是一篇非常有趣和宝贵的论文。已经发表的工作中出现的问题并不是学生的错。

而且，GPT-4 不能获得麻省理工学院的学位。

这样一份调查声明，真的足够了吗？回想一周前三位质疑者提交的分析，数据集被污染、手动检查的结果与论文所说的「几乎满分通过」相差甚远，这至少意味着论文内容应该被重新审查。

显然，并不是所有人都对调查结果满意，有人表示这是避重就轻的说法，只是关注他们不应该使用这些数据的事实，而不提捏造结果的错误。

「所以这三位麻省理工学院的教授认为，未经同意使用数据是论文的唯一问题。」

针对「这本来是一篇非常有趣和宝贵的论文」的说法，更多人点了反对：「让 GPT-4 给自己生成的答案打分，这就是有趣和宝贵吗？」

另外，有人发现 Iddo Drori 的个人主页已经更新，删掉了「MIT 客座教授」的 title。而且根据领英主页的信息，他将在这个月结束自己的 MIT 访问之旅。

「一些教授决定让一位客座讲师成为替罪羊，并试图将每个人的注意力从方法论转移到数据隐私问题上，却没有批评这篇论文。这是多么典型的学术政治问题。」

正如三位质疑者在博客中所写的那样：「这篇论文道出了最近人工智能领域研究的一个更大趋势。随着该领域的进展越来越快，新发现的时间节奏似乎在缩短，这往往伴随着捷径。一个特别令人担忧的趋势是使用像 GPT-4 这样基于语言的模型来评估一个模型的准确性的技术。」

对于此事，你怎么看？

©THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

标签：

GPT-4得不到MIT学位，MIT研究团队回应「作弊」，但网友不买账-焦点滚动

GPT-4得不到MIT学位，MIT研究团队回应「作弊」，但网友不买账-焦点滚动

全球资讯：节后几点感受

TD早报 | 乐山大佛被卖17亿？景区回应；新疆旅游旺季景区涨价？官方辟谣_环球今头条

当前焦点!电从海上来！全球首台16兆瓦风机即将完成安装

当前报道:2023年广西初中级经济师考试报名入口开通时间

水云归炸900，朱砂234铃铛纪录-最资讯

环球视讯！高温下，他们坚守岗位

最新！一汽车巨头计划裁员，削减成本215亿！ 世界新消息

解码耳放迷你台机的尽头应该是它吧，水桶的最后一块齐了！

每日时讯!长久物流: 长久物流：为子公司申请年度银行授信提供担保的进展公告

全国首艘海陆一体化智能FPSO在南通交付

今日看点：财报前瞻 | 存储芯片市场前景改善 美光科技(MU.US)Q3财报将带来惊喜?

深市两单房企再融资获批！"第三支箭"陆续落地，交易所推进优质房企疏通融资 环球播报

每日热文：胎盘怎么吃最有营养（胎盘怎么吃）

全球快播：千元机性能暴涨，吃上了4nm的高通骁龙4 Gen 2跑步入场 最新

灌区渠道内提前蓄水保障农田用水 保证粮食安全

高质量建设科创金融改革试验区新棋局铺展 20项实施举措落子 各路先锋机构集结 快消息

两大交易所铝库存双双回落 伦铝库存降至逾两个月新低 环球短讯

【世界播资讯】百变大侦探狂舞凶手是谁-狂舞真相解析

净利润增速下降，公司实控人拿走超90亿分红，还要减持套现？

【直播预告】书记、县长挂帅督战 山区教育“超速”发展 | 融媒体局长访谈

讯飞星火大模型V1.5迎来三大升级 星火APP正式发布 环球微头条

新时达跌6.06% 机构净买入6865万元

英利汽车：公司投资者联系电话：0431-85022771，联系邮箱：IR@engley.net|天天新消息

华为即将揭晓 鸿蒙OS 4.0预计将于8月发布

中国（广东）-新加坡经贸合作交流会在新加坡举行

【全球报资讯】打针就能瘦？让马斯克减肥27斤的“神药”，被指有致癌风险

B 站将用播放分钟数替代次数 / 足控狂喜模拟器登陆 Steam|天天聚看点

inner flow三亚新展「遐想蔓延热带岛屿」开幕 探索文旅产业新模式

连续27个月保持两位数增速，广东工业投资有多“燃”？_当前关注

武当山开展数字化复原、保护与利用工程 武当文物活了

全社会用电量217.9亿千瓦时

焦点观察：老舍的我这一辈子适合孩子读吗（老舍的 我这一辈子 的简介）

【新要闻】湖南、广东或将互助供电，湘粤联网工程正在论证中

柯文哲火力全开，质问蔡英文为何不废掉ECFA，侯友宜大谈两岸一家

平面模特李诗_平面模特网 环球今日报

亼是什么意思中文_亼是什么意思

欧盟就实施巴塞尔协议Ⅲ改革达成临时协议

天天视点！贵州：技能比武展风采

OpenAI薪资待遇曝光：工程师年薪约92.5万美元

【世界聚看点】完成拼图12

今日报丨支持中小企业走专精特新之路，利好政策有哪些

ar测距仪怎么用_测距仪怎么用

环球即时：常州市政府召开做强新能源汽车关键零部件产业推进会

“暑期经济”提前升温 各地促消费“活力全开”|即时

夏季出行，这篇交通安全提示请收下！

荣昌三项目上榜数字经济产业发展试点示范项目名单

浙江温州：崛起世界级鞋业产业集群 当前热讯

《蓝色协议》毕业装备有哪些？全职业毕业装备推荐_今日播报

2连板华脉科技：与深兰科技签署附条件生效的认购合同 公司内外部环境、主营业务未发生重大变化

超前服务 “电”助新疆乳业加速跑-全球观焦点

【当前独家】极限挑战几点更新第七季 极限挑战几点更新

富士康抢人，招工奖金最高3500元！中介“7月有多少人要多少人” 当前视讯

当前资讯!卢卡申科谈“瓦格纳叛乱”：如俄崩溃，白俄罗斯将处于“废墟”之下

今日头条是哪个公司的

天天热消息：烟台力凯数控科技有限公司董事长吕春哲——以多元发展应对市场之变

【世界热闻】北京城建收到京城佳业物业2022年度分红 金额约1067.8万元

有什么很可爱的歌_有什么可爱歌曲么-天天时快讯

光遇周年庆活动蜡烛获取攻略

全球热讯:“港车北上”来了！深圳经营性停车场系统升级，将可自动识别港澳车牌

全球资讯：吴京、斯坦森《巨齿鲨2》8月上映！科幻+动作+冒险，你期待吗？

观察：珠江啤酒副总经理高艺林辞职 2022年薪酬为100.9万

最新：多地开展禁毒宣传活动 提高大众识毒、防毒、拒毒能力

郴州职院举办企业家进校园系列活动

最终幻想16二周目新增内容是什么

焦点热文：奇迹，男篮压制欧洲冠军西班牙！领先10分后韩登败笔换人葬送优势

九洲集团：拟向九洲能源增资不超过4亿元

呈贡区高校灭火救援实战演练在云南师范大学举行

全球资讯：西媒：联合国称世界毒品消费达到创纪录水平

老将出马！高颂替补出战20分钟 11投7中高效砍下15分6板1助1断-当前快讯

四川乐山大佛景区管委会官方回应称：大佛被卖传言不实-环球快看

环球精选！大兴区亦庄镇：免费体检暖人心 拥军优属在行动

暖新闻丨乘客长沙公交车上昏倒 司机紧急救助

每日聚焦：四川泸州长江六桥顺利合龙 预计年底通车运行

【天天播资讯】台式电脑亮度调整（台式电脑屏幕亮度调暗）

全球今热点：知名基金经理出手了！这一数据曝光

关注：新兴装备: 独立董事关于第五届董事会第二次会议相关事项的事前认可意见

沈阳百亿级片区王家湾板块开发项目启动 将打造成国际之城

东软集团成立数智健康信息科技公司，注册资本1亿元

最新！一汽车巨头计划裁员，削减成本215亿！世界新消息

今日看点：财报前瞻 | 存储芯片市场前景改善美光科技(MU.US)Q3财报将带来惊喜?

深市两单房企再融资获批！"第三支箭"陆续落地，交易所推进优质房企疏通融资环球播报

全球快播：千元机性能暴涨，吃上了4nm的高通骁龙4 Gen 2跑步入场最新

灌区渠道内提前蓄水保障农田用水保证粮食安全

高质量建设科创金融改革试验区新棋局铺展 20项实施举措落子各路先锋机构集结快消息

两大交易所铝库存双双回落伦铝库存降至逾两个月新低环球短讯

【直播预告】书记、县长挂帅督战山区教育“超速”发展 | 融媒体局长访谈

讯飞星火大模型V1.5迎来三大升级星火APP正式发布环球微头条

华为即将揭晓鸿蒙OS 4.0预计将于8月发布

inner flow三亚新展「遐想蔓延热带岛屿」开幕探索文旅产业新模式

武当山开展数字化复原、保护与利用工程武当文物活了

焦点观察：老舍的我这一辈子适合孩子读吗（老舍的我这一辈子的简介）

平面模特李诗_平面模特网环球今日报

“暑期经济”提前升温各地促消费“活力全开”|即时

浙江温州：崛起世界级鞋业产业集群当前热讯

2连板华脉科技：与深兰科技签署附条件生效的认购合同公司内外部环境、主营业务未发生重大变化

【当前独家】极限挑战几点更新第七季极限挑战几点更新

【世界热闻】北京城建收到京城佳业物业2022年度分红金额约1067.8万元

最新：多地开展禁毒宣传活动提高大众识毒、防毒、拒毒能力

环球精选！大兴区亦庄镇：免费体检暖人心拥军优属在行动

暖新闻丨乘客长沙公交车上昏倒司机紧急救助

每日聚焦：四川泸州长江六桥顺利合龙预计年底通车运行

沈阳百亿级片区王家湾板块开发项目启动将打造成国际之城

混迹在娱乐圈的日子小说混迹在娱乐圈的日子

卢卡申科：瓦格纳事件期间白俄罗斯反对派准备发动武装政变|环球微资讯

世界快看：男篮U19三场皆墨仍有亮点！三小将太出色未来或成国家队重要一员

【湖北应急网评大赛⑲】东湖评论：防风险清隐患筑牢安全生产“铜墙铁壁”_视讯

港城广场四期项目全面提速，顺利通过主体结构验收热头条

西门子风机质量问题“带崩”A股风电概念振江股份：对公司没有影响

今日最新！强预期再起黑色板块集体反弹

世界今亮点！地椒草种子价格地椒草

因举办重要活动中国人民抗日战争纪念馆将临时闭馆

国服无畏契约怎么加好友天天热文

全球观热点：招商南油：您提到的协议签署双方分别是中国长江航运集团有限公司和国银金融租赁股份有限公司

高考生喊话马化腾新版QQ空间难用后腾讯火速调整：改好了！-看点

欧盟理事会通过关于与新西兰签署自由贸易协定的决议天天信息

网传四川出现非洲猪瘟？官方最新回应世界报道

未来3天天气预报天天消息

赛恩斯：公司暂时没有盐湖提锂相关技术应用环球今热点

床垫什么样的好对人体有益_床垫什么样的好实时

虽然两场比赛皆负但是U19男篮却表现出了顽强的拼搏精神天天快资讯

福星股份、中交地产再融资项目注册生效深市上市房企再融资正式落地

AI赋能文明发展文明铸魂技术创新-天天百事通

全球观察：新鲜芦笋保存方法_新鲜芦笋怎样长期储存新鲜芦笋如何长期储存

每日快讯!浙商银行A股配股发行成功中小银行掀起配股募资热潮

永福股份(300712.SZ)：预中标2893万元特高压项目天天快播

《南京市孤独症儿童教育指导手册》发布世界独家