OpenAI 下一代模型遭遇重大瓶颈，前首席科学家透露新技术路线

爱范儿2024-11-15

OpenAI 的下一代大语言模型“Orion”可能遭遇了前所未有的瓶颈。据 The Information 报道，OpenAI 的内部员工称 Orion 模型的性能提升没有达到预期，与从 GPT-3 到 GPT-4 的升级相比，质量提升要“小得多”。此外，他们还表示 Orion 在处理某些任务时并不比其前身 GPT-4 更可靠。尽管 Orion 在语言技能上更强，但在编程方面可能无法超越 GPT-...

网页链接

免责声明：本文观点仅代表作者个人观点，不构成本平台的投资建议，本平台不对文章信息准确性、完整性和及时性做出任何保证，亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"isChannel":false,"data":{"share":"https://www.laohu8.com/m/news/2483288367?lang=zh_CN&edition=full","thumbnail":"","is_english":false,"pubTime":"2024-11-15 09:40","share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","id":"2483288367","market":"hk","top_or_hot":-1,"title":"OpenAI 下一代模型遭遇重大瓶颈，前首席科学家透露新技术路线","media":"爱范儿","content":"<div>\n<p>OpenAI 的下一代大语言模型“Orion”可能遭遇了前所未有的瓶颈。据 The Information 报道，OpenAI 的内部员工称 Orion 模型的性能提升没有达到预期，与从 GPT-3 到 GPT-4 的升级相比，质量提升要“小得多”。此外，他们还表示 Orion 在处理某些任务时并不比其前身 GPT-4 更可靠。尽管 Orion 在语言技能上更强，但在编程方面可能无法超越 GPT-...</p>\n\n<a href=\"https://tech.ifeng.com/c/8eWdgTia2si\">网页链接</a>\n\n</div>\n","source":"ifeng_tech","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>OpenAI 下一代模型遭遇重大瓶颈，前首席科学家透露新技术路线</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\nOpenAI 下一代模型遭遇重大瓶颈，前首席科学家透露新技术路线\n</h2>\n\n<h4 class=\"meta\">\n\n\n2024-11-15 09:40 北京时间&nbsp;&nbsp;&nbsp;<a href=https://tech.ifeng.com/c/8eWdgTia2si><strong>爱范儿</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>OpenAI 的下一代大语言模型“Orion”可能遭遇了前所未有的瓶颈。据 The Information 报道，OpenAI 的内部员工称 Orion 模型的性能提升没有达到预期，与从 GPT-3 到 GPT-4 的升级相比，质量提升要“小得多”。此外，他们还表示 Orion 在处理某些任务时并不比其前身 GPT-4 更可靠。尽管 Orion 在语言技能上更强，但在编程方面可能无法超越 GPT-...</p>\n\n<a href=\"https://tech.ifeng.com/c/8eWdgTia2si\">网页链接</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU1543694498.USD","symbol_name":"法巴水资源基金RH MD Dis","start_time":0,"source_url":"https://tech.ifeng.com/c/8eWdgTia2si","article_id":"2483288367","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2483288367","pubTimestamp":1731634804,"columns":[],"sourceInfo":{"source_id":"ifeng_tech","name":"凤凰网财经"},"weMediaInfo":null,"summary":"OpenAI 的下一代大语言模型“Orion”可能遭遇了前所未有的瓶颈。据 The Information 报道，OpenAI 的内部员工称 Orion 模型的性能提升没有达到预期，与从 GPT-3 到 GPT-4 的升级相比，质量提升要“小得多”。这意味着开发和运行 Orion 以及后续大语言模型的成本和代价将变得更加昂贵。OpenAI 的研究人员也大都同意这种看法。例如，OpenAI 所开发的“o1”模型就使用了这种推理模式。Orion 预计将在 2025 年推出。OpenAI 将其命名为“Orion”而非“GPT-5”，这也许暗示着一场新的革命。","collect":0,"end_time":0,"defaultTopTitle":"ifeng.com","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU1543694498.USD":"法巴水资源基金RH MD Dis","BK4152":"农用农业机械","LU1165135440.EUR":"BNP Paribas Aqua Classic Cap EUR","TTC":"托罗配件"},"translate_title":"OpenAI's next-generation model encounters major bottlenecks, former chief scientist reveals new technology route","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"TTC":1},"content_text":"OpenAI 的下一代大语言模型“Orion”可能遭遇了前所未有的瓶颈。据 The Information 报道，OpenAI 的内部员工称 Orion 模型的性能提升没有达到预期，与从 GPT-3 到 GPT-4 的升级相比，质量提升要“小得多”。此外，他们还表示 Orion 在处理某些任务时并不比其前身 GPT-4 更可靠。尽管 Orion 在语言技能上更强，但在编程方面可能无法超越 GPT-4。▲图源：WeeTech报道指出，训练高质量文本和其他数据的供应正在减少，这使得找到好的训练数据变得更加困难，从而减缓了大语言模型（LLMs）在某些方面的发展。不仅如此，未来的训练将更加耗费计算资源、财力甚至电力。这意味着开发和运行 Orion 以及后续大语言模型的成本和代价将变得更加昂贵。OpenAI 的研究员诺姆·布朗（Noam Brown）最近在 TED AI 大会上就表示，更先进的模型可能“在经济上不可行”：我们真的要花费数千亿美元或数万亿美元训练模型吗？ 在某个时候，扩展定律会崩溃。对此，OpenAI 已经成立了一个由负责预训练的尼克·雷德（Nick Ryder）领导的基础团队，来研究如何应对训练数据的匮乏，以及大模型的扩展定律（scaling laws）将持续到什么时候。▲Noam Brown扩展定律（scaling laws）是人工智能领域的一个核心假设：只要有更多数据可供学习，并有更多的计算能力来促进训练过程，大语言模型就能继续以相同的速度提升性能。简单来说，scaling laws 描述了投入（数据量、计算能力、模型大小）和产出之间的关系，即我们对大语言模型投入更多资源时，其性能提升的程度。举例来讲，训练大语言模型就像在车间生产汽车。最初车间规模很小，只有几台机器和几个工人。这时，每增加一台机器或一个工人，都能显著提高产量，因为这些新增资源直接转化为生产能力的提升。随着工厂规模的扩大，每增加一台机器或工人带来的产量提升开始减少。可能是因为管理变得更加复杂，或者工人之间的协调变得更加困难。当工厂达到一定规模后，再增加机器和工人可能对产量的提升非常有限。这时，工厂可能已经接近土地、电力供应和物流等的极限，增加的投入不再能带来成比例的产出增加。而 Orion 的困境就在于此。随着模型规模的增加（类似增加机器和工人），在初期和中期，模型的性能提升可能非常明显。但到了后期，即使继续增加模型大小或训练数据量，性能的提升也可能越来越小，这就是所谓的“撞墙”。一篇近期发表在 arXiv 上的论文也表示，随着对公共人类文本数据需求的增长和现有数据量的有限性，预计到 2026 年至 2032 年之间，大语言模型的发展将耗尽现有的公共人类文本数据资源。▲图源：arXiv即使诺姆·布朗指出了未来模型训练的“经济问题”，但他还是对以上观点表示反对。他认为“人工智能的发展不会很快放缓”。OpenAI 的研究人员也大都同意这种看法。他们认为，尽管模型的扩展定律可能放缓，但依靠优化推理时间和训练后改进，AI 的整体发展不会受到影响。此外，Meta 的马克·扎克伯格、OpenAI 的山姆·奥特曼和其他 AI 开发商的首席执行官也公开表示，他们尚未达到传统扩展定律的极限，并且仍在开发昂贵的数据中心以提升预训练模型的性能。▲Sam Altman（图源：Vanity Fair）OpenAI 的产品副总裁彼得·韦林德（Peter Welinder）也在社媒上表示“人们低估了测试时计算的强大功能”。测试时计算（TTC）是机器学习中的一个概念，它指的是在模型部署后，对新的输入数据进行推理或预测时所进行的计算。这与模型训练阶段的计算是分开的，训练阶段是指模型学习数据模式和做出预测的阶段。在传统的机器学习模型中，一旦模型被训练好并部署，它通常不需要额外的计算来对新的数据实例做出预测。然而在某些更复杂的模型中，如某些类型的深度学习模型，可能需要在测试时（即推理时）进行额外的计算。例如，OpenAI 所开发的“o1”模型就使用了这种推理模式。实际上，整个 AI 产业界正将重心转向在初始训练后再对模型进行提升的模式。▲Peter Welinder（图源：Dagens industri）对此，OpenAI 的联合创始人之一伊利亚·苏茨克弗（Ilya Sutskever）最近在接受路透社采访时承认，通过使用大量未标记数据来训练人工智能模型，以使其理解语言模式和结构的预训练阶段，其效果提升已趋于平稳。伊利亚表示“2010 年代是扩展的时代，现在我们再次回到了探索和发现的时代”，并且指出“扩大正确的规模比以往任何时候都更加重要”。Orion 预计将在 2025 年推出。OpenAI 将其命名为“Orion”而非“GPT-5”，这也许暗示着一场新的革命。虽然暂时受理论限制而“难产”，我们仍然期待着这个拥有新名字的“新生儿”能给 AI 大模型带来新的转机。","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":1,"need_auth":false,"code":"91000000","status":"200"},"commentList":[],"isCommentEnd":true,"newsSizeData":{"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"likeStatus":false,"favoriteStatus":false},"APP":{"userAgent":"Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)","isDev":false,"isTTM":false,"tenantId":"TBCN","deviceId":"web-server-community-laohu8-v3","version":"4.36.0","shortVersion":"4.36.0","platform":"web","vendor":"web","appName":"laohu8","isIOS":false,"isAndroid":false,"isTiger":false,"isTHS":false,"isWeiXin":false,"isWeiXinMini":false,"isWeiBo":false,"isQQ":false,"isBaiduSwan":false,"isBaiduBox":false,"isDingTalk":false,"isToutiao":false,"isOnePlus":false,"isHuaWei":false,"isXiaomi":false,"isXiaomiWebView":false,"isOppo":false,"isVivo":false,"isSamsung":false,"isMobile":false},"href":"/m/news/2483288367","isCrawlerRequest":true}