热归热，Groq离取代英伟达GPU有多远？

澎湃新闻05-03

来源：节选自 2024 年 Week08 业内通讯2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。2024 年 2 月，初创公司 Groq 展示了其 LPU 处理器对大语言模型任务提供的超高速推理的支持。彼时，Groq的 LPU 已能够实现...

网页链接

免责声明：本文观点仅代表作者个人观点，不构成本平台的投资建议，本平台不对文章信息准确性、完整性和及时性做出任何保证，亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"isChannel":false,"data":{"share":"https://www.laohu8.com/m/news/2432961484?lang=zh_CN&edition=full","thumbnail":"","is_english":false,"pubTime":"2024-05-03 07:05","share_image_url":"https://static.laohu8.com/9a95c1376e76363c1401fee7d3717173","id":"2432961484","market":"us","top_or_hot":-1,"title":"热归热，Groq离取代英伟达GPU有多远？","media":"澎湃新闻","content":"<div>\n<p>来源：节选自 2024 年 Week08 业内通讯2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。2024 年 2 月，初创公司 Groq 展示了其 LPU 处理器对大语言模型任务提供的超高速推理的支持。彼时，Groq的 LPU 已能够实现...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN2024050307060087cc8400&s=b\">网页链接</a>\n\n</div>\n","source":"tencent","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>热归热，Groq离取代英伟达GPU有多远？</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n热归热，Groq离取代英伟达GPU有多远？\n</h2>\n\n<h4 class=\"meta\">\n\n\n2024-05-03 07:05 北京时间&nbsp;&nbsp;&nbsp;<a href=http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN2024050307060087cc8400&s=b><strong>澎湃新闻</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>来源：节选自 2024 年 Week08 业内通讯2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。2024 年 2 月，初创公司 Groq 展示了其 LPU 处理器对大语言模型任务提供的超高速推理的支持。彼时，Groq的 LPU 已能够实现...</p>\n\n<a href=\"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN2024050307060087cc8400&s=b\">网页链接</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU0170899867.USD","symbol_name":"EASTSPRING INVESTMENTS WORLD VALUE EQUITY  \"A\" (USD) ACC","start_time":0,"source_url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN2024050307060087cc8400&s=b","article_id":"2432961484","we_media_id":null,"thumbnails":[],"rights":{"source":"tencent","url":"http://gu.qq.com/resources/shy/news/detail-v2/index.html#/?id=nesSN2024050307060087cc8400&s=b","rn_cache_url":null,"customStyle":"body{padding-top:10px;}#news_title{font-weight:bold;#titleStyle#;}#news_description span{font-size:12px;#descriptionStyle#;}.footer-note{#statement#}","selectors":".mod-LoadTzbdNews, body","filters":".relate-stock, .hot-list, .recom-box, .wx-sou","directOrigin":true},"url":"https://stock-news.laohu8.com/highlight/detail?id=2432961484","pubTimestamp":1714691100,"sourceInfo":{"source_id":"tencent","name":"腾讯"},"weMediaInfo":null,"summary":"彼时，Groq的 LPU 已能够实现每秒能输出 500 个 token，比英伟达的GPU快10倍，而成本仅为 GPU 的 10%。据悉，Groq 模型目前可在 Mixtral 8x7B SMoE 和 Llama2 7B 上运行，每100 万 token 价格为 0.27 美元。Groq 真的有望取代英伟达 GPU 吗？在Groq首次发布演示Demo后，诸多大佬和从业人员就LPU能否取代GPU的话题分享了自己的看法和分析结果。而 Groq LPU 的爆火则将市场风向将 AI 芯片的主战场由训练走向推理......《热归热，Groq离取代英伟达GPU有多远？》阅读原文","collect":0,"end_time":0,"defaultTopTitle":"qq.com","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU0170899867.USD":"EASTSPRING INVESTMENTS WORLD VALUE EQUITY  \"A\" (USD) ACC","LU0238689110.USD":"贝莱德环球动力股票基金","LU0234570918.USD":"高盛全球核心股票组合Acc Close","LU0417517546.SGD":"Allianz US Equity Cl AT Acc SGD","LU0053666078.USD":"摩根大通基金-美国股票A（离岸）美元","LU0072462426.USD":"贝莱德全球配置 A2","BK4532":"文艺复兴科技持仓","LU0082616367.USD":"摩根大通美国科技A（dist）","BK4592":"伊斯兰概念","LU0056508442.USD":"贝莱德世界科技基金A2","LU0080751232.USD":"富达环球多元动力基金A","IE00BJJMRY28.SGD":"Janus Henderson Balanced A Inc SGD","BK4585":"ETF&股票定投概念","IE00BMPRXR70.SGD":"Neuberger Berman 5G Connectivity A Acc SGD-H","LU0308772762.SGD":"Blackrock Global Allocation A2 SGD-H","IE00BMPRXN33.USD":"NEUBERGER BERMAN 5G CONNECTIVITY \"A\" (USD) ACC","LU0234572021.USD":"高盛美国核心股票组合Acc","LU0109392836.USD":"富兰克林科技股A","BK4587":"ChatGPT概念","LU0353189763.USD":"ALLSPRING  US ALL CAP GROWTH FUND \"I\" (USD) ACC","BK4527":"明星科技股","BK4543":"AI","BK4579":"人工智能","LU0061474705.USD":"THREADNEEDLE (LUX) GLOBAL DYNAMIC REAL RETURN \"AU\" (USD) ACC","LU0097036916.USD":"贝莱德美国增长A2 USD","NVDA":"英伟达","BK4588":"碎股","LU0466842654.USD":"HSBC ISLAMIC GLOBAL EQUITY INDEX \"A\" (USD) ACC","IE00BWXC8680.SGD":"PINEBRIDGE US LARGE CAP RESEARCH ENHANCED \"A5\" (SGD) ACC","LU0320765059.SGD":"FTIF - Franklin US Opportunities A Acc SGD","BK4141":"半导体产品","BK4503":"景林资产持仓","IE00B3M56506.USD":"NEUBERGER BERMAN EMERGING MARKETS EQUITY \"A\" (USD) ACC","LU0198837287.USD":"UBS (LUX) EQUITY SICAV - USA GROWTH \"P\" (USD) ACC","IE00BD6J9T35.USD":"NEUBERGER BERMAN NEXT GENERATION MOBILITY \"A\" (USD) ACC","LU0276348264.USD":"THREADNEEDLE (LUX) GLOBAL DYNAMIC REAL RETURN\"AUP\" (USD) INC","BK4551":"寇图资本持仓","LU0316494557.USD":"FRANKLIN GLOBAL FUNDAMENTAL STRATEGIES \"A\" ACC","LU0289961442.SGD":"SUSTAINABLE GLOBAL THEMATIC PORTFOLIO \"AX\" (SGD) ACC","IE00BFSS8Q28.SGD":"Janus Henderson Balanced A Inc SGD-H","LU0444971666.USD":"天利全球科技基金","BK4581":"高盛持仓","LU0127658192.USD":"EASTSPRING INVESTMENTS GLOBAL TECHNOLOGY \"A\" (USD) ACC","LU0289739343.SGD":"SUSTAINABLE GLOBAL THEMATIC PORTFOLIO \"A\" (SGD) ACC","IE00B7KXQ091.USD":"Janus Henderson Balanced A Inc USD","BK4549":"软银资本持仓","LU0348723411.USD":"ALLIANZ GLOBAL HI-TECH GROWTH \"A\" (USD) INC","BK4548":"巴美列捷福持仓","IE00BFSS7M15.SGD":"Janus Henderson Balanced A Acc SGD-H","BK4529":"IDC概念"},"translate_title":"Heat return, how far is Groq from replacing Nvidia GPU?","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"NVDA":1},"content_text":"来源：节选自 2024 年 Week08 业内通讯2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。2024 年 2 月，初创公司 Groq 展示了其 LPU 处理器对大语言模型任务提供的超高速推理的支持。彼时，Groq的 LPU 已能够实现每秒能输出 500 个 token，比英伟达的GPU快10倍，而成本仅为 GPU 的 10%。4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800，引起社区热议。Groq 为何一夜爆火？根据 Groq 官方在 2 月发布的 Demo 演示，基于其自研的 LPU 上运行的开源模型 Mixtral 能够在 1 秒内回复包含数百个单词的事实性的、引用的答案（其中四分之三的时间用来搜索）。据悉，Groq 模型目前可在 Mixtral 8x7B SMoE 和 Llama2 7B 上运行，每100 万 token 价格为 0.27 美元。其在Mixtral 8x7B SMoE 可以达到 480 token / S，极限情况下，用 Llama2 7B 甚至能实现 750 token / S。图：Groq 网站示意有网友对比了 Groq、GPT-4 和 Genimi 在简单代码调试问题上的耗时，Groq 的速度比 Gemini 快 10 倍，比 GPT-4 快 18 倍。其中：Groq 耗时 0.96 秒，答案可用Gemini 耗时 10.47 秒，答案质量最高ChatGPT-4 耗时 17.66 秒，答案可用LPU是什么？参考 Groq 公开的资料， LPU（语言处理单元）是一种专为计算密集型应用设计的端到端处理单元系统，尤其适用于需要处理序列数据的应用程序，如大型语言模型（LLM）。LPU 采用了一种商用、可扩展的张量流处理器架构，它通过独特的设计实现了在单个芯片上并行处理大量张量操作的能力。与传统 GPU 所采用的 SIMD（单指令、多数据）模型不同，LPU 架构采用更精简的方法，减少了对复杂调度硬件的需求。这种设计优化了每个时钟周期的利用效率，确保了一致的延迟和吞吐量。LPU 在执行深度学习模型，如 Transformer 架构时，能够实现高效的数据流处理。此外，LPU 的能源效率表现优于 GPU，因为它减少了管理多线程的开销，并避免了核心利用率不足的问题，从而提供了更多的每瓦计算量。LPU 的架构还支持将多个 TSP（张量流处理器）连接在一起，避免了 GPU 集群中常见的瓶颈问题，展现出极高的可扩展性。随着更多 LPU 的添加，可以实现性能的线性扩展，简化了大规模 AI 模型的硬件要求，并使开发人员能够更容易地扩展其应用程序。Groq 真的有望取代英伟达 GPU 吗？在Groq首次发布演示Demo后，诸多大佬和从业人员就LPU能否取代GPU的话题分享了自己的看法和分析结果。原阿里副总裁、Lepton 创始人贾扬清对比了 Groq 硬件和英伟达 H100 在运行 LLaMA 70b 模型时的成本。他发现，在同等吞吐量下，Groq 的硬件成本和能耗成本分别高达 H100 的 40 倍和 10 倍。例如，为了运行 LLaMA 70b 模型，可能需要数百张 Groq 卡，而使用英伟达 H100 则成本大幅降低。华为的左鹏飞提出了不同的视角，他强调在讨论成本时应区分售卖价和成本价，并指出 Groq 卡的成本价可能远低于市场售价。他还提到，Groq 卡未使用高成本的 HBM，而是使用了成本较低的 SRAM，这可能影响成本效益分析。Smol AI 的创始人 Shawn Wang 从每 token 成本的角度出发，认为 Groq 在高批量处理的假设下，其成本与定价相匹配，并且可能比基于 H100 的成本更低，显示出 Groq 在成本效益上可能具有竞争力。表：SemiAnalysis 的 Groq 和 H100 的性价比对比Groq 卡的 per token 成本比之 H100 如何？各方大佬觉得Groq 有希望取代 GPU 吗？AI 芯片的市场风向要走向推理了吗？英伟达股价有被 Groq 影响吗？有分析认为，此前大模型的训练和推理工作大多基于 GPU 设计，采用 CUDA 软件技术栈。而 Groq LPU 的爆火则将市场风向将 AI 芯片的主战场由训练走向推理......原标题：《热归热，Groq离取代英伟达GPU有多远？》阅读原文","kind":null,"is_publish_news":null,"is_publish_highlight":null,"is_publish_live":null,"is_publish_wemedia":null,"editions":null,"symbols":[],"gpt_button":1},"commentList":[],"isCommentEnd":true,"newsSizeData":{"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"likeStatus":false,"favoriteStatus":false},"APP":{"userAgent":"Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)","isDev":false,"isTTM":false,"deviceId":"web-server-community-laohu8-v3","version":"4.22.4","shortVersion":"4.22.4","platform":"web","vendor":"web","appName":"laohu8","isIOS":false,"isAndroid":false,"isTiger":false,"isTHS":false,"isWeiXin":false,"isWeiXinMini":false,"isWeiBo":false,"isQQ":false,"isBaiduSwan":false,"isBaiduBox":false,"isDingTalk":false,"isToutiao":false,"isOnePlus":false,"isHuaWei":false,"isXiaomi":false,"isXiaomiWebView":false,"isOppo":false,"isVivo":false,"isSamsung":false,"isMobile":false},"href":"/m/news/2432961484"}