这篇文章不错，转发给_老虎社区_美港股上老虎 - 老虎社区

这篇文章不错，转发给大家看看

老黄深夜炸场，AIGC进入iPhone时刻！Hugging Face接入最强超算，神秘显卡胜过A100

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":206912988385496,"tweetId":"206912988385496","gmtCreate":1691545226118,"gmtModify":1691545227287,"author":{"id":3572147457692901,"idStr":"3572147457692901","authorId":3572147457692901,"authorIdStr":"3572147457692901","name":"笑傲股海","avatar":"https://static.tigerbbs.com/54e90820f68ad6ee93cc4907e09819bd","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":3,"crmLevelSwitch":0,"currentWearingBadge":{"badgeId":"e50ce593bb40487ebfb542ca54f6a561-2","templateUuid":"e50ce593bb40487ebfb542ca54f6a561","name":"资深虎友","description":"加入老虎社区1000天","bigImgUrl":"https://static.tigerbbs.com/0063fb68ea29c9ae6858c58630e182d5","smallImgUrl":"https://static.tigerbbs.com/96c699a93be4214d4b49aea6a5a5d1a4","grayImgUrl":"https://static.tigerbbs.com/35b0e542a9ff77046ed69ef602bc105d","redirectLinkEnabled":0,"hasAllocated":1,"isWearing":1,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2023.09.23","individualDisplayEnabled":0},"individualDisplayBadges":[],"fanSize":2,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"html":"<html><head></head><body><p>这篇文章不错，转发给大家看看</p></body></html>","htmlText":"<html><head></head><body><p>这篇文章不错，转发给大家看看</p></body></html>","text":"这篇文章不错，转发给大家看看","highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/206912988385496","repostId":1137698356,"repostType":2,"repost":{"id":"1137698356","kind":"news","pubTimestamp":1691542542,"share":"https://www.laohu8.com/m/news/1137698356?lang=&edition=full","pubTime":"2023-08-09 08:55","market":"us","language":"zh","title":"老黄深夜炸场，AIGC进入iPhone时刻！Hugging Face接入最强超算，神秘显卡胜过A100","url":"https://stock-news.laohu8.com/highlight/detail?id=1137698356","media":"新智元","summary":"生成式AI的时代已经来临，属于它的iPhone时刻到了！比如，集成了8个GPU并拥有1万亿个晶体管的NVIDIA HGX H100。据悉，该产品预计将在2024年第二季度推出。在发布这新GPU的时候，现场还出现了一个意外的小花絮。接下来，在Jupyter Notebook中，从Hugging Face加载预训练的Stable Diffusion XL模型，并要求它生成一个「太空中的Toy Jensen」。Hugging Face一键访问最强算力作为最受AI开发者喜爱的平台之一，拥有200万用户、超25万个模型，以及5万个数","content":"<html><head></head><body><blockquote><a href=\"https://laohu8.com/S/NVDA\">英伟达</a>下一代GH200超级芯片平台具有连接多个GPU的能力，从而实现卓越的性能和易于扩展的服务器设计，能够处理世界上最复杂的生成式工作负载，包括大语言模型、推荐系统和向量数据库等。专为搭建数据中心而设计的NVIDIA L40S GPU，性能就更加爆炸了，小胜A100。</blockquote><p style=\"text-align: justify;\">生成式AI的时代已经来临，属于它的iPhone时刻到了！</p><p style=\"text-align: justify;\">就在8月8日，英伟达CEO黄仁勋，再次登上了世界顶级计算机图形学会议SIGGRAPH的舞台。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/80bc021c47fed1776ad1b3a061c24efe\" title=\"\" tg-width=\"640\" tg-height=\"285\"/></p><p style=\"text-align: justify;\">一系列重磅更新接踵而至——下一代GH200超级芯片平台、AI Workbench、OpenUSD……</p><p style=\"text-align: justify;\">而英伟达也借此将过去数十年的所有创新，比如人工智能、虚拟世界、加速、模拟、协作等等，一举融合到一起。</p><p style=\"text-align: justify;\">在这个LLM大爆炸的时代，老黄依然敢大胆放话：「买得越多，省得越多！」</p><p><strong>英伟达最强AI超算再升级</strong></p><p style=\"text-align: justify;\">在5年前的SIGGRAPH上，英伟达通过将人工智能和实时光线追踪技术引入GPU，重新定义了计算机图形学。</p><p style=\"text-align: justify;\">老黄表示：「当我们通过AI重新定义计算机图形学时，我们也在为AI重新定义GPU。」</p><p style=\"text-align: justify;\">随之而来的，便是日益强大的计算系统。比如，集成了8个GPU并拥有1万亿个晶体管的NVIDIA HGX H100。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/6759b1c56f77155431c8a93d1eacd5b7\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"487\"/></p><p style=\"text-align: justify;\">就在今天，老黄再次让AI计算上了一个台阶——</p><p style=\"text-align: justify;\">除了为NVIDIA GH200 Grace Hopper配备更加先进的HBM3e内存外，下一代GH200超级芯片平台还将具有连接多个GPU的能力，从而实现卓越的性能和易于扩展的服务器设计。</p><p style=\"text-align: justify;\">而这个拥有多种配置的全新平台，将能够处理世界上最复杂的生成式工作负载，包括大语言模型、推荐系统和向量数据库等等。</p><p style=\"text-align: justify;\">比如，双核心方案就包括一台配备了144个Arm Neoverse核心并搭载了282GB HBM3e内存的服务器，可以提供8 petaflops的AI算力。</p><p style=\"text-align: justify;\">其中，全新的HBM3e内存要比当前的HBM3快了50%。而10TB/sec的组合带宽，也使得新平台可以运行比上一版本大3.5倍的模型，同时通过3倍更快的内存带宽提高性能。</p><p style=\"text-align: justify;\">据悉，该产品预计将在2024年第二季度推出。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/0eff2143922f48658add165e101aa13c\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"600\"/></p><p><strong>RTX工作站：绝佳刀法，4款显卡齐上新</strong></p><p style=\"text-align: justify;\">这次老黄的桌面AI工作站GPU系列也全面上新，一口气推出了4款新品：RTX 6000、RTX 5000、RTX 4500和RTX 4000。</p><p style=\"text-align: justify;\">如果H100以及配套的产品线展示的是英伟达GPU性能的天际线的话，针对桌面和数据中心推出的这几款产品，则是老黄对成本敏感客户秀出的绝佳「刀法」。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/95f81348bf05b50e7803d8a83dfff9c1\" alt=\"\" title=\"\" tg-width=\"640\" tg-height=\"310\"/></p><p style=\"text-align: justify;\">在发布这新GPU的时候，现场还出现了一个意外的小花絮。</p><p style=\"text-align: justify;\">老黄从后台拿出第一块GPU的时候，似乎不小心在镜面面板上沾了指纹。</p><p style=\"text-align: justify;\">老黄发现后觉得可能是自己搞砸了，就很不好意思地和现场观众说对不起，表示这次产品发布可能是有史以来最差的一次。</p><p style=\"text-align: justify;\">看来就算开发布会熟练如老黄，也会有翻车的时刻。</p><p style=\"text-align: justify;\">而如此可爱的老黄，也惹得在场观众不断发笑。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/0e71d54e6d75d789e4565ae5a6ba6ae0\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"383\"/></p><p style=\"text-align: justify;\">言归正传，作为旗舰级专业卡，RTX 6000的性能参数毫无疑问是4款新品中最强的。</p><p style=\"text-align: justify;\">凭借着48GB的显存，18176个CUDA核心，568个Tensor核心，142个RT核心，和高达960GB/s的带宽，它可谓是一骑绝尘。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b8c75289b80a26c04d41f0d8eafd286d\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"482\"/></p><p style=\"text-align: justify;\">RTX 5000配备了32GB显存，12800个CUDA核心，400个Tensor核心，100个RT核心。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/9325ea6a51cfab542b963165e26ae730\" alt=\"\" title=\"\" tg-width=\"1005\" tg-height=\"704\"/></p><p style=\"text-align: justify;\">RTX 4500配备了24GB显存，7680个CUDA核心，240个Tensor核心，60个RT核心。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/50483d5045cb6b46006ba907a1bd5720\" alt=\"\" title=\"\" tg-width=\"998\" tg-height=\"449\"/></p><p style=\"text-align: justify;\">RTX 4000配备了20GB显存，6144个CUDA核心，192个Tensor核心，48个RT核心。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b720f269d9ae0646c9b23e82f92b4bcf\" alt=\"\" title=\"\" tg-width=\"983\" tg-height=\"396\"/></p><p style=\"text-align: justify;\">基于新发布的4张新的GPU，针对企业客户，老黄还准备一套一站式解决方案—— RTX Workstation。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/287612445449084acc0370d2c1239248\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"600\"/></p><p style=\"text-align: justify;\">支持最多4张RTX 6000 GPU，可以在15小时内完成8.6亿token的GPT3-40B的微调。</p><p style=\"text-align: justify;\">还能让Stable Diffusion XL每分钟生成40张图片，比4090快5倍。</p><p><strong>OVX服务器：搭载L40S，性能小胜A100</strong></p><p style=\"text-align: justify;\">而专为搭建数据中心而设计的NVIDIA L40S GPU，性能就更加爆炸了。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/cde5f2421193ad45107d80eededbf72d\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p style=\"text-align: justify;\">基于Ada Lovelace架构的L40S，配备有48GB的GDDR6显存和846GB/s的带宽。</p><p style=\"text-align: justify;\">在第四代Tensor核心和FP8 Transformer引擎的加持下，可以提供超过1.45 petaflops的张量处理能力。</p><p style=\"text-align: justify;\">对于算力要求较高的任务，L40S的18,176个CUDA核心可以提供近5倍于A100的单精度浮点（FP32）性能，从而加速复杂计算和数据密集型分析。</p><p style=\"text-align: justify;\">此外，为了支持如实时渲染、产品设计和3D内容创建等专业视觉处理工作，英伟达还为L40S 还配备了142个第三代RT核心，可以提供212 teraflops的光线追踪性能。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/fdc009d81307f77541b1eda6562b3c69\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"1145\"/></p><p style=\"text-align: justify;\">对于具有数十亿参数和多种模态的生成式AI工作负载，L40S相较于老前辈A100可实现高达1.2倍的推理性能提升，以及高达1.7倍的训练性能提升。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/ef467d15d394a73dcb0ae98bdcebe70e\" alt=\"\" title=\"\" tg-width=\"563\" tg-height=\"386\"/></p><p style=\"text-align: justify;\">在L40S GPU的加持下，老黄又针对数据中心市场，推出了最多可搭载8张L40S的OVX服务器。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/8522b14038607b83432ecb37114440d9\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"600\"/></p><p style=\"text-align: justify;\">对于拥有8.6亿token的GPT3-40B模型，OVX服务器只需7个小时就能完成微调。</p><p style=\"text-align: justify;\">对于Stable Diffusion XL模型，则可实现每分钟80张的图像生成。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e1340845cf97ea5478615dd238f7590b\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"600\"/></p><p><strong>AI Workbench：加速定制生成式AI应用</strong></p><p style=\"text-align: justify;\">除了各种强大的硬件之外，老黄还重磅发布了全新的NVIDIA AI Workbench，来帮助开发和部署生成式AI模型。</p><p style=\"text-align: justify;\">概括来说，AI Workbench为开发者提供了一个统一且易于使用的工具包，能够快速在PC或工作站上创建、测试和微调模型，并无缝扩展到几乎任何数据中心、公有云或NVIDIA DGX Cloud上。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/d96055b4ef317862d897d3cdab08986f\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"600\"/></p><p style=\"text-align: justify;\">具体而言，AI Workbench的优势如下：</p><p style=\"text-align: justify;\">-<strong> 易于使用</strong></p><p style=\"text-align: justify;\">AI Workbench通过提供一个单一的平台来管理数据、模型和计算资源，简化了开发过程，支持跨机器和环境的协作。</p><p style=\"text-align: justify;\"><strong>- 集成AI开发工具和存储库</strong></p><p style=\"text-align: justify;\">AI Workbench与GitHub、NVIDIA NGC、Hugging Face等服务集成，开发者可以使用JupyterLab和VS Code等工具，并在不同平台和基础设施上进行开发。</p><p style=\"text-align: justify;\"><strong>- 增强协作</strong></p><p style=\"text-align: justify;\">AI Workbench采用的是以项目为中心的架构，便于开发者进行自动化版本控制、容器管理和处理机密信息等复杂任务，同时也可以支持团队之间的协作。</p><p style=\"text-align: justify;\"><strong>- 访问加速计算资源</strong></p><p style=\"text-align: justify;\">AI Workbench部署采用客户端-服务器模式。团队可以现在在本地计算资源上进行开发，然后在训练任务变得更大时切换到数据中心或云资源上。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/88694d13024e4a314973219e1b16b091\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"441\"/></p><p style=\"text-align: justify;\"><strong>Stable Diffusion XL自定义图像生成</strong></p><p style=\"text-align: justify;\">首先，打开AI Workbench并克隆一个存储库。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/93ff0e9b8b20d13deeef86ec66b62b47\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"636\"/></p><p style=\"text-align: justify;\">接下来，在Jupyter Notebook中，从Hugging Face加载预训练的Stable Diffusion XL模型，并要求它生成一个「太空中的Toy Jensen」。</p><p style=\"text-align: justify;\">然而，根据输出的图像可以看出，模型并不知道Toy Jensen是谁。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/a3921d4cffb27d1baddfc3d186ea6d2d\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"773\"/></p><p style=\"text-align: justify;\">这时就可以通过DreamBooth，并使用8张Toy Jensen的图片对模型进行微调。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/63eb50a6d15b8e9cd46495e53a854e43\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"605\"/></p><p style=\"text-align: justify;\">最后，在用户界面上重新运行推理。</p><p style=\"text-align: justify;\">现在，知道了Toy Jensen是谁的模型，就可以生成切合需求的图像了。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b71e48099fa709fd58d26839065e8260\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"560\"/></p><p style=\"text-align: justify;\"><strong>Hugging Face一键访问最强算力</strong></p><p style=\"text-align: justify;\">作为最受AI开发者喜爱的平台之一，拥有200万用户、超25万个模型，以及5万个数据集的Hugging Face，这次也与英伟达成功达成了合作。</p><p style=\"text-align: justify;\">现在，开发者可以通过Hugging Face平台直接获得英伟达DGX Cloud AI超算的加持，从而更加高效地完成AI模型的训练和微调。</p><p style=\"text-align: justify;\">其中，每个DGX Cloud实例都配备有8个H100或A100 80GB GPU，每个节点共有640GB显存，可满足顶级AI工作负载的性能要求。</p><p style=\"text-align: justify;\">此外，英伟达还将联合Hugging Face推出全新的「Training Cluster as a Service」服务，简化企业创建和定制生成式AI模型的过程。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/803c03b139e60ef870dfbef96a3bd5f8\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"600\"/></p><p style=\"text-align: justify;\">对此，老黄激动得表示：「这次，Hugging Face和英伟达将世界上最大的AI社区与全球领先的云AI计算平台真正地连接在了一起。Hugging Face的用户只需点击一下，即可访问英伟达的最强AI算力。」</p><p><strong>AI Enterprise 4.0：定制企业级生成式AI</strong></p><p style=\"text-align: justify;\">为了进一步加速生成式AI的应用，英伟达也将其企业级平台NVIDIAAI Enterprise升级到了4.0版本。</p><p style=\"text-align: justify;\">目前，AI Enterprise 4.0不仅可以为企业提供生成式AI所需的工具，同时还提供了生产部署所需的安全性和API稳定性。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/7c35f9ab30754b244774218a1306cf38\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"574\"/></p><p><strong>- NVIDIA NeMo</strong></p><p style=\"text-align: justify;\">一个用于构建、定制和部署大语言模型的云原生框架。借助NeMo，英伟达AI Enterprise可以为创建和定制大语言模型应用提供了端到端的支持。</p><p style=\"text-align: justify;\"><strong>- NVIDIA Triton管理服务</strong></p><p style=\"text-align: justify;\">帮助企业进行自动化和优化生产部署，使其在Kubernetes中能够自动部署多个推理服务器实例，并通过模型协调实现可扩展A 的高效运行。</p><p style=\"text-align: justify;\"><strong>- NVIDIA Base Command Manager Essentials集群管理软件</strong></p><p style=\"text-align: justify;\">帮助企业在数据中心、多云和混合云环境中最大化AI服务器的性能和利用率。</p><p style=\"text-align: justify;\">除了英伟达自己，AI Enterprise 4.0还将集成到给其他的合作伙伴，比如Google Cloud和Microsoft Azure等。</p><p style=\"text-align: justify;\">此外，MLOps提供商，包括Azure Machine Learning、ClearML、Domino Data Lab、Run:AI和Weights &amp; Biases，也将与英伟达AI平台进行无缝集成，从而简化生成式AI模型的开发。</p><p style=\"text-align: justify;\">Omniverse：在元宇宙中加入大语言模型</p><p style=\"text-align: justify;\">最后，是NVIDIA Omniverse平台的更新。</p><p style=\"text-align: justify;\">在接入了OpenUSD和AIGC工具之后，开发者可以更加轻松地生成模拟真实世界的3D场景和图形。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/f8730f5f54e801233a0522dc1200f23e\" alt=\"\" title=\"\" tg-width=\"640\" tg-height=\"360\"/></p><p style=\"text-align: justify;\">就像它的名字一样，Omniverse的定位是一个集合了各种工具的3D图形制作协作平台。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/df535d68cfad56e49faffe26406c461f\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"288\"/></p><p style=\"text-align: justify;\">3D开发者可以像文字编辑们在飞书或者钉钉中一样，在Omniverse上共同制作3D图形和场景。</p><p style=\"text-align: justify;\">而且可以将不同的3D制作工具制作出来的成果直接整合在Omniverse之内，将3D图形和场景的制作工作流彻底打通，化繁为简。</p><p style=\"text-align: justify;\"><strong>OpenUSD</strong></p><p style=\"text-align: justify;\">而这次更新中，接入的OpenUSD是什么东西？</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/410cf1ddf4c8df085443f860c4fa6694\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"624\"/></p><p style=\"text-align: justify;\">OpenUSD（Universal Scene Description）提供了一个开源，通用的场景描述格式，使不同品牌、不同类型的3D设计软件可以无障碍的协作。</p><p style=\"text-align: justify;\">Omnivers本身就是建立在USD体系之上的，这次Omniverse针对OpenUSD的升级，使得Omniverse能为开发者，企业推出了更多的框架和资源服务。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/e529e322bfde10d84190f1bdd0b3899f\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"363\"/></p><p style=\"text-align: justify;\">基于OpenUSD这个开源的3D图像编辑格式，5家公司（<a href=\"https://laohu8.com/S/AAPL\">苹果</a>，皮克斯，<a href=\"https://laohu8.com/S/ADBE\">Adobe</a>，Autodesk，英伟达）成立了AOUSD联盟，进一步推动了3D图像业界采用OpenUSD格式。</p><p style=\"text-align: justify;\">而且，借助AOUSD联盟的成立，Omniverse的开发者也可以方便的创建各种兼容于苹果的ARKit或者是RealityKit的素材和内容，更新后Omniverse也支持OpenXR的标准，使得Omniverse能够支持HTC VIVE，Magic Leap，Vajio等VR头显设备。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/1b68c7264c311dafa168f74bd22ccafe\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p style=\"text-align: justify;\"><strong>API，ChatUSD和其他更新</strong></p><p style=\"text-align: justify;\">此外，英伟达还发布了新的Omniverse Cloud API，让开发者可以更加无缝地部署OpenUSD管线和应用程序。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/ff477c310be20f6dda0db5eb08c0787b\" alt=\"\" title=\"\" tg-width=\"1080\" tg-height=\"287\"/></p><p style=\"text-align: justify;\">而最引人瞩目的，就是支持基于大语言模型的ChatUSD的支持。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/87b3ad1f7f4650bd75c2bc201e56b525\" alt=\"\" title=\"\" tg-width=\"641\" tg-height=\"258\"/></p><p style=\"text-align: justify;\">基于大语言模型技术的ChatUSD能像Github Copilot一样，在Omniverse平台中回答开发者的相关问题，或者自动生成Python-USD的代码，让开发人员效率暴增。</p><p style=\"text-align: justify;\">总而言之，英伟达再次用暴力的产品，令人惊叹的技术，高瞻远瞩的洞见，让全世界再次看到，它未来将如何引领世界AI和图形计算的新浪潮。</p><p style=\"text-align: justify;\">在老黄的经典名言「the more you buy，the more you save！」中，老黄缓缓走下舞台，却把现场气氛推向了最高潮。</p></body></html>","source":"lsy1569730104218","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>老黄深夜炸场，AIGC进入iPhone时刻！Hugging Face接入最强超算，神秘显卡胜过A100</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n老黄深夜炸场，AIGC进入iPhone时刻！Hugging Face接入最强超算，神秘显卡胜过A100\n</h2>\n\n<h4 class=\"meta\">\n\n\n2023-08-09 08:55 北京时间&nbsp;&nbsp;&nbsp;<a href=https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652364162&idx=1&sn=777dd9262460db84e5ab1e62103ffe27&chksm=f124a973c653206563fdba2a199bd7d5db5a6ec05dacd55400ad541ba7022508a77c4ab2a1f4&mpshare=1&scene=23&srcid=0809LH4C2g7KG4Q5z0rvqD9k&sharer_sharetime=1691536149059&sharer_shareid=00a55b671777cf0e253d4693000ead51#rd><strong>新智元</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>英伟达下一代GH200超级芯片平台具有连接多个GPU的能力，从而实现卓越的性能和易于扩展的服务器设计，能够处理世界上最复杂的生成式工作负载，包括大语言模型、推荐系统和向量数据库等。专为搭建数据中心而设计的NVIDIA L40S GPU，性能就更加爆炸了，小胜A100。生成式AI的时代已经来临，属于它的iPhone时刻到了！就在8月8日，英伟达CEO黄仁勋，再次登上了世界顶级计算机图形学会议...</p>\n\n<a href=\"https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652364162&idx=1&sn=777dd9262460db84e5ab1e62103ffe27&chksm=f124a973c653206563fdba2a199bd7d5db5a6ec05dacd55400ad541ba7022508a77c4ab2a1f4&mpshare=1&scene=23&srcid=0809LH4C2g7KG4Q5z0rvqD9k&sharer_sharetime=1691536149059&sharer_shareid=00a55b671777cf0e253d4693000ead51#rd\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/f51e0887617e5ccdb1f56ab9d6b7e088","relate_stocks":{"BK4575":"芯片概念","IE00BJTD4V19.USD":"NEUBERGER BERMAN US LONG SHORT EQUITY \"A1\" (USD) ACC","BK4566":"资本集团","LU0353189680.USD":"富国美国全盘成长基金Cl A Acc","IE00BJJMRY28.SGD":"Janus Henderson Balanced A Inc SGD","BK4559":"巴菲特持仓","BK4579":"人工智能","BK4550":"红杉资本持仓","LU0353189763.USD":"ALLSPRING  US ALL CAP GROWTH FUND \"I\" (USD) ACC","BK4574":"无人驾驶","IE00B1BXHZ80.USD":"Legg Mason ClearBridge - US Appreciation A Acc USD","IE00BFSS8Q28.SGD":"Janus Henderson Balanced A Inc SGD-H","BK4533":"AQR资本管理(全球第二大对冲基金)","BK4532":"文艺复兴科技持仓","BK4553":"喜马拉雅资本持仓","NVDA":"英伟达","BK4571":"数字音乐概念","BK4534":"瑞士信贷持仓","BK4576":"AR","LU0053666078.USD":"摩根大通基金-美国股票A（离岸）美元"},"source_url":"https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652364162&idx=1&sn=777dd9262460db84e5ab1e62103ffe27&chksm=f124a973c653206563fdba2a199bd7d5db5a6ec05dacd55400ad541ba7022508a77c4ab2a1f4&mpshare=1&scene=23&srcid=0809LH4C2g7KG4Q5z0rvqD9k&sharer_sharetime=1691536149059&sharer_shareid=00a55b671777cf0e253d4693000ead51#rd","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1137698356","content_text":"英伟达下一代GH200超级芯片平台具有连接多个GPU的能力，从而实现卓越的性能和易于扩展的服务器设计，能够处理世界上最复杂的生成式工作负载，包括大语言模型、推荐系统和向量数据库等。专为搭建数据中心而设计的NVIDIA L40S GPU，性能就更加爆炸了，小胜A100。生成式AI的时代已经来临，属于它的iPhone时刻到了！就在8月8日，英伟达CEO黄仁勋，再次登上了世界顶级计算机图形学会议SIGGRAPH的舞台。一系列重磅更新接踵而至——下一代GH200超级芯片平台、AI Workbench、OpenUSD……而英伟达也借此将过去数十年的所有创新，比如人工智能、虚拟世界、加速、模拟、协作等等，一举融合到一起。在这个LLM大爆炸的时代，老黄依然敢大胆放话：「买得越多，省得越多！」英伟达最强AI超算再升级在5年前的SIGGRAPH上，英伟达通过将人工智能和实时光线追踪技术引入GPU，重新定义了计算机图形学。老黄表示：「当我们通过AI重新定义计算机图形学时，我们也在为AI重新定义GPU。」随之而来的，便是日益强大的计算系统。比如，集成了8个GPU并拥有1万亿个晶体管的NVIDIA HGX H100。就在今天，老黄再次让AI计算上了一个台阶——除了为NVIDIA GH200 Grace Hopper配备更加先进的HBM3e内存外，下一代GH200超级芯片平台还将具有连接多个GPU的能力，从而实现卓越的性能和易于扩展的服务器设计。而这个拥有多种配置的全新平台，将能够处理世界上最复杂的生成式工作负载，包括大语言模型、推荐系统和向量数据库等等。比如，双核心方案就包括一台配备了144个Arm Neoverse核心并搭载了282GB HBM3e内存的服务器，可以提供8 petaflops的AI算力。其中，全新的HBM3e内存要比当前的HBM3快了50%。而10TB/sec的组合带宽，也使得新平台可以运行比上一版本大3.5倍的模型，同时通过3倍更快的内存带宽提高性能。据悉，该产品预计将在2024年第二季度推出。RTX工作站：绝佳刀法，4款显卡齐上新这次老黄的桌面AI工作站GPU系列也全面上新，一口气推出了4款新品：RTX 6000、RTX 5000、RTX 4500和RTX 4000。如果H100以及配套的产品线展示的是英伟达GPU性能的天际线的话，针对桌面和数据中心推出的这几款产品，则是老黄对成本敏感客户秀出的绝佳「刀法」。在发布这新GPU的时候，现场还出现了一个意外的小花絮。老黄从后台拿出第一块GPU的时候，似乎不小心在镜面面板上沾了指纹。老黄发现后觉得可能是自己搞砸了，就很不好意思地和现场观众说对不起，表示这次产品发布可能是有史以来最差的一次。看来就算开发布会熟练如老黄，也会有翻车的时刻。而如此可爱的老黄，也惹得在场观众不断发笑。言归正传，作为旗舰级专业卡，RTX 6000的性能参数毫无疑问是4款新品中最强的。凭借着48GB的显存，18176个CUDA核心，568个Tensor核心，142个RT核心，和高达960GB/s的带宽，它可谓是一骑绝尘。RTX 5000配备了32GB显存，12800个CUDA核心，400个Tensor核心，100个RT核心。RTX 4500配备了24GB显存，7680个CUDA核心，240个Tensor核心，60个RT核心。RTX 4000配备了20GB显存，6144个CUDA核心，192个Tensor核心，48个RT核心。基于新发布的4张新的GPU，针对企业客户，老黄还准备一套一站式解决方案—— RTX Workstation。支持最多4张RTX 6000 GPU，可以在15小时内完成8.6亿token的GPT3-40B的微调。还能让Stable Diffusion XL每分钟生成40张图片，比4090快5倍。OVX服务器：搭载L40S，性能小胜A100而专为搭建数据中心而设计的NVIDIA L40S GPU，性能就更加爆炸了。基于Ada Lovelace架构的L40S，配备有48GB的GDDR6显存和846GB/s的带宽。在第四代Tensor核心和FP8 Transformer引擎的加持下，可以提供超过1.45 petaflops的张量处理能力。对于算力要求较高的任务，L40S的18,176个CUDA核心可以提供近5倍于A100的单精度浮点（FP32）性能，从而加速复杂计算和数据密集型分析。此外，为了支持如实时渲染、产品设计和3D内容创建等专业视觉处理工作，英伟达还为L40S 还配备了142个第三代RT核心，可以提供212 teraflops的光线追踪性能。对于具有数十亿参数和多种模态的生成式AI工作负载，L40S相较于老前辈A100可实现高达1.2倍的推理性能提升，以及高达1.7倍的训练性能提升。在L40S GPU的加持下，老黄又针对数据中心市场，推出了最多可搭载8张L40S的OVX服务器。对于拥有8.6亿token的GPT3-40B模型，OVX服务器只需7个小时就能完成微调。对于Stable Diffusion XL模型，则可实现每分钟80张的图像生成。AI Workbench：加速定制生成式AI应用除了各种强大的硬件之外，老黄还重磅发布了全新的NVIDIA AI Workbench，来帮助开发和部署生成式AI模型。概括来说，AI Workbench为开发者提供了一个统一且易于使用的工具包，能够快速在PC或工作站上创建、测试和微调模型，并无缝扩展到几乎任何数据中心、公有云或NVIDIA DGX Cloud上。具体而言，AI Workbench的优势如下：- 易于使用AI Workbench通过提供一个单一的平台来管理数据、模型和计算资源，简化了开发过程，支持跨机器和环境的协作。- 集成AI开发工具和存储库AI Workbench与GitHub、NVIDIA NGC、Hugging Face等服务集成，开发者可以使用JupyterLab和VS Code等工具，并在不同平台和基础设施上进行开发。- 增强协作AI Workbench采用的是以项目为中心的架构，便于开发者进行自动化版本控制、容器管理和处理机密信息等复杂任务，同时也可以支持团队之间的协作。- 访问加速计算资源AI Workbench部署采用客户端-服务器模式。团队可以现在在本地计算资源上进行开发，然后在训练任务变得更大时切换到数据中心或云资源上。Stable Diffusion XL自定义图像生成首先，打开AI Workbench并克隆一个存储库。接下来，在Jupyter Notebook中，从Hugging Face加载预训练的Stable Diffusion XL模型，并要求它生成一个「太空中的Toy Jensen」。然而，根据输出的图像可以看出，模型并不知道Toy Jensen是谁。这时就可以通过DreamBooth，并使用8张Toy Jensen的图片对模型进行微调。最后，在用户界面上重新运行推理。现在，知道了Toy Jensen是谁的模型，就可以生成切合需求的图像了。Hugging Face一键访问最强算力作为最受AI开发者喜爱的平台之一，拥有200万用户、超25万个模型，以及5万个数据集的Hugging Face，这次也与英伟达成功达成了合作。现在，开发者可以通过Hugging Face平台直接获得英伟达DGX Cloud AI超算的加持，从而更加高效地完成AI模型的训练和微调。其中，每个DGX Cloud实例都配备有8个H100或A100 80GB GPU，每个节点共有640GB显存，可满足顶级AI工作负载的性能要求。此外，英伟达还将联合Hugging Face推出全新的「Training Cluster as a Service」服务，简化企业创建和定制生成式AI模型的过程。对此，老黄激动得表示：「这次，Hugging Face和英伟达将世界上最大的AI社区与全球领先的云AI计算平台真正地连接在了一起。Hugging Face的用户只需点击一下，即可访问英伟达的最强AI算力。」AI Enterprise 4.0：定制企业级生成式AI为了进一步加速生成式AI的应用，英伟达也将其企业级平台NVIDIAAI Enterprise升级到了4.0版本。目前，AI Enterprise 4.0不仅可以为企业提供生成式AI所需的工具，同时还提供了生产部署所需的安全性和API稳定性。- NVIDIA NeMo一个用于构建、定制和部署大语言模型的云原生框架。借助NeMo，英伟达AI Enterprise可以为创建和定制大语言模型应用提供了端到端的支持。- NVIDIA Triton管理服务帮助企业进行自动化和优化生产部署，使其在Kubernetes中能够自动部署多个推理服务器实例，并通过模型协调实现可扩展A 的高效运行。- NVIDIA Base Command Manager Essentials集群管理软件帮助企业在数据中心、多云和混合云环境中最大化AI服务器的性能和利用率。除了英伟达自己，AI Enterprise 4.0还将集成到给其他的合作伙伴，比如Google Cloud和Microsoft Azure等。此外，MLOps提供商，包括Azure Machine Learning、ClearML、Domino Data Lab、Run:AI和Weights & Biases，也将与英伟达AI平台进行无缝集成，从而简化生成式AI模型的开发。Omniverse：在元宇宙中加入大语言模型最后，是NVIDIA Omniverse平台的更新。在接入了OpenUSD和AIGC工具之后，开发者可以更加轻松地生成模拟真实世界的3D场景和图形。就像它的名字一样，Omniverse的定位是一个集合了各种工具的3D图形制作协作平台。3D开发者可以像文字编辑们在飞书或者钉钉中一样，在Omniverse上共同制作3D图形和场景。而且可以将不同的3D制作工具制作出来的成果直接整合在Omniverse之内，将3D图形和场景的制作工作流彻底打通，化繁为简。OpenUSD而这次更新中，接入的OpenUSD是什么东西？OpenUSD（Universal Scene Description）提供了一个开源，通用的场景描述格式，使不同品牌、不同类型的3D设计软件可以无障碍的协作。Omnivers本身就是建立在USD体系之上的，这次Omniverse针对OpenUSD的升级，使得Omniverse能为开发者，企业推出了更多的框架和资源服务。基于OpenUSD这个开源的3D图像编辑格式，5家公司（苹果，皮克斯，Adobe，Autodesk，英伟达）成立了AOUSD联盟，进一步推动了3D图像业界采用OpenUSD格式。而且，借助AOUSD联盟的成立，Omniverse的开发者也可以方便的创建各种兼容于苹果的ARKit或者是RealityKit的素材和内容，更新后Omniverse也支持OpenXR的标准，使得Omniverse能够支持HTC VIVE，Magic Leap，Vajio等VR头显设备。API，ChatUSD和其他更新此外，英伟达还发布了新的Omniverse Cloud API，让开发者可以更加无缝地部署OpenUSD管线和应用程序。而最引人瞩目的，就是支持基于大语言模型的ChatUSD的支持。基于大语言模型技术的ChatUSD能像Github Copilot一样，在Omniverse平台中回答开发者的相关问题，或者自动生成Python-USD的代码，让开发人员效率暴增。总而言之，英伟达再次用暴力的产品，令人惊叹的技术，高瞻远瞩的洞见，让全世界再次看到，它未来将如何引领世界AI和图形计算的新浪潮。在老黄的经典名言「the more you buy，the more you save！」中，老黄缓缓走下舞台，却把现场气氛推向了最高潮。","news_type":1},"isVote":1,"tweetType":1,"viewCount":880,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":27,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/206912988385496"}