+关注
Jacksim
暂无个人介绍
IP属地:未知
331
关注
4
粉丝
0
主题
0
勋章
主贴
热门
Jacksim
2021-08-21
[强] [强] [强]
即将推出MSCI中国A50指数期货,会给A股带来什么?
Jacksim
2021-10-15
$老虎证券(TIGR)$
心都碎了
Jacksim
2021-08-21
Good...
特斯拉Dojo芯片,领先竞争对手一个数量级
去老虎APP查看更多动态
{"i18n":{"language":"zh_CN"},"userPageInfo":{"id":"4090666679009510","uuid":"4090666679009510","gmtCreate":1627565437053,"gmtModify":1629532127998,"name":"Jacksim","pinyin":"jacksim","introduction":"","introductionEn":"","signature":"","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","hat":null,"hatId":null,"hatName":null,"vip":1,"status":2,"fanSize":4,"headSize":331,"tweetSize":3,"questionSize":0,"limitLevel":999,"accountStatus":4,"level":{"id":1,"name":"萌萌虎","nameTw":"萌萌虎","represent":"呱呱坠地","factor":"评论帖子3次或发布1条主帖(非转发)","iconColor":"3C9E83","bgColor":"A2F1D9"},"themeCounts":0,"badgeCounts":0,"badges":[],"moderator":false,"superModerator":false,"manageSymbols":null,"badgeLevel":null,"boolIsFan":false,"boolIsHead":false,"favoriteSize":0,"symbols":null,"coverImage":null,"realNameVerified":null,"userBadges":[{"badgeId":"e50ce593bb40487ebfb542ca54f6a561-1","templateUuid":"e50ce593bb40487ebfb542ca54f6a561","name":"出道虎友","description":"加入老虎社区500天","bigImgUrl":"https://static.tigerbbs.com/0e4d0ca1da0456dc7894c946d44bf9ab","smallImgUrl":"https://static.tigerbbs.com/0f2f65e8ce4cfaae8db2bea9b127f58b","grayImgUrl":"https://static.tigerbbs.com/c5948a31b6edf154422335b265235809","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2022.12.12","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1001},{"badgeId":"35ec162348d5460f88c959321e554969-1","templateUuid":"35ec162348d5460f88c959321e554969","name":"精英交易员","description":"证券或期货账户累计交易次数达到30次","bigImgUrl":"https://static.tigerbbs.com/ab0f87127c854ce3191a752d57b46edc","smallImgUrl":"https://static.tigerbbs.com/c9835ce48b8c8743566d344ac7a7ba8c","grayImgUrl":"https://static.tigerbbs.com/76754b53ce7a90019f132c1d2fbc698f","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2022.11.10","exceedPercentage":"60.51%","individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100},{"badgeId":"976c19eed35f4cd78f17501c2e99ef37-1","templateUuid":"976c19eed35f4cd78f17501c2e99ef37","name":"博闻投资者","description":"累计交易超过10只正股","bigImgUrl":"https://static.tigerbbs.com/e74cc24115c4fbae6154ec1b1041bf47","smallImgUrl":"https://static.tigerbbs.com/d48265cbfd97c57f9048db29f22227b0","grayImgUrl":"https://static.tigerbbs.com/76c6d6898b073c77e1c537ebe9ac1c57","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2022.02.06","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1102},{"badgeId":"518b5610c3e8410da5cfad115e4b0f5a-1","templateUuid":"518b5610c3e8410da5cfad115e4b0f5a","name":"实盘交易者","description":"完成一笔实盘交易","bigImgUrl":"https://static.tigerbbs.com/2e08a1cc2087a1de93402c2c290fa65b","smallImgUrl":"https://static.tigerbbs.com/4504a6397ce1137932d56e5f4ce27166","grayImgUrl":"https://static.tigerbbs.com/4b22c79415b4cd6e3d8ebc4a0fa32604","redirectLinkEnabled":0,"redirectLink":null,"hasAllocated":1,"isWearing":0,"stamp":null,"stampPosition":0,"hasStamp":0,"allocationCount":1,"allocatedDate":"2021.12.21","exceedPercentage":null,"individualDisplayEnabled":0,"backgroundColor":null,"fontColor":null,"individualDisplaySort":0,"categoryType":1100}],"userBadgeCount":4,"currentWearingBadge":null,"individualDisplayBadges":null,"crmLevel":1,"crmLevelSwitch":0,"location":"未知","starInvestorFollowerNum":0,"starInvestorFlag":false,"starInvestorOrderShareNum":0,"subscribeStarInvestorNum":0,"ror":null,"winRationPercentage":null,"showRor":false,"investmentPhilosophy":null,"starInvestorSubscribeFlag":false},"baikeInfo":{},"tab":"hot","tweets":[{"id":824096466,"gmtCreate":1634260603866,"gmtModify":1634274406782,"author":{"id":"4090666679009510","authorId":"4090666679009510","name":"Jacksim","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4090666679009510","authorIdStr":"4090666679009510"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/TIGR\">$老虎证券(TIGR)$</a>心都碎了","listText":"<a href=\"https://laohu8.com/S/TIGR\">$老虎证券(TIGR)$</a>心都碎了","text":"$老虎证券(TIGR)$心都碎了","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":3,"commentSize":1,"repostSize":0,"link":"https://laohu8.com/post/824096466","isVote":1,"tweetType":1,"viewCount":1127,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":836742227,"gmtCreate":1629530110969,"gmtModify":1633684158726,"author":{"id":"4090666679009510","authorId":"4090666679009510","name":"Jacksim","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4090666679009510","authorIdStr":"4090666679009510"},"themes":[],"htmlText":"[强] [强] [强] ","listText":"[强] [强] [强] ","text":"[强] [强] [强]","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":4,"commentSize":1,"repostSize":0,"link":"https://laohu8.com/post/836742227","repostId":"2160582710","repostType":4,"repost":{"id":"2160582710","pubTimestamp":1629513324,"share":"https://www.laohu8.com/m/news/2160582710?lang=&edition=full","pubTime":"2021-08-21 10:35","market":"sh","language":"zh","title":"即将推出MSCI中国A50指数期货,会给A股带来什么?","url":"https://stock-news.laohu8.com/highlight/detail?id=2160582710","media":"界面新闻","summary":"香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越","content":"<div>\n<p>香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越多国际投资者通过沪深港通进入中国内地市场。\n据了解,香港交易所已经与全球领先的投资决策支持工具和服务供应商MSCI 签订新的授权协议,推出以MSCI中国A50互联互通指数为标的期货合约。\nMSCI...</p>\n\n<a href=\"https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml\">Web Link</a>\n\n</div>\n","source":"sina_symbol","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>即将推出MSCI中国A50指数期货,会给A股带来什么?</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n即将推出MSCI中国A50指数期货,会给A股带来什么?\n</h2>\n\n<h4 class=\"meta\">\n\n\n2021-08-21 10:35 北京时间 <a href=https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml><strong>界面新闻</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越多国际投资者通过沪深港通进入中国内地市场。\n据了解,香港交易所已经与全球领先的投资决策支持工具和服务供应商MSCI 签订新的授权协议,推出以MSCI中国A50互联互通指数为标的期货合约。\nMSCI...</p>\n\n<a href=\"https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/7e98e87e70d708bbd7b223988c7e784e","relate_stocks":{"510030":"价值ETF","510050":"上证50ETF","512550":"A50ETF基金","000300.SH":"沪深300","XPP":"二倍做多富时中国50ETF(ProShares)","000016.SH":"上证50","YXI":"ProShares做空FTSE中国50ETF","00388":"香港交易所","FXP":"二倍做空富时中国50ETF-ProShares"},"source_url":"https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"2160582710","content_text":"香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越多国际投资者通过沪深港通进入中国内地市场。\n据了解,香港交易所已经与全球领先的投资决策支持工具和服务供应商MSCI 签订新的授权协议,推出以MSCI中国A50互联互通指数为标的期货合约。\nMSCI中国A50互联互通指数将追踪50只通过沪深港通交易的主要沪深股票表现。这只离岸交易、并有均衡行业代表性的中国A股指数期货产品,将于2021年10月18日推出。\n港交所行政总裁欧冠升表示:“今天宣布推出的A股指数期货,标志着我们在推进于香港建立离岸中国内地股票衍生产品系列迈出了关键一步。与MSCI的长期合作关系亦更为紧密,共同努力发展香港成为亚洲顶尖衍生产品交易中心,提升香港市场投资产品的深度及广度。这只新产品将为投资者提供一个有效管理A股相关资产风险的工具。”\n对于新指数期货对A股市场的意义,欧冠升认为,A股指数期货的推出为国际投资者提供了管理A股投资风险的低成本且方便的工具,将有助于提升国际投资者对A股的兴趣和需求,吸引更多国际投资者进入中国内地股票市场。\n“新的指数期货为国际投资者提供更多投资选择,将支持和推动中国A股市场进一步开放和国际化,进一步增强A股市场活力和流动性。”欧冠升补充道。\n对于新指数期货对香港的意义,在欧冠升看来,这是香港首个A股期货产品,将进一步丰富香港交易所现有的人民币相关产品组合,为投资者提供更多的风险管理工具。\n“与我们的沪深港通计划相配合,为国际投资者投资及管理A股持仓风险提供一站式的解决方案。有助于增强香港交易所的竞争力,进一步巩固香港作为连接中国与世界的国际金融中心地位。”他表示。\n据MSCI方面提供的数据,过去四年(2016年末至2020年末),外资对中国A股持股市值增长了80%,其中90%的外资持股源于沪股通和深股通。为反映此强劲增长,MSCI建立了基于中国A股基准的产品生态系统。\n界面新闻记者留意到,这份新协议基于香港交易所与 MSCI 早前签订的授权协议,并于去年成功推出了一系列 MSCI 亚洲及新兴市场期货和期权,延续香港交易所与 MSCI 的持续战略合作关系。\n截止目前,香港交易所已推出41只追踪MSCI指数的衍生产品。\n据港交所将介绍,MSCI中国A50互联互通指数将会涵盖中国内地A股大型股中的50只股票,目标为每个行业至少两只,以全面反映中国的经济状况。该指数包含 50只合资格沪深港通交易的股票,并与主要 MSCI A股指数的历史表现高度相关。\n基于互联互通机制,该指数采用创新的行业中性策略(Sector-neutral approach),遵循其母指数MSCI 中国 A 股指数的行业权重配置,并通过纳入全球行业分类标准范围内各行业最大的两只股票平衡行业代表性。该指数可作为指数挂钩投资产品的基础,例如交易所交易基金(ETF)、交易所交易票据(ETN)、公募基金、结构性产品及其他指数工具。\n自2014年推出以来,连接香港和内地股票市场的沪深港通已成为国际投资者进入A股市场的主要渠道,并帮助促成了中国A股纳入全球主要指数。\n沪深港通成交量在 2021 年第一季再创新高,北向和南向交易的日均成交额分别大幅增加至1268 亿元人民币和 608 亿港元。\n中泰国际策略分析师颜招骏向界面新闻表示,港交所此举是给机构投资者提供一个A股风险管理的工具,降低组合波动性。\n“港交所提供更多A股相关投资产品乃大势所趋。”他补充道。\n香颂资本执行董事沈萌告诉界面新闻,指数期货是一种金融衍生品,A股期货对于A股行情具有很大的指向性意义,甚至在某些时段会具有A股行情的前瞻作用,同时也可以作为A股投资的对冲工具。\n沈萌认为,在内地,股市的指数期货还不完善,目前只有新加坡市场的A50,无法充分管控A股的波动风险。与内地更紧密的港交所推出相关指数期货,可以在一定程度上对冲恶意做空和打压A股的操作。","news_type":1},"isVote":1,"tweetType":1,"viewCount":564,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":836741524,"gmtCreate":1629529589168,"gmtModify":1633684161084,"author":{"id":"4090666679009510","authorId":"4090666679009510","name":"Jacksim","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4090666679009510","authorIdStr":"4090666679009510"},"themes":[],"htmlText":"Good... ","listText":"Good... ","text":"Good...","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":3,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/836741524","repostId":"2161746147","repostType":4,"repost":{"id":"2161746147","pubTimestamp":1629514858,"share":"https://www.laohu8.com/m/news/2161746147?lang=&edition=full","pubTime":"2021-08-21 11:00","market":"us","language":"zh","title":"特斯拉Dojo芯片,领先竞争对手一个数量级","url":"https://stock-news.laohu8.com/highlight/detail?id=2161746147","media":"半导体行业观察","summary":"特斯拉刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CP","content":"<p><a href=\"https://laohu8.com/S/TSLA\">特斯拉</a>刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机IO。</p>\n<p>几周前,我们推测该系统的封装是 TSMC 晶圆集成扇出系统 (InFO_SoW)。我们解释了这种类型的封装的好处以及这种大规模扩展训练芯片所涉及的冷却和功耗。此外,我们估计该软件包的性能将优于 Nvidia 系统。所有这些似乎都是有根据的推测。今天,我们将深入的挖掘更多的半导体细节。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110451514v197zlc3kf89g5a\" tg-width=\"1080\" tg-height=\"504\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>在我们深入讨论硬件之前,让我们先谈谈评估基础架构。特斯拉不断地重新训练和改进他们的神经网络。他们评估任何代码更改以查看是否有改进。在汽车和服务器中部署了数以千计的相同芯片。他们每周进行数百万次评估。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110452695v197e2lm3fz76i2\" tg-width=\"1080\" tg-height=\"568\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>多年来,特斯拉一直在扩大其GPU集群的规模。如果特斯拉停止所有实际工作负载,运行Linpack,并将其提交到Top500榜单,他们目前的训练集群将成为第五大超级计算机。然而,对于特斯拉和其雄心来说,这种性能的扩展是不够的,所以他们在几年前就开始开发自己的Dojo芯片项目。特斯拉需要更高的性能,以节能且经济高效的方式实现更大、更复杂的神经网络。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110453776v197jx2k68fhcml\" tg-width=\"1080\" tg-height=\"490\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>特斯拉的架构解决方案是分布式计算架构。当我们听他们的细节时,这个架构看起来很像Cerberus。我们分析了Cerebras晶圆级引擎及其架构。每个AI训练架构都是以这种方式布置的,但计算元素、网络和结构的细节差别很大。这些类型的网络最大的问题是扩大带宽和保持低延迟。为了扩大网络规模,特斯拉特别关注于此,这影响了他们设计的每个部分,从芯片材料到封装。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110454722v197cx5xiqu333q\" tg-width=\"1080\" tg-height=\"599\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>该功能单元被设计为可通过1个时钟周期,但足够大,以至于同步开销和软件不是主要问题。因此,他们得出的设计几乎和Cerebras一模一样。由高速结构连接的单个单元的网状结构,该结构在一个时钟内的功能是单元之间的路由通信。每个单元都有一个大的1.25MB SRAM暂存板和多个具有SIMD功能的超标量CPU核,以及支持所有常见数据类型的矩阵乘法单元。此外,他们还引入了一种名为CFP8的新数据类型,可配置浮点8。每个单元可在BF16 / CFP8上支持1TFlop,FP31上64GFlops,每个方向512GB/s的带宽。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110500799v197xhcnedchtus\" tg-width=\"1080\" tg-height=\"572\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>CPU也是毫不逊色,它在矢量管道上是4宽2宽。每个核心可以承载4个线程,以最大限度的提高利用率。遗憾的是,特斯拉使用了定制的ISA,而不是像 RISC V 这样的顶级开源 ISA。这个定制的ISA引入了转置,收集,广播,和链接遍历的指令。</p>\n<p>这354个功能单元的全芯片可达到BF16或CFP8的362 TFlops和FP32的22.6 TFlops。它总共有645mm²和500亿个晶体管。每个芯片都有惊人的400W TDP,这意味着功率密度高于大多数配置的Nvidia A100 GPU。有趣的是,特斯拉实现了每mm²上集成7750万个晶体管的有效晶体管密度,仅次于移动芯片和<a href=\"https://laohu8.com/S/AAPL\">苹果</a>M1,比其他所有高性能芯片都要高。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110503440v197lagxvjg0azx\" tg-width=\"1080\" tg-height=\"557\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>基本功能单元的另一个有趣的方面是NOC路由器。它与Tenstorrent有非常类似的在芯片内部和芯片间的扩展方式。毫不意外,特斯拉正在采用与其他备受推崇的人工智能初创公司类似的架构。Tenstorrent 非常适合扩展培训,而特斯拉非常关注这方面。</p>\n<p>在芯片上,特斯拉拥有惊人的10TBps定向带宽,但这个数字在实际工作负载中没有多大意义。特斯拉相对于Tenstorrent的一个巨大优势是芯片之间的带宽要高得多。他们在 112GTs 上有 576 个 SerDes。这产生了总共 64Tb/s 或 8TB/s 的带宽。</p>\n<p>我们不确定特斯拉每条边的4TB/s是从哪里得到的,更有可能是X轴和Y轴上的数字。先不说这张令人困惑的幻灯片,这个芯片的带宽是疯狂的。目前已知的最高外部带宽芯片是32Tb/s网络交换机芯片。特斯拉能够通过大量的SerDes和先进的封装将这个数字翻倍。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110506551v1979x5minzarss\" tg-width=\"1080\" tg-height=\"487\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>特斯拉通过PCIe 4.0将Dojo芯片的计算平面连接到连接主机系统的接口处理器上。这些接口处理器还支持更高的基数网络连接,以补充现有的计算平面网格。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110513356v197ye4od4q94c8\" tg-width=\"1080\" tg-height=\"586\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>25个D1芯片被封装成 “扇出晶圆工艺(fan out wafer process)”。特斯拉并没有像我们几周前猜测的那样确认这个封装是<a href=\"https://laohu8.com/S/TSM\">台积电</a>的集成晶圆扇形系统(InFO_SoW),但考虑到疯狂的芯片间带宽和他们特别提到的扇出晶圆,这看起来很有可能。</p>\n<p>特斯拉开发了一种专有的高带宽连接器,可以保留这些芯片之间的芯片外带宽。每个芯片都有令人印象深刻的9PFlops BF16/CFP8和36tb /s的off-tile带宽。这远远超过了Cerebras的晶圆外带宽,使特斯拉系统的横向扩展能力甚至比横向扩展设计(例如 Tenstorrent 架构)还要好。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110515346v197ep16cl0iw6o\" tg-width=\"1080\" tg-height=\"765\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>电源传输是独一无二的,定制的,也非常令人印象深刻。由于具有如此大的带宽和超过 10KW 的功耗,特斯拉在电力传输方面进行了创新,并垂直供电。定制稳压器调制器直接回流到扇出晶片上。功率、热量和机械都直接与芯片连接。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110516207v1975u9vgzz63ni\" tg-width=\"1080\" tg-height=\"594\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>即使芯片本身的总功率只有10KW,但芯片的总功率仍然是15KW。电力传输、IO和晶圆线也在消耗大量的电力。能量从底部进来,热量从顶部出来。特斯拉的规模单位不是芯片,而是25块芯片。这个贴图远远超过了Nvidia, Graphcore, Cerebras, Groq, Tenstorrent, SambaNova,或任何其他AI训练项目的单位性能和扩展能力。</p>\n<p>所有这些似乎都是非常遥远的技术,但特斯拉声称,他们已经在实验室的真实人工智能网络上以2GHz的频率运行了芯片。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110518184v197qyjtg5phst7\" tg-width=\"1080\" tg-height=\"715\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>扩展到数千个芯片的下一步是服务器级别。Dojo可扩展为2 x 3的tile配置,在一个服务器中有两个这样的配置。对于那些在家计数的人来说,每个服务器总共有12个tile,每个服务器总共有108个PFlops,超过100,000个功能单元,400,000个定制核和132GB SRAM是令人震惊的数字。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110519282v197ncjdhvmc22t\" tg-width=\"1080\" tg-height=\"482\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>特斯拉不断扩大其网格中的机柜级别。芯片之间没有带宽中断,它是一个具有惊人带宽的同质芯片网格。他们计划扩大到10个机柜、1.1 Exaflops、1,062,000个功能单元、4,248,000个核心和1.33TB的SRAM。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110520332v197acj94hjb924\" tg-width=\"1031\" tg-height=\"825\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>软件方面很有趣,但我们今天不会太深入讨论。他们声称他们可以对其进行虚拟细分。他们说不管集群的大小如何,软件都可以在Dojo处理单元(DPU)之间无缝扩展。Dojo 编译器可以处理硬件计算平面的细粒度并行和映射网络。它可以通过数据模型图并行性来实现这一点,但也可以进行优化以减少内存占用。</p>\n<p>模型并行性可以跨芯片边界扩展,甚至不需要大批量的轻松解锁具有数万亿参数甚至更多参数的下一级AI模型。他们不需要依赖手写的代码来在这个庞大的集群上运行模型。</p>\n<p>总的来说,与<a href=\"https://laohu8.com/S/NVDA\">英伟达</a>的GPU相比,成本相当,但特斯拉声称他们可以实现4倍的性能,每瓦性能提高1.3倍,减少5倍的面积。特斯拉的TCO优势几乎比英伟达的AI解决方案好一个数量级。如果他们的说法是真的,特斯拉已经超越了人工智能硬件和软件领域的所有人。我对此表示怀疑,但这也是硬件极客的美梦。</p>\n<p>我们都要试图冷静下来,等一等,看看它什么时候会实际部署到生产环境中。</p>","source":"bdthygc","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>特斯拉Dojo芯片,领先竞争对手一个数量级</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n特斯拉Dojo芯片,领先竞争对手一个数量级\n</h2>\n\n<h4 class=\"meta\">\n\n\n2021-08-21 11:00 北京时间 <a href=https://mp.weixin.qq.com/s/EPgSUdG_3_t3XpeXVQne0A><strong>半导体行业观察</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>特斯拉刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机IO。\n几周前,我们推测该系统的封装是 TSMC 晶圆集成扇出系统 (InFO_SoW)。我们解释了这种类型的封装的好处以及这种大规模扩展训练芯片所涉及的冷却和功耗。...</p>\n\n<a href=\"https://mp.weixin.qq.com/s/EPgSUdG_3_t3XpeXVQne0A\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/e49ab90f6352b6ebbb45091ad18b5a2e","relate_stocks":{"TSLA":"特斯拉"},"source_url":"https://mp.weixin.qq.com/s/EPgSUdG_3_t3XpeXVQne0A","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"2161746147","content_text":"特斯拉刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机IO。\n几周前,我们推测该系统的封装是 TSMC 晶圆集成扇出系统 (InFO_SoW)。我们解释了这种类型的封装的好处以及这种大规模扩展训练芯片所涉及的冷却和功耗。此外,我们估计该软件包的性能将优于 Nvidia 系统。所有这些似乎都是有根据的推测。今天,我们将深入的挖掘更多的半导体细节。\n\n在我们深入讨论硬件之前,让我们先谈谈评估基础架构。特斯拉不断地重新训练和改进他们的神经网络。他们评估任何代码更改以查看是否有改进。在汽车和服务器中部署了数以千计的相同芯片。他们每周进行数百万次评估。\n\n多年来,特斯拉一直在扩大其GPU集群的规模。如果特斯拉停止所有实际工作负载,运行Linpack,并将其提交到Top500榜单,他们目前的训练集群将成为第五大超级计算机。然而,对于特斯拉和其雄心来说,这种性能的扩展是不够的,所以他们在几年前就开始开发自己的Dojo芯片项目。特斯拉需要更高的性能,以节能且经济高效的方式实现更大、更复杂的神经网络。\n\n特斯拉的架构解决方案是分布式计算架构。当我们听他们的细节时,这个架构看起来很像Cerberus。我们分析了Cerebras晶圆级引擎及其架构。每个AI训练架构都是以这种方式布置的,但计算元素、网络和结构的细节差别很大。这些类型的网络最大的问题是扩大带宽和保持低延迟。为了扩大网络规模,特斯拉特别关注于此,这影响了他们设计的每个部分,从芯片材料到封装。\n\n该功能单元被设计为可通过1个时钟周期,但足够大,以至于同步开销和软件不是主要问题。因此,他们得出的设计几乎和Cerebras一模一样。由高速结构连接的单个单元的网状结构,该结构在一个时钟内的功能是单元之间的路由通信。每个单元都有一个大的1.25MB SRAM暂存板和多个具有SIMD功能的超标量CPU核,以及支持所有常见数据类型的矩阵乘法单元。此外,他们还引入了一种名为CFP8的新数据类型,可配置浮点8。每个单元可在BF16 / CFP8上支持1TFlop,FP31上64GFlops,每个方向512GB/s的带宽。\n\nCPU也是毫不逊色,它在矢量管道上是4宽2宽。每个核心可以承载4个线程,以最大限度的提高利用率。遗憾的是,特斯拉使用了定制的ISA,而不是像 RISC V 这样的顶级开源 ISA。这个定制的ISA引入了转置,收集,广播,和链接遍历的指令。\n这354个功能单元的全芯片可达到BF16或CFP8的362 TFlops和FP32的22.6 TFlops。它总共有645mm²和500亿个晶体管。每个芯片都有惊人的400W TDP,这意味着功率密度高于大多数配置的Nvidia A100 GPU。有趣的是,特斯拉实现了每mm²上集成7750万个晶体管的有效晶体管密度,仅次于移动芯片和苹果M1,比其他所有高性能芯片都要高。\n\n基本功能单元的另一个有趣的方面是NOC路由器。它与Tenstorrent有非常类似的在芯片内部和芯片间的扩展方式。毫不意外,特斯拉正在采用与其他备受推崇的人工智能初创公司类似的架构。Tenstorrent 非常适合扩展培训,而特斯拉非常关注这方面。\n在芯片上,特斯拉拥有惊人的10TBps定向带宽,但这个数字在实际工作负载中没有多大意义。特斯拉相对于Tenstorrent的一个巨大优势是芯片之间的带宽要高得多。他们在 112GTs 上有 576 个 SerDes。这产生了总共 64Tb/s 或 8TB/s 的带宽。\n我们不确定特斯拉每条边的4TB/s是从哪里得到的,更有可能是X轴和Y轴上的数字。先不说这张令人困惑的幻灯片,这个芯片的带宽是疯狂的。目前已知的最高外部带宽芯片是32Tb/s网络交换机芯片。特斯拉能够通过大量的SerDes和先进的封装将这个数字翻倍。\n\n特斯拉通过PCIe 4.0将Dojo芯片的计算平面连接到连接主机系统的接口处理器上。这些接口处理器还支持更高的基数网络连接,以补充现有的计算平面网格。\n\n25个D1芯片被封装成 “扇出晶圆工艺(fan out wafer process)”。特斯拉并没有像我们几周前猜测的那样确认这个封装是台积电的集成晶圆扇形系统(InFO_SoW),但考虑到疯狂的芯片间带宽和他们特别提到的扇出晶圆,这看起来很有可能。\n特斯拉开发了一种专有的高带宽连接器,可以保留这些芯片之间的芯片外带宽。每个芯片都有令人印象深刻的9PFlops BF16/CFP8和36tb /s的off-tile带宽。这远远超过了Cerebras的晶圆外带宽,使特斯拉系统的横向扩展能力甚至比横向扩展设计(例如 Tenstorrent 架构)还要好。\n\n电源传输是独一无二的,定制的,也非常令人印象深刻。由于具有如此大的带宽和超过 10KW 的功耗,特斯拉在电力传输方面进行了创新,并垂直供电。定制稳压器调制器直接回流到扇出晶片上。功率、热量和机械都直接与芯片连接。\n\n即使芯片本身的总功率只有10KW,但芯片的总功率仍然是15KW。电力传输、IO和晶圆线也在消耗大量的电力。能量从底部进来,热量从顶部出来。特斯拉的规模单位不是芯片,而是25块芯片。这个贴图远远超过了Nvidia, Graphcore, Cerebras, Groq, Tenstorrent, SambaNova,或任何其他AI训练项目的单位性能和扩展能力。\n所有这些似乎都是非常遥远的技术,但特斯拉声称,他们已经在实验室的真实人工智能网络上以2GHz的频率运行了芯片。\n\n扩展到数千个芯片的下一步是服务器级别。Dojo可扩展为2 x 3的tile配置,在一个服务器中有两个这样的配置。对于那些在家计数的人来说,每个服务器总共有12个tile,每个服务器总共有108个PFlops,超过100,000个功能单元,400,000个定制核和132GB SRAM是令人震惊的数字。\n\n特斯拉不断扩大其网格中的机柜级别。芯片之间没有带宽中断,它是一个具有惊人带宽的同质芯片网格。他们计划扩大到10个机柜、1.1 Exaflops、1,062,000个功能单元、4,248,000个核心和1.33TB的SRAM。\n\n软件方面很有趣,但我们今天不会太深入讨论。他们声称他们可以对其进行虚拟细分。他们说不管集群的大小如何,软件都可以在Dojo处理单元(DPU)之间无缝扩展。Dojo 编译器可以处理硬件计算平面的细粒度并行和映射网络。它可以通过数据模型图并行性来实现这一点,但也可以进行优化以减少内存占用。\n模型并行性可以跨芯片边界扩展,甚至不需要大批量的轻松解锁具有数万亿参数甚至更多参数的下一级AI模型。他们不需要依赖手写的代码来在这个庞大的集群上运行模型。\n总的来说,与英伟达的GPU相比,成本相当,但特斯拉声称他们可以实现4倍的性能,每瓦性能提高1.3倍,减少5倍的面积。特斯拉的TCO优势几乎比英伟达的AI解决方案好一个数量级。如果他们的说法是真的,特斯拉已经超越了人工智能硬件和软件领域的所有人。我对此表示怀疑,但这也是硬件极客的美梦。\n我们都要试图冷静下来,等一等,看看它什么时候会实际部署到生产环境中。","news_type":1},"isVote":1,"tweetType":1,"viewCount":178,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"EN","totalScore":0}],"hots":[{"id":836742227,"gmtCreate":1629530110969,"gmtModify":1633684158726,"author":{"id":"4090666679009510","authorId":"4090666679009510","name":"Jacksim","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4090666679009510","authorIdStr":"4090666679009510"},"themes":[],"htmlText":"[强] [强] [强] ","listText":"[强] [强] [强] ","text":"[强] [强] [强]","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":4,"commentSize":1,"repostSize":0,"link":"https://laohu8.com/post/836742227","repostId":"2160582710","repostType":4,"repost":{"id":"2160582710","pubTimestamp":1629513324,"share":"https://www.laohu8.com/m/news/2160582710?lang=&edition=full","pubTime":"2021-08-21 10:35","market":"sh","language":"zh","title":"即将推出MSCI中国A50指数期货,会给A股带来什么?","url":"https://stock-news.laohu8.com/highlight/detail?id=2160582710","media":"界面新闻","summary":"香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越","content":"<div>\n<p>香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越多国际投资者通过沪深港通进入中国内地市场。\n据了解,香港交易所已经与全球领先的投资决策支持工具和服务供应商MSCI 签订新的授权协议,推出以MSCI中国A50互联互通指数为标的期货合约。\nMSCI...</p>\n\n<a href=\"https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml\">Web Link</a>\n\n</div>\n","source":"sina_symbol","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>即将推出MSCI中国A50指数期货,会给A股带来什么?</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n即将推出MSCI中国A50指数期货,会给A股带来什么?\n</h2>\n\n<h4 class=\"meta\">\n\n\n2021-08-21 10:35 北京时间 <a href=https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml><strong>界面新闻</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越多国际投资者通过沪深港通进入中国内地市场。\n据了解,香港交易所已经与全球领先的投资决策支持工具和服务供应商MSCI 签订新的授权协议,推出以MSCI中国A50互联互通指数为标的期货合约。\nMSCI...</p>\n\n<a href=\"https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/7e98e87e70d708bbd7b223988c7e784e","relate_stocks":{"510030":"价值ETF","510050":"上证50ETF","512550":"A50ETF基金","000300.SH":"沪深300","XPP":"二倍做多富时中国50ETF(ProShares)","000016.SH":"上证50","YXI":"ProShares做空FTSE中国50ETF","00388":"香港交易所","FXP":"二倍做空富时中国50ETF-ProShares"},"source_url":"https://cj.sina.cn/article/normal_detail?url=https://finance.sina.com.cn/tech/2021-08-20/doc-ikqcfncc4060135.shtml","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"2160582710","content_text":"香港交易所引入离岸内地股票衍生工具产品组合计划迈出关键一步。\n8月20日,港交所宣布推出首只A股指数期货产品。新期货合约将为国际投资者提供一个有效管理其沪深港通合资格A股投资组合风险的工具,反映越来越多国际投资者通过沪深港通进入中国内地市场。\n据了解,香港交易所已经与全球领先的投资决策支持工具和服务供应商MSCI 签订新的授权协议,推出以MSCI中国A50互联互通指数为标的期货合约。\nMSCI中国A50互联互通指数将追踪50只通过沪深港通交易的主要沪深股票表现。这只离岸交易、并有均衡行业代表性的中国A股指数期货产品,将于2021年10月18日推出。\n港交所行政总裁欧冠升表示:“今天宣布推出的A股指数期货,标志着我们在推进于香港建立离岸中国内地股票衍生产品系列迈出了关键一步。与MSCI的长期合作关系亦更为紧密,共同努力发展香港成为亚洲顶尖衍生产品交易中心,提升香港市场投资产品的深度及广度。这只新产品将为投资者提供一个有效管理A股相关资产风险的工具。”\n对于新指数期货对A股市场的意义,欧冠升认为,A股指数期货的推出为国际投资者提供了管理A股投资风险的低成本且方便的工具,将有助于提升国际投资者对A股的兴趣和需求,吸引更多国际投资者进入中国内地股票市场。\n“新的指数期货为国际投资者提供更多投资选择,将支持和推动中国A股市场进一步开放和国际化,进一步增强A股市场活力和流动性。”欧冠升补充道。\n对于新指数期货对香港的意义,在欧冠升看来,这是香港首个A股期货产品,将进一步丰富香港交易所现有的人民币相关产品组合,为投资者提供更多的风险管理工具。\n“与我们的沪深港通计划相配合,为国际投资者投资及管理A股持仓风险提供一站式的解决方案。有助于增强香港交易所的竞争力,进一步巩固香港作为连接中国与世界的国际金融中心地位。”他表示。\n据MSCI方面提供的数据,过去四年(2016年末至2020年末),外资对中国A股持股市值增长了80%,其中90%的外资持股源于沪股通和深股通。为反映此强劲增长,MSCI建立了基于中国A股基准的产品生态系统。\n界面新闻记者留意到,这份新协议基于香港交易所与 MSCI 早前签订的授权协议,并于去年成功推出了一系列 MSCI 亚洲及新兴市场期货和期权,延续香港交易所与 MSCI 的持续战略合作关系。\n截止目前,香港交易所已推出41只追踪MSCI指数的衍生产品。\n据港交所将介绍,MSCI中国A50互联互通指数将会涵盖中国内地A股大型股中的50只股票,目标为每个行业至少两只,以全面反映中国的经济状况。该指数包含 50只合资格沪深港通交易的股票,并与主要 MSCI A股指数的历史表现高度相关。\n基于互联互通机制,该指数采用创新的行业中性策略(Sector-neutral approach),遵循其母指数MSCI 中国 A 股指数的行业权重配置,并通过纳入全球行业分类标准范围内各行业最大的两只股票平衡行业代表性。该指数可作为指数挂钩投资产品的基础,例如交易所交易基金(ETF)、交易所交易票据(ETN)、公募基金、结构性产品及其他指数工具。\n自2014年推出以来,连接香港和内地股票市场的沪深港通已成为国际投资者进入A股市场的主要渠道,并帮助促成了中国A股纳入全球主要指数。\n沪深港通成交量在 2021 年第一季再创新高,北向和南向交易的日均成交额分别大幅增加至1268 亿元人民币和 608 亿港元。\n中泰国际策略分析师颜招骏向界面新闻表示,港交所此举是给机构投资者提供一个A股风险管理的工具,降低组合波动性。\n“港交所提供更多A股相关投资产品乃大势所趋。”他补充道。\n香颂资本执行董事沈萌告诉界面新闻,指数期货是一种金融衍生品,A股期货对于A股行情具有很大的指向性意义,甚至在某些时段会具有A股行情的前瞻作用,同时也可以作为A股投资的对冲工具。\n沈萌认为,在内地,股市的指数期货还不完善,目前只有新加坡市场的A50,无法充分管控A股的波动风险。与内地更紧密的港交所推出相关指数期货,可以在一定程度上对冲恶意做空和打压A股的操作。","news_type":1},"isVote":1,"tweetType":1,"viewCount":564,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":824096466,"gmtCreate":1634260603866,"gmtModify":1634274406782,"author":{"id":"4090666679009510","authorId":"4090666679009510","name":"Jacksim","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4090666679009510","authorIdStr":"4090666679009510"},"themes":[],"htmlText":"<a href=\"https://laohu8.com/S/TIGR\">$老虎证券(TIGR)$</a>心都碎了","listText":"<a href=\"https://laohu8.com/S/TIGR\">$老虎证券(TIGR)$</a>心都碎了","text":"$老虎证券(TIGR)$心都碎了","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":3,"commentSize":1,"repostSize":0,"link":"https://laohu8.com/post/824096466","isVote":1,"tweetType":1,"viewCount":1127,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"CN","totalScore":0},{"id":836741524,"gmtCreate":1629529589168,"gmtModify":1633684161084,"author":{"id":"4090666679009510","authorId":"4090666679009510","name":"Jacksim","avatar":"https://static.tigerbbs.com/cad02c18681a5073da96066b242bdaca","crmLevel":1,"crmLevelSwitch":0,"followedFlag":false,"idStr":"4090666679009510","authorIdStr":"4090666679009510"},"themes":[],"htmlText":"Good... ","listText":"Good... ","text":"Good...","images":[],"top":1,"highlighted":1,"essential":1,"paper":1,"likeSize":3,"commentSize":0,"repostSize":0,"link":"https://laohu8.com/post/836741524","repostId":"2161746147","repostType":4,"repost":{"id":"2161746147","pubTimestamp":1629514858,"share":"https://www.laohu8.com/m/news/2161746147?lang=&edition=full","pubTime":"2021-08-21 11:00","market":"us","language":"zh","title":"特斯拉Dojo芯片,领先竞争对手一个数量级","url":"https://stock-news.laohu8.com/highlight/detail?id=2161746147","media":"半导体行业观察","summary":"特斯拉刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CP","content":"<p><a href=\"https://laohu8.com/S/TSLA\">特斯拉</a>刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机IO。</p>\n<p>几周前,我们推测该系统的封装是 TSMC 晶圆集成扇出系统 (InFO_SoW)。我们解释了这种类型的封装的好处以及这种大规模扩展训练芯片所涉及的冷却和功耗。此外,我们估计该软件包的性能将优于 Nvidia 系统。所有这些似乎都是有根据的推测。今天,我们将深入的挖掘更多的半导体细节。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110451514v197zlc3kf89g5a\" tg-width=\"1080\" tg-height=\"504\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>在我们深入讨论硬件之前,让我们先谈谈评估基础架构。特斯拉不断地重新训练和改进他们的神经网络。他们评估任何代码更改以查看是否有改进。在汽车和服务器中部署了数以千计的相同芯片。他们每周进行数百万次评估。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110452695v197e2lm3fz76i2\" tg-width=\"1080\" tg-height=\"568\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>多年来,特斯拉一直在扩大其GPU集群的规模。如果特斯拉停止所有实际工作负载,运行Linpack,并将其提交到Top500榜单,他们目前的训练集群将成为第五大超级计算机。然而,对于特斯拉和其雄心来说,这种性能的扩展是不够的,所以他们在几年前就开始开发自己的Dojo芯片项目。特斯拉需要更高的性能,以节能且经济高效的方式实现更大、更复杂的神经网络。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110453776v197jx2k68fhcml\" tg-width=\"1080\" tg-height=\"490\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>特斯拉的架构解决方案是分布式计算架构。当我们听他们的细节时,这个架构看起来很像Cerberus。我们分析了Cerebras晶圆级引擎及其架构。每个AI训练架构都是以这种方式布置的,但计算元素、网络和结构的细节差别很大。这些类型的网络最大的问题是扩大带宽和保持低延迟。为了扩大网络规模,特斯拉特别关注于此,这影响了他们设计的每个部分,从芯片材料到封装。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110454722v197cx5xiqu333q\" tg-width=\"1080\" tg-height=\"599\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>该功能单元被设计为可通过1个时钟周期,但足够大,以至于同步开销和软件不是主要问题。因此,他们得出的设计几乎和Cerebras一模一样。由高速结构连接的单个单元的网状结构,该结构在一个时钟内的功能是单元之间的路由通信。每个单元都有一个大的1.25MB SRAM暂存板和多个具有SIMD功能的超标量CPU核,以及支持所有常见数据类型的矩阵乘法单元。此外,他们还引入了一种名为CFP8的新数据类型,可配置浮点8。每个单元可在BF16 / CFP8上支持1TFlop,FP31上64GFlops,每个方向512GB/s的带宽。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110500799v197xhcnedchtus\" tg-width=\"1080\" tg-height=\"572\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>CPU也是毫不逊色,它在矢量管道上是4宽2宽。每个核心可以承载4个线程,以最大限度的提高利用率。遗憾的是,特斯拉使用了定制的ISA,而不是像 RISC V 这样的顶级开源 ISA。这个定制的ISA引入了转置,收集,广播,和链接遍历的指令。</p>\n<p>这354个功能单元的全芯片可达到BF16或CFP8的362 TFlops和FP32的22.6 TFlops。它总共有645mm²和500亿个晶体管。每个芯片都有惊人的400W TDP,这意味着功率密度高于大多数配置的Nvidia A100 GPU。有趣的是,特斯拉实现了每mm²上集成7750万个晶体管的有效晶体管密度,仅次于移动芯片和<a href=\"https://laohu8.com/S/AAPL\">苹果</a>M1,比其他所有高性能芯片都要高。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110503440v197lagxvjg0azx\" tg-width=\"1080\" tg-height=\"557\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>基本功能单元的另一个有趣的方面是NOC路由器。它与Tenstorrent有非常类似的在芯片内部和芯片间的扩展方式。毫不意外,特斯拉正在采用与其他备受推崇的人工智能初创公司类似的架构。Tenstorrent 非常适合扩展培训,而特斯拉非常关注这方面。</p>\n<p>在芯片上,特斯拉拥有惊人的10TBps定向带宽,但这个数字在实际工作负载中没有多大意义。特斯拉相对于Tenstorrent的一个巨大优势是芯片之间的带宽要高得多。他们在 112GTs 上有 576 个 SerDes。这产生了总共 64Tb/s 或 8TB/s 的带宽。</p>\n<p>我们不确定特斯拉每条边的4TB/s是从哪里得到的,更有可能是X轴和Y轴上的数字。先不说这张令人困惑的幻灯片,这个芯片的带宽是疯狂的。目前已知的最高外部带宽芯片是32Tb/s网络交换机芯片。特斯拉能够通过大量的SerDes和先进的封装将这个数字翻倍。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110506551v1979x5minzarss\" tg-width=\"1080\" tg-height=\"487\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>特斯拉通过PCIe 4.0将Dojo芯片的计算平面连接到连接主机系统的接口处理器上。这些接口处理器还支持更高的基数网络连接,以补充现有的计算平面网格。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110513356v197ye4od4q94c8\" tg-width=\"1080\" tg-height=\"586\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>25个D1芯片被封装成 “扇出晶圆工艺(fan out wafer process)”。特斯拉并没有像我们几周前猜测的那样确认这个封装是<a href=\"https://laohu8.com/S/TSM\">台积电</a>的集成晶圆扇形系统(InFO_SoW),但考虑到疯狂的芯片间带宽和他们特别提到的扇出晶圆,这看起来很有可能。</p>\n<p>特斯拉开发了一种专有的高带宽连接器,可以保留这些芯片之间的芯片外带宽。每个芯片都有令人印象深刻的9PFlops BF16/CFP8和36tb /s的off-tile带宽。这远远超过了Cerebras的晶圆外带宽,使特斯拉系统的横向扩展能力甚至比横向扩展设计(例如 Tenstorrent 架构)还要好。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110515346v197ep16cl0iw6o\" tg-width=\"1080\" tg-height=\"765\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>电源传输是独一无二的,定制的,也非常令人印象深刻。由于具有如此大的带宽和超过 10KW 的功耗,特斯拉在电力传输方面进行了创新,并垂直供电。定制稳压器调制器直接回流到扇出晶片上。功率、热量和机械都直接与芯片连接。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110516207v1975u9vgzz63ni\" tg-width=\"1080\" tg-height=\"594\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>即使芯片本身的总功率只有10KW,但芯片的总功率仍然是15KW。电力传输、IO和晶圆线也在消耗大量的电力。能量从底部进来,热量从顶部出来。特斯拉的规模单位不是芯片,而是25块芯片。这个贴图远远超过了Nvidia, Graphcore, Cerebras, Groq, Tenstorrent, SambaNova,或任何其他AI训练项目的单位性能和扩展能力。</p>\n<p>所有这些似乎都是非常遥远的技术,但特斯拉声称,他们已经在实验室的真实人工智能网络上以2GHz的频率运行了芯片。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110518184v197qyjtg5phst7\" tg-width=\"1080\" tg-height=\"715\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>扩展到数千个芯片的下一步是服务器级别。Dojo可扩展为2 x 3的tile配置,在一个服务器中有两个这样的配置。对于那些在家计数的人来说,每个服务器总共有12个tile,每个服务器总共有108个PFlops,超过100,000个功能单元,400,000个定制核和132GB SRAM是令人震惊的数字。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110519282v197ncjdhvmc22t\" tg-width=\"1080\" tg-height=\"482\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>特斯拉不断扩大其网格中的机柜级别。芯片之间没有带宽中断,它是一个具有惊人带宽的同质芯片网格。他们计划扩大到10个机柜、1.1 Exaflops、1,062,000个功能单元、4,248,000个核心和1.33TB的SRAM。</p>\n<p><img src=\"https://fid-75186.picgzc.qpic.cn/20210821110520332v197acj94hjb924\" tg-width=\"1031\" tg-height=\"825\" referrerpolicy=\"no-referrer\" width=\"100%\" height=\"auto\"></p>\n<p>软件方面很有趣,但我们今天不会太深入讨论。他们声称他们可以对其进行虚拟细分。他们说不管集群的大小如何,软件都可以在Dojo处理单元(DPU)之间无缝扩展。Dojo 编译器可以处理硬件计算平面的细粒度并行和映射网络。它可以通过数据模型图并行性来实现这一点,但也可以进行优化以减少内存占用。</p>\n<p>模型并行性可以跨芯片边界扩展,甚至不需要大批量的轻松解锁具有数万亿参数甚至更多参数的下一级AI模型。他们不需要依赖手写的代码来在这个庞大的集群上运行模型。</p>\n<p>总的来说,与<a href=\"https://laohu8.com/S/NVDA\">英伟达</a>的GPU相比,成本相当,但特斯拉声称他们可以实现4倍的性能,每瓦性能提高1.3倍,减少5倍的面积。特斯拉的TCO优势几乎比英伟达的AI解决方案好一个数量级。如果他们的说法是真的,特斯拉已经超越了人工智能硬件和软件领域的所有人。我对此表示怀疑,但这也是硬件极客的美梦。</p>\n<p>我们都要试图冷静下来,等一等,看看它什么时候会实际部署到生产环境中。</p>","source":"bdthygc","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>特斯拉Dojo芯片,领先竞争对手一个数量级</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n特斯拉Dojo芯片,领先竞争对手一个数量级\n</h2>\n\n<h4 class=\"meta\">\n\n\n2021-08-21 11:00 北京时间 <a href=https://mp.weixin.qq.com/s/EPgSUdG_3_t3XpeXVQne0A><strong>半导体行业观察</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>特斯拉刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机IO。\n几周前,我们推测该系统的封装是 TSMC 晶圆集成扇出系统 (InFO_SoW)。我们解释了这种类型的封装的好处以及这种大规模扩展训练芯片所涉及的冷却和功耗。...</p>\n\n<a href=\"https://mp.weixin.qq.com/s/EPgSUdG_3_t3XpeXVQne0A\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/e49ab90f6352b6ebbb45091ad18b5a2e","relate_stocks":{"TSLA":"特斯拉"},"source_url":"https://mp.weixin.qq.com/s/EPgSUdG_3_t3XpeXVQne0A","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"2161746147","content_text":"特斯拉刚刚召开了他们的人工智能日,并透露了其软件和硬件基础设施的内部工作原理。此次公开的部分一是之前公开的Dojo AI训练芯片。特斯拉称他们的 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机IO。\n几周前,我们推测该系统的封装是 TSMC 晶圆集成扇出系统 (InFO_SoW)。我们解释了这种类型的封装的好处以及这种大规模扩展训练芯片所涉及的冷却和功耗。此外,我们估计该软件包的性能将优于 Nvidia 系统。所有这些似乎都是有根据的推测。今天,我们将深入的挖掘更多的半导体细节。\n\n在我们深入讨论硬件之前,让我们先谈谈评估基础架构。特斯拉不断地重新训练和改进他们的神经网络。他们评估任何代码更改以查看是否有改进。在汽车和服务器中部署了数以千计的相同芯片。他们每周进行数百万次评估。\n\n多年来,特斯拉一直在扩大其GPU集群的规模。如果特斯拉停止所有实际工作负载,运行Linpack,并将其提交到Top500榜单,他们目前的训练集群将成为第五大超级计算机。然而,对于特斯拉和其雄心来说,这种性能的扩展是不够的,所以他们在几年前就开始开发自己的Dojo芯片项目。特斯拉需要更高的性能,以节能且经济高效的方式实现更大、更复杂的神经网络。\n\n特斯拉的架构解决方案是分布式计算架构。当我们听他们的细节时,这个架构看起来很像Cerberus。我们分析了Cerebras晶圆级引擎及其架构。每个AI训练架构都是以这种方式布置的,但计算元素、网络和结构的细节差别很大。这些类型的网络最大的问题是扩大带宽和保持低延迟。为了扩大网络规模,特斯拉特别关注于此,这影响了他们设计的每个部分,从芯片材料到封装。\n\n该功能单元被设计为可通过1个时钟周期,但足够大,以至于同步开销和软件不是主要问题。因此,他们得出的设计几乎和Cerebras一模一样。由高速结构连接的单个单元的网状结构,该结构在一个时钟内的功能是单元之间的路由通信。每个单元都有一个大的1.25MB SRAM暂存板和多个具有SIMD功能的超标量CPU核,以及支持所有常见数据类型的矩阵乘法单元。此外,他们还引入了一种名为CFP8的新数据类型,可配置浮点8。每个单元可在BF16 / CFP8上支持1TFlop,FP31上64GFlops,每个方向512GB/s的带宽。\n\nCPU也是毫不逊色,它在矢量管道上是4宽2宽。每个核心可以承载4个线程,以最大限度的提高利用率。遗憾的是,特斯拉使用了定制的ISA,而不是像 RISC V 这样的顶级开源 ISA。这个定制的ISA引入了转置,收集,广播,和链接遍历的指令。\n这354个功能单元的全芯片可达到BF16或CFP8的362 TFlops和FP32的22.6 TFlops。它总共有645mm²和500亿个晶体管。每个芯片都有惊人的400W TDP,这意味着功率密度高于大多数配置的Nvidia A100 GPU。有趣的是,特斯拉实现了每mm²上集成7750万个晶体管的有效晶体管密度,仅次于移动芯片和苹果M1,比其他所有高性能芯片都要高。\n\n基本功能单元的另一个有趣的方面是NOC路由器。它与Tenstorrent有非常类似的在芯片内部和芯片间的扩展方式。毫不意外,特斯拉正在采用与其他备受推崇的人工智能初创公司类似的架构。Tenstorrent 非常适合扩展培训,而特斯拉非常关注这方面。\n在芯片上,特斯拉拥有惊人的10TBps定向带宽,但这个数字在实际工作负载中没有多大意义。特斯拉相对于Tenstorrent的一个巨大优势是芯片之间的带宽要高得多。他们在 112GTs 上有 576 个 SerDes。这产生了总共 64Tb/s 或 8TB/s 的带宽。\n我们不确定特斯拉每条边的4TB/s是从哪里得到的,更有可能是X轴和Y轴上的数字。先不说这张令人困惑的幻灯片,这个芯片的带宽是疯狂的。目前已知的最高外部带宽芯片是32Tb/s网络交换机芯片。特斯拉能够通过大量的SerDes和先进的封装将这个数字翻倍。\n\n特斯拉通过PCIe 4.0将Dojo芯片的计算平面连接到连接主机系统的接口处理器上。这些接口处理器还支持更高的基数网络连接,以补充现有的计算平面网格。\n\n25个D1芯片被封装成 “扇出晶圆工艺(fan out wafer process)”。特斯拉并没有像我们几周前猜测的那样确认这个封装是台积电的集成晶圆扇形系统(InFO_SoW),但考虑到疯狂的芯片间带宽和他们特别提到的扇出晶圆,这看起来很有可能。\n特斯拉开发了一种专有的高带宽连接器,可以保留这些芯片之间的芯片外带宽。每个芯片都有令人印象深刻的9PFlops BF16/CFP8和36tb /s的off-tile带宽。这远远超过了Cerebras的晶圆外带宽,使特斯拉系统的横向扩展能力甚至比横向扩展设计(例如 Tenstorrent 架构)还要好。\n\n电源传输是独一无二的,定制的,也非常令人印象深刻。由于具有如此大的带宽和超过 10KW 的功耗,特斯拉在电力传输方面进行了创新,并垂直供电。定制稳压器调制器直接回流到扇出晶片上。功率、热量和机械都直接与芯片连接。\n\n即使芯片本身的总功率只有10KW,但芯片的总功率仍然是15KW。电力传输、IO和晶圆线也在消耗大量的电力。能量从底部进来,热量从顶部出来。特斯拉的规模单位不是芯片,而是25块芯片。这个贴图远远超过了Nvidia, Graphcore, Cerebras, Groq, Tenstorrent, SambaNova,或任何其他AI训练项目的单位性能和扩展能力。\n所有这些似乎都是非常遥远的技术,但特斯拉声称,他们已经在实验室的真实人工智能网络上以2GHz的频率运行了芯片。\n\n扩展到数千个芯片的下一步是服务器级别。Dojo可扩展为2 x 3的tile配置,在一个服务器中有两个这样的配置。对于那些在家计数的人来说,每个服务器总共有12个tile,每个服务器总共有108个PFlops,超过100,000个功能单元,400,000个定制核和132GB SRAM是令人震惊的数字。\n\n特斯拉不断扩大其网格中的机柜级别。芯片之间没有带宽中断,它是一个具有惊人带宽的同质芯片网格。他们计划扩大到10个机柜、1.1 Exaflops、1,062,000个功能单元、4,248,000个核心和1.33TB的SRAM。\n\n软件方面很有趣,但我们今天不会太深入讨论。他们声称他们可以对其进行虚拟细分。他们说不管集群的大小如何,软件都可以在Dojo处理单元(DPU)之间无缝扩展。Dojo 编译器可以处理硬件计算平面的细粒度并行和映射网络。它可以通过数据模型图并行性来实现这一点,但也可以进行优化以减少内存占用。\n模型并行性可以跨芯片边界扩展,甚至不需要大批量的轻松解锁具有数万亿参数甚至更多参数的下一级AI模型。他们不需要依赖手写的代码来在这个庞大的集群上运行模型。\n总的来说,与英伟达的GPU相比,成本相当,但特斯拉声称他们可以实现4倍的性能,每瓦性能提高1.3倍,减少5倍的面积。特斯拉的TCO优势几乎比英伟达的AI解决方案好一个数量级。如果他们的说法是真的,特斯拉已经超越了人工智能硬件和软件领域的所有人。我对此表示怀疑,但这也是硬件极客的美梦。\n我们都要试图冷静下来,等一等,看看它什么时候会实际部署到生产环境中。","news_type":1},"isVote":1,"tweetType":1,"viewCount":178,"authorTweetTopStatus":1,"verified":2,"comments":[],"imageCount":0,"langContent":"EN","totalScore":0}],"lives":[]}