HZFOX
05-15
没一个可打的,全是零碎的功能,pr差的一踏糊涂
AI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAI
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
分享至
微信
复制链接
精彩评论
我们需要你的真知灼见来填补这片空白
打开APP,发表看法
APP内打开
发表看法
{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":305936732598488,"tweetId":"305936732598488","gmtCreate":1715726156502,"gmtModify":1715726158441,"author":{"id":31402196173656,"idStr":"31402196173656","authorId":31402196173656,"authorIdStr":"31402196173656","name":"HZFOX","avatar":"https://static.tigerbbs.com/1d66119c214d7313aac150b033e17113","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":2,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":3,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"html":"<html><head></head><body><p>没一个可打的,全是零碎的功能,pr差的一踏糊涂</p></body></html>","htmlText":"<html><head></head><body><p>没一个可打的,全是零碎的功能,pr差的一踏糊涂</p></body></html>","text":"没一个可打的,全是零碎的功能,pr差的一踏糊涂","highlighted":1,"essential":1,"paper":1,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/305936732598488","repostId":1151865178,"repostType":4,"repost":{"id":"1151865178","kind":"news","pubTimestamp":1715722921,"share":"https://www.laohu8.com/m/news/1151865178?lang=&edition=full","pubTime":"2024-05-15 05:42","market":"us","language":"zh","title":"AI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAI","url":"https://stock-news.laohu8.com/highlight/detail?id=1151865178","media":"硬AI","summary":"AI搜索正是Pichai提到的Gemini融入谷歌多种服务之一。Gemini 1.5 Pro上下文窗口200万token全球最长谷歌称,推出号称有史以来最强大AI模型Gemini Advanced三个月内,已有超过100用户注册。有网友评论称,想知道相比OpenAI周一发布的最新旗舰模型GPT-4o,Gemini的对话功能会有多好。谷歌称,将很快为模型Gemini Nano添加多模式功能。谷歌称,今年晚些时候,Gemini Nano的辅助功能TalkBack将增强。","content":"<html><head></head><body><blockquote><p>Gemini 1.5 Pro上下文窗口200万token,号称聊天机器人中的全球最长窗口;Gemini新增语音对话功能Live,与OpenAI新模型GPT-4o一较高下;Gemini将可根据用户需求定制;谷歌的多模态AI项目Project Astra可回答手机摄像头所拍的物体相关问题,安卓端侧Gemini增加多模态功能。</p></blockquote><p style=\"text-align: justify;\">虽然被OpenAI抢在前面发布了重磅新品演示,但谷歌后发制人,做到了OpenAI还没能做到的事,率先发布人工智能(AI)搜索引擎,捍卫搜索领域的王者地位,同时对垒OpenAI新发布的旗舰模型GPT-4o,以升级版的最强大AI模型Gemini迎战。</p><p style=\"text-align: justify;\">美东时间5月24日周二举行的年度Google I/O开发者大会上,谷歌CEO Sundar Pichai表示,谷歌所有的工作都围绕生成式AI模型Gemini来做,“我们希望每个人都能从Gemini 所做的事中受益。” 将生成式AI引入搜索的AI搜索引擎正是Pichai提到的Gemini融入谷歌多种服务之一。</p><p style=\"text-align: justify;\">Pichai宣布,本周,AI技术生成摘要的功能将上线美国的谷歌搜索,它名为AI Overviews,并很快会在更多国家地区推出。</p><p style=\"text-align: justify;\">通过多步推理,Gemini可以代替用户研究,找到更好的搜索结果。比如谷歌搜索中的Gemini可以通过汇总一天中的所有膳食以及所有菜肴的食谱,为用户规划膳食。如果用户觉得做饭太麻烦,谷歌搜索还可以在Gemini的帮助下,为用户找到可以购买用户所需餐食的地方。</p><p style=\"text-align: justify;\">在Gemini的帮助下,用户的搜索结果页面也会发生变化,比如寻找有现场音乐的餐厅,它甚至可以根据不同的季节做推荐,比如显示有屋顶的餐厅。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/35e8ddfe7b5ade0df35bbdb6fb30c008\" tg-width=\"640\" tg-height=\"360\"/></p><p style=\"text-align: justify;\">Pichai现场演示,借助Gemini 的强大功能,在谷歌相册Google Photos可以进行更多的相关搜索,比如通过名为Ask Photos with Gemini的新功能让Gemini找到用户想要的车牌照号,Gemini将根据上下文响应在相册中搜索,并选出用户想要的照片,得到照片中拍到的车牌照号。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/28ea72191a5f92a6e47c547a98db5d33\" tg-width=\"640\" tg-height=\"360\"/></p><p style=\"text-align: justify;\">谷歌云计算生产力和协作平台Google Workspace的许多服务将结合Gemini,例如用Gemini 在Gmail中搜索特定发件人发出的电邮,在线上网络和视频会议Google Meeting中找到亮点。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/92b518d45f551fe45057ddac883333d7\" tg-width=\"640\" tg-height=\"360\"/></p><p style=\"text-align: justify;\">Gemini可用于搜索用户的手机,帮用户查找收据、安排取货窗口。如果用户计划旅行,Gemini 可以用来搜索有趣的活动。Pichai表示,谷歌正在“让AI对每个人都有帮助”。</p><p style=\"text-align: justify;\">谷歌称,用户将可以直接在搜索中通过视频提问。谷歌高管演示了,如何借助视频搜索修复损坏的电唱机。具体做法是,先录制视频展示损坏的问题,然后询问,为什么电唱机无法正常工作。谷歌搜索就能够进行逐帧搜索,回答高管的问题。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/05070ddfe19391317588d8bb1cfa7d44\" tg-width=\"640\" tg-height=\"360\"/></p><h2 id=\"id_4168763219\">Gemini 1.5 Pro上下文窗口200万token 全球最长</h2><p style=\"text-align: justify;\">谷歌称,推出号称有史以来最强大AI模型Gemini Advanced三个月内,已有超过100用户注册。</p><p style=\"text-align: justify;\">从本周二起,谷歌在Gemini Advanced中加入新模型成员Gemini 1.5 Pro,称它拥有的上下文窗口在全球消费类聊天机器人中最长,窗口起始就有100万个token。Gemini 1.5 Pro将向150 多个国家地区的Gemini Advanced订阅者提供,支持超过35 种语言。</p><p style=\"text-align: justify;\">Pichai称,Gemini 1.5 Pro“提供了迄今为止所有基础模型中最长的上下文窗口。” 他介绍,Gemini 1.5 Pro将拥有200 万个token的上下文窗口,是当前模型100万个token窗口的两倍。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/d5cf9339c17dc6842614eff633d8e906\" tg-width=\"640\" tg-height=\"425\"/></p><p style=\"text-align: justify;\"> </p><h2 id=\"id_1891172161\">Gemini新语音对话功能Live 定制版Gemini</h2><p style=\"text-align: justify;\">谷歌称,今年夏季将扩展 Gemini 的多模态功能,包括增加用语音进行深入双向对话的能力,该功能被称为 Live。通过 Gemini Live,用户可以与 Gemini 交谈,并可以从各种自然的声音中选择它回应的声音。 用户甚至可以按照自己的节奏说话,或者在回答过程中打断并澄清问题,就像在任何人类对话中一样。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/59ec277877c31a2537ca86460f82e665\" tg-width=\"640\" tg-height=\"691\"/></p><p style=\"text-align: justify;\">有网友评论称,想知道相比OpenAI周一发布的最新旗舰模型GPT-4o,Gemini的对话功能会有多好。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/23b4bdcda59e070afff45761b09728ce\" tg-width=\"640\" tg-height=\"139\"/></p><p style=\"text-align: justify;\">谷歌称,今年夏季,将在Gemini Advanced 中添加新的旅行规划功能。借助考虑时间和空间方面物流的先进推理,Gemini将能够创建个性化的行程,节省用户的工作时间。</p><p style=\"text-align: justify;\">未来几周,谷歌将在Gemini Advanced中添加新的数据分析功能。用户只需上传电子表格,Gemini 就可以分析数据、制作图表,并更快地发掘见解。</p><p style=\"text-align: justify;\">谷歌将推出被称为Gem的Gemini的定制版本。Gemini Advanced 订阅者将很快可以获得更个性化的体验,根据自己的需要创建Gemini,只需描述用户希望 Gem 做什么以及希望它如何响应,就可以让它化身健身伙伴、主厨帮手、编代码的拍档或者创意写作指南。</p><p style=\"text-align: justify;\">例如,用户可以要求Gemini:做我的跑步教练,给我一个每天跑步的计划,而且保持积极、乐观、激励我。Gemini将接收这些说明,用户只需单击一下,即可强化这方面的特质,创建一个满足特定需求的Gem。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/176fb820536cdb32346155c4957ba01e\" tg-width=\"640\" tg-height=\"367\"/></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/f1ea866ab6a82fa62fe0a7999b713355\" tg-width=\"640\" tg-height=\"330\"/></p><h2 id=\"id_1715763164\">Project Astra回答手机所拍物问题 安卓端侧Gemini增加多模态功能</h2><p style=\"text-align: justify;\">谷歌官宣推出新的多模态AI项目Project Astra,它可以为用户解释智能手机拍到的东西。在谷歌展示的视频中,只要将手机摄像头对准某个物体,Gemini就可以识别它,比如一个红苹果,还可以回答诸如镜头中什么东西是可以发声的这种问题。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c497df355484770682da940ccf3b4f33\" tg-width=\"640\" tg-height=\"360\"/></p><p style=\"text-align: justify;\">谷歌称,将很快为模型Gemini Nano添加多模式功能。这意味着,用户的手机可以通过文本、图像、声音和口语,按照用户理解的方式理解世界。</p><p style=\"text-align: justify;\">谷歌称,端侧安卓系统手机版的Gemini Nano将更有帮助,更有上下文的意识。今年,安卓手机的用户将可以将生成的图像拖放到Google Messages 和 Gmail 中,并可以直接在手机上提出有关YouTube视频和 PDF文件的问题,得到解答。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/225157788e35019f41a68021a2ddd1f2\" tg-width=\"640\" tg-height=\"607\"/></p><p style=\"text-align: justify;\">谷歌称,今年晚些时候,Gemini Nano的辅助功能TalkBack将增强。图像描述将更加清晰和丰富,帮助弱视用户和盲人用户通过语音反馈,更好地指示他们的手机。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b5fde9910aecabb481335599f27ea373\" tg-width=\"640\" tg-height=\"709\"/></p><p style=\"text-align: justify;\">对周二谷歌开发者大会的所有发布和演示内容,谷歌Health AI产品经理Charlene Wang在社交媒体X评论称,除了AI代理和AI Teammates之外,她从中得到的主要收获实际上是 Gmail、搜索、Workspace 甚至 Chat 未来几个月会变得更有用。目前有大量具有杀手级用户体验的产品引人注目,而将所有内容组织并同步在一个空间中的想法将是使用谷歌产品最令人信服的理由。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/afff9cdba4aa00c7400ebe9cecd1a689\" tg-width=\"640\" tg-height=\"197\"/></p><p style=\"text-align: justify;\">有网友则认为,谷歌的整场活动没有达到苹果的水准,呼吁谷歌的高管向苹果学一学,称喜欢Project Astra项目的东西,但并没有觉得很兴奋,因为OpenAI周一已经发布类似的了。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/3d2274b0400f34acc5146a64c0717e1c\" tg-width=\"640\" tg-height=\"168\"/></p><p style=\"text-align: justify;\">还有网友称,周二的活动中没有听到任何和安卓15系统或相关硬件有关的东西,不知谷歌是不是要把它们保留到今年10月的发布会再亮相。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/3c0006c54883a0f7979dd7abff70f697\" tg-width=\"640\" tg-height=\"160\"/></p></body></html>","source":"lsy1690508328926","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>AI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAI</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\nAI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAI\n</h2>\n\n<h4 class=\"meta\">\n\n\n2024-05-15 05:42 北京时间 <a href=https://wallstreetcn.com/articles/3714906><strong>硬AI</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>Gemini 1.5 Pro上下文窗口200万token,号称聊天机器人中的全球最长窗口;Gemini新增语音对话功能Live,与OpenAI新模型GPT-4o一较高下;Gemini将可根据用户需求定制;谷歌的多模态AI项目Project Astra可回答手机摄像头所拍的物体相关问题,安卓端侧Gemini增加多模态功能。虽然被OpenAI抢在前面发布了重磅新品演示,但谷歌后发制人,做到了...</p>\n\n<a href=\"https://wallstreetcn.com/articles/3714906\">Web Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/f348812ea39b45cad3d64af127992eb9","relate_stocks":{"IE00BJJMRY28.SGD":"Janus Henderson Balanced A Inc SGD","LU0061474960.USD":"天利环球焦点基金AU Acc","LU0310800379.SGD":"FTIF - Templeton Global A Acc SGD","LU0353189680.USD":"富国美国全盘成长基金Cl A Acc","BK4503":"景林资产持仓","LU1803068979.SGD":"FTIF - Franklin Technology A (acc) SGD-H1","GOOG":"谷歌","GOOGL":"谷歌A","IE0004445239.USD":"JANUS HENDERSON US FORTY \"A2\" (USD) ACC","LU0456855351.SGD":"JPMorgan Funds - Global Equity A (acc) SGD","LU0642271901.SGD":"Janus Henderson Horizon Global Technology Leaders A2 SGD-H","LU0053666078.USD":"摩根大通基金-美国股票A(离岸)美元","LU0052756011.USD":"TEMPLETON GLOBAL BALANCED \"A\" (USD) INC","IE00BJTD4V19.USD":"NEUBERGER BERMAN US LONG SHORT EQUITY \"A1\" (USD) ACC","LU2237443382.USD":"Aberdeen Standard SICAV I - Global Dynamic Dividend A MIncA USD","LU0048573561.USD":"FIDELITY AMERICA \"A\" (USD) INC","LU0082616367.USD":"摩根大通美国科技A(dist)","LU2237443549.SGD":"Aberdeen Standard SICAV I - Global Dynamic Dividend A MIncA SGD-H","LU0719512351.SGD":"JPMorgan Funds - US Technology A (acc) SGD","LU2237443622.USD":"Aberdeen Standard SICAV I - Global Dynamic Dividend A Acc USD"},"source_url":"https://wallstreetcn.com/articles/3714906","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1151865178","content_text":"Gemini 1.5 Pro上下文窗口200万token,号称聊天机器人中的全球最长窗口;Gemini新增语音对话功能Live,与OpenAI新模型GPT-4o一较高下;Gemini将可根据用户需求定制;谷歌的多模态AI项目Project Astra可回答手机摄像头所拍的物体相关问题,安卓端侧Gemini增加多模态功能。虽然被OpenAI抢在前面发布了重磅新品演示,但谷歌后发制人,做到了OpenAI还没能做到的事,率先发布人工智能(AI)搜索引擎,捍卫搜索领域的王者地位,同时对垒OpenAI新发布的旗舰模型GPT-4o,以升级版的最强大AI模型Gemini迎战。美东时间5月24日周二举行的年度Google I/O开发者大会上,谷歌CEO Sundar Pichai表示,谷歌所有的工作都围绕生成式AI模型Gemini来做,“我们希望每个人都能从Gemini 所做的事中受益。” 将生成式AI引入搜索的AI搜索引擎正是Pichai提到的Gemini融入谷歌多种服务之一。Pichai宣布,本周,AI技术生成摘要的功能将上线美国的谷歌搜索,它名为AI Overviews,并很快会在更多国家地区推出。通过多步推理,Gemini可以代替用户研究,找到更好的搜索结果。比如谷歌搜索中的Gemini可以通过汇总一天中的所有膳食以及所有菜肴的食谱,为用户规划膳食。如果用户觉得做饭太麻烦,谷歌搜索还可以在Gemini的帮助下,为用户找到可以购买用户所需餐食的地方。在Gemini的帮助下,用户的搜索结果页面也会发生变化,比如寻找有现场音乐的餐厅,它甚至可以根据不同的季节做推荐,比如显示有屋顶的餐厅。Pichai现场演示,借助Gemini 的强大功能,在谷歌相册Google Photos可以进行更多的相关搜索,比如通过名为Ask Photos with Gemini的新功能让Gemini找到用户想要的车牌照号,Gemini将根据上下文响应在相册中搜索,并选出用户想要的照片,得到照片中拍到的车牌照号。谷歌云计算生产力和协作平台Google Workspace的许多服务将结合Gemini,例如用Gemini 在Gmail中搜索特定发件人发出的电邮,在线上网络和视频会议Google Meeting中找到亮点。Gemini可用于搜索用户的手机,帮用户查找收据、安排取货窗口。如果用户计划旅行,Gemini 可以用来搜索有趣的活动。Pichai表示,谷歌正在“让AI对每个人都有帮助”。谷歌称,用户将可以直接在搜索中通过视频提问。谷歌高管演示了,如何借助视频搜索修复损坏的电唱机。具体做法是,先录制视频展示损坏的问题,然后询问,为什么电唱机无法正常工作。谷歌搜索就能够进行逐帧搜索,回答高管的问题。Gemini 1.5 Pro上下文窗口200万token 全球最长谷歌称,推出号称有史以来最强大AI模型Gemini Advanced三个月内,已有超过100用户注册。从本周二起,谷歌在Gemini Advanced中加入新模型成员Gemini 1.5 Pro,称它拥有的上下文窗口在全球消费类聊天机器人中最长,窗口起始就有100万个token。Gemini 1.5 Pro将向150 多个国家地区的Gemini Advanced订阅者提供,支持超过35 种语言。Pichai称,Gemini 1.5 Pro“提供了迄今为止所有基础模型中最长的上下文窗口。” 他介绍,Gemini 1.5 Pro将拥有200 万个token的上下文窗口,是当前模型100万个token窗口的两倍。 Gemini新语音对话功能Live 定制版Gemini谷歌称,今年夏季将扩展 Gemini 的多模态功能,包括增加用语音进行深入双向对话的能力,该功能被称为 Live。通过 Gemini Live,用户可以与 Gemini 交谈,并可以从各种自然的声音中选择它回应的声音。 用户甚至可以按照自己的节奏说话,或者在回答过程中打断并澄清问题,就像在任何人类对话中一样。有网友评论称,想知道相比OpenAI周一发布的最新旗舰模型GPT-4o,Gemini的对话功能会有多好。谷歌称,今年夏季,将在Gemini Advanced 中添加新的旅行规划功能。借助考虑时间和空间方面物流的先进推理,Gemini将能够创建个性化的行程,节省用户的工作时间。未来几周,谷歌将在Gemini Advanced中添加新的数据分析功能。用户只需上传电子表格,Gemini 就可以分析数据、制作图表,并更快地发掘见解。谷歌将推出被称为Gem的Gemini的定制版本。Gemini Advanced 订阅者将很快可以获得更个性化的体验,根据自己的需要创建Gemini,只需描述用户希望 Gem 做什么以及希望它如何响应,就可以让它化身健身伙伴、主厨帮手、编代码的拍档或者创意写作指南。例如,用户可以要求Gemini:做我的跑步教练,给我一个每天跑步的计划,而且保持积极、乐观、激励我。Gemini将接收这些说明,用户只需单击一下,即可强化这方面的特质,创建一个满足特定需求的Gem。Project Astra回答手机所拍物问题 安卓端侧Gemini增加多模态功能谷歌官宣推出新的多模态AI项目Project Astra,它可以为用户解释智能手机拍到的东西。在谷歌展示的视频中,只要将手机摄像头对准某个物体,Gemini就可以识别它,比如一个红苹果,还可以回答诸如镜头中什么东西是可以发声的这种问题。谷歌称,将很快为模型Gemini Nano添加多模式功能。这意味着,用户的手机可以通过文本、图像、声音和口语,按照用户理解的方式理解世界。谷歌称,端侧安卓系统手机版的Gemini Nano将更有帮助,更有上下文的意识。今年,安卓手机的用户将可以将生成的图像拖放到Google Messages 和 Gmail 中,并可以直接在手机上提出有关YouTube视频和 PDF文件的问题,得到解答。谷歌称,今年晚些时候,Gemini Nano的辅助功能TalkBack将增强。图像描述将更加清晰和丰富,帮助弱视用户和盲人用户通过语音反馈,更好地指示他们的手机。对周二谷歌开发者大会的所有发布和演示内容,谷歌Health AI产品经理Charlene Wang在社交媒体X评论称,除了AI代理和AI Teammates之外,她从中得到的主要收获实际上是 Gmail、搜索、Workspace 甚至 Chat 未来几个月会变得更有用。目前有大量具有杀手级用户体验的产品引人注目,而将所有内容组织并同步在一个空间中的想法将是使用谷歌产品最令人信服的理由。有网友则认为,谷歌的整场活动没有达到苹果的水准,呼吁谷歌的高管向苹果学一学,称喜欢Project Astra项目的东西,但并没有觉得很兴奋,因为OpenAI周一已经发布类似的了。还有网友称,周二的活动中没有听到任何和安卓15系统或相关硬件有关的东西,不知谷歌是不是要把它们保留到今年10月的发布会再亮相。","news_type":1},"isVote":1,"tweetType":1,"viewCount":573,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":42,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/305936732598488"}
精彩评论