关于OpenAI周一发布会的一些剧透

饭团比比叨
05-13

OpenAI在今天周一的晚上21:00(北京时间)发布会将打响AI战的第一枪,CEO Sam已经讲过不是GPT-5,也不是搜索引擎。

这个倒没什么,因为已经有无数的更先进的东西在抢夺搜索引擎的市场。确实,不是GPT-5,有那么一丝丝的让人有点失望。

我之前经常使用的一个代码问答的工具,最近的流量走势是这样的...在上面参与的大神以及高质量的代码少了很多,这种降维打击就发生在一瞬间。开始还挣扎一下,去年3月份出现了大量关于大模型的代码,然后当GPT-4发布之后,stack就s了...

不过好消息是,stackoverflow要跟OpenAI合作了。一个代码问答工具和一个很牛X的代码生成工具合作,有点意思了。

OpenA的高管一直在接受各种采访,GPT-4成了最大怨种,Sam说“糟糕得可笑”,另一个说“最愚蠢的模型......太愚蠢了”。

这事儿把大家的胃口吊的很高,如果明天不是一个很牛的发布会,那么本来要狙击Google的,怕是要直接窜稀...

OpenAI今晚要么再次改变游戏规则,要么将会被微软背刺。OpenAI和微软之间现在的合作越来越走向“最信任的竞争者”的方向,非常微妙。

我觉得OpenAI今晚很有可能将会推出全新AI语音助手,这个Assistant集成了OpenAI现有的所有前沿模型:包括

1,GPT-4V (视觉)

2,自动语音识别(Whisper,OpenAI的一个开源模型)

3,语音引擎

我们将会见证一个里程碑。一个运行在终端的AI Agent将会成为随身助理级别的答案引擎,而不是一个尴尬的古典搜索引擎。

AI Agent可以成为智能体,Agent可以理解为由LLM(大模型)+记忆(memory)+工具(Tools)+决策(Action)组成的完整的一套系统。也就是说,Agent更像是个能听懂、会办事的助手。

假如我是一个A股投资者,我可以告诉AI Agent,水务板块的股票我能买么?那么Agent首先需要用大脑(大模型)思考,对我提的“这件事”进行拆解,然后通过我提供的工具,比如Wind、同花顺,思考后直接开始输出交易方案;最后给出具体的决策,能不能买,买什么具体的股票,什么时候买,买多少...

每个人都会有自己的Agent,这种Agent非常个性化,真的就是每个人不一样的个人助手。

明天OpenAI就是想把目前的组件整合成一个更强大的AI Agent,新的语音助手可能是一种基于GPT4 Turbo的代理工作流系统,它不是“搜索引擎”,而是“答案引擎”,GPT-3.5也将会被GPT-4 Lite版本给替代。

彭博的消息说苹果基本已经敲定和OpenAI的合作,一些流出的视频也能够证实这一点。

介绍一下Whisper。这个是OpenAI的一个开源项目,之前OpenAI从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练,现在应该有更好的性能。除了可以用于语音识别,Whisper 还能实现多种语言的转录,以及翻译功能。

这件事儿在我看来又是一项技术的碾压式打击,看似是一个项目,但是OpenAI掌握了太顶级的资源。如果类似的产品进入国内,国内做语音识别的科大讯飞还如何应对?

OpenAI搞的所有这些新模型结合起来,会将多模态的能力提升到了非常可用的地步。高维技术对低维技术的斩杀以分钟为单位,用户的流失就在个把月。

AI Agent的快速推进,需要苹果的参与,包括后面的终端推理芯片的开发和设计。苹果在顶级技术的再次开发尤其是形成产品上是这个星球上最强的,没有之一。尤其是Agent,这个需要在终端落地,就需要苹果这样有强大终端且对用户需求极度理解的角色参与落地,就像手机SoC,苹果不是最早做的,但是确实是做的最极致的;包括PC,Intel也要说一句牛x...

先忘了狗s一般的社融数据吧,看点令人激动的事情。从下星期开始,AI就是中心舞台,一场又一场重量级的发布会:

OpenAl:5/13

Google IO: 5/14

Microsoft Build: 5/21

Apple WWDC: 6/10

GenAI Summit: 5/29

万亿美金巨头之间的厮杀正式开始,别跑神,能够理解这些科技巨头到底在干什么,这里到底有一套什么样的底层规律,很可能为我们现在遇到的严重问题提供一些思路。 $英伟达(NVDA)$ $微软(MSFT)$ $谷歌(GOOG)$

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法