Open AI 首届Dev day 纪要

金叔谈新股
2023-11-07

大家好,我是不想你亏钱的金叔。

了解我的小伙伴应该知道,金叔是很早一批就在关注GPT的小伙伴

在内部也做了很多应用的尝试,非常大的提高了生产力。

并且我也是GPT 4.0的忠实用户,每个月真金白银花20美元供养Open AI公司。

但是6月份之后,我基本很少写GPT的文章了,本着对技术的狂热向大家传道,但是发现真正有兴趣和能力钻研的人太少了,能感受到技术革命的人也太少了。

之后偶尔还是会发一发心得。希望能帮到大家,能惊醒一个是一个。

      第一部分:本次发布会的一些革新

1)发布全新的最强大模型GPT-4 Turbo,同时价格更加便宜,具有128k上下文,同时价格方面,GPT-4Turbo与GPT-4相比输入输入成本便宜3倍,GPT-4 Turbo也具备了视觉功能,能够还对函数调用和指令、JSON模式进行了调优。意味着GPT 4很可能要从20美元降到10美元,基本上是手机月费的价格,更亲民了

2)发布了GPTs:可自定义的垂类A助手,用户在构建自定义GPT时无需任何代码,全程支持可视化点击操作,只需要给ChaiGP对话指令或额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能即可,目前OpenAl已经内置了很多定义GPT版本。同时开发人员可以通过向 GPT 提供一个或多个API 来定义自定义操作。官方支持客服定制化功能,这个将极大的改变目前的淘宝之类的客服市场,可以预想日后客服将见不到真人,这块国内很多公司也在做,直接被GPT挖了根子。

3.正式开始构建生态,建立GPT商店:主要用于分享用户构建的自定义GPT助手,例,法律助手、家庭常识助手、客服助手等类似于APPstore,能为开发者带来收入。终于开发者可以靠GPT赚钱了,有点Apple store的感觉

4.推出Assistants API新增了 Code nterpreter(代码解释器)Retrieval(信息检索)以及函数调用等功能,帮用户更好的承担复杂任务。这个功能非常好用,我就说几个我自己最常见的应用,第一是写SQL代码,我现在基本只要自己出思路,剩下交给GPT来写,还有就是检索基金合同里面的关键信息,也可以做到自动化。

5.推出了DALL-E3和新的语音转文字模型API。这个功能在我去埃及旅游的时候已经有感受到,在博馆的时候,只要拍摄文物图片,就可以GPT自动解说文物的背景,并且还可以识别象形文字,真的是万能的工具。

               第二部分:现场详细会议纪要

GPT-4 Turbo

GPT-4 Turbo特征:1)更长的上下文长度,GPT-4支持8K上下文,某些情况下32K,但GPT-4 Turbo支持128K上下文标记,相当于一本标准书的300页,除了更长的上下文长度,模型的准确性还更高;2)更多控制,开发人员需要对模型的响应和输出进行更多控制,GPT-4 Turbo有一项名为“JSON Mode”的新功能,可确保模型将以更加有效的JSON进行响应,另外还有项 Reproducible Outcome”(可重现输出)的新功能,通过传递种子参数,模型将返回一致的输出结果,使用户对模型行为有更高程度的控制,已推出测试版,未来几周还将推出能让用户在API中查看日志的新功能;3)更新的知识库,GPT-4 Turbo的知识库截止时间是20234月,未来也将不断更新;4)多模态,支持DALLE3,带有视觉功能的GPT-4 Turbo和新的文本到语音模型都将在API中推出,GPT-4 Turbo可以通过API接受图像和输入,并生成标题、分类和分析,API中的文本还能生成非常自然的语音。公司同时发布开源语音识别模型的下一个版本:Whisper V35)自定义,自GPT-3.5以来,微调功能一直运行良好,今天开始,微调功能将扩展到16K版本的模型,并邀请微调的活跃用户参加“GPT-4 fine-tuning ExperimentalAccess Program”,另外公司还启动“Custom Models”项目,为公司制作定制模型,包括修改模型训练过程、进行额外的特定领域预训练、为特定领域量身定制RL后期训练过程等;6)提高速率限制,公司已将所有开通GPT-4客户的每分钟token数翻倍,用户还可以申请进一步提升速率。

公司还引入“Copyright Shield”(版权保护机制),如果用户面临有关版权侵权的法律索赔,公司将出面为客户辩护并支付相关费用,适用于 ChatGPT 企业版和 API。公司不会对来自 API ChatGPT 企业版的数据进行训练。

GPT-4 Turbo 定价

Input TokenGPT-4便宜了三倍,Complete TokenGPT-4便宜了两倍,新定价为1k Input tokens/1美分,3k Complete tokens/3美分,对大部分用户来讲,GPT-4 Turbo的综合费率比GPT-4便宜了2.75倍。公司选择先让价格便宜,后续会继续在速度上下功夫,GPT-4 TurboGPT-4速度快很多。GPT-3.5 16K模型比GPT-3.5 4K模型更便宜。

ChatGPT改进

ChatGPT现在使用GPT-4 Turbo模型,并进行了所有最近改进,例如知识截断,未来也将持续更新,ChatGPT现在可以在需要编写和运行代码、分析数据、拍摄和生成图片等时浏览网页。

GPTs

GPTs是为特定目的量身定制的ChatGPT版本,几乎适用于任何带有说明、扩展知识和操作的内容,用户可以创建发布,供他人使用,用户可以在ChatGPT中直接使用,通过与GPT对话,就能使用自然语言对其编程,GPTs在很多情况下能更好的发挥作用,且能用让用户更好地进行控制。具体用例:

(1)Code.org创建了Lesson Planner GPT以帮助老师为中学生提供更有吸引力的教学体验。如果教师要求它以创造性的方式解释“for loop”循环,它将以视频游戏角色反复拾取硬币的方式进行解释,更容易让学生理解。这个 GPT 将代码组织、广泛的课程和专业知识结合在一起,让教师可以快速、轻松地根据自己的需求进行调整。

(2)Canva构建了能让用户通过自然语言描述来设计想要的东西的GPT,例如如果用户要为今天下午或今天晚上的开发者日招待会制作一张海报,并向它提供一些细节,它就会通过 Canva API 生成一些可供选择的方案

(3)Zapier构建了能跨6000多个应用程序执行操作的GPTZapier AI可以连接用户的日历,用户可以询问今天的日程安排,在执行操作或共享数据前,GPT会征求用户的许可,并能识别用户的冲突时间段。通过在GPT中告诉GPT自己需要和Sam说早点离开,GPT能在Slack上通知Sam

用户个性化创建GPT

通过对话就能为 GPT 编程,无需代码。自然语言将成为未来人们使用计算机的重要方式。

示例:创建一个 GPT,帮助初创企业创始人思考他们的商业想法并获得建议,在创始人得到一些建议后,再问他们为什么没有更快地发展。

图:用户通过聊天的方式表达意愿给GPT,意愿是想帮助初创企业创始人思考他们的商业想法及获得一些建议

GPT首先 生成推荐的企业名及企业头像

随后用户上传“自己曾经给初创企业建议的讲座”文件,向GPT提问“初创企业在招聘员工需要注意的三个点是什么?”并注明反馈要简明扼要,富有建设性。

GPT根据文件内容,自动列出初创企业在招聘员工时需要的三点(反馈结果与文件的核心思想完全相融)

11月即将推出GPT 商店(GPT Store)

OpenAI 欢迎开发者开发自己的GPT, 将向制作最有用、最常用 GPT 的开发者支付部分收入。GPT Store将 营造一个充满活力的生态系统。

将同样的概念引入 API

Assistant API 包括threading,Retrieval,工作上的 Python interpreter 和沙盒环境(sandbox environment),当然还有之前谈到的改进的函数调用(function calling)。

将 wanderlust 打造成一款面向全球探险者的旅行应用的登陆页面,插图通过全新 DallE3 API 程式化生成的。

应用程序添加非常简单的助手来增强它的功能。首先,切换到新的PlayGround。创建助手非常简单(名字、初始指令和模型)在本例中,模型为GPT-4-Turbo。还要继续选择一些工具,打开代码解释器(Code interpreter)和检索(Retrieval),然后保存,助手已经准备就绪。

接下来,在API助手中集成两个新的原始数据类型:threads和messages。对于每个新用户,都会创建一个新线程。当这些用户与他们的助手互动时,会将他们的消息添加到这些线程中。

函数调用(function calling)的应用 (图中Assistant API给出了巴黎排行前十的风景点)

并注释了在地图的位置

在API助手上传一张pdf版的电子机票

自动生成提取机票的信息(retreval)

Code interpreter 回答用户的指令(具体细节)

与 API 交流:Whisper API (声音转文字) —— Assistant API (与GPT 4-turbo结合)  —— TTS API( 讲话)

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法