ChatGPT官网

ChatGPT发布会更新汇总,越到后面越有戏!

OpenAI圣诞季,已经持续了七天,你们都看了么?感觉如何?说实话,前几天的更新,让我挺失望,但是最近两天更新,我感觉还不错。

如果你还没看,或者没有仔细看。

我来整理一下,用一篇文章,把 7 天更新内容给概括一下,并且说说自己的感想。

Day1 :o1 正式版和 $200的专业版(死贵)

O1 正式版:

  • 性能提升: O1 模型在智能水平、速度和多模态处理能力方面均有显著改进。与预览版相比,错误率降低约 34%,思考速度提升约 50%。

  • 多模态输入: O1 现在能够同时处理图像和文字信息,适用于更广泛的应用场景,如图像理解和图文结合的创作。

  • 应用范围: O1 正式版已取代预览版,向 ChatGPT Plus 和 Pro 订阅者开放。

ChatGPT Pro:

  • 订阅价格: 每月 200 美元。

  • 功能特点: 提供无限模型使用、高级语音模式和 O1 Pro 模式,适合在数学、程序设计、写作等领域有高需求的用户。

  • O1 Pro 模式: 允许模型使用更多计算资源,提升性能和可靠性,特别适用于处理高难度的数学、科学和程序设计问题。

对于第一天的更新,我估计大部分都不太满意。ChatGPT Pro 的推出让 Plus 用户“不上不下”,让免费用户“高不可攀”。

唯一有点用处的是 o1 正式版了支持多模态了。

但是相比 4o 单纯从使用感受来说提升并不大。

有时候我甚至觉得 4o的能力一直在变弱,联网功能出来之后智商明显变低,网络开关并不好用,有时候能联网有时候不能联网,图片识别也出现大量不能识别的内容。

Day2:强化微调研究计划(画饼中...)

强化微调(Reinforcement Fine-Tuning,RFT):

  • 功能介绍: RFT 允许用户在自己的数据集上对 O1 模型进行微调,利用强化学习算法,将模型能力从高级水平提升到专家级水平。这不同于传统的监督式微调,RFT 教会模型在特定领域以新的方式进行推理。

  • 应用领域: RFT 适用于需要深厚专业知识的领域,如法律、金融、工程和保险等。例如,OpenAI 与汤森路透合作,使用 RFT 对 O1 Mini 进行微调,开发了法律助理 AI,帮助法律专业人士完成复杂的分析工作。

  • 技术优势: RFT 只需少量高质量的示例即可有效训练模型。与传统的监督微调相比,RFT 能够通过极少量的高质量示例,快速调整模型的推理方式。

对于专业用户来说,这是一个非常好的功能。但是,这还是一个画饼功能,发布会当前并无法使用,只能申请内测,正式发布要到明年了。

追发布会,但是发现新功能用不了,这感受真不好!

Day3:视频生成模型 Sora(画饼一年)

Sora 是 OpenAI 推出的文本生成视频模型,用户可以通过输入文本描述,生成高达 1080p 分辨率、最长 20 秒的视频。此外,Sora 还支持图像转视频和视频样式转换等功能。

  • 功能亮点

    • 文本生成视频:用户输入简单文本描述,如 “韩国小姐姐吃面”,Sora 就能生成符合描述的短视频。

    • 图像扩展:用户可通过上传图片或已有视频,延展场景、添加动作。

    • 时间线编辑:用户能像导演一样,通过时间线规划多个场景,定义角色动作和场景细节,并实时预览生成效果。

    • 风格和场景重塑:Remix 功能支持对已有视频进行内容或风格的重塑,Loop 功能则可无缝衔接视频开头和结尾,创建完美循环。

    • 高级融合功能:Blend 功能可以将两个视频融合成一个全新的场景,为创意提供更多可能性。

  • 编辑工具:

    • Remix:允许对已有视频进行内容或风格的重塑。

    • Re-cut:支持在故事板中对视频进行精简或扩充。

    • Loop:创建无缝循环的视频。

    • Blend:将两个视频融合成一个全新的场景。

    • Storyboard:用户可以像导演一样,通过时间线规划多个场景,定义角色动作和场景细节,并实时预览生成的效果。

  • 订阅与适用范围:

    • ChatGPT Plus 用户:每月可生成 50 个视频,支持 720p 分辨率,视频时长可达 5 秒。

    • ChatGPT Pro 用户:每月享有 500 次快速生成,支持 1080p 分辨率,视频时长可达 20 秒,并可无限次慢速生成。

我清楚的记得,SORA是年初炸裂开场。

然后就没啥消息了。期间Runway,pika,可灵等登上视频生成的舞台,风光无限。

SORA一直到年末才姗姗来迟啊。

尴尬的是,上线当天就被刷爆了,导致充钱的用户都无法登录。(有种被耍猴的感觉)

说起钱,这又是一个费钱的功能。

免费用户已经没啥好玩了,Plus 用户,也就是每月 50 个视频,只能小玩一下。这就是逼你开 Pro 的节奏了。AI 再好,太贵就没意思了啊。

从效果来说,整体应该还是不错滴。毕竟可以直接 1080P,20 秒,可以文生视频,图生视频,视频生视频。还可以对生成的内容进行二次加工。生成内容的连贯性和完整性也不错。

由于他第一天就把我卡在门外,我很生气🌶︎🐔。但是今天我已经可以登录了,就先不过多评价了,后续实测完再说。

前三天,基本都是看看的功能,要么太贵,要么还没发布,要么用不上。

所以主观感受不是太好,但是客观来说,要把这一切做出来,要做这么多功能,也确实要花很多功夫。

Day4:Canvas (变化不大)

主要更新内容:

  • Canvas 向所有用户开放:Canvas 正式向免费用户和付费用户开放,并与 OpenAI 的主要模型深度集成,用户可在 GPT-4 中体验其便捷功能。

  • 支持 Python 代码运行:Canvas 内置 WebAssembly Python 模拟器,可快速加载几乎任何 Python 库并运行代码,提供即时反馈,还能显示文本或图形输出结果,提升编程效率,为数据可视化等任务提供更直观支持。

  • 登陆自定义 GPT:用户可将 Canvas 的强大功能融入到自定义 GPT 中,打造更个性化、更高效的 AI 助手,如创建 “圣诞老人助手” GPT,用于生成信件草稿等。

OpenAI 工程师进行了现场演示。

包括用 Canvas 创作儿童圣诞故事,与 ChatGPT 并排协作编辑文档;

使用 Canvas 改进物理论文,ChatGPT 提供修改建议并添加评论;

利用 Canvas 调试 Python 代码并生成图表;

以及在自定义 GPT 中使用 Canvas 生成信件草稿等.

通过这些更新,OpenAI 旨在为用户提供更强大的 AI 辅助创作平台,提升写作、编程等任务的效率和体验。

这不是惊艳的更新,对普通用户比较无感,但是对专业用户,可能在便捷性和实用性上有一些提升。对于编程来说,这样确实会好一些,但是终极形态还是cursor这种。

Day5:苹果智能(与国内无关,与安卓...)

这一天主要更新是 ChatGPT 与 Siri 深度集成。

  • 功能介绍: OpenAI 宣布 ChatGPT 已与苹果的 Siri 深度集成,用户可以通过 Siri 直接与 ChatGPT 互动。这使得在 iPhone 和 Mac 等苹果设备上使用 ChatGPT 更加便捷。

  • 操作方式: 用户可以通过语音指令让 Siri 将问题传递给 ChatGPT,获取更详细和准确的回答。在发送之前,Siri 会进行确认,确保用户意图的准确传达。

  • 多模态输入: 该集成支持多种输入方式,包括语音、文字、摄像头等,用户甚至可以直接上传文档,让 ChatGPT 进行分析和处理。

苹果Siri 和 ChatGPT 高度集成,在苹果手机和苹果电脑上,都可以无缝使用。无论办公还是娱乐,效率都大大提升。

这功能,应该是苹果用户非常期待的功能之一,但是对于中国苹果用户来说,只有两个字“无语” !

你想用上这个功能,起码得跨过 N 个门槛,未来也永远不会有,等来的只能是基于“百度AI ”的苹果 AI。据说苹果不想给个用户隐私数据,但是百度强烈要求拿用户数据....

Day6:实时视频聊天和圣诞老人专属声音

  • 功能介绍: ChatGPT 现已具备高级语音视觉功能,能够通过视觉和听觉与用户互动,提供实时的视觉互动体验。这使得与 AI 的交互更加自然,类似于与真人视频聊天。

  • 操作方式: 用户可以通过手机摄像头捕捉画面或屏幕上显示的信息,ChatGPT 将根据这些视觉输入提供相应的辅助和反馈。

  • 适用范围: 该功能将在 ChatGPT 移动应用中向全球的 Teams、Plus 和 Pro 订阅者推出,但欧洲用户暂时无法使用。

  • 节日彩蛋: 在圣诞节期间,OpenAI 特别推出了圣诞老人的声音功能,为用户带来节日惊喜。

相比于之前的一些更新,有的没啥变化,有的根本用不上。这个功能是上线就直接可以用,而且也挺好用的一个功能。

这也是我期待已久的功能。

虽然这也是一个画饼很长时间的功能,但是我依旧认为这个更新是我最想要的一个更新。因为它从文字,声音,进阶到了视频。这直接是维度的提升。

有了对环境的感知,才会让你感觉,和 AI 对话,好像就是和一个真人在对话。

这个高级语音对话功能的界面如下:

就和各类社交软件的视频通话一样:

可以直接开启视频和关闭摄像头

可以切换前后摄像头

可以关闭和开启麦克风

还可以直接共享屏幕

直接拍照发送不中断对话

直接上传本地照片不中断对话。

我做了一些简单的测试,感觉还不错。

其实这些任务并不难,但是交互感有提升巨大,尤其是实时交互,没有卡顿的感觉很好。在早期的时候,单纯语音对话都会卡好久,现在视频对话,都能如此丝滑,这么一比,真的是很不错了。

另外,我也尝试让他做英语老师,真的可以哪里不会点哪里,根本不用点读笔。

内容读取准确,发音也标准。几千块钱的点读笔可以省了,另外智商当然碾压点读笔,可以进行各种扩展联系。

我也尝试让他做一个数学老师,直接让他自己读题,自己解答。这部分简单算术题,应用题,也是可以轻松搞定。但是他在读题时候对图形类的题目,稳定性还不是很高。

OpenAI 这个功能基本已经跑通了,接下来只要不断提升识别能力即可。大量的现实世界的数据,应该会快速提升 AI 对真实世界的理解能力。

到这里,AI 该有的嘴巴,耳朵,眼睛,脑子都有了。

Day7:项目

  • 功能介绍: OpenAI 推出了全新的 Projects 功能,允许用户在 ChatGPT 平台上创建和管理对话项目。用户可以上传各类文件,包括文本、图片和视频,并设置个性化指令,以实现更高效的对话管理和项目协作。

  • 操作方式: 用户只需在主页左侧导航栏点击“+”号,即可创建新项目并为其命名。此外,用户还可以自定义 Projects 的颜色,以提升使用体验。在创建项目后,即使尚未添加任何文件,用户也可在该项目中直接开启新的对话。

  • 适用范围:Project功能先向plus和pro用户推送,一段时间后开放给免费用户。

通过此次更新,OpenAI 为用户提供了更灵活的对话管理工具,提升了 ChatGPT 的实用性和用户体验。

这个功能对于高频用户来说,是非常实用的。

当你和 Gpt 的对话越来越多,越来越深入。你就会想要整理和保存一些对话。归档功能无法修改,多有不便。有了项目功能之后,就很容易整理了。

另外,同一个项目的对话可以共享文件资源和添加特殊的指定。这样就可以针对某一个项目,进行多维度的交流。不用把所有内容都堆在一个对话里面了。

这个功能,很实用。

我本来只是想三言两语就写完的。没想到写一写也有这么多内容。

其实,今年 AI 突破速度明显放缓了,新闻也没有那么火爆了。好多人可能觉得 AI 与自己无关,或者这个热潮已经过去了,其实并不是这样。

AI 正在从空中楼阁,慢慢渗透到各行各业。刚开始大家都追求一些华而不实的功能,随着技术的成熟,各种专业的 AI 会越来越专业,越来越有用。

OpenAI 的更新也是如此,很多功能都是针对特定场景或者更专业的用户。

始终保持学习心态吧!

再过几个小时,Day8就来了,又会有什么更新呢?

12Day完整视频

https://openai.com/12-days/

本文链接:https://zqlvshi.net/chatgpt/737.html

ChatGPT的推荐语chatgpt女博士chatGPT星火产品chatgpt人类chatgpt详细解说用chatgpt做智脑浏览器edge插件chatgpt注册chatgpt知乎chatgpt杉树chatgpt画图帅哥肌肉

相关文章

网友评论