OpenAI 12天发布会内容全记录,一文快速捕捉亮点信息

AI工具3个月前发布 AI工具
6 0 0

OpenAI于12月5日正式宣布,将举办为期12天的一系列发布活动,每天发布一个产品或样品,包括预期的AI视频生成工具Sora和新的推理模型。本文将介绍为期12天的新闻发布会的日常发布内容和相关亮点。

Day1:o1满血版上线,ChatGPT Pro订阅服务

OpenAI在第一天的新闻发布会上正式推出了最强的推理模型o1全血版及其Pro版。模型比之前的o1-preview版本更完整,性能提高了34%,错误率降低了34%。支持多模式输入。与此同时,OpenAI推出了chatGPT 以每月200美元的价格订阅Pro服务,提供无限访问o1和专业版o1。

亮点分析:

  • 01 基础版:适用于日常使用,功能强大,反应快。
    • 增强多模态能力:大大提高了处理文本和图像的能力,支持图像内容分析和相关问题的回答。
    • 提高语言理解能力:更准确地捕捉语言细节和上下文,使文本生成、翻译和摘要更加流畅和自然。
    • 与预览版相比,错误率降低了35%,生成内容更加准确可靠。
    • 响应速度提高:速度提高50%,减少用户等待时间,带来更流畅的使用体验。
  • 01 Pro 版本:对人工智能性能要求较高的专业用户,强大准确。
    • 深度推理能力:能处理复杂的数学和科学问题,支持多步推理和专业计算,思考时间约1-3分钟。
    • 专业知识:在科学、数学、编程等领域表现出色,提供专业、准确的答案。
    • 长文本处理能力:支持长文本输入输出,易于处理长文档处理和内容生成。
    • 自定义能力:提供更多的微调选项,用户可以根据自己的需要进行个性化定制。

原视频:

Day2:强化微调(ReinforcementFine-Tuning)

OpenAI在第二天的新闻发布会上介绍了强化微调技术。这是一种支持用户在特定领域使用少量培训数据创建专家模型的新模型培训方法。通过加强学习算法,加强微调,优化模型输出,使其更符合用户的预期。预计强化微调将在2025年春季向用户开放。

亮点分析:

  • 少量数据训练: 模型可以用很少的样本学习新的推理方法。
  • 强化学习算法: 不断优化模型的输出,根据用户提供的评分机制。
  • 适用于复杂任务: 特别适用于法律、金融、医疗等需要深入专业知识的领域。

原视频:

Day3:Sora正式版出现

OpenAI在第三天的新闻发布会上推出Sora正式版和新版 Sora Turbo。Sora是一种视频生成工具,可以根据文本描述生成连贯、逼真的视频内容。Sora支持生成高达1080p分辨率和最长20秒的视频,支持各种视频比例,并提供各种视频编辑功能。在这个阶段,Sora只面向ChatGPTPlus与Pro用户开放,Plus用户每月有50个视频生成配额,Pro用户高达5000个。

亮点分析:

  • 故事板功能: 用户通过时间线指导视频中的多个动作,创建复杂的视频序列。
  • 各种视频编辑功能: 包括Remix、Re-cut、Storyboard等,增强创作的逻辑性和流畅性。
  • 视频混合:支持将两个视频场景合并为一个全新的场景,生成创意新内容。
  • 支持高分辨率和持续时间: 支持生成1080p分辨率和最长20秒的视频。

原视频:

Day4:ChatGPT Canvas全面开放,人人 启动人工智能合作模式

OpenAI在第四天的新闻发布会上宣布Canvas功能全面开放。Canvas支持用户与ChatGPT合作,从聊天工具升级为生产力工具,提供共享画布,用户和ChatGPT可以共同编辑文档和代码。

亮点分析:

  • 写作与编程合作: 用户可以与ChatGPT一起完成写作和编码。
  • 支持Python代码运行: 几乎所有常用的Python库都内置在Canvas中,在编写代码时可以实时与AI合作。
  • 图片识别: Canvas支持图片识别,用户可以上传图片并生成相关文本内容。
  • Canvas: 提供写作、审稿、编码和图片识别的协作功能。

原视频:

Day5:OpenAI与苹果合作,ChatGPT集成到Apple Intelligence

在第五天的新闻发布会上,OpenAI宣布ChatGPT正式集成到Apple Intelligence。意思是iPhone、通过Siri,iPad和Mac用户可以使用ChatGPT。

亮点分析:

  • Siri支持: 用户可以通过Siri语音命令完成更复杂的任务。
  • 升级写作工具: ChatGPT能力将引入苹果的智能写作工具。
  • 视觉智能: 用户可以利用搜索功能快速识别眼前的物品。
  • ChatGPT集成: 在iOS,iPadOS,ChatGPT在MacOS生态系统中提供智能支持。

原视频:

Day6:OpenAI版「Her」在线,增强高级语音模型

在第六天的新闻发布会上,OpenAI是ChatGPT先进的语音模式带来了视频输入和实时屏幕共享功能。基于这些视觉信息,ChatGPT可以“看到”用户和周围环境,更好地理解用户的指令和问题。高级语音模式采用多模态4o模式,可直接输入和输出音频,支持50多种语言,对移动用户、Plus和Pro订阅用户开放。

亮点分析:

  • 视频输入功能: 先进的ChatGPT语音模式增加了视频输入功能,使其能够“看到”用户。
  • 屏幕共享功能: 通过屏幕共享功能,ChatGPT可以帮助用户回复信息、辅助工作和学习。
  • 圣诞老人虚拟角色: 用户可以通过高级语音模式与“圣诞老人”进行视频或语音通话。

原视频:

Day7:ChatGPT发布 Projects 功能

在第七天的新闻发布会上,OpenAI推出 Projects 新功能。支持用户将相关信息、文件、聊天记录等信息集中到一个“Project支持项目管理与写作、文件与数据管理、个性化定制等场景。整合Canvas和ChatGPT Search,对ChatGPTPlus/Pro用户开放,计划在明年年初向企业和教育用户提供。

亮点分析:

  • 项目管理: 使用者可以创建项目,上传文件,设置个性化指令。
  • Canvas和ChatGPT Search集成: 集成Canvas和网络搜索能力的Projects功能。
  • 执行多步任务: 为今后多步骤任务的实施奠定了基础。
  • Projects: 支持用户上传文件,设置自定义指令,分组聊天和数据。

原视频:

Day8:ChatGPT Search全面升级,免费开放

在第八天的新闻发布会上,OpenAI 展示了ChatGPT Search最新的搜索功能是基于GPT-4o模型的微调版本。该功能通过与第三方搜索提供商和ChatGPT合作伙伴直接提供的内容相结合,用户可以快速准确地获取所需的信息。新的可搜索信息包括最新的体育比分、新闻、股票报价和其他实时信息。用户可以通过指向相关网络资源的链接获得快速、及时的答案。

亮点分析:

  • 提高搜索性能: 搜索速度更快,移动终端体验更好,增加了地图体验。
  • 语音搜索整合: 用户可以通过语音对话获取实时网络信息。
  • 全球免费开放: 免费向世界上所有登录用户开放搜索功能。
  • 对话搜索: ChatGPT可以保持对话的上下文,理解用户的意图。

原视频:

Day9:开放o1推理模型 API,成本暴降60%

在第九天的新闻发布会上,OpenAI O1模型正式推出API,成本降低60%,可定制升级、新函数调用、开发者信息和图像分析等功能。这是一个重要的技术升级。新模型不仅变得更聪明,而且能更快地响应用户的需求。实时API进行了全面升级,包括引入WebRTC支持、降低价格和更灵活的响应控制。

亮点分析:

  • o1模型API: 全血版o1模型API正式推出,支持功能调用、开发者消息、Structured Outputs、视觉识别等功能。
  • 实时API升级: 集成简单的WebRTC功能,GPT-4o音频价格下调60%。
  • 偏好微调: 基于直接偏好优化的推出(DPO)微调功能偏好算法。
  • 多语言SDK支持: 开放Go和Java 支持多种编程语言的SDK测试版。
  • 性能提升: o1模型在编程能力测试中达到76.6%的高分等多个领域表现出色。

原视频:

Day10:ChatGPT通过电话和Whatsapp使用ChatGPT

在第十天的新闻发布会上,OpenAI 通过电话和Whatsapp介绍了ChatGPT的新功能。这一更新意味着用户可以通过最基本的电话功能或Whatsapp与最先进的AI对话,号码为1-800-CHAT-GPT,或1-800-242-8478。支持智能手机、老人机、座机等设备。大大降低了使用门槛。

亮点分析:

  • 电话接入: 用户可以拨打1-8000-CHAT-GPT与ChatGPT进行语音对话。
  • Whatsapp集成: 全球用户可以在WhatsApp上向ChatGPT发送消息,提供服务的模式是4o。-mini。
  • 简单易用: 不需要注册账号,不需要记住密码,只需要像打电话一样简单。
  • 跨设备支持: 可以直接与AI对话,从最新的iPhone到老式翻盖机。
  • 多语言支持: 如教用户用西班牙语交流,ChatGPT可以提供多语言服务。

原视频:

Day11:ChatGPT与Mac应用深度集成

OpenAI在第11天的现场直播中宣布了ChatGPT和Mac应用程序的深度集成,特别是在编程和写作方面。现在,用户可以通过简单的复制和粘贴操作与Warp合作、XCode和其他应用程序可以在没有详细沟通的情况下执行任务。此外,ChatGPT还支持语音模式下的Notionn、Apple Notes和其他应用程序合作。这些新功能已经在Mac最新版本的ChatGPT应用程序中推出,Windows用户需要等待。

亮点分析:

  • 桌面应用新升级:ChatGPT 桌面应用程序支持与开发工具和文档编辑工具等多种应用程序合作。通过 ChatGPT 分析 Git 提交数据并生成可视化图表。
  • 实时演示与 Warp 终端、Xcode IDE 的智能协作:展示了 ChatGPT 如何与开发环境无缝合作,为编程任务提供实时支持。 Xcode 实现代码自动补充和功能添加。
  • 对 Notion、Apple Notes、Quip 支持写作工具:这些功能现在已经存在了 Mac Windows用户需要等待桌面应用上线。
  • 高级语音交互模式:通过语音模式和 ChatGPT 谈话提供了更自然、更有效的体验。
  • 搜索辅助功能:结合搜索功能,确保输出信息的准确性,优化写作内容。

原视频:

Day12:最新一代推理模型 o3 和 o3-mini 发布介绍

OpenAI发布了其最强的推理模型o3,宣称接近通用人工智能(AGI)。o3在ARC-AGI测试中得分87.5%,远远超过GPT-3和GPT-4o。o3有完整版和mini版,mini版将于1月底推出。o3在编程竞赛Codeforces中得分2727分,AIME数学基准测试 2024年准确率达到96.7%。OpenAI将与ARC-AGI基金会合作构建下一个基准测试。

亮点分析:

  • 提升数学推理能力:o3在复杂的数学问题上表现出色,在美国AIME数学竞赛中达到了96.7%的准确率,显示了顶尖数学家解决问题的能力。
  • 编程性能优异:ELO在Codeforces编程竞赛平台上获得2727分,超过顶级程序员水平。
  • 能够解决科学问题:o3在GPQA科学基准测试中达到87.7%的准确率,超过人类专家的平均水平(70%)。
  • 透明推理路径:提供一个清晰的推理过程,可以显示每一步的逻辑思维和中间结论。

原视频:

© 版权声明

相关文章

暂无评论

none
暂无评论...