您的位置 首页 家纺布艺

AI垦利感知,眼观八方,耳听万物,口述乾坤

5 月 14 日电(中国新闻网 吴家驹)不是 GPT-5,而是 GPT-4O。 5 月 14 日,开发 CHA…

5 月 14 日电(中国新闻网 吴家驹)不是 GPT-5,而是 GPT-4O。


5 月 14 日,开发 CHATGPT 的公司 OPENAI 发布了拥有“听、看、说”能力的 GPT-4O。


OPENAI 官网表示,GPT-4O 中的“O”代表“OMNI”,在英语中常作为词根,表示“全部”或“所有”的概念。


OPENAI 首席执行官萨姆·奥特曼(SAM ALTMAN)此前预告,最新发布的产品“不是 GPT-5,也不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西”。


据介绍,GPT-4O 可以实时对音频、视觉和文本进行推理,接受文本、音频和图像任意组合输入,并生成文本、音频和图像任意组合输出。


OPENAI 称,GPT-4O 可以在短至 232 毫秒的时间内对音频输入做出反应。它的英语和代码文本处理性能与 GPT-4 TURBO 相当,在非英语语言文本处理方面也有显著提升。它的 API(应用程序接口)速度更快,成本也降低了 50%。


OPENAI 现场展示了 GPT-4O 的多个应用场景。


例如,在演示中,OPENAI 前沿研究负责人马克·陈(MARK CHEN)通过手机与 CHATGPT 对话。陈和 CHATGPT 聊到他正在进行演示有些紧张,CHATGPT 就“像朋友一样”安慰了他,并从陈急促的喘气声中听出他的紧张,对他说:“慢一点。MARK,你不是吸尘器。吸气,然后数到四”。


在另一个演示中,OPENAI 后训练团队负责人巴雷特·佐夫(BARRET ZOPH)对着镜头让 GPT-4O 观察他的情绪如何。ZOPH 先拍了一张木质桌面,CHATGPT 说:“我看到的是木质表面。”再拍自己,CHATGPT 则说:“你看起来很开心,笑容灿烂,也许还有一丝兴奋”。


OPENAI 官网还发布了一系列演示视频:GPT-4O 可以帮助学习数学、学习西班牙语、准备面试,可以通过画面判断出你正在过生日,然后给你唱生日快乐歌,可以根据要求唱不同风格的催眠曲,甚至还可以当“石头剪刀布”的裁判。在这些视频中,GPT-4O 与演示者的对话流畅,说话语气“像真人一样”。


有网友表示,从展示的视频来看,GPT-4O 在语音交互体验上提升了不少。也有网友认为,GPT-4O 对算力的需求更大了。还有网友提出,既然 GPT-4O 具备了“视觉”,它是否可以代替盲人看世界。

据 OPENAI 称,该公司借助 GPT-4O 训练了一个跨文本、视觉和音频的新端到端模型,这意味着所有输入和输出均由同一神经网络处理。由于 GPT-4O 是 OPENAI 首个将所有这些模式相结合的模型,因此该公司仍处于探索该模型功能及其限制的初期阶段。


对此,萨姆·阿尔特曼在社交媒体上表示,最初的 CHATGPT 展示了语言界面雏形,而新款 CHATGPT 则给人以截然不同的感觉。它反应迅速、智能、风趣、自然,而且“乐于助人”。“随着我们添加(可选的)个性化功能、信息访问功能、代表你采取行动的功能等等,我真切地看到一个令人兴奋的未来,我们可以用电脑做更多的事情。”

本文来自网络,不代表品牌家电维修网立场,转载请注明出处:https://www.33x1.com/brand/jfby/557266.html

作者: baixiuhui1

为您推荐

联系我们

联系我们

18079759494

在线咨询: QQ交谈

邮箱: 964571095@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部