OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容 – 蓝点网

OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,推出态版该功能仅限于 Android 和 iOS 版 ChatGPT,多模对话点网并且可以上传图片由 ChatGPT 进行分析、本可别图社会实践体会与感悟识别并给出回答。语音
当这个功能可用后,及识用户转到 ChatGPT 设置里点击新功能,像内然后就可以开启语音对话功能,容蓝还可以从 5 个声音里选择一个。推出态版
OPENAI 表示:
新的多模对话点网社会实践体会与感悟语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的本可别图样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,语音我们还使用我们的及识开源语音识别系统 Whisper 将您的声音转录为文本。
第二个功能是像内图像识别功能,用户可以使用移动端 ChatGPT 拍照或选择照片发送给 AI,容蓝然后 ChatGPT 会像素级分析图片内容并按照用户提问给出详细的推出态版回答,例如分析工作图表、在设备工作异常时进行故障排除等等。
OPENAI 表示:
图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。
新功能将在接下来几周推出,首先获得该功能的是 ChatGPT Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。
最后,OPENAI 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 ChatGPT 集成,将在 10 月份推出。
相关文章
第十七届山东省职业院校技能大赛“融媒体内容策划与制作”比赛在山东传媒职业学院举行
近日,第十七届山东职业技能大赛高职组“融媒体内容策划与制作”大赛在山东传媒职业学院举行。来自全省50所职业院校的精英团队在同一舞台上竞争,以精湛的技艺展现实力和风采。经过激烈的竞争,山东传媒职业学院、2025-03-13- 我在世界上的另一个成就需要玩家把开拓者的表情包发给一个朋友。很多朋友对这个成就很好奇吗?那么如何实现世界上的另一个成就呢?让我们来介绍一下这个成就的实现步骤。如何实现星穹铁路的另一个成就?我在世界上的2025-03-13
- 据“拜城网信”微信微信官方账号消息,3月5日18时53分,新疆阿克苏地区拜城县发生4.5级地震(北纬42.00度,东经82.54度),震源深度17公里。地震发生后,一些自媒体账户在互联网上传播了所谓的2025-03-13
微惊悚文物考古《The Children of Clay》已免费推出
微惊悚文物考古《The Children of Clay》已免费推出2025-03-11 16:11:18来源:玩游戏网编辑:七七。 Balazs Ronyai开发并发行2025-03-13- 为了进一步贯彻“人民城市”的理念,有效激发居民参与社区治理的积极性,高静镇积极开展“景翔·社区合作伙伴”计划,率先探索居民参与规划,总结经验,形成《高静镇参与规划议事协商指南》。以工作坊、共建沙龙、创2025-03-13
- 目前,美国公司亚马逊已经完全控制了“007”系列的创意控制。最新报道称,007的选角仍有几项严格规定:男性、英国人或英联邦)。据《周日邮报》报道,亚马逊发布了一份内部备忘录,规定詹姆斯·邦德的性别或国2025-03-13
最新评论