IT世界网 >> 热点

热点

新版ChatGPT加强语音、文本、音视频交互功能

   时间:2024-05-16 09:41   来源:中国经济网   阅读量:13621   

美国开放人工智能研究中心13日展示了最新版本ChatGPT的新技能:与使用者展开语音对话、识别图像并展开讨论、翻译……

GPT-4o为新版本编号。据路透社报道,相比先前版本,GPT-4o与使用者对话基本无延迟,和人类反应速度类似。即使对话中途被打断,也能继续下去。这些都是实现逼真语音对话的标志,也是当前众多人工智能语音助手普遍面临的技术难点。

在当天网络直播的展示中,这款生成式人工智能工具利用其视觉和语音能力,指导演示者在纸上逐步解出一道方程题,而不是直接给出答案。它还展示了英语与意大利语互译、用自拍照片识别情绪等能力。当一名演示者告诉它,自己正展示它是“多么有用和不可思议”时,它回答道:“哦,快别说了,怪害臊的。”

开放人工智能研究中心首席执行官萨姆·奥尔特曼当天在博客中写道,GPT-4o就像“电影中的人工智能”技术。“与电脑交谈一直让我感觉不自然,现在自然了。”

开放人工智能研究中心首席技术官米拉·穆拉蒂在当天活动中说,GPT-4o将于今后几周内上线,用户可免费试用。ChatGPT原有付费用户将获得新版本更多使用权限。

路透社报道,开放人工智能研究中心希望以GPT-4o在激烈的人工智能技术竞争中保持领先。该公司2022年发布ChatGPT后,短时间内每月活跃用户增至1亿。然而,研究机构西米勒网络公司的数据显示,去年以来ChatGPT用户人数呈现过山车式变化,近期才重回去年5月巅峰时期的水平。

近年来,开发更人性化、功能更强大的生成式人工智能工具竞争激烈。谷歌母公司字母表公司拟于14日召开谷歌开发者年度会议,预计届时将展示谷歌开发的相关产品。硅谷企业家埃隆·马斯克、技术企业“深层思维”创始人之一穆斯塔法·苏莱曼也分别投资开发了聊天机器人Grok和Pi,将拟人化特点作为产品主攻方向。

在英国广播公司看来,GPT-4o能够结合文本、音频和图像内容瞬间做出反应,目前在竞争中仍处于领先地位。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

  • 怎么选购电动叉车呢?易工机械分享几个要点
    怎么选购电动叉车呢?易工机械分享几个要点

    电动叉车是现代物流行业中的重要设备之一,与传统的燃油叉车相比,它具有更好的环保性、低噪音、更低的维护成本、操作简便、节省时间和更高的安全性等优势。但在选购电动叉车时,需要考虑以下几个方面:一、载货能力叉车的载货能力是一个非常重要的指标。在选...

  • 不断创“芯”,亚略特为行业高质量发展提供强劲动能
    不断创“芯”,亚略特为行业高质量发展提供

    近日,由深圳市芯片行业协会联合凤凰网举办的“新时代芯未来“全球芯片产业链发展高峰论坛在深圳前海万科国际会议中心成功召开。亚略特作为杰出企业代表之一受邀参与了此次峰会,并凭借在多模态生物识别核心技术上的不断创新,以及芯片研发领域的持续突破,获...

  • 我国5G基站总数达238.4万个
    我国5G基站总数达238.4万个

    工信部发布2023年1—2月份通信业经济运行情况。截至2月末,我国5G基站总数达238.4万个,占移动基站总数的21.9%,5G网络建设稳步推进。数据显示,1—2月份,信息通信行业整体运行平稳。电信业务收入和业务总量稳步增长,云计算等新兴业...

  • 灵感来自中国:俄罗斯电视台首次推出AI女主播!--
    灵感来自中国:俄罗斯电视台首次推出AI女

    这年头,连女主播都可能不是真人了。据看看新闻KNEWS报道,俄罗斯南部斯塔夫罗波尔地区的一家电视台推出了一位AI天气预报女播报员,她亮相2次后就圈粉无数。3月22日SvoyoTV电视台首播了名为ldquo;未来预测rdquo;的新节目,最引...