OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。 刚刚,阿里通义实验室也出手了—— 最新发布开源语音大模型项目FunAudioLLM,而且一次包含两个模型:SenseVoice和CosyVoice。 SenseVoice专注高精度多语言语音识别、情感辨识和音频事件检测,支持超过50种语言...
曾经的 PC 阵营很简单:微软出系统,英特尔出处理器,OEM 厂商出产品,20 年来都如此。 然而现在的 PC 阵营,高通和 AMD 后来居上,颇有和英特尔三分天下之势,曾经看似牢不可破的「Wintel」联盟,好像逐渐成为了历史。 最近的台北电脑展(Computex),这三家厂商都发表主题演讲,介绍了自家最新的处理器产品(高通继续介绍骁龙 X Elite...
过去一周,美国 GPT 热潮的主角是 OpenAI 和谷歌,国内大模型市场的主角则是字节跳动和腾讯。 一方进攻,另外一方往往就是防守反击。赶在谷歌 i/o 发布一系列 AI 新产品之前,OpenAI 发布了能看能听的智能助手「GPT-4o」,o 代表「omnimodel」(全能模型)。 与过往的语音助手不同,GPT-4o 可以实现更自然流畅的语音交互,相...
2024年5月6日消息,钛媒体App独家获悉,估值超200亿的国内 AI 大模型独角兽公司“智谱 AI”正在研发对标OpenAI Sora的高质量文生视频模型,预计最快年内发布。 “文生视频目前处于一个快速发展的阶段,预计今年将是文生视频大模型的爆发期。国内公司在文生视频技术方面的客户需求非常多样,从电影拍摄到短视频、游戏制作等。智谱也将通过使用更高质量的数据和更大...