语音
-
声网CEO赵斌:大模型API成本已下降超9成 实时互联迎来新纪元
在近期举办的RTE2024实时互联网大会上,业界大咖们对AI产业发展趋势进行了深度剖析。随着OpenAI大幅下调API调用成本,以及中国市场价格竞争加剧,生成式AI正以前所未有的速…
-
Meta推出NotebookLM开源版“NotebookLlama”:文本轻松转播客
最近,Meta 公司推出了一款名为 NotebookLlama 的新工具,它可以说是谷歌的 NotebookLM 中备受欢迎的生成播客功能的开源版。 NotebookLlama 依…
-
苹果新AI系统Ferret-UI 2刷新UI交互体验 轻松操控你的设备
苹果公司近日发布了新一代人工智能系统Ferret-UI2。这款跨平台AI助手在UI元素识别方面取得重大突破,测试得分达89.73,大幅领先GPT-4V的77.73分,展现出卓越的性…
-
OpenAI macOS 应用重磅更新:语音界面终于支持图片上传!
最近,OpenAI 在其 macOS 应用的高级语音模式界面上进行了重要更新,推出了一个全新的图片上传功能。以前,这个功能是无法点击的,现在用户终于可以通过语音 UI 上传图片了,…
-
英伟达与微软强强联合,打造医疗 AI 创新加速器
最近,英伟达和微软携手推出了一项新计划,旨在推动医疗领域的 AI 创新。这项合作结合了英伟达的 Inception 全球计划和微软的初创企业支持计划,意在帮助更多初创企业提升他们的…
-
全球增速最快!海螺AI 9月访问量暴涨867% 成Runway强劲对手
在全球AI视频生成领域掀起新一轮竞争浪潮之际,中国科技企业MiniMax的"海螺AI"以其惊人的表现强势出圈。数据显示,这款诞生于今年4月的AI产品在9月份创下…
-
智谱清言端到端情感语音功能上线:可随时打断 支持多种语言和方言
智谱AI宣布,其端到端情感语音技术已正式登陆智谱清言平台,并向所有用户开放。这项技术突破了传统文本转语音(TTS)技术的局限,能够深入理解上下文语境,并生成富有情感的自然对话。这标…
-
Perplexity 发布首款 macOS 原生应用,带来 AI 搜索新体验
Perplexity,最近推出了它的第一款原生 macOS 桌面应用。这款应用的推出,意味着 Mac 用户可以享受到更高效、更智能的搜索体验。 这款新应用结合了 Perplexi…
-
科大讯飞星火4.0 Turbo大模型发布 星火超拟人数字人同步推出
在10月24日举行的科大讯飞全球1024开发者节上,科大讯飞展示了讯飞星火4.0Turbo大模型。这个升级版的人工智能模型在多项能力上都超越了之前的版本,甚至在某些方面超过了业界领…
-
ElevenLabs推声音设计功能,文字提示就能创建独特的声音
日前,ElevenLabs 推出了一项激动人心的新功能 —— 语音设计,用户可以通过简单的文字提示来创建完全独特的声音。 虽然ElevenLabs 的语音库有3,000个高质量的语…