视觉
-
Suno v4版本发布!新增翻唱、人声一致功能
在版权争议声中持续创新的AI音乐平台Suno今日迎来重大升级。作为目前全球第五大生成式AI服务提供商,Suno面向付费用户正式发布第四代模型(V4),带来了革命性的技术突破和创作体…
-
任天堂基于宝可梦Go玩家数据构建一个“地理空间”AI模型
近日,Niantic (任天堂)公司宣布正在研发一种名为 “大型地理空间模型”(Large Geospatial Model,简称 LGM)的全新人工智能模型。 该模型的构建依赖于…
-
Roboflow完成4000万美元B轮融资,视觉AI开发平台引领行业变革
视觉AI开发平台Roboflow近日宣布完成4000万美元B轮融资。本轮融资由GV领投,Craft Ventures、Y Combinator以及Vercel AI创始人Guill…
-
新开源 “人生搜索引擎” Pensieve,可记录并回忆电脑屏幕内容
近日,一款名为 Pensieve(冥想盆)的开源软件在 GitHub 热榜上引起了广泛关注。 这款软件的设计灵感来源于《哈利波特》中提取和回忆记忆的神奇工具,它能够自动记录用户在电…
-
AI 搜索引擎 Perplexity 新增一键购物功能
人工智能问答平台 Perplexity 近日宣布其购物功能正式上线,用户现在可以通过该平台直接购物,体验一键结账和 AI 产品推荐的便捷服务。这一新功能旨在通过其搜索界面优化在线购…
-
Mistral推最强开源多模态模型 Pixtral Large,升级Le Chat可直接调用Flux Pro
法国人工智能初创公司 Mistral AI 宣布为其 Le Chat AI 助手添加了一系列新功能,包括集成的网络搜索、图像生成以及新推出的 Pixtral Large 模型。 L…
-
微软全新AI实验室东京启幕,前大阪大学教授松下康之重掌帅印
微软研究院近日在日本东京隆重揭幕其最新实验室,这标志着该公司进一步深化在亚太地区的AI研究布局。作为掌门人,前大阪大学教授、微软亚洲研究院资深研究员松下康之携十年学界经验重返微软,…
-
AI搜索引擎新势力Perplexity入局电商,开发智能购物中心挑战谷歌霸主地位
由亚马逊创始人贝索斯和AI芯片巨头英伟达投资支持的搜索引擎创企Perplexity周一正式推出智能购物中心,这一重磅功能的上线标志着该公司在挑战谷歌搜索引擎统治地位的道路上迈出关键…
-
腾讯混元大模型技术负责人刘威离职
据AI前线消息,腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威已经从腾讯离职。刘威在腾讯负责混元大模型的技术开发和应用实践。他曾在多个国际会议和期刊上发表论文,并获得多个奖项。 …
-
北大团队发布多模态模型 LLaVA-o1,推理能力堪比 GPT-o1!
近日,北京大学等科研团队宣布发布了一款名为 LLaVA-o1的多模态开源模型,据称这是首个能够进行自发、系统推理的视觉语言模型,堪比 GPT-o1。 该模型在六个具有挑战性的多模态…