视觉
-
Claude 3.5 Sonnet模型增加PDF 文件处理功能 可分析文档图像、图表和表格
近日,人工智能公司 Anthropic 宣布,在其 Claude 3.5 Sonnet 模型中增加了 PDF 文件处理的功能,目前该功能已进入公共测试阶段。用户现在可以使用该模型分…
-
告别随机生成!Runway推出高级摄像机控制 像导演一样掌控镜头
知名 AI 视频生成平台 Runway 近日宣布推出全新功能——高级摄像机控制。 该功能允许用户像操控真实摄影机一样,精准控制虚拟场景中的镜头移动,为 AI 视频创作带来前所未有的…
-
AI定制婚礼! Celebrateally AI婚礼主题生成器,一键搞定个性方案
随着科技的发展,越来越多的行业开始借助人工智能来提升服务质量。婚礼策划行业也不例外,最近,CelebrateAlly 推出了一款名为 “Celebrateally AI” 的婚礼主…
-
Diffusion 模型也能“举一反三”?阿里IC-LoRA给图像生成模型增加情节记忆力能力
阿里巴巴通义实验室最新研究表明,现有的文生图 Diffusion Transformer 模型其实已经具备生成多张具有特定关系图像的能力,只需稍加“点拨”就能“融会贯通”,生成高质…
-
CareYaya推AI驱动眼镜,助力阿尔茨海默病患者重拾记忆
近日,CareYaya Health Technologies 推出了一款名为 MedaCareLLM 的人工智能(AI)驱动大型语言模型,旨在帮助痴呆症和阿尔茨海默病患者改善日常…
-
挑战谷歌!OpenAI正式推出AI大模型 search搜索功能
OpenAI公司推出了一项名为AI大模型 search的新功能,该功能允许用户通过对话界面快速获取最新的网络搜索结果,并提供相关网页链接。这一改进使得用户可以直接在AI大模型中获得…
-
OpenAI CEO 透露计算能力不足致产品发布延迟
在近期的一次 Reddit 问答中,OpenAI 的首席执行官山姆・阿尔特曼(Sam Altman)坦承,计算能力的不足是公司无法频繁推出新产品的主要原因之一。他表示,当前的 AI…
-
又一AI生图模型新宠!Recraft v3 横扫基准测试, 击败Flux和Ideogram位列第一
近日,图像 AI 初创公司 Recraft 发布了其最新的文本生成图像模型 Recraft v3,该模型在独立测试中表现出色,重新定义了图像生成的性能标准。 根据 Recraft …
-
微软OmniParser开源项目跃居HuggingFace最受欢迎模型榜首
微软近期推出的屏幕内容解析工具OmniParser,本周跃居人工科技开源平台HuggingFace最受欢迎模型榜首。据HuggingFace联合创始人兼首席执行官Clem Dela…
-
别小看它!英伟达HOVER神经网络:在虚拟训练中仅用50分钟就能控制机器人
的研究团队宣布了一项令人兴奋的进展,他们开发了一种名为 HOVER(人形多功能控制器)的新型神经网络。这个神经网络拥有150万参数,专门用于协调人形机器人的运动和操作。 NVIDI…