论文
-
想让机器人更智能?清华团队发现机器人学习速成秘诀
深度学习的快速发展离不开规模化的数据集、模型和计算量。在自然语言处理和计算机视觉领域,研究人员已经发现了模型性能与数据规模之间存在幂律关系。然而,机器人领域,特别是机器人操控领域,…
-
无需顶级显卡,Meissonic 让你轻松生成媲美 SDXL 的高清大图!
Stable Diffusion 等模型的出现标志着图像生成领域取得了重大进展,但其与自回归语言模型的根本区别,阻碍了统一的语言视觉模型的开发。为解决这一问题,研究人员推出了 Me…
-
TableGPT2:让表格数据“开口说话”!
大型语言模型(LLM)的崛起为人工智能应用带来了革命性的变化,然而,它们在处理表格数据方面却存在着明显的不足。 浙江大学计算创新研究院的研究团队针对这一问题,推出了一款名为 Tab…
-
Meta AI发布FBDetect:实时识别0.005%性能下降,节省数千台服务器!
在大型云基础设施的管理中,即便是微小的性能下降也可能导致显著的资源浪费。例如,在 Meta 这样的公司中,一项应用的运行速度下降0.05% 看似微不足道,但在数百万台服务器同时运转…
-
10月份AI大模型 流量激增至37 亿,谷歌NotebookLM 凭新功能飙升成黑马!
根据 Similarweb 最新数据显示,AI大模型 在2024年10月的全球访问量达到了37亿次,较上月增长了17.2%,同比去年增长了115.9%。 自2024年4月从 cha…
-
研究发现:AI Agent 更易受弹窗干扰,攻击率高达 86%
近期,斯坦福大学和香港大学的研究人员发现,当前的 AI Agent(如 Claude)比人类更容易受到弹窗干扰,甚至在面对简单的弹窗时,它们的表现大幅下降。 根据研究,AI Age…
-
告别龟速视频生成!Meta AdaCache 算法实现 4.7 倍加速,成本狂降!
生成高质量、时间连续的视频需要大量的计算资源,尤其是对于较长的时间跨度而言。最新的扩散Transformer 模型(DiTs)虽然在视频生成方面取得了显著进展,但由于其依赖于更大的…
-
AI “电子舌”来了!可品尝食物味道,轻松检测食品新鲜度
最近,科学家们成功研发出一种名为 “电子舌” 的新型设备,这种设备利用人工智能技术,能够准确区分不同种类的咖啡混合物,并且具备检测食品和饮料是否即将变质的能力。随着科技的不断进步,…
-
中国团队推世界最大多模态数据集“Infinity-MM”和顶尖微型AI模型“Aquila-VL-2B”
近日,来自多家中国机构的研究团队成功创建了 “Infinity-MM” 数据集,这是目前最大规模的公开多模态 AI 数据集之一,同时训练出了一款性能卓越的小型新模型 ——Aquil…
-
苹果放大招!Ferret-UI 2来了, UI 理解力直接拉满!
手机、平板、电脑、电视,屏幕越来越多,操作越来越复杂,是不是让你眼花缭乱?苹果最近丢出一个王炸——Ferret-UI2,一个超强 UI 理解模型,号称要统一江湖! 这可不是吹牛,F…