视觉
-
告别模糊画质!超清AI图像生成模型FLUX 1.1 Pro Ultra发布 10秒生成4兆像素图像
知名 AI 图像生成工具 FLUX1.1Pro 迎来重大更新,推出全新版本 FLUX1.1Pro Ultra。新版本支持高达4兆像素的分辨率,生成速度也大幅提升,每张图片仅需约10…
-
小鹏AI机器人XPENG Iron亮相 采用端到端AI鹰眼视觉系统
在2024年小鹏AI科技日的活动中,小鹏汽车公司推出了其最新的AI机器人——Iron。这款机器人以其先进的技术和仿人结构设计引起了广泛关注。小鹏AI机器人Iron身高178cm,体…
-
最强工业AI终端来袭!ONERugged新品支持32 TOPS算力,军工级防护再创新高
在数字化转型浪潮中,ONERugged带来了一场工业级AI设备的革命性突破。这家全球工业计算解决方案领导者近日发布了三款重磅产品:坚固型AI笔记本EM-X14M、EM-X15M和坚…
-
中国团队推世界最大多模态数据集“Infinity-MM”和顶尖微型AI模型“Aquila-VL-2B”
近日,来自多家中国机构的研究团队成功创建了 “Infinity-MM” 数据集,这是目前最大规模的公开多模态 AI 数据集之一,同时训练出了一款性能卓越的小型新模型 ——Aquil…
-
中国团队发布全球最大开源多模态数据集,2B参数模型性能创新高
近日,来自多家中国科研机构的研究团队重磅发布了名为Infinity-MM的超大规模多模态数据集,并基于该数据集训练出了一个性能卓越的AI模型Aquila-VL-2B。这一突破为多模…
-
CMU、Meta联手放大招! VQAScore一个问题搞定文生图模型评测,准确性远超传统方法!
生成式AI发展迅猛,但如何全面评估其性能一直是个难题。各种模型层出不穷,效果也是越来越惊艳。但是,问题来了,怎么评价这些文生图模型的效果呢? 传统的评价方法,要么是靠人眼看,主观性…
-
马斯克的xAI面向开发者推出API,提供每月25美元的免费使用额度
埃隆马斯克的人工智能公司 xAI 宣布,其应用程序接口(API)现已向开放,并为开发者提供每月25美元的免费 API 使用额度,截止至年底。这一决定是在 xAI API 进入公测阶…
-
苹果放大招!Ferret-UI 2来了, UI 理解力直接拉满!
手机、平板、电脑、电视,屏幕越来越多,操作越来越复杂,是不是让你眼花缭乱?苹果最近丢出一个王炸——Ferret-UI2,一个超强 UI 理解模型,号称要统一江湖! 这可不是吹牛,F…
-
Nvidia 推出 AI 蓝图,助力开发者轻松构建视频分析智能代理
Nvidia 近期宣布推出其最新的 AI 蓝图,旨在帮助各行业的开发者轻松构建智能代理,分析视频和图像内容。通过这一技术,任何行业的用户都能高效地搜索和总结大量的视觉数据。 全球知…
-
别再用“框框”糊弄AI了!SegVG框架开源,像素级细节助力精准定位
在AI视觉领域,目标定位一直是个老大难问题。传统的算法就像个“近视眼”,只能粗略地用“框框”圈出目标,却看不清里面的细节。这就好比你跟朋友描述一个人,只说了个大概身高体型,朋友能找…