论文
-
告别“黑匣子”!北大研发新AI框架FakeShield,让图像造假无所遁形!
随着AIGC技术的快速发展,图像编辑工具日益强大,图像篡改变得更加容易,也更难被察觉。 虽然现有的图像篡改检测和定位方法(IFDL)通常很有效,但它们往往面临两大挑战:一是“黑匣子…
-
大模型也会“说谎”?哈佛最新研究揭秘AI“幻觉”真相
大型语言模型(LLM)的横空出世,尤其是AI大模型等应用的普及,彻底改变了人机交互的方式。 这些模型能够生成连贯且全面的文本,令人印象深刻。然而,尽管能力强大,LLM却容易产生“幻…
-
OpenAI推全新模型sCM,内容生成速度提升50倍,生图只需0.1秒
近日,OpenAI 的研究人员发布了一项令人振奋的研究成果,介绍了一种全新的连续时间一致性模型(sCM)。这一模型在生成多媒体内容(如图像、视频和音频)的速度上实现了飞跃,相较于传…
-
吊打ControlNe?全能型图像生成模型OmniGen问世,简单提示实现图像生成与精细编辑
近日,北京人工智能学院的研究团队推出了一款名为 OmniGen 的全新图像生成模型。 全能型图片生成编辑选手 与以往的图像生成工具如 Stable Diffusion ,OmniG…
-
AI专家谭旭加盟月之暗面,负责研发端到端语音模型
据媒体报道,微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,其中一项重要目标是为该公司打造类似GPT-4o的语音体验。 …
-
腾讯推出ima.copilot智能工作台产品 由混元大模型提供技术支持
腾讯公司近期推出了一款名为ima.copilot(简称ima)的智能工作台产品,它由腾讯混元大模型提供技术支持。这款产品旨在通过其会思考的知识库,为用户开启搜读写的新体验。ima.…
-
阿里巴巴达摩院开源CoI-Agent:一键生成科研idea的AI研究助手
阿里巴巴达摩院最近开源了一款名为CoI-Agent的AI工具,可以帮助科研人员自动生成科研idea。这个工具可以根据输入的论文主题,快速生成相关的科研idea,帮助科研人员节省时间…
-
加州大学推出DocETL:精准处理复杂文档 准确性提升1.34倍
近年来,大型语言模型(LLMs)在数据管理领域受到了广泛关注,应用范围不断扩大,包括数据整合、数据库调优、查询优化以及数据清洗等。然而,处理非结构化数据,尤其是复杂文档时,依然面临…
-
DeepMind超大规模Transformer棋力惊人,挑战AI规划极限!
最近,DeepMind一篇关于超大规模 Transformer 在国际象棋领域应用的论文,引发了 AI 社区的广泛讨论。研究人员利用名为 ChessBench 的全新数据集,训练了…
-
智源重磅推出Emu3:仅凭一个token,实现文本图像视频的全能理解与生成
智源研究院正式推出了他们的新一代多模态世界模型 Emu3,该模型最为显著的特色在于,其仅凭借对下一个 token 的预测能力,便能够在文本、图像和视频这三种不同模态中实现理解和生成…