News

IT之家 5 月 30 日消息,Xiaomi MiMo 官方公众号今日发文宣布,小米多模态大模型 Xiaomi MiMo-VL 现已正式开源。官方表示,其在图片、视频、语言的通用问答和理解推理等多个任务上,大幅领先同尺寸标杆多模态模型 Qwen2.5 ...
这是 Invariant 首次自动检测并披露此类漏洞。与传统的“工具被篡改”不同,Toxic Agent Flow 不需要 MCP 本身被攻破。攻击的本质是:智能代理暴露在不可信外部信息(如 GitHub Issue)环境下,被诱导执行恶意操作。
随着人工智能技术的不断发展和普及,像FOA-Attack这样的研究将发挥越来越重要的作用,推动我们在提升AI能力的同时不断加强其安全性和可靠性。期待在不久的将来,我们能够看到更多基于这些发现的创新防御方法,使AI系统更加安全、稳健,并更好地服务于人类 ...
近期,美国明尼苏达大学与伊利诺伊大学芝加哥分校等联合团队提出并实现了一个名为 InfantAgent-Next 的通用型多模态智能体系统,其能够通过文字、图像、音频等方式与计算机进行自动化交互。
MiMo-VL 的开源,无疑将加速多模态大模型技术的发展,并推动相关应用落地。随着 MiMo-VL 的开源,开发者们将能够基于该模型进行二次开发,构建更加多样化的应用场景。这不仅会促进 AI 技术的普及,也将加速 AI ...
一个团队带来了视觉信息检索领域的重大突破!由东北大学孔帆恒、冯世、杨小翠、王大领与快手科技的张静源、刘亚辉、张宏志、田宇、Victoria ...
IT之家 5 月 30 日消息,阿里巴巴昨日在 Github 上开源了其创新的自主搜索 AI Agent——WebAgent,具备端到端的自主信息检索与多步推理能力,能够像人类一样在网络环境中主动感知、决策和行动。
近期,先是OpenAI宣布Codex Agent编程模式,微软正式开源GitHub Copilot Extension for VS ...
我在《晚点》公众号读到一篇质量非常高的访谈,嘉宾是 AI 应用创业公司 YouWare 的创始人明超平。YouWare 做的事情正是 Vibe Coding。这篇是我近期读到最为深刻的创始人访谈文章。明超平居然是 95 ...
香港科技大学的研究团队从人类用户构建工作流的方式中汲取灵感,提出了ComfyMind框架。他们观察到,人类用户通常不会从头开始构建复杂工作流,而是将任务分解为更小的子任务,并基于更高层次的语义为每个子任务选择适当的模板工作流。这种模块化、逐步规划的过 ...
近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在AI评测领域的 最新 ...
尤其是最近,美国AI独角兽公司Anthropic发布新升级的大模型Claude4系列,再次让全球的程序员感受到压力。该系列包含Claude Opus 4和Claude Sonnet 4,最大特点是编程时长和理解能力突出,尤其是Claude Opus ...