英伟达发布 Eagle 2.5 视觉语言 AI 模型:8B 参数媲美 GPT-4o
科技媒体 marktechpost 昨日(4 月 22 日)发布博文,报道称英伟达最新推出 Eagle 2.5,一款专注于长上下文多模态学习的视觉-语言模型(VLM)。该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。
尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。卤鹅哥投喂周鸿祎拉扯20多秒被指过火