尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
已满i8进入i3入7y7y9秒李在明的经历,是韩国“汉江奇迹”时期农民身份变迁的缩影。伴随工业化进程,失地农民举家来到城市,却没有生存之道。李在明的父亲成为清洁工,母亲看厕所,几个孩子都辍学打工,一位哥哥因工伤断了腿。从2018年开始,李先生就被降为副机长,中间还有几年被停飞。李先生说:“因为我认为不公平,我进行过申诉,后面公司也劝能不能缓和一下,先回来飞,我暂时就答应了,但每次回来,都被一直压着。”已满i8进入i3入7y7y9秒姐姐让我戴上避孕套歌曲原唱江苏亚华通用航空的企业负责人是扬州本地企业家沈刚,他在接受媒体采访时称,自己既是资深球迷也是航空爱好者,这次飞行本是镇江到扬州的例行训练,但特意选在比赛时间飞过球场,就是想为家乡球队助威。卡纳瓦罗在去年年底成为萨格勒布迪纳摩主帅,今年4月下课。如今卡纳瓦罗又收到了莫斯科中央陆军的邀请,有可能前往俄罗斯执教。在2024-25赛季的俄超联赛,莫斯科中央陆军排名第三。
20250819 💔 已满i8进入i3入7y7y9秒值得注意的是,如果美国空军对伊朗发动大规模空袭,在很大程度上需要依托分布在海湾国家的大型空军基地,包括卡塔尔的乌代德基地、伊拉克的阿萨德空军基地、阿联酋的阿尔达夫拉空军基地等,但使用这些基地需要得到相关国家的许可。截至目前相关国家纷纷表态不同意美军使用本国基地空袭伊朗。这也意味着如果美军战机不能使用这些中东基地,将在很大程度上限制美国空军的发挥余地。y31成色好的y31赛季初,他的表现并非那么出色,但后来他踢得很好。他进了很多球,也适应了在皇马的踢球方式,这和在其他球队踢球完全不同。
📸 高世华记者 郑占立 摄
20250819 😘 已满i8进入i3入7y7y9秒对于车主的维权行为,网友也有不同看法。有网友表示,从车主自己放的图片起火位置,的确不像电池自燃。也有网友表示,车停在地库,又不是暴晒。免费观看已满十八岁播放电视剧在前主帅齐沃离任并前往国米执教后,帕尔马需要寻找一名新主帅。迪马济奥透露,德罗西在竞争中领先吉拉迪诺,更加接近帕尔马的帅位。德罗西此前曾执教过斯帕尔、罗马,去年9月在罗马下课。除了帕尔马之外,意大利国家队也将德罗西视为新主帅候选人之一。
📸 陈虽军记者 李黎 摄
👄 该报道指出,加斯佩里尼在此前执教亚特兰大的时候就很欣赏韦斯利-利马,目前他也已经要求罗马关注这位年轻的巴西国脚。少女初恋吃小头头视频免费播放