动态场景,开放文本查询!清华哈佛联合建模4D语言场

动态场景,开放文本查询!清华哈佛联合建模4D语言场

新智元报道编辑:LRST【新智元导读】4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用多模态大模型生成物体级的语言描述,并通过状态

10小时前10