计算机系统应用教程网站

网站首页 > 技术文章正文

云从科技提出视觉-语言跟踪大一统模型，刷新4项世界纪录

btikc 2024-09-10 11:41:33 技术文章 8 ℃ 0 评论

鞭牛士 8月8日消息，云从科技官方微信公众号发文称，近日，作为多媒体领域唯一CCF A类顶级国际人工智能学术会议ACM MM 2023公布了论文接收名单，云从科技及联合研究团队的论文《All in One: Exploring Unified Vision-Language Tracking with Multi-Modal Alignment》成功入选。

All-in-One模型首次实现了视觉-语言跟踪网络结构与学习范式的大一统，摒弃了复杂的融合模块，实现了更加高效的多模态跟踪框架。All-in-One在4个富有挑战性的数据集（TNL2K, LaSOT, LaSOTExt, WebUAV-3M）上刷新了四项世界纪录，并在OTB99-L数据集上使用单模型达到了多模型效果，这是云从科技从容大模型在多模态方面的又一次技术突破。

上一篇：商汤开源最大目标跟踪库PySOT，代码已正式上线!
下一篇： 2019年综述TOP20

网站首页 > 技术文章正文

云从科技提出视觉-语言跟踪大一统模型，刷新4项世界纪录

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

网站首页 > 技术文章 正文

云从科技提出视觉-语言跟踪大一统模型，刷新4项世界纪录

猜你喜欢

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎 你 发表评论:

网站首页 > 技术文章正文

取消回复欢迎你发表评论: