凯时AG

2026-06-15 18:53:28 设为首页 | 加入珍藏

英伟达推出LocateAnything,,主打AI高速、高精度检测工具

2026-06-15 18:53:28 宣布 泉源:博客园下载 作者:黄俊豪 浏览:8804次

IT之家 5 月 30 日新闻,,英伟达昨日(5 月 29 日)宣布博文,,宣布携手香港理工大学、南京大学等,,推出 LocateAnything 模子,,主打高速、高精度检测工具。。。。。。

该模子可以从照片或截图中找出指定工具,,并用检测框标出位置,,重点服务机械人感知、电脑自动操作等需要快速定位的场景。。。。。。

NVIDIA 在先容中强调,,机械人和 AI Agent(智能体)仅能“望见”还不敷,,还必需足够快地确认目的位置。。。。。。LocateAnything 围绕检测框展望重新设计,,让视觉语言检测更适合即时交互使命。。。。。。

LocateAnything 提出 Parallel Box Decoding(并行框解码),,把界线框或点作为牢靠长度原子单位,,在 1 步内展望 x1、y1、x2、y2。。。。。。

该框架提供 Fast Mode、Slow Mode 与 Hybrid Mode:

Fast Mode 面向端侧机械人和具身智能,,强调吞吐;;;;;;Slow Mode 偏向离线标注和高精度评测;;;;;;Hybrid Mode 默认快速输出,,遇到名堂异;;;;;;蚩占淦缫迨鼻谢刈曰毓榻饴。。。。。。

团队还构建 LocateAnything-Data,,包括 12M 自力图像、138M 语言盘问和 785M 界线框。。。。。。数据笼罩通用检测、GUI 元素定位、指代表达明确、OCR 文字定位、版面定位和点定位,,显著扩展训练场景。。。。。。

在单张 NVIDIA H100 GPU 上,,LocateAnything 默认 Hybrid Mode 抵达 12.7 Boxes Per Second(每秒框数),,凌驾 Qwen3-VL 的 1.1 BPS,,也高于 Rex-Omni 的 5.0 BPS。。。。。。

高精度使命中,,LocateAnything 在 LVIS 的 IoU=0.95 下得分 31.1,,高于 Rex-Omni 的 20.7;;;;;;ScreenSpot-Pro 平均 F1 达 60.3;;;;;;DocLayNet 和 M6Doc 划分达 76.8 与 70.1。。。。。。

IT之家附上参考地点

中新网5月9日电(燕新台)综合台媒报道,,8日,,台立法机构表决通过7800亿新台币“防务特殊条例草案”。。。。。。民进党民意代表因不满1.25万亿元新台币巨额预算被削减,,而整体投下弃权票。。。。。。有岛内学者以为,,相关预算或沦为“;;;;;;し选保,却得不到切实的所谓“清静包管”。。。。。。 -->

责任编辑:郭冠军    校对:刘子慧

今日热门

  1. 伊朗副外长转达向美方提交的方案
  2. 陕西“90后”墟落西席办“助学小院” 为墟落学生提供免费午饭
  3. 《煤矿重大事故隐患判断标准》修订 今年7月1日起施行
  4. 总书记的关切·落地的回响|8400万新就业形态劳动者的期盼渐成现实
  5. 西藏开展2026年“5·18国际博物馆日”系列活动
  6. 奥运冠军袁心玥走进香港社区“教排球”
  7. 科技赋能种质立异 辣椒育种离别履历化选育
  8. “北威州初夏之约”——中德友好协会联谊活动举行
  9. 美国在委内瑞拉举行军演 民众抗议
  10. 数字产品影响孩子视力、注重力等 教育部紧迫叫停“电子带娃”

相关推荐

【网站地图】