凯时AG

2026-06-17 17:03:18 设为首页 | 加入珍藏

英伟达推出LocateAnything,,,,,主打AI高速、高精度检测工具

2026-06-17 17:03:18 宣布 泉源:企鹅电竞 作者:林彦韦 浏览:6361次

IT之家 5 月 30 日新闻,,,,,英伟达昨日(5 月 29 日)宣布博文,,,,,宣布携手香港理工大学、南京大学等,,,,,推出 LocateAnything 模子,,,,,主打高速、高精度检测工具。。。。。

该模子可以从照片或截图中找出指定工具,,,,,并用检测框标出位置,,,,,重点服务机械人感知、电脑自动操作等需要快速定位的场景。。。。。

NVIDIA 在先容中强调,,,,,机械人和 AI Agent(智能体)仅能“望见”还不敷,,,,,还必需足够快地确认目的位置。。。。。LocateAnything 围绕检测框展望重新设计,,,,,让视觉语言检测更适合即时交互使命。。。。。

LocateAnything 提出 Parallel Box Decoding(并行框解码),,,,,把界线框或点作为牢靠长度原子单位,,,,,在 1 步内展望 x1、y1、x2、y2。。。。。

该框架提供 Fast Mode、Slow Mode 与 Hybrid Mode:

Fast Mode 面向端侧机械人和具身智能,,,,,强调吞吐;;;;;;Slow Mode 偏向离线标注和高精度评测;;;;;;Hybrid Mode 默认快速输出,,,,,遇到名堂异;;;;;;蚩占淦缫迨鼻谢刈曰毓榻饴。。。。。

团队还构建 LocateAnything-Data,,,,,包括 12M 自力图像、138M 语言盘问和 785M 界线框。。。。。数据笼罩通用检测、GUI 元素定位、指代表达明确、OCR 文字定位、版面定位和点定位,,,,,显著扩展训练场景。。。。。

在单张 NVIDIA H100 GPU 上,,,,,LocateAnything 默认 Hybrid Mode 抵达 12.7 Boxes Per Second(每秒框数),,,,,凌驾 Qwen3-VL 的 1.1 BPS,,,,,也高于 Rex-Omni 的 5.0 BPS。。。。。

高精度使命中,,,,,LocateAnything 在 LVIS 的 IoU=0.95 下得分 31.1,,,,,高于 Rex-Omni 的 20.7;;;;;;ScreenSpot-Pro 平均 F1 达 60.3;;;;;;DocLayNet 和 M6Doc 划分达 76.8 与 70.1。。。。。

IT之家附上参考地点

记者和患者眷属携带处方,,,,,在一家药店以89.99元的价钱购置了一盒相同规格、相同厂家的药品。。。。。随后,,,,,带着这盒药品再次来到了京远大药房。。。。。事情职员却体现,,,,,不知道这个药品集采降价,,,,,也没有接到价钱调解的通知。。。。。

责任编辑:刘家念    校对:黎彦君

今日热门

  1. “五一”假期 郑州考古工地吸引民众陶醉式体验考古魅力
  2. 勇立潮头大湾区丨文博会首设APEC展区 不止于生意 更在于“链”接
  3. 读懂中国是福山们的必修课
  4. 当魔术邂逅科学 “科普中国说”开学第一课让知识“活”起来
  5. 一批儿童相关国家标准宣布
  6. 俄国防部宣布5月8日至9日实验;;;;;;
  7. 多地银行正按要求适当加大信贷投放
  8. 女子月租10万住旅馆退租被要磨损费
  9. 在渝侨界组团寓目《给阿嬷的情书》 冀更多人读懂侨史的温度
  10. “2026年高考护航行动”启动实验:攻击种种作弊行为 优化自愿填报服务

相关推荐

【网站地图】