凯时AG

2026-06-18 07:25:34 设为首页 | 加入珍藏

英伟达推出LocateAnything,,,,,主打AI高速、高精度检测工具

2026-06-18 07:25:34 宣布 泉源:统一下载 作者:农淑娟 浏览:6380次

IT之家 5 月 30 日新闻,,,,,英伟达昨日(5 月 29 日)宣布博文,,,,,宣布携手香港理工大学、南京大学等,,,,,推出 LocateAnything 模子,,,,,主打高速、高精度检测工具。。 。

该模子可以从照片或截图中找出指定工具,,,,,并用检测框标出位置,,,,,重点服务机械人感知、电脑自动操作等需要快速定位的场景。。 。

NVIDIA 在先容中强调,,,,,机械人和 AI Agent(智能体)仅能“望见”还不敷,,,,,还必需足够快地确认目的位置。。 。LocateAnything 围绕检测框展望重新设计,,,,,让视觉语言检测更适合即时交互使命。。 。

LocateAnything 提出 Parallel Box Decoding(并行框解码),,,,,把界线框或点作为牢靠长度原子单位,,,,,在 1 步内展望 x1、y1、x2、y2。。 。

该框架提供 Fast Mode、Slow Mode 与 Hybrid Mode:

Fast Mode 面向端侧机械人和具身智能,,,,,强调吞吐 ;;Slow Mode 偏向离线标注和高精度评测 ;;Hybrid Mode 默认快速输出,,,,,遇到名堂异 ;;蚩占淦缫迨鼻谢刈曰毓榻饴。。 。

团队还构建 LocateAnything-Data,,,,,包括 12M 自力图像、138M 语言盘问和 785M 界线框。。 。数据笼罩通用检测、GUI 元素定位、指代表达明确、OCR 文字定位、版面定位和点定位,,,,,显著扩展训练场景。。 。

在单张 NVIDIA H100 GPU 上,,,,,LocateAnything 默认 Hybrid Mode 抵达 12.7 Boxes Per Second(每秒框数),,,,,凌驾 Qwen3-VL 的 1.1 BPS,,,,,也高于 Rex-Omni 的 5.0 BPS。。 。

高精度使命中,,,,,LocateAnything 在 LVIS 的 IoU=0.95 下得分 31.1,,,,,高于 Rex-Omni 的 20.7 ;;ScreenSpot-Pro 平均 F1 达 60.3 ;;DocLayNet 和 M6Doc 划分达 76.8 与 70.1。。 。

IT之家附上参考地点

王萍是径山抹茶制作武艺代表性传承人,,,,,一经笃志钻研宋代茶汤工艺的她,,,,,现在的新身份是茶艺“导师”,,,,,她的古法抹茶体验课天天一座难求。。 。陈金信是茶筅制作武艺代表性传承人,,,,,在他的非遗工坊里,,,,,古板工艺被精准解码,,,,,年轻人在指尖流转间读懂作甚中国匠心。。 。留学返乡的马宽把自家茶楼刷新成茶文化体验空间,,,,,以茶文旅融合探索非遗活态传承。。 。

责任编辑:黎彦君    校对:林诗婷

今日热门

  1. 江门中微子实验平稳运行 中微子振荡准确丈量时代已到来
  2. 从“五一”假期消耗看中国经济向新向优
  3. 民盟东营市委会启动“爱心润星・益起偕行”公益帮扶自闭症儿童行动
  4. 中国拍的月球反面照片来了
  5. 不出校门看天下!在高校国际青年文化节开启陶醉式环球之旅
  6. 杭州萧山机场海关查获化妆品、衣服等物品共计162件
  7. 从千年药香到数字工厂 外洋留学生“陶醉式”感知中国
  8. 国台办回应台湾网红“馆长”在川渝直播参访
  9. 中国人民对外友好协会会长杨万明率团会见加拿大、美国
  10. 山西举行2026年“天下计量日”主题宣传活动

相关推荐

【网站地图】