本文摘要:Google近日公布了全新的移动末端3D辨识方案Objectron,该方案可在2D图像中找到物体并通过AI模型估计其方位、方向和尺寸。
Google近日公布了全新的移动末端3D辨识方案Objectron,该方案可在2D图像中找到物体并通过AI模型估计其方位、方向和尺寸。Google回应,Objectron对机器人技术、自动驾驶汽车、图像检索和AR技术影响深远影响,例如,其可以协助工厂车间的机器人动态回避障碍。目前,追踪3D对象是一个棘手的问题,特别是在是在处置受限的计算资源时。
由于缺少数据以及物体的外观和形状的多样性,当仅有的能用图像为2D时,情况不会显得更糟。为此,Objectron研发团队研发了一种图片标记工具,该工具可以通过分屏视角表明2D视频帧,反对标记者用于分屏视图表明2D视频帧来标记对象的3D边界板(即矩形边框)。这些3D边界框将变换在点云数据、摄像头画面和辨识到的平面上。标记者在3D视图中标记3D边界框后,可以在2D视频帧中展开检验,而对于静态图像,标记者只需在单个帧中标记目标对象才可。
标记工具还用于ARsession数据中的实际摄像头信息来确认该物体在所有帧中的方位。为了补足现实世界中的数据以提升AI模型预测的准确性,Google研发团队研发了一种引擎,将虚拟世界对象摆放到包括AR不会话数据的场景中,这样就可以用于摄像机图像检测到的平面区以及预测的光线,来分解与场景给定的光照在物理中的方位,从而产生高质量的制备数据。在检验测试中,综合数据的准确性提升了大约10%。
本文来源:半岛体育官网-www.hz-nk.cn