访问 |人形机器人智能的核心代码就藏在这个数据工厂里_新京报

高质量、大规模的现实世界采集数据是驱动仿人机器人算法迭代和商业部署的关键资源。 3月19日,新京报贝壳财经记者探访了北京仿人机器人创新中心(以下简称“北京仿人”),该中心内设有智能机器人训练和数据采集基地。记者了解到,建成投产不到半年,该基地已成为我国内置的专业智能数据采集平台之一,领域覆盖最全、机器人配置最丰富、数据生成能力和质量最好。此外,凭借规模化的生产能力和核心标准化体系,北京Humanoid不仅主导制定了国内首个嵌入式智能数据集行业标准《数据采集规范》《内置人工智能智能数据工厂》,从而向外部市场提供了数万小时的高质量真实采集数据。该开源数据集的下载量已超过 200 万次,即将成为世界上第一个百万小时的高质量、有形、智能的数据。北京仿人标准化打造智能嵌入式“数据工厂” 与仿真数据不同,真机采集的多模态数据准确恢复了虚拟场景中难以再现的力反馈、触觉信息、环境干扰等细节,充分再现了真实环境中的任务闭环,解决了模型训练中的“分布补偿”问题,助力机器人智能从虚拟走向现实。在北京约5000平米的智能机器人数据采集与培训基地,新京报贝壳财经记者发现,该基地再现了家居、超市等六大领域办公、工业、医疗、健康等领域,构建了30多个典型应用场景。同时建设了约200平米的专业光学动作捕捉场地,可通过高精度动作捕捉技术实现拟人化动作的采集。北京的人形工作人员是远程控制的机器人,可以拾取物体。图为新京报贝壳财经记者韦博雅拍摄。现场工作人员告诉记者,基地内的所有场景都可以动态配置和重新布置,灯光、物体位置和人体运动都可以根据需要进行调整,因此收集到的数据具有足够的泛化性,可以覆盖训练算法所需的边缘情况和长尾场景。在硬件配置方面,我们目前拥有120余种不同类型的机器人设备,其中包括北京仿人公司自主研发的“天工”、“天翼”系列机器人,以及Aloha、Yushu、Youbi、Franca、UR等国内外专业机器人及设备。同时,底座配备了采集装置,如轻型头带式、夹式采集装置,实现了真机远程控制、开放环境采集、动作捕捉采集三大采集功能。 “这种多品牌、多配置、多形式的训练模式,打破了孤岛效应。单个机器人采集的数据,使用了多个来源的不同数据,涵盖了不同的运动控制逻辑、不同的识别方式、不同的交互方式。据现场工作人员介绍,该站还建立了标准化的数据生成系统,覆盖数据采集、标注和质检的全流程,确保从任务下达到最终交付的整个过程质量可控。北京娃娃工作人员机器人远程控制选择新京报贝壳财经记者韦博雅摄 解决北京Humanoid数据采集及前后端工作中出现的问题。参观期间,北京仿人智能机器人数据与培训基地主任姜未来接受了新京报贝壳财经等媒体采访,就数据质量、标准统一、行业趋势、商业落地等业界关注的核心问题进行了采访。江未来实业表示,使用人形机器人进行数据收集可用于大规模地图数据和语言数据收集。我们坦率地承认词模型数据与注释有根本的不同。这涉及到整个流程大量的现场管理和控制,影响数据质量的因素影响整个采集环节。比如采集前的场景描述、任务布局是否合理,长期任务变量的配置是否足够恩特。采集过程中的图像曝光、非平滑运动轨迹、环境反射等各种干扰。平台自动化能力和处理效率采集后标注签名直接影响最终数据的质量。江未来透露,基地运营初期,数据接受率仅为50%,大量不合格数据造成成本浪费。针对这一问题,本次安置既注重前期的现场管理,又注重后期的行政处理。从一开始就建立了严格的流程控制流程和专门的培训体系,从源头上减少采集错误。后期依靠自主研发的数据平台,对单台仪器的采集质量进行监控,对数据标准进行分类,跟踪误差,形成采集质量检查、反馈、优化的闭环管理。在。经过四个月的持续投入,基地内部质检合格率已提升至95%左右,70%以上的产能用于服务行业研发客户。当前,行业普遍存在的问题是数据异构。不同的制造商拥有不同的机器人硬件、传感器设计和控制接口,形成了机器人“方言”墙,导致数据重用效率较低,并阻碍了公司之间的数据流动。 “目前行业内主要有两种解决方案:一是探索不与特定机器人绑定的采集解决方案,二是推进世界模型的技术路线。我们也在同时进行相关探索。”江未来认识到,目前现实世界采集数据已经进入量产阶段,可以支持在现实场景下稳定训练模型。然而,异构数据解决方案仍处于试点阶段f 全行业需要研发和实施,以及技术能力和资源的改进。需要投资。对于2026年行业发展趋势,蒋未来表示,嵌入式智能数据的市场需求呈现爆发式增长,基本达到10万小时甚至数十万小时的水平,至少是2025年需求规模的10倍。行业的一个核心趋势将是新的采集方式的引入和不断优化。该行业将在现场收藏和模拟收藏之间找到更好的平衡。同时,进一步提高数据采集的规范化、智能化程度。北京贝壳财经报记者韦博雅编辑杨繁芳赵琳遮瑕

推荐文章

发表评论

邮箱地址不会被公开。 必填项已用*标注