《具身智能语料库建设导则》正式发布!
2025-05-08 09:53 来源:库帕思
2025年4月30日,经上海市人工智能行业协会审查通过,库帕思牵头发布《具身智能语料库建设导则》(T/SAIAS 018—2025)团体标准修订版。《导则》修订版由上海人工智能行业协会归口,由上海库帕思科技有限公司牵头,联合上海人工智能创新中心、人形机器人(上海)有限公司、上海电器科学研究所(集团)有限公司、上海智元新创技术有限公司、上海穹彻智能科技有限公司、上海傅利叶科技有限公司、上海开普勒探索机器人有限公司、中国电子科技集团公司第二十一研究所、星海图(苏州) 人工智能科技有限公司和中国信通院上海工创中心等22家研究机构、行业协会和企业共同编制。
在人工智能的浪潮中,具身智能作为前沿科技的代表,正受到国家和上海市的高度重视。2024年11月由库帕思牵头发布的《具身智能语料库建设导则》正是在这一背景下应运而生,提供了建设具身智能数据、具身智能数据采集方式、具身智能语料生产方法和数据安全方面的技术指导方法,为具身智能研究提供统一的语料库建设框架。2025年2月,结合当前具身智能行业的新发展,充分考虑具身智能领域数据采集的多样性和数据质量的有效性,特别是对模型训练的可验证性等,库帕思主动牵头启动该标准的修订工作,迅速组建修编工作小组,联合机器人企业、科研机构、高校等,深入开展行业调研,收集整理相关数据资料,起草标准修订版,并根据各方反馈意见进行修改完善。本次修订聚焦五大核心领域:
数据存储方案兼容性:补充具身智能数据常见底层存储格式;
采集方式完整性:补充“生产伴随”数据采集模式及数据生产标准;
场景分类标准化:补充具身智能数据场景分类体系,包括场景、任务及原子技能等;
操作规范场景适配性:补充具身智能数据各个场景下的操作规范和采集标准;
质量验证模型导向性:补充多种数据采集方式下的数据质量验证方法,加强数据预处理。
《具身智能语料库建设导则》修订版旨在为语料库的建设提供更坚实的数据基础和标准化指导。通过构建覆盖全流程的标准化体系,有效解决行业在数据采集多样性、质量验证可靠性、存储方案兼容性等方面的共性问题。未来该标准的实施将推动具身智能技术的创新和应用,为具身智能产业的科学健康发展注入强大动力。