当前位置: 首页 » 资讯 » 行业资讯 » 下游动态 » 正文

智元发布全国首个通用具身基座模型ViLLA,开启具身智能新纪元

放大字体  缩小字体 发布日期:2025-03-10  来源:盖世汽车
摘要:       2025年3月10日,国内人工智能领军企业智元科技在北京国家会议中心正式发布"智元启元大模型(Genie Operator-1)",这是我国首个面向复杂物理世界的通用具身智能基座模型。该成果突破...
       2025年3月10日,国内人工智能领军企业智元科技在北京国家会议中心正式发布"智元启元大模型(Genie Operator-1)",这是我国首个面向复杂物理世界的通用具身智能基座模型。该成果突破性地提出"Vision-Language-Latent-Action(ViLLA)"融合架构,标志着中国在通用人工智能领域取得重大技术跃迁。

重构人机交互范式 ViLLA架构实现多模态深度融合

区别于传统单模态大模型,启元模型通过三层异构神经网络构建感知决策闭环:视觉模块采用动态注意力机制处理环境信息,语言引擎集成多轮对话上下文记忆,而独创的Latent Action空间则将抽象指令转化为可执行的动作序列。在测试中,模型展现出跨场景任务迁移能力——面对"整理杂乱书桌"指令时,系统能自主规划路径、识别物品类别并完成精准抓取摆放,全程无需人工干预。

全场景落地加速 智能终端迎来革命性升级

基于启元基座开发的具身智能终端已进入规模化测试阶段。在工业质检领域,搭载该模型的机械臂可将零件缺陷识别准确率提升至99.7%,同时将操作效率提高3倍;智能家居系统中,家庭服务机器人可通过三维语义理解实现"擦桌子时避开装饰品"等精细化动作。更值得关注的是医疗护理场景,经过专业数据训练的机器人已能协助完成导诊分诊、康复器械操作等专业任务,为老龄化社会提供解决方案。

产学研联动构建生态壁垒

智元科技联合清华大学、中科院自动化所等机构成立"具身智能联合实验室",计划年内开放百万级参数级的开源训练框架。公司CEO李峰透露:"我们将持续投入超20亿元研发资金,年内推出支持多国语言、适配主流硬件的开发者套件,与合作伙伴共建具身智能产业生态。"随着国家"新一代人工智能发展规划"的深入推进,智元科技此次突破或将加速我国在通用人工智能赛道上的国际竞争力。

 
关于我们:ICC鑫椤资讯成立于2010年,主要服务于炭素、锂电、电炉钢3大行业,是中国领先的专业产业研究和顾问公司。鑫椤资讯以研究为中心,提供媒体资讯、研究咨询、数据库和市场营销等解决方案。
鑫椤锂电专注于锂电池原材料、锂电池及其下游等相关产业链跟踪,对市场价格、行情动态等资讯的搜集与研究,常年跟踪行业内400多家生产企业,拥有完善的产业数据库。根据企业需求提供定制报告,为企业提供专业化服务。
鑫椤锂电以研究为中心,服务于行业企业、金融机构(一二级市场私募基金/券商/银行等)、高校/科研院所、政府等,为客户提供的独特洞见、分析和资源,帮助客户高效决策,以实现高质量的业务增长。

[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
资讯浏览
市场报价
 
| 版权隐私 | 使用协议 | 网站服务 | 联系方式 | 网站招聘 | 关于我们
电话:021-50184981   电子邮箱:service@iccsino.com   地址:上海市浦东新区商城路506号新梅联合广场B座21楼D  邮编:200122  沪ICP备2022024271号-1