【余行智库】人形机器人算法可以继续细分:用“余行补位”在软件层面找到你的核心生态位
本文是余行智库“人形机器人产业深度观察系列”文章。我们以人形机器人算法为例,深入运用“专利零件”方法论,展示在软件定义机器人的时代,如何通过层层拆解、识别缺失、精准补位,在算法这个“软”领域找到属于你自己的“硬”核生态位。我们专注于机器人、智能制造领域的高价值专利挖掘与布局,致力于通过知识产权赋能企业高质量发展。
一、引言:算法——人形机器人的“灵魂”
如果说减速器是机器人的“关节”,灵巧手是机器人的“指尖”,伺服控制是机器人的“神经系统”,那算法就是机器人的“灵魂”。
它决定了机器人:
- 能不能看懂世界(感知算法)
- 能不能想明白该干什么(决策算法)
- 能不能干得漂亮(控制算法)
- 能不能和人自然交流(交互算法)
在人形机器人技术体系中,算法的价值占比越来越高。特斯拉Optimus的价值,一半在硬件,一半在算法。而随着技术发展,算法的占比只会越来越大。
全球算法赛道,巨头林立:
| 领域 | 代表企业 | 优势 |
|---|---|---|
| 感知算法 | OpenAI、谷歌DeepMind、Meta | 大模型、多模态 |
| 决策算法 | DeepMind、伯克利、斯坦福 | 强化学习、模仿学习 |
| 控制算法 | 波士顿动力、宇树科技、优必选 | 运动控制、平衡控制 |
| 交互算法 | 谷歌、亚马逊、科大讯飞 | 语音识别、自然语言 |
看起来,算法赛道比硬件赛道更加“拥挤”——巨头碾压,创业公司还有机会吗?
答案是:有。而且机会比硬件更多。因为算法本身,比硬件更容易细分。
每拆解一层,你就离真正的“蓝海”更近一步。
二、拆解人形机器人算法:画出它的“零件地图”
用“专利零件”方法论,我们可以把人形机器人算法拆解成以下核心层级:
第一层:按功能维度拆解
| 层级 | 算法大类 | 子类 | 功能 | 技术难点 |
|---|---|---|---|---|
| L1 | 感知算法 | 视觉感知 | 看懂世界 | 物体识别、场景理解、三维重建 |
| L1 | 感知算法 | 听觉感知 | 听懂声音 | 语音识别、声源定位、语义理解 |
| L1 | 感知算法 | 触觉感知 | 感受接触 | 触觉信号处理、材质识别 |
| L1 | 感知算法 | 力觉感知 | 感受力度 | 力/力矩信号处理、阻抗估计 |
| L1 | 感知算法 | 多模态融合 | 综合理解 | 视觉+听觉+触觉+力觉融合 |
| L2 | 决策算法 | 任务规划 | 决定干什么 | 任务分解、资源分配、时序规划 |
| L2 | 决策算法 | 路径规划 | 决定怎么走 | 全局路径、局部避障、动态规划 |
| L2 | 决策算法 | 行为决策 | 决定怎么动 | 动作选择、行为树、状态机 |
| L3 | 控制算法 | 运动控制 | 让机器人动起来 | 运动学、动力学、轨迹跟踪 |
| L3 | 控制算法 | 力/位混合控制 | 既控位置又控力 | 阻抗控制、导纳控制、柔顺控制 |
| L3 | 控制算法 | 平衡控制 | 让机器人站稳 | 姿态估计、稳定性控制、跌倒保护 |
| L3 | 控制算法 | 灵巧操作 | 让手干活 | 抓取规划、操作控制、手眼协调 |
| L4 | 交互算法 | 语音交互 | 和人说话 | 语音唤醒、语音合成、对话管理 |
| L4 | 交互算法 | 表情交互 | 和人共情 | 表情生成、情绪识别、眼神交流 |
| L4 | 交互算法 | 行为交互 | 和人配合 | 意图理解、协同控制、社交礼仪 |
第二层:按技术方法拆解(以视觉感知为例)
| 子类 | 技术模块 | 功能 | 技术难点 |
|---|---|---|---|
| 视觉感知 | 目标检测 | 找到物体在哪里 | 小目标、遮挡、速度 |
| 视觉感知 | 目标识别 | 认出物体是什么 | 细粒度分类、域适应 |
| 视觉感知 | 语义分割 | 给每个像素分类 | 边缘精度、实时性 |
| 视觉感知 | 实例分割 | 区分不同个体 | 重叠物体、实时性 |
| 视觉感知 | 姿态估计 | 知道物体怎么摆 | 6D姿态、遮挡 |
| 视觉感知 | 三维重建 | 知道场景什么样 | 深度估计、多视角融合 |
| 视觉感知 | 场景理解 | 知道在发生什么 | 事件识别、行为预测 |
第三层:按实现方式拆解(以目标检测为例)
| 技术模块 | 子模块 | 功能 | 技术难点 |
|---|---|---|---|
| 目标检测 | 骨干网络 | 提取特征 | 轻量化、高效率 |
| 目标检测 | 特征金字塔 | 多尺度特征 | 信息融合、计算量 |
| 目标检测 | 检测头 | 输出结果 | 定位精度、分类精度 |
| 目标检测 | 后处理 | 去重、过滤 | NMS加速、阈值选择 |
| 目标检测 | 训练策略 | 让模型学好 | 数据增强、损失函数 |
这张地图告诉我们:算法不是“一个”技术,而是“一片”技术的海洋。 每个子模块,都可能是一个独立的赛道。
三、用“余行补位”方法识别“缺失零件”
3.1 第一步:扫描现有技术,找出“空白区”
我们针对人形机器人算法的各个子模块,进行现有技术扫描:
| 层级 | 子模块 | 现有技术情况 | 竞争程度 | 开源程度 |
|---|---|---|---|---|
| L1感知 | 通用目标检测 | YOLO系列、DETR系列成熟 | ⭐⭐⭐⭐⭐ | 高 |
| L1感知 | 轻量化检测 | 移动端优化仍有空间 | ⭐⭐⭐ | 中 |
| L1感知 | 通用语义分割 | Mask R-CNN成熟 | ⭐⭐⭐⭐ | 高 |
| L1感知 | 实例分割 | 实时实例分割是难点 | ⭐⭐⭐ | 中 |
| L1感知 | 6D姿态估计 | 遮挡下精度差 | ⭐⭐ | 低 |
| L1感知 | 三维重建 | NeRF/SDF热门 | ⭐⭐⭐⭐ | 中 |
| L1感知 | 多模态融合 | 简单融合为主 | ⭐⭐ | 低 |
| L2决策 | 全局路径规划 | A*/Dijkstra成熟 | ⭐⭐⭐⭐ | 高 |
| L2决策 | 动态避障 | 动态环境是难点 | ⭐⭐⭐ | 中 |
| L2决策 | 任务规划 | 开放场景规划难 | ⭐⭐ | 低 |
| L3控制 | 运动学控制 | 成熟 | ⭐⭐⭐⭐ | 高 |
| L3控制 | 动力学控制 | 建模难、实时难 | ⭐⭐⭐ | 中 |
| L3控制 | 力位混合控制 | 复杂接触难 | ⭐⭐ | 低 |
| L3控制 | 平衡控制 | 强扰动下难 | ⭐⭐⭐ | 中 |
| L3控制 | 灵巧操作 | 通用性差 | ⭐⭐ | 低 |
| L4交互 | 语音识别 | 通用ASR成熟 | ⭐⭐⭐⭐ | 高 |
| L4交互 | 情感识别 | 准确率低 | ⭐⭐ | 低 |
| L4交互 | 多轮对话 | 垂直领域可优化 | ⭐⭐⭐ | 中 |
从这张扫描表可以清晰地看到:
- 红海:通用目标检测、通用语义分割、经典路径规划(开源多、成熟度高)
- 蓝海:轻量化检测、遮挡下姿态估计、多模态融合、动态环境决策、灵巧操作、情感识别
- 深蓝海:开放场景任务规划、复杂接触力控制、通用灵巧操作(难度大、进展慢)
3.2 第二步:评估“缺失零件”的商业价值
用三个维度评估每个“缺失零件”:
| 子模块 | 技术痛点强度 | 市场规模 | 国产替代紧迫性 | 综合价值 |
|---|---|---|---|---|
| 轻量化检测 | ⭐⭐⭐⭐(端侧实时需求) | ⭐⭐⭐⭐⭐(所有机器人) | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| 遮挡下姿态估计 | ⭐⭐⭐⭐⭐(抓取关键) | ⭐⭐⭐⭐(工业/服务) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 多模态融合 | ⭐⭐⭐⭐(鲁棒性关键) | ⭐⭐⭐⭐⭐(所有场景) | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| 动态环境决策 | ⭐⭐⭐⭐(复杂环境) | ⭐⭐⭐⭐(服务/特种) | ⭐⭐⭐ | ⭐⭐⭐ |
| 力位混合控制 | ⭐⭐⭐⭐⭐(精细操作) | ⭐⭐⭐⭐(工业/医疗) | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 灵巧操作 | ⭐⭐⭐⭐⭐(通用性) | ⭐⭐⭐⭐⭐(未来) | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 情感识别 | ⭐⭐⭐(辅助功能) | ⭐⭐⭐(服务) | ⭐⭐ | ⭐⭐⭐ |
力位混合控制和灵巧操作,是价值最高的“缺失零件”。
四、找到你的“生态位”:六个典型案例
4.1 生态位一:遮挡下的6D姿态估计算法
| 维度 | 分析 |
|---|---|
| 技术痛点 | 机器人在抓取时,物体经常被遮挡,现有算法精度大幅下降 |
| 目标用户 | 工业机器人、服务机器人、仓储机器人 |
| 竞争对手 | 通用算法如PoseCNN、DenseFusion在遮挡下表现不佳 |
| 技术路线 | 基于关键点、基于稠密对应、基于渲染比对 |
| 你的机会 | 开发专为遮挡场景优化的姿态估计算法 |
| 专利布局 | 网络结构、损失函数、训练策略、数据增强方法 |
4.2 生态位二:动态环境下的实时避障算法
| 维度 | 分析 |
|---|---|
| 技术痛点 | 现有避障算法在动态环境(人走来走去)中容易“僵住”或撞人 |
| 目标用户 | 服务机器人、人形机器人、AGV |
| 竞争对手 | 经典DWA、TEB算法动态性能差;学习-based方法不稳定 |
| 技术路线 | 预测+规划联合优化、强化学习、模仿学习 |
| 你的机会 | 开发能预测行人轨迹并实时规划的避障算法 |
| 专利布局 | 轨迹预测模型、联合优化框架、奖励函数设计 |
4.3 生态位三:小样本灵巧抓取算法
| 维度 | 分析 |
|---|---|
| 技术痛点 | 现有抓取算法需要大量标注数据,新物体要重新训练 |
| 目标用户 | 家庭服务机器人、仓库分拣机器人 |
| 竞争对手 | 通用抓取算法GraspNet等需要大量数据 |
| 技术路线 | 元学习、少样本学习、知识迁移 |
| 你的机会 | 开发见过1个新物体就能抓同类物体的算法 |
| 专利布局 | 元学习框架、特征迁移方法、抓取先验设计 |
4.4 生态位四:力位混合控制中的接触稳定性算法
| 维度 | 分析 |
|---|---|
| 技术痛点 | 机器人在打磨、装配等任务中,接触时容易振荡或脱离 |
| 目标用户 | 工业机器人、协作机器人、人形机器人 |
| 竞争对手 | 经典阻抗控制在变接触场景下不稳定 |
| 技术路线 | 变阻抗控制、自适应控制、学习-based控制 |
| 你的机会 | 开发能自动调节刚度的接触稳定算法 |
| 专利布局 | 刚度调节策略、稳定性判据、控制框架 |
4.5 生态位五:基于RGB-D的实时三维重建算法(轻量化版)
| 维度 | 分析 |
|---|---|
| 技术痛点 | 现有三维重建算法计算量大,不能在机器人端侧实时运行 |
| 目标用户 | 服务机器人、AR/VR设备 |
| 竞争对手 | NeRF、3D Gaussian Splatting计算量大 |
| 技术路线 | 稀疏表示、神经隐式场加速、专用硬件 |
| 你的机会 | 开发能在Jetson等嵌入式平台实时运行的轻量重建算法 |
| 专利布局 | 网络剪枝、量化方法、加速架构 |
4.6 生态位六:跨场景任务规划中的意图理解算法
| 维度 | 分析 |
|---|---|
| 技术痛点 | 机器人不知道用户真正想要什么,“帮我拿东西”到底拿什么? |
| 目标用户 | 家庭服务机器人、陪护机器人 |
| 竞争对手 | 通用LLM做规划容易出错 |
| 技术路线 | 多模态意图理解、场景常识推理 |
| 你的机会 | 开发能结合场景上下文理解用户意图的规划算法 |
| 专利布局 | 意图推理模型、上下文编码方法、人机交互框架 |
五、算法专利的特殊性:如何保护“软”的东西
算法专利和硬件专利有很大不同,需要特别注意:
5.1 算法专利的“三座大山”
| 难点 | 说明 | 对策 |
|---|---|---|
| 客体问题 | 纯算法属于“智力活动规则”,不能授权 | 必须结合硬件,写成“方法+装置” |
| 创造性 | 算法改进容易被认为“常规优化” | 强调技术效果,用数据证明提升 |
| 公开充分 | 算法“黑箱”可能被认为没说清楚 | 公开关键细节,但不一定公开全部 |
5.2 算法专利的撰写技巧
| 技巧 | 做法 | 好处 |
|---|---|---|
| 软硬结合 | 写成“一种机器人控制方法,包括:获取传感器数据……输出控制指令……” | 过客体关 |
| 场景绑定 | 强调在“机器人抓取”“机器人避障”等具体场景的应用 | 增加创造性 |
| 效果量化 | 用对比数据说明“精度提升X%”“速度提升Y倍” | 证明创造性 |
| 多实施例 | 给出不同的实现方式(不同网络结构、不同参数) | 支撑范围 |
5.3 用“专利零件”方法论布局算法专利
| 专利类型 | 保护什么 |
|---|---|
| 核心专利 | 算法流程、核心公式、网络结构 |
| 外围专利 | 不同的实现变体、不同的应用场景 |
| 数据专利 | 训练数据集的构建方法、标注方法 |
| 应用专利 | 在具体任务(抓取、避障、装配)中的应用 |
六、余行总结:用“余行补位”在算法红海中找到蓝海
- 算法不是“一个”技术,是“一片”技术的海洋——感知、决策、控制、交互,每个大类都能再拆解成无数子模块。拆得越细,机会越多。
- 开源≠没机会——通用目标检测是红海,但轻量化检测、遮挡下姿态估计、小样本抓取,都是蓝海。
- 算法专利要“软硬结合”——纯算法不能授权,必须结合“传感器”“控制器”“机器人”等硬件,写成具体的技术方案。
- 数据也是壁垒——很多算法的核心不在“模型”而在“数据”。独特的训练数据、数据增强方法,同样可以申请专利。
余行补位思想:我们帮企业做的,不是“在通用算法里内卷”,而是“在细分赛道上深耕”。用“专利零件”方法论层层拆解,用“余行补位”思想识别空白,然后用专利锁死你的算法生态位。
如果您想用“余行补位”方法论,在人形机器人算法领域找到属于您的技术生态位,欢迎联系我们。成都余行专利代理事务所(普通合伙)是经国家知识产权局批准备案的专业代理机构(机构代码:51283),专注于机器人、智能制造领域的高价值专利挖掘与布局。
我们的优势:
- ✅ 发明专利授权率85%以上——远高于行业平均水平,用数据说话
- ✅ 全流程全生命周期服务——从专利挖掘、申请布局到维权诉讼、许可运营,一站式解决
- ✅ “专利零件”方法论——独创的技术拆解方法,帮您逐级拆解、找到最底层的核心件
- ✅ “余行补位”思想——帮您识别技术空白,找到专属生态位
- ✅ 专注垂直领域——深耕机器人、智能制造,真正懂技术、懂产业、懂商业
成都余行专利代理事务所(普通合伙)
官网:www.hrpp.org.cn
地址:成都高新区孵化园
机构代码:51283
守护创新,创造价值——成都余行与您共创未来


