【余行智库】人形机器人算法可以继续细分：用“余行补位”在软件层面找到你的核心生态位

本文是余行智库“人形机器人产业深度观察系列”文章。我们以人形机器人算法为例，深入运用“专利零件”方法论，展示在软件定义机器人的时代，如何通过层层拆解、识别缺失、精准补位，在算法这个“软”领域找到属于你自己的“硬”核生态位。我们专注于机器人、智能制造领域的高价值专利挖掘与布局，致力于通过知识产权赋能企业高质量发展。

一、引言：算法——人形机器人的“灵魂”

如果说减速器是机器人的“关节”，灵巧手是机器人的“指尖”，伺服控制是机器人的“神经系统”，那算法就是机器人的“灵魂”。

它决定了机器人：

能不能看懂世界（感知算法）
能不能想明白该干什么（决策算法）
能不能干得漂亮（控制算法）
能不能和人自然交流（交互算法）

在人形机器人技术体系中，算法的价值占比越来越高。特斯拉Optimus的价值，一半在硬件，一半在算法。而随着技术发展，算法的占比只会越来越大。

全球算法赛道，巨头林立：

领域	代表企业	优势
感知算法	OpenAI、谷歌DeepMind、Meta	大模型、多模态
决策算法	DeepMind、伯克利、斯坦福	强化学习、模仿学习
控制算法	波士顿动力、宇树科技、优必选	运动控制、平衡控制
交互算法	谷歌、亚马逊、科大讯飞	语音识别、自然语言

看起来，算法赛道比硬件赛道更加“拥挤”——巨头碾压，创业公司还有机会吗？

答案是：有。而且机会比硬件更多。因为算法本身，比硬件更容易细分。

每拆解一层，你就离真正的“蓝海”更近一步。

二、拆解人形机器人算法：画出它的“零件地图”

用“专利零件”方法论，我们可以把人形机器人算法拆解成以下核心层级：

第一层：按功能维度拆解

层级	算法大类	子类	功能	技术难点
L1	感知算法	视觉感知	看懂世界	物体识别、场景理解、三维重建
L1	感知算法	听觉感知	听懂声音	语音识别、声源定位、语义理解
L1	感知算法	触觉感知	感受接触	触觉信号处理、材质识别
L1	感知算法	力觉感知	感受力度	力/力矩信号处理、阻抗估计
L1	感知算法	多模态融合	综合理解	视觉+听觉+触觉+力觉融合
L2	决策算法	任务规划	决定干什么	任务分解、资源分配、时序规划
L2	决策算法	路径规划	决定怎么走	全局路径、局部避障、动态规划
L2	决策算法	行为决策	决定怎么动	动作选择、行为树、状态机
L3	控制算法	运动控制	让机器人动起来	运动学、动力学、轨迹跟踪
L3	控制算法	力/位混合控制	既控位置又控力	阻抗控制、导纳控制、柔顺控制
L3	控制算法	平衡控制	让机器人站稳	姿态估计、稳定性控制、跌倒保护
L3	控制算法	灵巧操作	让手干活	抓取规划、操作控制、手眼协调
L4	交互算法	语音交互	和人说话	语音唤醒、语音合成、对话管理
L4	交互算法	表情交互	和人共情	表情生成、情绪识别、眼神交流
L4	交互算法	行为交互	和人配合	意图理解、协同控制、社交礼仪

第二层：按技术方法拆解（以视觉感知为例）

子类	技术模块	功能	技术难点
视觉感知	目标检测	找到物体在哪里	小目标、遮挡、速度
视觉感知	目标识别	认出物体是什么	细粒度分类、域适应
视觉感知	语义分割	给每个像素分类	边缘精度、实时性
视觉感知	实例分割	区分不同个体	重叠物体、实时性
视觉感知	姿态估计	知道物体怎么摆	6D姿态、遮挡
视觉感知	三维重建	知道场景什么样	深度估计、多视角融合
视觉感知	场景理解	知道在发生什么	事件识别、行为预测

第三层：按实现方式拆解（以目标检测为例）

技术模块	子模块	功能	技术难点
目标检测	骨干网络	提取特征	轻量化、高效率
目标检测	特征金字塔	多尺度特征	信息融合、计算量
目标检测	检测头	输出结果	定位精度、分类精度
目标检测	后处理	去重、过滤	NMS加速、阈值选择
目标检测	训练策略	让模型学好	数据增强、损失函数

这张地图告诉我们：算法不是“一个”技术，而是“一片”技术的海洋。每个子模块，都可能是一个独立的赛道。

三、用“余行补位”方法识别“缺失零件”

3.1 第一步：扫描现有技术，找出“空白区”

我们针对人形机器人算法的各个子模块，进行现有技术扫描：

层级	子模块	现有技术情况	竞争程度	开源程度
L1感知	通用目标检测	YOLO系列、DETR系列成熟	⭐⭐⭐⭐⭐	高
L1感知	轻量化检测	移动端优化仍有空间	⭐⭐⭐	中
L1感知	通用语义分割	Mask R-CNN成熟	⭐⭐⭐⭐	高
L1感知	实例分割	实时实例分割是难点	⭐⭐⭐	中
L1感知	6D姿态估计	遮挡下精度差	⭐⭐	低
L1感知	三维重建	NeRF/SDF热门	⭐⭐⭐⭐	中
L1感知	多模态融合	简单融合为主	⭐⭐	低
L2决策	全局路径规划	A*/Dijkstra成熟	⭐⭐⭐⭐	高
L2决策	动态避障	动态环境是难点	⭐⭐⭐	中
L2决策	任务规划	开放场景规划难	⭐⭐	低
L3控制	运动学控制	成熟	⭐⭐⭐⭐	高
L3控制	动力学控制	建模难、实时难	⭐⭐⭐	中
L3控制	力位混合控制	复杂接触难	⭐⭐	低
L3控制	平衡控制	强扰动下难	⭐⭐⭐	中
L3控制	灵巧操作	通用性差	⭐⭐	低
L4交互	语音识别	通用ASR成熟	⭐⭐⭐⭐	高
L4交互	情感识别	准确率低	⭐⭐	低
L4交互	多轮对话	垂直领域可优化	⭐⭐⭐	中

从这张扫描表可以清晰地看到：

红海：通用目标检测、通用语义分割、经典路径规划（开源多、成熟度高）
蓝海：轻量化检测、遮挡下姿态估计、多模态融合、动态环境决策、灵巧操作、情感识别
深蓝海：开放场景任务规划、复杂接触力控制、通用灵巧操作（难度大、进展慢）

3.2 第二步：评估“缺失零件”的商业价值

用三个维度评估每个“缺失零件”：

子模块	技术痛点强度	市场规模	国产替代紧迫性	综合价值
轻量化检测	⭐⭐⭐⭐（端侧实时需求）	⭐⭐⭐⭐⭐（所有机器人）	⭐⭐⭐	⭐⭐⭐⭐
遮挡下姿态估计	⭐⭐⭐⭐⭐（抓取关键）	⭐⭐⭐⭐（工业/服务）	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
多模态融合	⭐⭐⭐⭐（鲁棒性关键）	⭐⭐⭐⭐⭐（所有场景）	⭐⭐⭐	⭐⭐⭐⭐
动态环境决策	⭐⭐⭐⭐（复杂环境）	⭐⭐⭐⭐（服务/特种）	⭐⭐⭐	⭐⭐⭐
力位混合控制	⭐⭐⭐⭐⭐（精细操作）	⭐⭐⭐⭐（工业/医疗）	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
灵巧操作	⭐⭐⭐⭐⭐（通用性）	⭐⭐⭐⭐⭐（未来）	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
情感识别	⭐⭐⭐（辅助功能）	⭐⭐⭐（服务）	⭐⭐	⭐⭐⭐

力位混合控制和灵巧操作，是价值最高的“缺失零件”。

四、找到你的“生态位”：六个典型案例

4.1 生态位一：遮挡下的6D姿态估计算法

维度	分析
技术痛点	机器人在抓取时，物体经常被遮挡，现有算法精度大幅下降
目标用户	工业机器人、服务机器人、仓储机器人
竞争对手	通用算法如PoseCNN、DenseFusion在遮挡下表现不佳
技术路线	基于关键点、基于稠密对应、基于渲染比对
你的机会	开发专为遮挡场景优化的姿态估计算法
专利布局	网络结构、损失函数、训练策略、数据增强方法

4.2 生态位二：动态环境下的实时避障算法

维度	分析
技术痛点	现有避障算法在动态环境（人走来走去）中容易“僵住”或撞人
目标用户	服务机器人、人形机器人、AGV
竞争对手	经典DWA、TEB算法动态性能差；学习-based方法不稳定
技术路线	预测+规划联合优化、强化学习、模仿学习
你的机会	开发能预测行人轨迹并实时规划的避障算法
专利布局	轨迹预测模型、联合优化框架、奖励函数设计

4.3 生态位三：小样本灵巧抓取算法

维度	分析
技术痛点	现有抓取算法需要大量标注数据，新物体要重新训练
目标用户	家庭服务机器人、仓库分拣机器人
竞争对手	通用抓取算法GraspNet等需要大量数据
技术路线	元学习、少样本学习、知识迁移
你的机会	开发见过1个新物体就能抓同类物体的算法
专利布局	元学习框架、特征迁移方法、抓取先验设计

4.4 生态位四：力位混合控制中的接触稳定性算法

维度	分析
技术痛点	机器人在打磨、装配等任务中，接触时容易振荡或脱离
目标用户	工业机器人、协作机器人、人形机器人
竞争对手	经典阻抗控制在变接触场景下不稳定
技术路线	变阻抗控制、自适应控制、学习-based控制
你的机会	开发能自动调节刚度的接触稳定算法
专利布局	刚度调节策略、稳定性判据、控制框架

4.5 生态位五：基于RGB-D的实时三维重建算法（轻量化版）

维度	分析
技术痛点	现有三维重建算法计算量大，不能在机器人端侧实时运行
目标用户	服务机器人、AR/VR设备
竞争对手	NeRF、3D Gaussian Splatting计算量大
技术路线	稀疏表示、神经隐式场加速、专用硬件
你的机会	开发能在Jetson等嵌入式平台实时运行的轻量重建算法
专利布局	网络剪枝、量化方法、加速架构

4.6 生态位六：跨场景任务规划中的意图理解算法

维度	分析
技术痛点	机器人不知道用户真正想要什么，“帮我拿东西”到底拿什么？
目标用户	家庭服务机器人、陪护机器人
竞争对手	通用LLM做规划容易出错
技术路线	多模态意图理解、场景常识推理
你的机会	开发能结合场景上下文理解用户意图的规划算法
专利布局	意图推理模型、上下文编码方法、人机交互框架

五、算法专利的特殊性：如何保护“软”的东西

算法专利和硬件专利有很大不同，需要特别注意：

5.1 算法专利的“三座大山”

难点	说明	对策
客体问题	纯算法属于“智力活动规则”，不能授权	必须结合硬件，写成“方法+装置”
创造性	算法改进容易被认为“常规优化”	强调技术效果，用数据证明提升
公开充分	算法“黑箱”可能被认为没说清楚	公开关键细节，但不一定公开全部

5.2 算法专利的撰写技巧

技巧	做法	好处
软硬结合	写成“一种机器人控制方法，包括：获取传感器数据……输出控制指令……”	过客体关
场景绑定	强调在“机器人抓取”“机器人避障”等具体场景的应用	增加创造性
效果量化	用对比数据说明“精度提升X%”“速度提升Y倍”	证明创造性
多实施例	给出不同的实现方式（不同网络结构、不同参数）	支撑范围

5.3 用“专利零件”方法论布局算法专利

专利类型	保护什么
核心专利	算法流程、核心公式、网络结构
外围专利	不同的实现变体、不同的应用场景
数据专利	训练数据集的构建方法、标注方法
应用专利	在具体任务（抓取、避障、装配）中的应用

六、余行总结：用“余行补位”在算法红海中找到蓝海

算法不是“一个”技术，是“一片”技术的海洋——感知、决策、控制、交互，每个大类都能再拆解成无数子模块。拆得越细，机会越多。
开源≠没机会——通用目标检测是红海，但轻量化检测、遮挡下姿态估计、小样本抓取，都是蓝海。
算法专利要“软硬结合”——纯算法不能授权，必须结合“传感器”“控制器”“机器人”等硬件，写成具体的技术方案。
数据也是壁垒——很多算法的核心不在“模型”而在“数据”。独特的训练数据、数据增强方法，同样可以申请专利。

余行补位思想：我们帮企业做的，不是“在通用算法里内卷”，而是“在细分赛道上深耕”。用“专利零件”方法论层层拆解，用“余行补位”思想识别空白，然后用专利锁死你的算法生态位。

如果您想用“余行补位”方法论，在人形机器人算法领域找到属于您的技术生态位，欢迎联系我们。成都余行专利代理事务所（普通合伙）是经国家知识产权局批准备案的专业代理机构（机构代码：51283），专注于机器人、智能制造领域的高价值专利挖掘与布局。

我们的优势：

✅ 发明专利授权率85%以上——远高于行业平均水平，用数据说话
✅ 全流程全生命周期服务——从专利挖掘、申请布局到维权诉讼、许可运营，一站式解决
✅ “专利零件”方法论——独创的技术拆解方法，帮您逐级拆解、找到最底层的核心件
✅ “余行补位”思想——帮您识别技术空白，找到专属生态位
✅ 专注垂直领域——深耕机器人、智能制造，真正懂技术、懂产业、懂商业

成都余行专利代理事务所（普通合伙）
官网：www.hrpp.org.cn
地址：成都高新区孵化园
机构代码：51283

守护创新，创造价值——成都余行与您共创未来

【余行智库】人形机器人算法可以继续细分：用“余行补位”在软件层面找到你的核心生态位

【余行智库】人形机器人算法可以继续细分：用“余行补位”在软件层面找到你的核心生态位

一、引言：算法——人形机器人的“灵魂”

二、拆解人形机器人算法：画出它的“零件地图”

第一层：按功能维度拆解

第二层：按技术方法拆解（以视觉感知为例）

第三层：按实现方式拆解（以目标检测为例）

三、用“余行补位”方法识别“缺失零件”

3.1 第一步：扫描现有技术，找出“空白区”

3.2 第二步：评估“缺失零件”的商业价值

四、找到你的“生态位”：六个典型案例

4.1 生态位一：遮挡下的6D姿态估计算法

4.2 生态位二：动态环境下的实时避障算法

4.3 生态位三：小样本灵巧抓取算法

4.4 生态位四：力位混合控制中的接触稳定性算法

4.5 生态位五：基于RGB-D的实时三维重建算法（轻量化版）

4.6 生态位六：跨场景任务规划中的意图理解算法

五、算法专利的特殊性：如何保护“软”的东西

5.1 算法专利的“三座大山”

5.2 算法专利的撰写技巧

5.3 用“专利零件”方法论布局算法专利

六、余行总结：用“余行补位”在算法红海中找到蓝海

分享至微信分享

分享至微信