【余行智库】人形机器人“眼睛”可以继续细分:用“余行补位”在机器视觉领域找到你的核心生态位
本文是余行智库“人形机器人产业深度观察系列”文章。我们以人形机器人“眼睛”(视觉系统)为例,深入运用“专利零件”方法论,展示在机器视觉这个技术密集、巨头林立的领域,如何通过层层拆解、识别缺失、精准补位,找到属于你自己的技术生态位。我们专注于机器人、智能制造领域的高价值专利挖掘与布局,致力于通过知识产权赋能企业高质量发展。
一、引言:人形机器人的“眼睛”——感知世界的窗口
如果说“大脑”是机器人的灵魂,那“眼睛”就是灵魂与世界的接口。
没有好的“眼睛”,再聪明的大脑也是“睁眼瞎”。
人形机器人的“眼睛”,远比人类的视觉复杂。它不仅需要看清世界,还要能:
- 看得懂:识别物体、理解场景
- 测得准:知道物体离多远、有多大
- 跟得上:实时响应,不能卡顿
- 扛得住:在各种光照、环境条件下稳定工作
这个赛道上,同样是巨头林立:
| 领域 | 代表企业 | 优势产品 | 市场份额 |
|---|---|---|---|
| 图像传感器 | 索尼、三星、豪威 | CMOS图像传感器 | 索尼全球第一 |
| 深度相机 | 英特尔、微软、苹果 | RealSense、Kinect | 英特尔主导 |
| 激光雷达 | Velodyne、禾赛、速腾 | 机械式、固态激光雷达 | 禾赛/速腾崛起 |
| 机器视觉算法 | 海康、商汤、旷视 | 视觉感知算法 | 国内百花齐放 |
| 视觉处理器 | 英伟达、安霸、地平线 | 边缘计算芯片 | 英伟达主导 |
看起来,这是一个既有巨头垄断、又有群雄逐鹿的领域。创业公司还有机会吗?
答案是:有。而且机会丰富。因为“眼睛”是一个多传感器融合的系统,每一类传感器、每一个处理环节,都能继续细分。
每拆解一层,你就离真正的“蓝海”更近一步。
二、拆解人形机器人“眼睛”:画出它的“零件地图”
用“专利零件”方法论,我们可以把人形机器人“眼睛”拆解成以下核心层级:
第一层:按传感器类型拆解
| 传感器类型 | 子类型 | 功能 | 技术难点 | 代表企业 |
|---|---|---|---|---|
| 可见光相机 | RGB相机 | 彩色图像 | 分辨率、帧率、动态范围 | 索尼、三星 |
| 可见光相机 | 全局快门相机 | 高速拍摄 | 避免果冻效应 | 索尼、豪威 |
| 可见光相机 | 高动态范围相机 | 明暗兼顾 | HDR算法 | 索尼 |
| 深度相机 | 结构光 | 投射图案测距 | 室外效果差 | 苹果、英特尔 |
| 深度相机 | ToF | 飞行时间测距 | 分辨率、多径干扰 | 索尼、微软 |
| 深度相机 | 双目立体视觉 | 视差测距 | 基线限制、计算量大 | 各视觉公司 |
| 深度相机 | 激光雷达 | 激光扫描 | 成本、体积、功耗 | 禾赛、速腾 |
| 特种相机 | 事件相机 | 捕捉变化 | 高动态、低延迟 | Prophesee |
| 特种相机 | 偏振相机 | 检测偏振光 | 材料识别 | 4D Technology |
| 特种相机 | 多光谱/高光谱 | 分析物质成分 | 体积、成本 | Headwall |
| 红外相机 | 热成像 | 感知温度 | 分辨率、成本 | FLIR |
| 鱼眼相机 | 广角镜头 | 大视野 | 畸变校正 | 各镜头厂 |
第二层:按硬件组件拆解(以RGB相机为例)
| 组件 | 子组件 | 功能 | 技术难点 |
|---|---|---|---|
| 镜头 | 镜片 | 聚焦光线 | 非球面、低色散 |
| 镜头 | 光圈 | 控制进光量 | 精度、响应速度 |
| 镜头 | 对焦机构 | 自动对焦 | 速度、精度、噪音 |
| 图像传感器 | 感光像素 | 光电转换 | 量子效率、动态范围 |
| 图像传感器 | 彩色滤光片 | 色彩分离 | 透光率、串扰 |
| 图像传感器 | 微透镜 | 汇聚光线 | 填充率、角度响应 |
| 图像传感器 | 读出电路 | 信号读出 | 噪声、速度 |
| 图像处理器 | ISP | 图像处理 | 去马赛克、降噪、锐化 |
| 图像处理器 | 接口 | 数据传输 | MIPI、LVDS |
第三层:按处理算法拆解
| 算法类别 | 子算法 | 功能 | 技术难点 |
|---|---|---|---|
| ISP算法 | 去马赛克 | 恢复彩色 | 伪彩色抑制 |
| ISP算法 | 降噪 | 去除噪声 | 细节保留、实时性 |
| ISP算法 | 自动曝光 | 调整亮度 | 收敛速度、稳定性 |
| ISP算法 | 自动白平衡 | 还原色彩 | 光源判断、准确性 |
| ISP算法 | 高动态融合 | 多曝光合成 | 鬼影抑制、实时性 |
| 三维重建算法 | 立体匹配 | 找对应点 | 弱纹理、重复纹理 |
| 三维重建算法 | 深度滤波 | 去除噪声 | 时域滤波、置信度 |
| 三维重建算法 | 点云配准 | 多帧对齐 | 速度、精度 |
| 三维重建算法 | 表面重建 | 生成网格 | 完整性、精度 |
| 视觉SLAM算法 | 前端 | 特征提取匹配 | 鲁棒性、效率 |
| 视觉SLAM算法 | 后端 | 优化 | 精度、回环检测 |
| 视觉SLAM算法 | 建图 | 构建地图 | 稠密性、更新 |
第四层:按关键技术拆解(以图像传感器为例)
| 技术模块 | 子模块 | 功能 | 技术难点 |
|---|---|---|---|
| 像素设计 | 光电二极管 | 光子→电子 | 量子效率、暗电流 |
| 像素设计 | 传输门 | 电荷转移 | 转移效率、噪声 |
| 像素设计 | 浮动扩散 | 电压转换 | 转换增益、容量 |
| 像素设计 | 复位晶体管 | 复位 | 噪声 |
| 工艺技术 | 背照式 | 提高感光 | 减薄、键合 |
| 工艺技术 | 堆叠式 | 缩小体积 | 混合键合、互联 |
| 工艺技术 | 深槽隔离 | 减少串扰 | 刻蚀、填充 |
这张地图告诉我们:人形机器人的“眼睛”不是“一个”产品,而是一个“传感器+镜头+芯片+算法”的复杂系统。 每个子模块,都可能是一个独立的赛道。
三、用“余行补位”方法识别“缺失零件”
3.1 第一步:扫描现有技术,找出“空白区”
我们针对人形机器人“眼睛”的各个子模块,进行现有技术扫描:
| 层级 | 子模块 | 现有技术情况 | 竞争程度 | 国产化率 |
|---|---|---|---|---|
| 传感器层 | 高端CMOS | 索尼垄断 | ⭐⭐⭐⭐⭐ | 10% |
| 传感器层 | 全局快门CMOS | 索尼、豪威主导 | ⭐⭐⭐⭐ | 20% |
| 传感器层 | 事件相机 | 国外Prophesee领先 | ⭐⭐ | 10% |
| 传感器层 | SPAD(单光子) | 苹果、索尼在布局 | ⭐⭐ | 5% |
| 传感器层 | 偏振相机 | 小众 | ⭐ | 10% |
| 镜头层 | 非球面镜片 | 国内可生产 | ⭐⭐⭐ | 60% |
| 镜头层 | 液体镜头 | 变焦快、无机械 | ⭐⭐ | 20% |
| 镜头层 | 衍射光学元件 | 国外领先 | ⭐⭐⭐ | 30% |
| 芯片层 | 专用ISP芯片 | 手机SoC集成 | ⭐⭐⭐ | 40% |
| 芯片层 | 深度处理芯片 | 英特尔、苹果自研 | ⭐⭐⭐ | 30% |
| 芯片层 | 视觉SLAM加速器 | 学术界刚起步 | ⭐ | 20% |
| 算法层 | 通用ISP算法 | 成熟 | ⭐⭐⭐⭐ | 70% |
| 算法层 | 高动态范围融合 | 动态场景难 | ⭐⭐⭐ | 50% |
| 算法层 | 弱纹理立体匹配 | 鲁棒性差 | ⭐⭐ | 30% |
| 算法层 | 动态环境SLAM | 学术界热点 | ⭐⭐ | 40% |
从这张扫描表可以清晰地看到:
- 红海:通用CMOS、常规镜头、成熟ISP算法(竞争充分)
- 卡脖子重灾区:高端CMOS、全局快门、SPAD传感器(被索尼、三星垄断)
- 机会窗口:事件相机(新兴)、液体镜头(变焦)、专用SLAM芯片(软硬结合)、弱纹理匹配算法(痛点)
3.2 第二步:评估“缺失零件”的商业价值
用三个维度评估每个“缺失零件”:
| 子模块 | 技术痛点强度 | 市场规模 | 国产替代紧迫性 | 综合价值 |
|---|---|---|---|---|
| 高端CMOS | ⭐⭐⭐⭐⭐(索尼垄断) | ⭐⭐⭐⭐⭐(所有摄像头) | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 全局快门CMOS | ⭐⭐⭐⭐(高速拍摄) | ⭐⭐⭐⭐(机器人/工业) | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 事件相机 | ⭐⭐⭐⭐(高动态、低延迟) | ⭐⭐⭐(特种应用) | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| SPAD传感器 | ⭐⭐⭐⭐⭐(dToF核心) | ⭐⭐⭐⭐(手机/机器人) | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 液体镜头 | ⭐⭐⭐(快速变焦) | ⭐⭐⭐(机器视觉) | ⭐⭐ | ⭐⭐⭐ |
| 专用SLAM芯片 | ⭐⭐⭐⭐(低功耗、实时) | ⭐⭐⭐⭐(AR/机器人) | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| 弱纹理立体匹配 | ⭐⭐⭐⭐(实际场景痛点) | ⭐⭐⭐⭐(所有视觉机器人) | ⭐⭐⭐ | ⭐⭐⭐⭐ |
高端CMOS、SPAD传感器、专用SLAM芯片,是价值最高的“缺失零件”。
四、找到你的“生态位”:八个典型案例
4.1 生态位一:事件相机(动态视觉传感器)
| 维度 | 分析 |
|---|---|
| 技术痛点 | 传统相机在高速运动时模糊、在光照剧烈变化时失效,帧率受限 |
| 目标用户 | 人形机器人(平衡控制、高速避障)、无人机、工业检测 |
| 竞争对手 | 法国Prophesee(与索尼合作)、三星(正在研发) |
| 技术路线 | 每个像素独立感知亮度变化,输出“事件流” |
| 你的机会 | 开发事件相机传感器或信号处理芯片,或开发事件数据处理算法 |
| 专利布局 | 像素结构、读出电路、事件处理算法、与AI结合的架构 |
4.2 生态位二:SPAD(单光子雪崩二极管)传感器
| 维度 | 分析 |
|---|---|
| 技术痛点 | dToF(直接飞行时间)需要高灵敏度、高精度的SPAD传感器,苹果已用于iPhone,但国内空白 |
| 目标用户 | 机器人深度相机、手机、AR/VR |
| 竞争对手 | 索尼、ST、苹果(自研) |
| 技术路线 | SPAD像素设计、淬灭电路、TDC(时间数字转换器) |
| 你的机会 | 开发机器人专用的SPAD传感器(低分辨率但高性能、低成本) |
| 专利布局 | 像素结构、淬灭电路、TDC架构、阵列读出方法 |
4.3 生态位三:专用视觉SLAM加速芯片
| 维度 | 分析 |
|---|---|
| 技术痛点 | SLAM算法在CPU/GPU上运行功耗高、实时性受限,机器人需要专用加速器 |
| 目标用户 | 人形机器人、扫地机器人、AR眼镜 |
| 竞争对手 | 英特尔(Movidius)、苹果(自研)、学术界 |
| 技术路线 | 特征提取加速器、匹配加速器、优化求解器硬件化 |
| 你的机会 | 开发SLAM专用芯片IP或协处理器,服务机器人芯片厂 |
| 专利布局 | 硬件架构、数据流、并行计算方法 |
4.4 生态位四:高动态范围(HDR)融合算法IP
| 维度 | 分析 |
|---|---|
| 技术痛点 | 机器人从室内到室外,光照剧烈变化,现有HDR算法在动态场景有“鬼影” |
| 目标用户 | 机器人视觉系统、安防相机、车载摄像头 |
| 竞争对手 | 索尼(硬件级HDR)、安霸(ISP)、各算法公司 |
| 技术路线 | 多曝光融合、运动补偿、学习-based融合 |
| 你的机会 | 开发无鬼影、低延迟的HDR算法IP,授权给ISP或SoC厂 |
| 专利布局 | 融合策略、运动估计方法、硬件实现架构 |
4.5 生态位五:弱纹理环境立体匹配算法
| 维度 | 分析 |
|---|---|
| 技术痛点 | 双目相机在白墙、光滑表面等弱纹理区域无法匹配,导致深度缺失 |
| 目标用户 | 机器人导航、3D扫描、AR/VR |
| 竞争对手 | 学术界有多种方法,但鲁棒性和实时性难兼顾 |
| 技术路线 | 主动纹理投影、几何先验、学习-based匹配 |
| 你的机会 | 开发专为弱纹理环境优化的匹配算法,可软硬结合 |
| 专利布局 | 匹配代价计算、聚合方法、置信度估计 |
4.6 生态位六:液态镜头驱动与控制
| 维度 | 分析 |
|---|---|
| 技术痛点 | 传统机械式对焦慢、有噪音、寿命有限,液态镜头可瞬间变焦 |
| 目标用户 | 机器人视觉、工业相机、手机 |
| 竞争对手 | 法国Varioptic(已被收购)、国内有研究 |
| 技术路线 | 电润湿原理、驱动波形、控制算法 |
| 你的机会 | 开发机器人专用的液态镜头模组或驱动芯片 |
| 专利布局 | 镜片结构、驱动方法、温度补偿、控制算法 |
4.7 生态位七:偏振成像传感器
| 维度 | 分析 |
|---|---|
| 技术痛点 | 传统相机只能感知强度、颜色,无法感知光的偏振信息(用于材质识别、去反光) |
| 目标用户 | 机器人(识别透明物体、水面)、工业检测 |
| 竞争对手 | 日本4D Technology、Sony(有偏振传感器) |
| 技术路线 | 片上偏振滤波器、计算偏振算法 |
| 你的机会 | 开发机器人专用的偏振成像模组或偏振数据处理算法 |
| 专利布局 | 偏振像素布局、偏振信息解算、应用算法 |
4.8 生态位八:事件-帧混合视觉处理芯片
| 维度 | 分析 |
|---|---|
| 技术痛点 | 事件相机高动态但噪声大,传统相机信息丰富但延迟高,两者互补 |
| 目标用户 | 高速机器人、无人机、自动驾驶 |
| 竞争对手 | 学术界刚起步,工业界空白 |
| 技术路线 | 同时处理事件流和帧图像的融合架构 |
| 你的机会 | 开发事件-帧融合处理的芯片架构或IP |
| 专利布局 | 数据同步、融合处理单元、任务调度 |
五、“眼睛”专利布局的特殊性
5.1 光学、电子、算法三位一体
“眼睛”是典型的光机电算一体化产品,专利布局需覆盖:
| 专利类型 | 保护对象 | 例子 |
|---|---|---|
| 光学专利 | 镜头设计、滤光片、光路 | 非球面镜片、液体镜头 |
| 结构专利 | 传感器封装、模组结构 | 堆叠式传感器、微型模组 |
| 电路专利 | 像素设计、读出电路 | SPAD像素、列并行ADC |
| 算法专利 | 图像处理、深度计算 | HDR融合、立体匹配 |
| 系统专利 | 多传感器融合 | 事件-帧融合系统 |
5.2 传感器层:工艺+像素设计
传感器层的专利最难绕开,因为涉及具体工艺:
| 保护对象 | 专利类型 | 举例 |
|---|---|---|
| 像素结构 | 实用新型/发明 | 4T像素、全局快门像素 |
| 制造工艺 | 发明 | 背照式工艺、堆叠键合 |
| 读出电路 | 发明 | 列并行ADC、相关双采样 |
5.3 算法层:软硬结合
算法专利要“软硬结合”,避免成为“智力活动规则”:
| 写法类型 | 是否授权 | 原因 |
|---|---|---|
| “一种图像融合方法” | ❌ 可能被驳回 | 纯算法,智力活动规则 |
| “一种图像融合系统,包括存储器和处理器,执行……” | ✅ 可授权 | 软硬结合 |
| “一种图像处理芯片,包括……模块,实现……算法” | ✅ 可授权 | 硬件实现 |
六、余行总结:用“余行补位”在机器视觉领域找到你的核心生态位
- “眼睛”不是“一个”零件,而是一个“传感器+镜头+芯片+算法”的复杂系统——每类传感器、每个处理环节、每种算法,都能继续细分。拆得越细,机会越多。
- 被卡脖子的地方,就是最大的蓝海——高端CMOS、SPAD传感器被索尼垄断,这是国产替代的历史性机遇。
- 新兴技术方向是弯道超车的机会——事件相机、液态镜头、偏振成像,国外也刚起步,你有机会并跑甚至领跑。
- 软硬结合、系统布局——不能只做算法(容易被替代),要软硬结合;不能只做一个点,要布局核心+外围+应用。
余行补位思想:我们帮企业做的,不是“在红海里抢食”,而是“在视觉技术的细分赛道上深耕”。用“专利零件”方法论层层拆解,用“余行补位”思想识别空白,然后用专利锁死你的视觉生态位。
如果您想用“余行补位”方法论,在人形机器人“眼睛”领域找到属于您的技术生态位,欢迎联系我们。成都余行专利代理事务所(普通合伙)是经国家知识产权局批准备案的专业代理机构(机构代码:51283),专注于机器人、智能制造领域的高价值专利挖掘与布局。
我们的优势:
- ✅ 发明专利授权率85%以上——远高于行业平均水平,用数据说话
- ✅ 全流程全生命周期服务——从专利挖掘、申请布局到维权诉讼、许可运营,一站式解决
- ✅ “专利零件”方法论——独创的技术拆解方法,帮您逐级拆解、找到最底层的核心件
- ✅ “余行补位”思想——帮您识别技术空白,找到专属生态位
- ✅ 专注垂直领域——深耕机器人、智能制造,真正懂技术、懂产业、懂商业
成都余行专利代理事务所(普通合伙)
官网:www.hrpp.org.cn
地址:成都高新区孵化园
机构代码:51283
守护创新,创造价值——成都余行与您共创未来


