详情

基于多模态感知与边缘AI的隐私安全守护机器人

申报人:操凤萍 申报日期:2025-10-27

基本情况

2026
基于多模态感知与边缘AI的隐私安全守护机器人
创新训练项目
工学
计算机类
一年期
应用研究
教师自主选题
软件著作权,应用
操凤萍
指导教师
2025-10-27 10:22:38

一、研究目的与意义

本项目旨在设计并开发一款名为 “隐卫” 的隐私安全守护机器人,核心目的是解决独居老人监护与家庭安防中 “安全” 与 “隐私” 的尖矛盾。

通过采用轻量化多模态感知组合(视觉 RGB-D 摄像头、听觉麦克风阵列、环境传感烟雾 / 气体传感器、人体感知毫米波雷达)与边缘 AI 技术,在本地实时识别跌倒、入侵等异常行为,实现 “敏感数据不上云、本地智能决策” 的守护模式。

其意义在于:既能有效预防老人跌倒、家庭危险环境(如燃气泄漏)等意外后果,为子女及用户提供安心保障;又通过技术创新平衡 “安全监测” 与 “隐私保护”,避免传统视觉监控带来的隐私泄露风险,为智能家居安防设备的隐私合规发展提供可落地的技术路径。


二、研究目标与内容

机器人系统构建:完成 “隐卫” 机器人软硬件一体化开发与集成,重点突破三大核心层:1)感知层:实现多传感器(RGB-D 摄像头、麦克风阵列、烟雾 / 气体传感器、毫米波雷达)驱动与数据同步2)决策层:搭建边缘 AI 推理框架,完成轻量化行为识别模型部署与状态机设计,支持异常行为(跌倒、闯入)与危险环境(烟雾、燃气泄漏)的实时判断;3) 执行层:集成云台控制、声光报警、语音交互模块,实现异常事件触发后的快速响应与用户通知。

1.核心技术研发

1) 轻量化多模态融合算法:摒弃复杂 Transformer 大模型,采用轻量化注意力机制或图神经网络(GNN)构建动态融合框架,实现视觉(异常行为识别)、听觉(异响 / 呼救检测)、环境传感(危险气体报警)数据的实时融合,通过模态权重自适应调整,优先响应高优先级感知信号(如人体跌倒、烟雾报警);

2)边缘 AI 模型优化与部署:基于 MobileNetV3、Llama-3-7B 等轻量模型,通过知识蒸馏、量化压缩技术将多模态识别模型参数量降低 70% 以上,确保在树莓派、Jetson Nano 等边缘计算节点上实现毫秒级响应;

3) 隐私隔离机制:所有敏感数据(视频、语音)均在边缘端本地处理,仅将报警信息、状态摘要等非敏感数据通过加密传输推送至用户端,结合差分隐私技术对原始数据脱敏,从数据全生命周期杜绝泄露风险。

2.功能与场景验证

聚焦家庭隐私安防核心场景,在模拟家居环境中完成系统测试:

1)功能验证:测试异常行为识别(非法闯入、老人跌倒)准确率、危险环境监测(烟雾、燃气泄漏)响应速度;

 2)体验优化:测试用户一键开启 / 关闭感知功能、敏感时段(休息时)自动停止视频录制(仅保留声音和环境传感)的实用性,确保技术方案适配家庭实际使用需求。


三、特色及创新点

  技术架构创新:构建 “轻量化多模态感知 + 边缘 AI 本地推理” 的一体化架构,既通过多传感器融合提升监测精度,又借助边缘计算与数据脱敏技术从源头保障隐私,解决传统安防设备 “安全与隐私不可兼得” 的痛点;

误报抑制创新:结合多模态感知交叉验证机制,例如通过视觉(人体轮廓)+ 毫米波雷达(生命体征)双重验证,排除宠物移动、窗帘晃动等干扰因素导致的误报警,提升系统可靠性。


四、学生获得的训练

1. 硬核技术整合能力:深度掌握多传感器选型与驱动开发(RGB-D 摄像头、毫米波雷达等)、轻量化 AI 模型训练与压缩(知识蒸馏、量化)、边缘计算部署(树莓派 / Jetson Nano)、隐私计算(差分隐私)等技术,实践多领域技术的系统级集成;

2. 工程实践与问题解决能力:亲历从技术选型(如传感器组合、模型选择)、方案设计(融合算法框架、隐私机制)、模块开发(感知层 / 决策层代码实现)到系统联调(多模态数据同步、边缘推理测试)的全流程,锻炼资源受限场景下(边缘设备算力)的技术优化能力;

3. 产品思维与场景落地能力:围绕家庭用户实际需求,理解 “技术可行性” 与 “用户体验” 的平衡逻辑。

1.软件工程、电子信息工程、计算机科学与技术等相关专业同学,优先考虑对多模态感知、边缘 AI、隐私计算技术感兴趣,愿意投入时间攻克技术难点的学生。

2.技术能力要求,按模块分为三类,学生可根据专长选择方向,也可主动学习跨模块技能:

1 硬件与感知层开发:掌握 STM32 微控制器或树莓派 / Jetson Nano 等边缘设备开发,能够完成 RGB-D 摄像头、麦克风阵列、毫米波雷达、烟雾 / 气体传感器的驱动与数据采集②了解多模态数据同步技术(如 FPGA 时间戳机制)。

2AI 算法与决策层开发:掌握 Python 编程,熟悉 OpenCV、librosa 等工具,能够处理视觉、听觉、环境传感数据;②了解 MobileNetV3 等轻量模型原理,掌握知识蒸馏、量化压缩等模型优化技术,能在 Edge Impulse 或 TensorFlow Lite 平台完成多模态融合算法训练与边缘部署;③对轻量化注意力机制、图神经网络(GNN)有基础认知,可参与动态融合框架开发。

指南成员

4

指导教师

序号 教师姓名 教师账号 所属学院
1 操凤萍 138100460 电子与计算机工程学院 第一指导教师

指南附件

结束