🔋 电源管理系统

☁️ 阿里通义千问 Qwen-VL-Plus

💻 Python 后端服务器

🤖 多模态平衡机器人

📱 上位机/用户

逻辑与指令

音频/文本处理

⚙️ 运动控制板: STM32F103

📡 主控板: ESP32-S3

1FPS 图片

UART 串口透传

BLE 低功耗蓝牙

环境音

PCM数据

编码待发送的Opus包

1FPS 图片

JPEG流

esp32上传Opus音频+图片

文本 + 图片 + Tools

响应: 文本 + JSON函数

MP3

Opus音频

JSON指令

esp32接收Opus音频+JSON指令

播放Opus音频

PCM数据

JSON指令发给stm32

运动参数

表情/状态

姿态数据

🔋 电源板_12V8A锂电池

蓝牙小程序\nPID调参/WiFi配网

USB Host

WiFi / WebSocket 客户端

BLE 蓝牙服务

UART 指令发送

DMA 串口接收 & 解析

PID 闭环控制算法

陀螺仪姿态解算

电机驱动 PWM

SPI/IIC 屏幕驱动

贴片麦克风

Mic_Chip

Spk_Chip

喇叭

摄像头

霍尔编码电机

触摸显示屏

WebSocket 服务端

VAD 说话人检测

Opus转文本/STT

文本暂存

EdgeTTS: 文本转MP3

MP3转Opus编码

JSON 响应解析

构建 JSON 控制指令

多模态理解与推理

Function Calling 工具库

12V 8A 锂电池

稳压电源板 5V/3.3V

电机电压驱动板

Opus_Codec