SmolVLA: A vision-language-action model for affordable and efficient robotics

1. 摘要

2. 引言

2. 引言

2. 引言

3. 相关工作

3. 相关工作

4. 方法-模型架构

4. 方法-模型架构

4. 方法-模型架构

4. 方法-模型架构

4. 方法-模型架构

4. 方法-社区收集的预训练数据

4. 方法-社区收集的预训练数据

4. 方法-社区收集的预训练数据

4. 方法

4. 方法-异步推理

4. 方法-异步推理

4. 方法-异步推理

5. 实验-实验设置

5. 实验-评估

5. 实验-评估

5. 实验-评估

5. 实验-评估

5. 实验-消融实验

5. 实验-消融实验

5. 实验-消融实验

5. 实验-消融实验

结论

局限性

谢谢！