具身智能课程整体总结

张开发
2026/5/6 18:54:08 15 分钟阅读

分享文章

具身智能课程整体总结
具身智能课程1. CS188快速过渡期2. 承上启下的基础设施CS231N 与 CS2293. 跨越鸿沟的关键点CS285强化学习4. 终极挑战底层物理与灵巧手操作最底层一、课程体系总览二、推荐学习路径定制化路径三、逐课程深度解析3.1 Modern Robotics — 现代机器人学3.2 CS188 — Introduction to Artificial Intelligence3.3 CS229 — Machine Learning3.4 CS231N — Convolutional Neural Networks for Visual Recognition3.5 CS285 — Deep Reinforcement Learning3.6 CS287 — Advanced Robotics3.7 MIT Manipulation — 机器人操作四、课程资源汇总优质中文资源五、关键发现与学习建议5.1 第一手学习者建议汇总5.2 通用学习建议5.3 时间投入预期六、结论这张图总结得极其精准这是一份堪称经典的**“具身智能Embodied AI与机器人学习Robot Learning”标准技能树**。它完美地梳理了从经典物理控制到现代端到端深度学习的融合路径。结合你目前正在搭建的宏观到微观的系统架构我们可以顺着这张图对你接下来的技术攻坚做个“沙盘推演”1. CS188快速过渡期图中对 CS188 的批注是**“粒子/卡尔曼滤波重点看·快速刷完”**这与我们之前讨论的“抓大放小、直奔状态估计”的速通策略完全一致。在这个节点你的核心目的不是成为经典 AI 的专家而是为你后续处理视觉相机低频/有遮挡和触觉阵列高频/有噪声的数据融合建立最底层的概率论与状态估计直觉。2. 承上启下的基础设施CS231N 与 CS229作为视觉-语言-动作模型的开发者你对这一层应该已经有相当的实操经验比如之前跑的 YOLO 算法。图中批注“具身智能必备基本功”非常中肯。未来如果要将你们通过 V采集的高质量多模态人类先验数据视觉动作空间喂给神经网络这就需要你们团队具备极强的数据表征提取能力和网络调优能力。3. 跨越鸿沟的关键点CS285强化学习这张图把 CS285 放在了极高权重的位置这是绝对正确的。解决频率映射的核心Sergey Levine 是目前全球机器人深度强化学习Deep RL的领军人物。他的课程极度贴近真实机器人场景。4. 终极挑战底层物理与灵巧手操作最底层图中最下方的两门“高级”课程正是你最终要啃下的硬骨头尤其是右边那门MIT Manipulation (Russ Tedrake)这是为你量身定制的“终点站”。Russ Tedrake 的研究完全专注于复杂的接触力学、摩擦力模型和灵巧操作Dexterous Manipulation。由于你涉及极高精度的物理交互YOLO 给的 2D 框是不够的。你需要在这里学习如何利用高频闭环控制让机器人像人手一样处理滑动、抓取和工具使用。CS287 (Pieter Abbeel)侧重于将现代 Learning 方法与传统的 Optimal Control最优控制强强结合这对于需要绝对物理安全边界的机器人系统至关重要。总结来说这张图不仅是一份课程表更是你们技术栈升级的作战地图。针对你们即将建立的 System 0 架构你是打算按照这张图稳扎稳打地把底层控制体系全盘重构还是想直接跳到“强化学习”和“MIT Manipulation”的节点把现成的高频控制算法抽出来先解决眼前的工程打样问题一、课程体系总览图号课程编号课程名称授课院校授课教师难度等级预计学时图3Modern Robotics现代机器人学西北大学Kevin Lynch 等⭐ 入门30-40h图4CS188人工智能导论UC BerkeleyDan Klein 等⭐ 入门40-60h图5CS229机器学习Stanford马腾宇Tengyu Ma⭐⭐ 基础60-80h图6CS231N卷积神经网络与视觉识别StanfordFei-Fei Li 等⭐⭐⭐ 进阶50-70h图7CS285深度强化学习UC BerkeleySergey Levine⭐⭐⭐⭐ 高级80h图8CS287高级机器人学UC BerkeleyPieter Abbeel⭐⭐⭐⭐ 高级80h图9Manipulation机器人操作MITRuss Tedrake⭐⭐⭐⭐ 高级80h二、推荐学习路径【机器人基础】 Modern Robotics ↓ 【AI基础】 【ML基础】 CS188 CS229 ↓ ↘ ↙ ↓ └───→ CS231N ←── │ ↓ ↓ CS285 (深度强化学习) ↓ ┌────────┴────────┐ CS287 MIT Manipulation (learning control) (机器人操作)定制化路径目标方向推荐路径具身智能全栈Modern Robotics → CS188 → CS229 → CS231N → CS285 → CS287 → Manipulation机器人操作方向Modern Robotics → CS229 → CS285 → CS287 → Manipulation计算机视觉方向CS188 → CS229 → CS231N强化学习研究CS188 → CS229 → CS285快速上手AICS188选看→ CS229三、逐课程深度解析3.1 Modern Robotics — 现代机器人学基本信息授课院校西北大学Northwestern University授课教师Kevin Lynch 教授课程定位机器人学入门经典轻量级但体系完整配套教材Modern Robotics: Mechanics, Planning, and Control核心内容体系模块关键知识点旋转与坐标系SO(3)、SE(3)、旋转矩阵、四元数正逆运动学前向运动学FK、逆运动学IK、数值迭代速度运动学雅可比矩阵、奇异性分析动力学拉格朗日力学、牛顿-欧拉方法各种SpaceJoint Space、Task Space、Configuration Space路径规划轨迹生成、时间参数化学习者评价比较轻量级很适合了解机器人学基本知识。有配套的 YouTube 视频正逆运动学、动力学、各种 Space 等内容讲解清晰是机器人入门的理想选择。学习资源课程网站https://modernrobotics.northwestern.edu/YouTube 视频Northwestern Robotics 频道免费教材coursera.org 搜索 “Modern Robotics”3.2 CS188 — Introduction to Artificial Intelligence基本信息授课院校UC Berkeley授课教师Dan Klein 教授团队课程定位AI 入门必修课零基础友好教材Artificial Intelligence: A Modern ApproachRussell Norvig核心内容体系模块主题关键知识点搜索与规划经典AI搜索算法DFS/BFS/IDS、启发式搜索、A*、对抗搜索Minimax、Alpha-Beta 剪枝约束满足CSP求解回溯搜索、约束传播、弧一致性马尔可夫决策过程序贯决策MDP建模、价值迭代、策略迭代概率推理贝叶斯推断贝叶斯网络、条件概率、变量消除粒子滤波时序估计粒子表示、重采样、非线性状态估计卡尔曼滤波线性估计预测-更新步骤、高斯分布、传感器融合强化学习从经验中学习Q-Learning、SARSA学习者建议适合快速刷一遍。搜索、Min-Max 剪枝等算法课已学过可跳过粒子滤波和卡尔曼滤波值得用心看蛮有趣的Pacman 系列项目Project 1: 搜索算法A*、UCSProject 2: 多智能体对抗搜索Project 3: 隐马尔可夫模型与信号处理Project 4: 贝叶斯网络推理重点推荐Project 5: 强化学习学习资源官网https://inst.eecs.berkeley.edu/~cs188/YouTube搜索 “CS188 Berkeley”3.3 CS229 — Machine Learning基本信息授课院校Stanford University授课教师马腾宇Tengyu Ma教授新版Andrew Ng经典版课程定位机器学习领域最经典的理论课数学严谨课程特色系统建立ML理论体系强烈推荐完成所有课程作业核心内容体系模块主题关键知识点监督学习回归与分类线性回归、逻辑回归、SVM学习理论泛化与过拟合偏差-方差权衡、VC维度、正则化神经网络深度学习基础反向传播、激活函数、梯度下降无监督学习聚类与降维K-Means、PCA、EM算法高级主题特殊模型高斯过程、ICA、协同过滤学习者建议整体对机器学习的理论可以建立体系一定要做作业作业是真正巩固理解的关键。数学预备知识线性代数矩阵运算、特征值分解概率论与统计学条件概率、贝叶斯公式微积分偏导数、梯度学习资源官网https://cs229.stanford.edu/官方讲义https://cs229.stanford.edu/notes2022fall/main_notes.pdfCoursera 同名课程Andrew Ng 主讲内容有差异但更易上手3.4 CS231N — Convolutional Neural Networks for Visual Recognition基本信息授课院校Stanford University授课教师Fei-Fei Li李飞飞教授、Andrej Karpathy 等课程定位计算机视觉与深度学习交叉领域经典课课程特色ImageNet 推动者亲授具身智能必备基本功核心内容体系模块主题关键知识点CNN基础图像分类卷积层、池化层、全连接层、手写反向传播经典架构视觉模型演进AlexNet、VGG、ResNet、GoogLeNet训练技巧工程实践Batch Normalization、Dropout、数据增强目标检测定位与识别R-CNN、Faster R-CNN、YOLO图像分割像素级分类FCN、U-Net、Mask R-CNN注意力机制动态感知Self-Attention、Transformer in Vision生成模型图像生成GAN、VAE 基础学习者建议手写神经网络反向传播是必须完成的核心训练能让你真正理解深度学习原理。了解各种基本网络结构和最新深度学习模型——搞具身智能必备基本功。作业亮点Assignment 1: KNN/SVM/Softmax 图像分类Assignment 2:全连接网络与 BatchNorm手写实现Assignment 3:CNN 图像分类手写反向传播核心Final Project: 完整计算机视觉项目学习资源官网https://cs231n.stanford.edu/课程笔记https://cs231n.github.io/YouTube 官方视频3.5 CS285 — Deep Reinforcement Learning基本信息授课院校UC Berkeley授课教师Sergey Levine 教授课程定位深度强化学习领域最全面的课程之一课程特色内容广泛、理论推导细致大量机器人应用实例核心内容体系模块主题关键知识点基础强化学习MDP与动态规划马尔可夫决策过程、价值函数、Q函数策略梯度直接策略优化REINFORCE、Actor-Critic、PPO深度Q学习值函数近似DQN、Double DQN、Prioritized ReplayOff-Policy RL离策略方法DDPG、TD3、SACModel-Based RL基于模型World Models、Dreamer、MuZero模仿学习从专家学习DAgger、GAIL、逆强化学习迁移与多任务知识迁移元学习、持续学习学习者建议相较于 David Silver 的公开课内容更广、理论推导更细致虽然里面有一些小 bug但学完对整个领域有很深的理解。尤其 Sergey 自己做具身智能他很多 RL 的例子都是用机器人举例非常贴合应用场景。与 David Silver RL 课对比维度CS285David Silver RL内容广度更广含深度学习集成更聚焦经典RL理论理论深度细致有推导严谨数学味重应用场景大量机器人例子偏游戏/通用RL适合阶段有DL基础后纯RL入门也可学习资源官网https://rail.eecs.berkeley.edu/deeprlcourse/YouTube搜索 “CS285 Berkeley Deep RL”3.6 CS287 — Advanced Robotics基本信息授课院校UC Berkeley授课教师Pieter Abbeel 教授强化学习先驱、OpenAI 创始成员课程定位高等机器人学将 Learning 与 Control 深度融合课程特色理论与实用兼顾作者为具身智能领域奠基人核心内容体系模块主题关键知识点运动规划轨迹生成RRT、PRM、TrajOpt、CHOMP最优控制连续控制LQR、iLQR、MPC接触动力学物理交互Contact-Invariant Optimization视觉导航感知-动作闭环SLAM、视觉伺服模仿学习人类示范LfD、DAggerLearning Control 融合核心特色如何用学习方法增强控制器学习者评价曾任该课助教把 Learning 和 Control 融合在一起讲了高等机器人学对比较实用的机器人技术有很好的理解。是具身智能领域承上启下的关键课程。前置建议需要扎实的线性代数基础推荐 Boyd EE263熟悉优化理论建议先完成 CS285RL 基础学习资源官网https://people.eecs.berkeley.edu/~pabbeel/cs287-fa19/课程笔记https://stevengong.co/notes/CS2873.7 MIT Manipulation — 机器人操作基本信息授课院校MIT授课教师Russ Tedrake 教授Drake 机器人工具箱作者课程定位专注于机器人操作任务的高级课程课程特色聚焦具体的操作问题是机器人操作方向的必修课核心内容体系模块主题关键知识点抓取规划Grasp Planning摩擦锥、力封闭、形封闭运动规划操作轨迹轨迹优化、碰撞检测感知与估计物体识别点云处理、6D 位姿估计接触力学接触建模接触点分析、柔顺控制深度学习操作端到端方法Diffusion Policy、学习抓取场景理解语义操作Open-vocabulary 操作学习者建议专注于操作任务对机器人操作有兴趣的同学可以深入学习Russ Tedrake 是该领域权威课程内容前沿与工业应用紧密结合。学习资源官网https://manipulation.csail.mit.edu/Drake 工具箱https://drake.mit.edu/YouTube 视频MIT OCW 频道四、课程资源汇总课程官网YouTube关键词Modern Roboticsmodernrobotics.northwestern.eduNorthwestern RoboticsKevin LynchCS188inst.eecs.berkeley.edu/~cs188CS188 BerkeleyDan Klein AICS229cs229.stanford.eduCS229 StanfordTengyu Ma / Andrew NgCS231Ncs231n.stanford.eduCS231N StanfordFei-Fei Li CNNCS285rail.eecs.berkeley.edu/deeprlcourseCS285 BerkeleySergey Levine RLCS287people.eecs.berkeley.edu/~pabbeel/cs287-fa19CS287 BerkeleyPieter Abbeel RoboticsManipulationmanipulation.csail.mit.eduMIT ManipulationRuss Tedrake优质中文资源CS自学指南https://csdiy.wiki/ — 涵盖完整学习路线各课程知乎笔记、CSDN 博客五、关键发现与学习建议5.1 第一手学习者建议汇总课程核心建议可跳过内容重点内容Modern Robotics入门轻量先看它—运动学、Space概念CS188快速刷完搜索、Min-Max剪枝算法课学过粒子滤波、卡尔曼滤波CS229一定做作业—全部重在体系CS231N手写反向传播必做—CNN结构、具身必备CS285内容有小bug整体值得—RL理论机器人例子CS287LearningControl融合—实用机器人技术Manipulation操作方向深入—抓取、操作全链路5.2 通用学习建议数学基础优先线性代数和概率论是一切的基础手推公式特别是 CS231N 的反向传播手写一遍受益终生一定要做作业CS229/CS231N 的作业是精华所在GPU 资源CS231N/CS285/CS287 建议准备 GPU 环境机器人应用视角CS285 的例子大量来自机器人场景有助于迁移理解5.3 时间投入预期课程听课作业项目总计Modern Robotics15h10h5h30-35hCS18820h15h5h35-40hCS22930h25h20h70-80hCS231N25h25h20h60-70hCS28535h30h25h85-90hCS28735h25h25h80-85hManipulation30h25h25h75-80h六、结论这七门课程构成了具身智能领域最完整的学习体系Modern Robotics— 教你机器人的数学语言——空间、运动学、动力学CS188— 教你AI 如何思考——搜索、推理、概率滤波CS229— 教你AI 如何学习——从数据中提取规律CS231N— 教你AI 如何看——深度视觉感知CS285— 教你AI 如何做决策——强化学习理论与实践CS287— 教你如何让机器人学会技能——Learning 与 Control 的融合MIT Manipulation— 教你机器人如何用手——操作任务的完整链路完成这套体系你将具备从底层运动控制到上层智能决策的完整具身智能知识图谱。*备注参考许华哲老师小红书建议整理

更多文章