机器学习大师课 第 1 课:什么是机器学习?写出你的第一个 AI 程序

张开发
2026/4/28 21:20:31 15 分钟阅读

分享文章

机器学习大师课 第 1 课:什么是机器学习?写出你的第一个 AI 程序
课程承诺每节课只讲 1 个核心概念、1 个核心思想、1 段可运行代码。学完立刻能用绝不讲听不懂的废话。本节课目标彻底搞懂机器学习和普通编程的本质区别亲手写出人生第一个机器学习程序5 分钟内看到 AI 预测结果。 第一个核心概念机器学习到底是什么先忘掉所有你听过的 人工智能、神经网络、大模型 这些高大上的词。我用一句话给你讲明白普通编程人写规则计算机执行规则得到结果机器学习人给数据和结果计算机自己学会规则最通俗的例子区分苹果和橘子普通程序员的做法写一万条 if-else 规则plaintextif 颜色是红色 and 形状是圆形 and 直径10cm: return 苹果 elif 颜色是橙色 and 表皮有坑: return 橘子 ...结果遇到青苹果就错了遇到黄苹果也错了永远写不完所有规则。机器学习工程师的做法给计算机 1000 张苹果的照片标上 苹果。给计算机 1000 张橘子的照片标上 橘子计算机自己学会区分苹果和橘子的规则。核心区别普通编程是 人教计算机做事机器学习是 计算机自己从数据中学习做事。 第一个核心思想机器学习就是 找规律所有机器学习算法本质上都在做同一件事从一堆数据中找到隐藏的规律然后用这个规律去预测未知的事情。就像你小时候学数学老师给你例题数据112224336你找到规律一个数加它自己等于它的 2 倍你用规律做新题预测100100200机器学习也是一模一样的过程给它历史数据例题它找到数据之间的规律公式 / 模型用这个规律预测未来做新题本节课我们要解决的问题预测房子的面积和房价的关系已知5 套房子的面积和对应的价格目标让 AI 学会这个规律然后预测一套 120 平米的房子值多少钱 第一个可运行代码5 行代码写一个房价预测 AI前置要求你已经安装了 Python 和 scikit-learn 库如果没安装先在命令行运行这一行bash运行pip install scikit-learn numpy完整代码复制粘贴就能运行python运行# 1. 导入我们需要的工具 from sklearn.linear_model import LinearRegression # 从scikit-learn库导入线性回归模型类 该模型实现普通最小二乘法(OLS)线性回归算法用于建立特征与目标变量间的线性关系 import numpy as np # 导入NumPy科学计算库提供高效的多维数组操作和数学函数 是机器学习数据处理的基础依赖 # 2. 准备历史数据例题 # X特征矩阵必须是二维数组结构n_samples × n_features # 此处表示5个训练样本每个样本包含1个特征房屋面积单位平米 # 双括号[[50],...]表示列向量格式符合scikit-learn要求的输入规范即使单特征也需保持二维结构 X np.array([[50], [60], [70], [80], [90]]) # y目标向量一维数组结构n_samples, # 对应5个样本的真实房价标签单位万元 # 注意此处数据呈现完美的线性关系y 2x实际业务中数据通常包含噪声 y np.array([100, 120, 140, 160, 180]) # 3. 创建一个AI模型就像一个刚出生的学生 # 初始化线性回归模型实例normalizeFalse表示不进行特征标准化默认使用原始尺度 # fit_interceptTrue默认表示模型将计算截距项即y wx b中的b # 此时模型参数权重w和截距b尚未确定处于未训练状态 model LinearRegression() # 4. 让AI学习数据给它讲课让它找规律 # 执行模型拟合过程通过最小化残差平方和(RSS)计算最优参数 # 数学原理求解正规方程 (X^T X)^{-1} X^T y 或使用梯度下降法 # 训练完成后model.coef_ [2.0]斜率wmodel.intercept_ 0.0截距b model.fit(X, y) # 5. 用学会的规律预测新数据做新题 area 120 # 定义待预测的新样本特征值120平米房屋 # 将单个预测值转换为模型要求的二维输入格式[[120]] # 调用predict方法执行前向传播y_pred w * x b 2.0 * 120 0.0 240.0 predicted_price model.predict([[area]]) # 格式化输出预测结果保留两位小数 # 注意实际业务中需进行预测区间计算和置信度评估此处简化处理 print(f预测{area}平米的房子价格为{predicted_price[0]:.2f}万元)运行结果plaintext预测120平米的房子价格为240.00万元 逐行拆解代码彻底搞懂每一步在做什么我保证这 5 行代码包含了所有机器学习程序的基本结构以后你写的再复杂的 AI都是这个套路。导入工具python运行from sklearn.linear_model import LinearRegression我们不用自己从零写算法scikit-learn 这个库已经帮我们写好了所有经典算法。这里我们导入 线性回归 算法它是最简单、最常用的机器学习算法。准备数据python运行X np.array([[50], [60], [70], [80], [90]]) y np.array([100, 120, 140, 160, 180])X叫 特征就是我们用来预测的依据房子面积y叫 标签就是我们想要预测的结果房价这就是我们给 AI 的 例题创建模型python运行model LinearRegression()这一步就像你招了一个什么都不会的新员工他现在脑子里一片空白。训练模型核心步骤python运行model.fit(X, y)这是最神奇的一步fit就是 学习 的意思。当你运行这行代码时AI 会自动分析 X 和 y 之间的关系找到那个隐藏的规律。在这个例子中它找到了规律房价 面积 × 2预测python运行predicted_price model.predict([[area]])AI 学会了规律之后你给它一个新的面积它就会用刚才找到的规律算出对应的房价。✨ 神奇的实验让 AI 自己发现新规律现在请你动手修改一下代码看看会发生什么把房价数据改成python运行y np.array([150, 170, 190, 210, 230])再运行一次看看 120 平米的房子预测价格是多少你会发现AI 自动发现了新的规律 房价 面积 × 2 50预测结果变成了 290.00 万元你没有修改任何算法没有写任何新的规则只是给了它不同的数据它就自己学会了不同的规律。这就是机器学习的魔力 本节课总结核心概念机器学习是让计算机从数据中自己学习规则而不是人写规则核心思想所有机器学习都是 从数据中找规律用规律做预测核心代码结构导入工具 → 准备数据 → 创建模型 → 训练模型 → 预测你已经做到了写出了一个真正的机器学习程序它能根据历史数据预测未来 课后作业必须做否则等于白学运行上面的代码确保你能得到正确的结果自己造一组新的数据比如预测 学习时间和考试分数 的关系学习时间小时[1, 2, 3, 4, 5]考试分数分[60, 70, 80, 90, 100]预测学习 8 小时能考多少分思考一个问题如果数据不是这么完美的直线关系比如有一个数据点是 学习 5 小时考了 95 分AI 会怎么预测你可以改改代码试试。

更多文章