由于 Google 将会在 2021 年 7 月 30 日从此网站上移除《机器学习速成课程》。英语版本依然会提供.
所以对网站内容进行截图备份
Google 机器学习官网链接: 点击此处
框架处理-主要术语
深入了解机器学习
线性回归
训练与损失
检查你的理解情况-问题
检查你的理解情况-答案
降低损失
迭代方法
梯度下降法
学习速率
优化学习速率
随机梯度下降法
Playground 练习
检查你的理解情况-问题
检查你的理解情况-答案
使用 TF 的基本步骤-TODO
需要练习
泛化
过拟合的风险
训练集和测试集
拆分数据
Playground 练习
验证集
检查你的直觉
另一个划分
编程练习
表示法
特征工程
良好特征的特点
数据清理
编程练习
特征组合
对非线性规律进行编码
组合独热矢量
Payground 练习
编程练习
检查你的理解情况
正则化: 简单性
Playground 练习: 组合过度
L2 正则化
Lambda
Playground 练习: L2 正则化
检查你的理解情况
逻辑回归
计算概率
损失和正则化
分类
阈值
阳性与阴性:正分类与负分类
准确率
精确率和召回率
分类指标 F1值
: https://wikipedia.org/wiki/F1_score
检查你的理解情况:准确率、精确率、召回率
ROC 曲线和曲线下面积
检查你的理解情况:ROC 和曲线下面积
预测偏差
编程练习
正则化: 稀疏性
L1 正则化
Playground 练习
编程练习
检查你的理解情况
神经网络
神经网络是更复杂版本的特征组合。实质上,神经网络会学习适合您的相应特征组合。
学习目标
对神经网络有一定的了解,尤其是了解以下方面:
- 隐藏层
- 激活函数
结构
Playground 练习
编程练习
训练神经网络
反向传播算法是最常见的一种神经网络训练算法。借助这种算法,梯度下降法在多层神经网络中将成为可行方法。TensorFlow 可自动处理反向传播算法,因此您不需要对该算法作深入研究。要了解它的工作原理,请参阅下面的反向传播算法的直观说明。滚动浏览开头的说明时,请注意以下几点:
- 数据如何流经图表。
- 我们可以如何借助动态规划避免计算图表中数量达指数级别的路径。这里的“动态规划”仅仅是指记录正向传播和反向传播的中间结果。
学习目标
- 在一定程度上了解反向传播算法。
最佳做法
编程练习
多类别神经网络
前面您已经了解了二元分类模型,该模型可从两个可能的选项中选择其一,例如:
- 特定电子邮件是垃圾邮件还是非垃圾邮件。
- 特定肿瘤是恶性肿瘤还是良性肿瘤。
在本单元中,我们将研究多类别分类,这种模型可从多种可能的情况中进行选择。例如:
- 这条狗是小猎犬、巴吉度猎犬还是寻血猎犬?
- 这朵花是西伯利亚鸢尾花、荷兰鸢尾花、蓝旗鸢尾花还是有髯鸢尾花?
- 那架飞机是波音 747、空中客车 320、波音 777 还是 Embraer 190?
- 这是一张苹果、熊、糖果、狗狗还是鸡蛋的图片?
现实世界中的一些多类别问题需要从数百万个类别中进行选择。例如,一个几乎能够识别任何事物图片的多类别分类模型。
预计用时:5 分钟
学习目标
- 理解多类别分类问题,尤其是 Softmax。
- 在 TensorFlow 中制定 Softmax 解决方案。
一对多
Softmax
编程练习
嵌入
嵌套是一种相对低维的空间,您可以将高维矢量映射到这种低维空间里。通过使用嵌套,可以让在大型输入(比如代表字词的稀疏矢量)上进行机器学习变得更加容易。在理想情况下,嵌套可以将语义上相似的不同输入映射到嵌套空间里的邻近处,以此来捕获输入的语义。一个模型学习到的嵌套,也可以被其他模型重用。
学习目标
- 学习嵌套的定义和用途。
- 学习嵌套如何编码语义关系。
- 学习如何使用嵌套。
- 学习如何训练有意义的嵌套(例如使用 word2vec)
协同过滤的目的
分类输入数据
转换到低纬度空间
获取嵌入
https://tensorflow.google.cn/tutorials/text/word2vec