李宏毅机器学习：Introduction of Machine Learning

发表于 2018-07-13 更新于 2025-05-04 分类于学习笔记阅读次数： Disqus：本文字数： 0 阅读时长 ≈ 1 分钟

人工智能不是个新词，早在1950年就存在了，希望机器和人一样聪明。是我们想达成的目标。
之前我们并不知道如何来达成这个目标，直到机器学习的出现，机器学习是一种达到人工智能的手段。
而深度学习是机器学习的一种。机器学习包含很多算法，比如逻辑回归、SVM、决策树等。不过现在来看深度学习这种算法发挥出的作用远远大于机器学习中的其他算法，导致很多将深度学习等同于机器学习，但其实不是这样的，深度学习是机器学习的一个子集。

人工智能从生物的角度来说，来自于两个方面：生物的本能和后天的学习。
比如动物河狸，它的天生本能是筑水坝，只要听到流水声，它就要筑水坝直到听不到流水声。所以我们就可以利用它的这个本能来欺负它，用扬声器来模拟流水声。

人类的本能呢？
手写规则，比如我们要做一个聊天机器人，首先我们想到的就是手写一些规则。
缺点：

很难考虑到所有的可能性，比如在真实环境中，聊天机器人的可能性是无限的。

人工成本很大，需要很多工程师来写规则，数以万计的规则，不适合小企业，没那么多工程师。

AI inside

机器学习是什么

拟人化：你写一个程序来让机器持续学习…
数学：寻找一个函数，从你喂给它的数据中，其实如果人能够写出这个函数，我们就不需要机器学习了，直接把这个函数写在程序中就可以了。但在现实中的绝大多数任务中，我们人是很难算出或者找个这个函数的，需要借助机器的力量，让它去跑、去计算、去学习出这个复杂函数的参数。

框架

模型：函数集合$f{1},f{2}…$，几乎是无穷的
评估标准：好的算法来找出最好的函数($f^*$)
训练数据

三个步骤

定义一个函数集合

损失函数

从函数集合中找到最好的函数

和把大象塞进冰箱只需要三个步骤一样（打开冰箱门->把大象赶进去->关上冰箱门）

学习路线

从学习情景来分：
这是根据训练数据来决定的，比如你没有带标签的数据，那么你就不能做监督学习。

监督学习
有标签数据

非监督学习
没有标签数据

半监督学习
大量没有标签的数据，少量有标签的数据

迁移学习
数据和任务不相关，但是可以迁移过来

增强学习（Reinforcement Learning）

从任务上来分（也可以说从输出结果来分）：

回归

输出值是一个标量
需要大量的训练数据

分类

二分类和多分类，类似于选择题
邮件分类
文章新闻分类

结构学习

语音识别
机器翻译

关于监督学习与增强学习：监督学习类似于有个老师，从老师处学习，而增强学习是从评价中学习。
Alpha Go是监督学习加增强学习。

出现新工作：AI训练师
需要有经验的AI训练师。

小结

林轩田老师的课程是比较有趣的，中间会举很多有意思的例子，大多数是和动漫有关的。