分类算法与模型

Name: 分类算法与模型
Author: Briana Brownell

在这些课程中，您将学习最常用的分类算法以及它们通常适用于哪些问题。我们将介绍几种建模风格，包括：回归、朴素贝叶斯、支持向量机、决策树、随机森林模型、K-最近邻模型和多类模型。

概述字幕文稿随时随地学习

对于每一种建模风格，您将了解它们的相对优势和劣势以及它们之间的权衡。本章还将介绍神经网络及其在常见分类问题中的应用，例如图像分类和卷积神经网络。

学习目标

学习最常用的分类算法
了解算法的优缺点
介绍神经网络及其在分类问题中的应用

作者: Briana Brownell

时长: 34m · 8 课时

级别: Intermediate

语言: 简体中文

你将掌握的技能

数据分类决策树学习机器学习机器学习算法机器学习方法机器学习模型培训

您将学到的内容

识别最常用的分类算法及其通常适用的问题类型
比较回归、朴素贝叶斯、支持向量机、决策树、随机森林模型和K近邻算法的优缺点与权衡取舍
将多分类模型应用于分类问题
解释感知机和神经网络及其在分类问题中的应用
使用卷积神经网络进行图像分类

关键要点

本课程涵盖多种建模方式，包括回归、朴素贝叶斯、支持向量机、决策树、随机森林模型、梯度提升、K近邻算法和多分类模型。
针对每种建模方式，课程分析其相对优缺点及各方式之间的权衡取舍。
课程介绍神经网络及其在常见分类问题（如图像分类）中的应用。
卷积神经网络在图像分类的背景下进行讲解。

常见问题

本课程涵盖哪些分类算法？

课程涵盖回归、朴素贝叶斯、支持向量机、决策树、随机森林模型、梯度提升、K近邻算法、多分类模型、感知机与神经网络，以及用于图像分类的卷积神经网络。

我能学习这些算法之间的区别吗？

是的。针对每种建模方式，您将了解其相对优缺点以及各方式之间的权衡取舍。

课程是否涵盖神经网络？

是的。课程介绍神经网络及其在常见分类问题中的应用，包括图像分类和卷积神经网络。

本课程有助于培养哪些技能？

本课程有助于培养数据分类、决策树学习、机器学习、机器学习算法、机器学习方法以及机器学习模型训练等方面的技能。

字幕文稿

这一章，我们将亲自动手使用您可能使用的一些特定算法用于分类建模。最常用的方法之一做分类建模的是逻辑回归。现在，回归是最常见的风格之一在实践中使用的机器学习它的历史非常悠久。逻辑回归基于相同的理论作为线性回归，而不是预测一个特定的值，它预测概率属于特定类别。为此，它使用逻辑或 sigmoid 函数。这个函数从零概率开始到 100% 的概率。使用逻辑回归的优势是你确实有那个概率这可以相当直接地解释。这使您可以查看一个特定的输入变量并查看该输入变量的值如何变化影响数据点的整体概率属于特定的类。那么，让我们看看它是如何工作的。所以这里我有一个示例程序将运行特定模型在三个不同的合成数据集上。合成数据集已设置使它们具有特定的属性这样当我们比较不同模型的结果时，我们可以确定一些模型在哪里做得很好和其他型号的表现相对较差。所以在逻辑回归的情况下，首先我需要从 SK learn 导入模块。然后我需要为我的图表命名，最后，我需要输入实际的分类器本身我想跑，在这种情况下，这是逻辑回归。所以当我们运行它时，它首先显示合成数据集然后它向我们展示了性能的逻辑回归。第一个数据集就像两个互锁的卫星，第二个就像两个圆圈，一个围绕另一个。最后一个本质上是一个blob 是近似线性可分的。好的，那它是怎么做的？所以结果图中的阴影告诉我们其中模型预测一个值与另一个值。所以预测数据点是否属于红色类或蓝色类网格向我们展示了模型认为是一个区域的位置这与红色类更相关或蓝色班。所以你可以在第一个看到这里记住我们有那种线性关系模型中的两个变量之间。所以这意味着它会有点覆盖网格上基于概率的 sigmoid 函数以线性方式。因此，对于我们的示例，这并不能很好地工作它没有捕捉到卫星内的结构尤其是不在圈子内。现在是最后一个，线性可分数据集你可以看到它实际上做得更好，但有趣的是 100% 的概率模型相当确定的区域数据点属于该类其实离得很远。所以你可以看到大部分数据点它实际上对它们进行了非常接近的分类到那个 50% 的标记，或者略高于或略低于。所以这让我们对数据集的种类有了一些直觉逻辑回归可能无法很好地建模。所以这应该给你一点直觉关于逻辑回归如何工作在现实生活中的数据。尽管这种模式存在挑战这是一种非常常见的建模方法你可以肯定地说它不太好用对于某些类型的关系在您的输入变量之间。事实上，它并没有推断出任何复杂的关系在您的输入变量中。您需要创建这些输入变量作为新功能，以便使用它们。好消息是它很容易解释模型中发生了什么。所以如果你有一种风格的数据集有相当好的准确性，然后解释它很容易，因为你只有几个系数您需要对其进行解释以了解其重要性这些元素中的每一个都是。你可以直接把它们以概率的形式你可以用概率来考虑它们这是一种非常直观的思考方式分类建模。逻辑回归的最后一个问题是它对异常值非常敏感。这意味着你的训练集真的可以影响建模结果。所以要注意数据中的异常值，无论如何，这是您应该始终检查的东西但是当你使用逻辑回归时，它真的很重要。逻辑回归的另一个挑战是它建立在一组可能无法满足的假设之上与您使用的许多不同的数据源。因此，例如，具有不等的方差在您的不同输入变量中是可以极大地影响模型的东西你建造的。所以请记住我们来自卡片装饰的数据我们在输入变量中看到了很多不相等的方差。所以在这种情况下，我们想确定我们有一个可以在我们的模型中工作的输入变量。所以现在你应该有一个好主意如何实现逻辑回归使用 SK 学习库和您可以使用的方法一些可视化，以便解释模型告诉你什么以及发生了什么与预测。你可以在其中一些上建立你的直觉合成数据集，以便您了解不同模型的比较当您要在真正的挑战中使用它时。

随时随地学习

随时随地学习——使用 KnowledgeCity 应用，您可以在移动中观看课程。

课程内容34m 32s

回归免费预览6:53
朴素贝叶斯2:32
支持向量机5:15
决策树, 随机森林模型, 梯度提升4:54
K-最近邻模型4:47
多类模型2:25
感知器和神经网络4:06
图像分类和卷积神经网络3:40

第一课为免费预览。登录即可解锁其余课程。

认证测试

解锁完整课程库

无限畅享我们完整的课程库。

预约演示

能力构建器

技能评估

课程库

LMS

AI 课程创建器

人才测评

绩效管理

SOP & Policy Manager

事故管理