设为首页 | 收藏本站
185 1521 8668

Python中最常用的5种机器学习算法

发表时间:2025-03-11 14:50作者:Together规则引擎
文章附图

机器学习的概念是对机器进行编程,使其从经验和不同的示例中学习,而无需明确编程。它是AI的一种应用程序,允许机器自行学习。机器学习算法是数学和逻辑的组合,一旦输入数据发生变化,它们就会自我调整以更渐进地执行。作为一种通用、易于学习和理解的语言,Python可用于各种开发任务。它能够执行许多机器学习任务,这就是为什么大多数算法都是用Python编写的原因,要使用python编程语言建立坚实的ML基础。

创建机器学习算法的过程分为2个部分——训练和测试阶段。尽管机器学习算法种类繁多,但它们分为以下几类:监督学习、无监督学习和强化学习。

在本文中,我们将讨论前两类Python中最常用的5种机器学习算法。

Python中的机器学习算法

1. 线性回归

2. 决策树

3. 逻辑回归

4. 支持向量机(SVM)

5. 朴素贝叶斯

1.线性回归

它是最流行的监督式Python机器学习算法之一,它保持对连续特征的观察并基于它预测结果。它通过拟合最佳线来建立因变量和自变量之间的关系。这条最佳拟合线由线性方程Y=a*X+b表示,通常称为回归线。

在这个方程中,

Y–因变量

a-坡度

X–自变量

b-截距

回归线是最适合方程的线,用于提供因变量和自变量之间的关系。当它在单个变量或特征上运行时,我们称之为简单线性回归,当它在不同变量上运行时,我们称之为多元线性回归。这通常用于根据连续变量估算房屋成本、总销售额或呼叫总数。

2. 决策树

决策树是通过对分区数据重复提问来构建的。决策树算法的目标是提高每个分区级别的预测性,以便始终使用有关数据集的信息更新模型。

尽管它是一种监督式机器学习算法,但它主要用于分类而不是回归。简而言之,该模型采用一个特定的实例,通过将重要特征与条件语句进行比较来遍历决策树。当它下降到树的左子分支或右子分支时,根据结果,更重要的特征更接近根。这种机器学习算法的优点在于它同时适用于连续因变量和分类变量。

3. 逻辑回归

Python 中的一种监督式机器学习算法,用于估计二进制中的离散值,例如:0/1、yes/no、true/false。这是基于一组自变量。此算法用于通过将数据拟合到逻辑曲线或逻辑函数中来预测事件发生的概率。 这就是为什么它也被称为逻辑回归。

逻辑回归,也称为Sigmoid 函数,采用任何实值数字,然后将其映射到介于 0 和 1 之间的值。该算法可用于查找垃圾邮件、网站或广告点击预测以及客户流失。

Sigmoid 函数定义为,

f(x) = L / 1+e^(-x)

x:实数域

L:曲线的最大值

4. 支持向量机 (SVM)

这是Python 中最重要的机器学习算法之一,主要用于分类,但也可用于回归任务。在此算法中,每个数据项都绘制为 n 维空间中的一个点,其中 n 表示您拥有的特征数,每个特征的值作为特定坐标的值。

SVM 通过决策边界来区分这些类。例如:如果使用 length 和 width 对不同的单元格进行分类,则它们的观察值将绘制在 2D 空间中,并且一条线用于决策边界。如果您使用 3 个特征,则决策边界是 3D 空间中的一个平面。SVM 在维度数超过样本数的情况下非常有效。

5. 朴素贝叶斯

朴素贝叶斯是一种用于分类任务的监督式机器学习算法。这就是它也被称为朴素贝叶斯分类的原因之一。它假设特征彼此独立,并且它们之间不存在关联。但由于这些假设在现实生活中没有道理,因此这种算法被称为“天真”。

该算法适用于贝叶斯定理,即:

p(A|B) = p(A) .p(B|A) / p(B)

在这个

p(A):事件 A 的概率

p(B):事件 B 的概率

p(A|B):给定事件 B 的事件 A 的概率已经发生

p(B|A):给定事件 A 已经发生的事件 B 的概率

朴素贝叶斯分类器计算给定特征集p( yi I x1, x2, x3 中一个类的概率,...xn) 的由于将其放入贝叶斯定理中,我们得到 :

p( yi I x1, x2...xn)= p(x1,x2,...xn I yi)。p(yi) / p(x1, x2....xn)

由于朴素贝叶斯算法假设特征是独立的,因此p( x1, x2...xn I yi) 可以写成:

p(x1, x2,....xn I yi) = p(x1 I yi) .p(x2 I yi)...p(xn I yi)

p(x1 I yi) 是单个特征的条件概率,可以很容易地从数据中估计出来。假设有 5 个类和 10 个特征,需要存储 50 个概率分布。将所有这些相加,在给定特征值 (p(yi I x1,x2,...xn))。

结论

由于对技术的高需求,机器学习的受欢迎程度近年来飙升。这个领域有很大的潜力从数据中创造价值,这是它吸引不同行业企业的主要原因之一。这些是5 种最常用的机器学习算法。其中,您认为哪一个最有潜力?它们如何融入到企业决策管理中?请关注我们的解决方案。

文章分类: 人工智能DMN建模
分享到:
精选文章
公众号
关于我们
联系方式
让您的业务更自动化、智能化!
联系邮箱:   zhangy@jee-soft.cn       wangyl@jee-soft.cn
185 1521 8668
183 3562 2627
联系电话: