泛亚电竞作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算法的先决条件,也将帮助我们更深入透彻地了解算法的内在原理。所以,本文作者阐释了数据科学和机器学习为何离不开数学,并提供了统计学与概率论、多变量微积分、线性代数以及优化方法四个数学分支中需要熟悉的一些数学概念。
本文的作者是物理学家、数据科学教育者和作家 Benjamin Obi Tayo 博士,他的研究兴趣在于数据科学、机器学习、AI、Python 和 R 语言、预测分析、材料科学和生物物理学。
我几乎没有数学背景,那么能成为数据科学家吗? 哪些基本的数学技能在数据科学中非常重要呢?
我们都知道,数据科学离不开各式各样的扩展包。并且,现在有很多性能强大的包可以用来构建预测模型或者用来生成可视化数据。如下列举了用于描述性和预测性分析的一些最常见包:
得益于以上这些扩展包,任何人都可以构建模型或者生成可视化数据。但与此同时,要优化模型进而生成性能最佳的可靠模型,拥有强大的数学背景也是很有必要的。
也就是说,构建模型只是一方面,另一方面还需要对模型进行解释,得出有意义的结论,这样才能更好地做出数据驱动的决策。
最后,在使用这些包之前,你需要理解每个包中蕴含的数学基础,这样才不会只把这些包当作黑盒工具(black-box tool)。
数据集有多大? 特征变量和目标变量是什么? 哪些预测特征与目标变量关联最大? 哪些特征比较重要? 是否应该扩展特征? 数据集应该如何划分成训练集和测试集? 主成分分析(principal component analysis, PCA)是什么? 是否应该使用 PCA 删除多余特征? 如何评估模型?用 R2 值、MSE 还是 MAE? 如何提升模型的预测能力? 是否使用正则化回归模型(regularized regression model)? 回归系数是多少? 截距是多少(intercept)? 是否使用像 K 近邻回归(KNeighbors regression)或者支持向量回归(support vector regression)这样的无参数回归模型? 模型中的超参数是多少?如何调整超参数使模型性能达到最佳?
很明显,如果没有良好的数学背景,你将无法解决上述问题。因此,在数据科学和机器学习中,数学技能和编程技能一样重要,这很关键。
作为一个数据科学的推崇者泛亚电竞泛亚电竞,投入时间来学习数据科学和机器学习中的理论基础和数学基础很有必要。毫不夸张地说,你所构建的可靠有效模型能否用于解决现实世界的问题,这也将取决于你的数学技能有多好。
数学包罗万象,任何人都不可能门门精通。所以,在数据科学和机器学习研究中,我们可以根据自身所在的具体领域、手头的具体工作或者使用的具体算法来有侧重地学习对应的数学技能。
统计学和概率论可用于可视化变量、数据预处理、特征变换、数据插补、降维、特征工程和模型评估等等。
平均数、中位数、众数、标准差 / 方差; 相关系数和协方差矩阵、概率分布(二项分布、泊松分布和正态分布); p 值、贝叶斯定理(精度、召回率、正预测值、负预测值、混淆矩阵和 ROC 曲线)、中心极限定理 ;R_2 值、均方误差(MSE)、A/B 测试、蒙特卡罗模拟。
大多数机器学习模型是使用包含几种特征或预测变量的数据集来构建的。因此,熟悉多变量微积分对于构建机器学习模型非常重要。
多元函数、导数和梯度、阶跃函数; Sigmoid 函数、Logit 函数、ReLU 函数、损失函数; Plot 函数绘制、函数最小值和最大值。
线性代数是机器学习中最重要的数学技能,一个数据集可以被表示为一个矩阵。线性代数可用于数据预处理、数据转换以及降维和模型评估。
向量、向量范数; 矩阵、矩阵的转置、矩阵的逆、矩阵的行列式、矩阵的迹泛亚电竞、点积、特征值、特征向量。
总之,作为一个数据科学的推崇者,应该时刻谨记,理论基础对构建有效可靠的模型至关重要。因此,你应该投入足够的时间去研究每一种机器学习算法背后的数学理论。
作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算...
作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算...
作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算...
作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算...
作为一门基础性学科,数学在数据科学和机器学习领域都发挥着不可或缺的作用。数学基础是理解各种算...
据悉,全新的 15系列将有望继续在今年9月12日与大家见面。......
据悉,全新的华为Mate60系列有望在9月12日与大家见面。......
据德国汽车制造商大众汽车周三表示,为了应对全球芯片短缺的问题,该公......
IT之家 8 月 24 日消息,据彭博社 23 日报道,欧洲销量第二大的汽车制......
8月24日消息,日前,有自媒体称,国内运营商为诈骗集团提供了8000多万......
在财报中,英伟达预计第三财季营收160亿美元,上下浮动2%。......
8月24日消息,涂鸦智能发布截至2023年6月30日的第二季度及半年期经审计......
【TechWeb】8月24日消息,在好未来20周年直播活动中,CTO田密宣布好未......
8月24日消息,昨日晚间,五菱汽车公布中期业绩,上半年总收入为50.89亿......
8月24日消息,自23日起,京东调整自营商品运费标准,消费者在京东购买......
在 15系列的推动下,苹果相对而言会有不错的表现。......
【TechWeb】8月24日消息,沃尔沃汽车今日宣布,旗下首款纯电豪华MPV车......
【TechWeb】8月24日消息,好未来今日宣布其自研的数学领域千亿级大模型......
【TechWeb】8月24日消息,在好未来20周年直播活动中,CTO田密宣布好未......
8月24日消息,近日,《2022-2023年度中国平台软件市场研究报告》发布。......
8月24日消息,涂鸦智能发布截至2023年6月30日的第二季度及半年期经审计......
8月24日消息,Canalys发布的数据显示,2023年第二季度,各厂商在中东(......
据悉,全新的 15系列将有望继续在今年9月12日与大家见面。......
在马斯克带火了人形机器人之后,中国的人形机器人发展到什么程度了。......
在财报中,英伟达预计第三财季营收160亿美元,上下浮动2%。......
当地时间周二,VMware和英伟达宣布扩大战略合作伙伴关系,为更多企业带......
在 15系列的推动下,苹果相对而言会有不错的表现。......
预计有超过20项升级和变化的 15 Pro系列,售价也将会更高。......
买电动车,很多人为了充电便宜,但是近期,充电桩的话题热度居高不下。......
沉寂许久的科技公司 IPO 即将重启了,软银控股的英国芯片设计公司 Arm ......