1 / 404
文档名称:

大数据数学基础(R语言描述)课件.ppt

格式:ppt   大小:9,539KB   页数:404页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据数学基础(R语言描述)课件.ppt

上传人:miao19720107 2022/7/26 文件大小:9.32 MB

下载得到文件列表

大数据数学基础(R语言描述)课件.ppt

相关文档

文档介绍

文档介绍:绪论
*
1
数学与 R语言
目录
大数据与数学
2
小结
3
舍恩伯格在《大数据时代》一书中提到了大数据应该具备三种特征。
不是随机样本,而是全体数据
不是精确性,而是混杂性
不是因果关系,而是相关关系
大数据阵

用于提取矩阵的下三角矩阵
base
函数名
说明
t
用于矩阵的转置运算
det
用于求解行列式
solve
用于求解矩阵的逆
eigen
用于求矩阵的特征值和特征向量
svd
用于对矩阵进行奇异值分解
max
用于求数据的最大值
min
用于求数据的最小值
stats程序包是R语言的统计包,其包含用于统计计算和生成随机数的功能。stats程序包常用于统计计算的函数及其说明如下表所示。
stats
函数名
说明
D
用于求函数的导数或微分
integrate
用于求定积分
median
用于求中位数
quantile
用于求四分位数
mean
用于求均值
IQR
用于求四分位数间距
var
用于求方差
sd
用于求标准差
dbinom
用于求二项分布的概率
dpois
用于求泊松分布的概率
函数名
说明
dunif
用于求均匀分布的概率
dexp
用于求指数分布的概率
dnorm
用于求正态分布的概率
var
用于求协方差
cor
用于求相关系数
stats
1
数学与 R语言
目录
大数据与数学
2
小结
3
本章作为全书的引言,详细阐述了大数据的三个特性与5V理论,阐述了微积分、统计学、线性代数、数值计算与大数据之间的联系。
大数据所需的数学知识涵盖范围非常广,本书只是对其中最基础的部分做了介绍,并不能全面覆盖。
小结
微积分基础
*
1
导数与微分
目录
函数与极限
2
(1)集合的概念
定义 2‑1 集合(简称“集”)是指具有某种特定性质的事物的总体,组成这个集合的事物称为该集合的元素(简称“元”)。
通常用大写英文字母A,B,C,⋯ 表示集合,用小写英文字母 ,b,c,… 表示集合的元素。
定义 2-2 如果 是集合A的元素,则 属于A,记为 ∈A;如果 不是集合A 的元素,则 不属于A, 记为 或 。一个集合,若它只含有限个元素,则称为有限集;不是有限集的集合称为无限集。
如果集合A 的元素都是集合B 的元素,则A是B 的子集,记为A⊂B;如果集合A与集合B 互为子集,则集合A与集合B 相等,记为A=B。
映射与函数
1. 集合
(2)集合的运算
集合的基本运算有并、交、差三种。设A、B是两个集合。
定义 2‑3 由所有属于集合A或者属于集合B的元素组成的集合,称为A与B的并集(简称“并”),记为A∪B,即 。
定义 2‑4 由所有既属于集合A又属于集合B的元素组成的集合,称为A与B的交集(简称“交”),记为 A ∩ B,即 。
定义 2‑5 由所有属于集合A而不属于集合B的元素组成的集合,称为AB与的差集(简称“差”),记为A\B,即 。
对与集合的计算,可以使用Python运算符进行计算,常用的运算符有:+,-,*,/,**,//等。
映射与函数
例 2-1 设集合A={1,2,3,4,5},B= ,请计算出集合与的并、交、差。
解 集合B是方程的解集,可以表示为B={2,3}。
A与B的并: A∪B={1,2,3,4,5} 。
A与B的交: A ∩ B={2} 。
A与B的差: A\B ={1,4,5} 。
映射与函数
(1)映射的概念
定义 2‑6 设X,Y是两个非空集合,如果存在一个法则 ,使得对X 中每个元素x,按法则 ,在Y中有唯一确定的元素y与之对应,则称 为从X 到Y 的映射,记为 :X→Y。其中y称为元素 x(在映射 下)的像,并记为 (x);元素x称为元素y(在映射 下)的原像;集合X 称为映射 的定义域;集合X 中所有元素的像所组成的集合称为映射 的值域。
定义 2‑7 若对中任意两个不同元素 ,它们的像 ,则称 为X 到Y 的单射。
映射与函数
2. 映射
(2)逆映射的概念