文档介绍:初步算法(BasicAlgorithm) 算法的逻辑结构:顺序结构、条件结构、循环结构(UNTIL/WHILE)算法案例案例1:辗转相除法(欧几里得算法) 更相减损术——《九章算术》案例2:秦九韶算法:fx=i=0nanxn=⋯anx+an-1x+an-2x+⋯+a1x+a0案例3:进位制——(simplerandomsampling):从N个个体中逐个不放回地抽取n个个体,每个个体被抽到的机会相等(总体个数较少时宜使用)。(1)抽签法(抓阄法)(2)(systematicsampling):按照固定的间隔从N个个体中抽取n个个体(总体个数较多时宜使用)。(stratifiedsampling):将总体分成互不交叉的层,按照一定比例从各层中抽取个体(总体中差异明显时宜使用)。 频率分布(frequencydistribution):求极差决定组距与组数数据分组列频率分布表画频率分布直方图(频率面积=频率组距×组距)频率分布直线图总体密度曲线:反映总体在各个范围内取值的百分比。茎叶图(stem-and-leafdisplay)——出现频率(次数)最多的数。中位数——数据从小到大排列,处于最中间的一位或最中间的两位的平均数。样品中50%的个体≤中位数,50%的个体≥中位数(在频率分布直方图中,中位数左边和右边的直方图面积应相等)平均数(约等于频率分布直方图中每个小矩形面积×小矩形底边中点横坐标之和)标准差(standarddeviation):样本数据到平均数的一种平均距离(考察数据分散程度)S=x1-x+|x2-x|+⋯+|xn-x|ns=1n[x1-x2+x2-x2+⋯+(xn-x)2]方差s2=1n[x1-x2+x2-x2+⋯+(xn-x)2]*正态分布(高斯分布):N(μ,σ2)其中μ为平均数,σ2为方差;区间(μ-λσ,μ+λσ),λ∈N*(scatterplot),正相关,反相关线性相关关系:回归直线(regressionline)——通过样本点的中心(x,y)回归方程:最小二乘法(methodofleastsquare)对于一组具有线性相关关系的数据x1,y1,x2,y2,⋯,(xn,yn)Q=(y1-bx1-a)2+(y2-bx2-a)2+⋯+(yn-bxn-a)2b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2a=y-bx其中x=1ni=1nxi,y=1ni=1nyi, 回归方程:y=bx+a相关系数r——衡量两个变量之间线性关系的强弱r=i=1n(xi-x)(yi-y)i=1n(xi-x)2j=1n(yj-y)2如r∈[-1,-],则负相关很强;如r∈[,1],则正相关很强;如r∈(-,-]或r∈[,)