1 / 36

生物信息学基础讲座

生物信息学基础讲座. 第 3 讲 生物信息学与数学. 微积分. calculus. 函数 function. 一元函数 多元函数. 极限 limit. 上式中的 L 即为函数 f(x) 在 x 0 处的极限. 导数 derivative. 导数的几何意义 函数曲线在该点处切线( tangent )的斜率( slope ). 导数的规则 rules for derivatives. 加法规则 addition rule 传递原则 chain rule 乘法原则 multiplication rule 除法原则 division rule.

sereno
Télécharger la présentation

生物信息学基础讲座

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 生物信息学基础讲座 第3讲 生物信息学与数学

  2. 微积分 calculus

  3. 函数function • 一元函数 • 多元函数

  4. 极限limit • 上式中的L即为函数f(x)在x0处的极限

  5. 导数derivative 导数的几何意义 函数曲线在该点处切线(tangent)的斜率(slope)

  6. 导数的规则rules for derivatives • 加法规则addition rule • 传递原则chain rule • 乘法原则multiplication rule • 除法原则division rule

  7. Applied calculus • 变化Change: 常导数ordinary 、偏导数partial和方向导数directional derivatives • 最优化optimization:包括拟合fitting和带约束的优化constrained optimization • 建模modeling • 函数类型:线性linear、多项式polynomial、指数exponential、三角trigonometric、幂power-law • 多元函数multi-variables function • 微分方程differential equation • 单位和维度units and dimension • 例子:二元二次多项式

  8. 微分方程:动态过程建模 Differential Equation

  9. 动态模型dynamic model • 描述研究对象特征随时间/空间变化的演变过程 • 分析研究对象特征的变化规律 • 预测研究对象特征的未来状态 • 控制研究对象特征的未来状态 • 微分方程建模方法 • 根据函数及其变化率(导数)的关系建模 • 根据建模目的和问题分析简化假设 • 根据内在规律(模式)或类比法建立微分方程

  10. 线性代数:矩阵之美 Linear Algebra

  11. 基本概念 • 集合(set) • 线性空间(linear space) • 线性组合(linear combination) • 线性相关(linear independent) • 欧式空间(Euclidean space) • 正交(perpendicular,orthogonal)

  12. 向量的加法(addition) • 其实质是对应元素的加法 • 交换律(communicative law) • 结合律(associative law) • 分配率(distributive law) • 向量加减的几何学意义(geometric interpretation)

  13. 向量乘法(multiplication)的几何意义 • 内积(inner product):也称作点乘(dot product),其结果为一标量(scalar),相当于a的范数(L2-norm)与b的范数的乘积乘以两向量的夹角余弦值,表示为 <a, b> 或 a·b • 应用:计算物理上的做功。 • 外积(outer product):也称作叉乘(cross product),其结果为垂直于向量a与b形成的的平面的向量,其范数为向量a和b范数的乘积乘以夹角的正弦值,表示为 a×b • 应用:物理上的电磁力计算,确定方向采用右手螺旋方法

  14. 矩阵(matrix) • 矩阵的秩(rank):矩阵A的行(或列)极大无关组的个数,表示为rank(A),rank(A) <= min(m, n)。如果等式成立,则称A是满秩(full rank)的(行满秩还是列满秩取决于m、n大小);如果rank(A)=m=n,则称A为n阶非奇异方阵(n-order nonsingular square matrix),此时A可逆(invertible)。 • 方阵的行列式(determinant),表示为det(A)。矩阵非奇异的充要条件是:det(A)<>0 • 矩阵的转置(transpose matrix) • 逆矩阵(inverse matrix) • 对称矩阵(symmetric matrix) • 正交矩阵(orthonormal matrix) • 正定矩阵(positive definite matrix) • 正半定矩阵(positive semidefinite matrix)

  15. 矩阵分解(decomposition/factorization) 所谓矩阵分解,是将矩阵分解为经典矩阵(canonical matrix)的乘积的办法,目的是为了简化计算。 • LU分解:将矩阵分解为下三角矩阵(upper triangular matrix,L)和上三角矩阵(upper triangular matrix ,U)的乘积,常用于方程组的求解。通常A为方阵 • QR分解:将矩阵分解为一个正规正交矩阵(Q)和一个上三角矩阵的积(R)。QR分解常用来求解线性最小二乘问题。矩阵不必为方阵,分解得到Q为m×m方阵,R为n×n方阵 • Cholesky分解: • 特征值分解(eigendecomposition): • Schur分解: • 奇异值分解(singular value decomposition, SVD):A=USVT,其中U、V为正规正交矩阵,S为对角阵。是最为准确的矩阵分解方法,可用于主成份分析(PCA)和聚类(clustering)

  16. 最优化:理论与应用 Optimization Theory & Applications

  17. 数学规划(mathematical programming) • 最优化理论的一个重要分支 • 数学规划是指对n个变量对单目标(或多目标)函数求解极小值(或极大值) • 变量可能受到某些条件(等式或不等式)的约束

  18. 优化问题:分类 • 线性规划+非线性规划(二次规划等) • 凸规划+非凸规划 • 全局(global)优化和局部(local)优化 • 带约束的优化+不带约束的优化 • 无约束优化应用:最小二乘法(ordinary least squares, OLS) • 带约束的优化应用:LASSO(least absolute shrinkage and selection operator)

  19. 线性规划(linear programming) • 目标函数(objective)和约束函数(constraint)都是线性的 • 方法(solutions) • 图解法(graphical method) • 单纯形法(Simplex method) • 修正单纯形法(Modified Simplex method) • 对偶单纯形法(dual Simplex method) • 应用:

  20. 二次规划(quadratic programming)

  21. 概率论:赌场中产生的科学 Probability

  22. 统计:科学还是骗术? Statistics:Cheating Tools?

  23. Descriptive statistics • Continuous data • Location: mean, median, mode • Dispersion: range, standard deviation, coefficient of variation, percentile • Moments: variance, semivariance, skewness, kurtosis • Categorical data • Frequency • Contingency table

  24. Statistical graphics • bar plot • biplot • boxplot • Histogram • Stemplot • Q-Qplot • correlogram

  25. Mathematics can be beautiful …

  26. barplot

  27. boxplot

  28. Pairs plot

  29. Perspective plot

  30. Time series data decomposition

  31. Stem plot 1 | 1111112222233444 1 | 5555556666667899999 2 | 3344 2 | 59 3 | 3 | 5678 4 | 012

  32. 随机过程:从偶然到必然 Stochastic Process

  33. 马尔可夫链(Markov Chain) • 有向无环图(Directed Acyclic Graph, DAG) • 可用于预测(prediction)与分类(classification) • 每条有向边为量化的可信度(或者概率) • 是马尔可夫链(Markov chain, MC)的扩展(extension或generalization) • 每个节点概率的计算,可用贝叶斯公式计算;与马尔可夫链相似,每个状态值取决于前面有限个状态

  34. 贝叶斯网络(Bayesian Network) • 有向无环图(Directed Acyclic Graph, DAG) • 可用于预测(prediction)与分类(classification) • 每条有向边为量化的可信度(或者概率) • 是马尔可夫链(Markov chain, MC)的扩展(extension或generalization) • 每个节点概率的计算,可用贝叶斯公式计算;与马尔可夫链相似,每个状态值取决于前面有限个状态

  35. 图论:树与网络 Graph Theory

  36. Classification minds • (apple, orange, banana, watermelon, grape, grapefruit, mango, star fruit) • Clustering or classification?

More Related