系统发生树的构建 基于距离的方法 neighbor joining 最大简约法 maximum parsimony 最大似然法 maximum likelihood 贝叶斯推断法 bayesian inference 快 慢 高 低 计算速度 计算准确度
基于距离的 UPGMA 法 非加权分组平均法( UPGMA )构建实例 UPGMA 法是通过计算所有序列两两间的距离,再根据距离远近构建系统发生树。 序列两两间的距离可以用双序列比对得出的一致度 / 相似度代表,或用其他简化值代替。 如果 DNA 序列两两间一致度大于 70% ,就选用 DNA 序列构建序列树。 如果 DNA 序列两两间一致度小于 70% ,则可选用 DNA 或蛋白质序列构建。
基于距离的 UPGMA 法 四条序列 A : T A G G B : T A C G C : A A G C D : A G C C 用序列间不同的碱基数目作为序列间遗传距离的度量 A 和 B 的距离 d[AB]=1 A: T A G G B: T A C G A 和 C 的距离 d[AC]=2 A: T A G G C: A A G C A 和 D 的距离 d[AD]=4 A: T A G G D: A G C C B 和 C 的距离 d[BC]=3 B: T A C G C: A A G C B 和 D 的距离 d[BD]=3 B: T A C G D: A G C C C 和 D 的距离 d[CD]=2 C: A A G C D: A G C C
基于距离的 UPGMA 法 距离矩阵 A 和 B 的距离 d[AB]=1 A: T A G G B: T A C G A 和 C 的距离 d[AC]=2 A: T A G G C: A A G C A 和 D 的距离 d[AD]=4 A: T A G G D: A G C C B 和 C 的距离 d[BC]=3 B: T A C G C: A A G C B 和 D 的距离 d[BD]=3 B: T A C G D: A G C C C 和 D 的距离 d[CD]=2 C: A A G C D: A G C C A B C B 1 C 2 3 D 4 3 2
基于距离的 UPGMA 法 距离矩阵 A B C B 1 C 2 3 D 4 3 2 0.5 1 2 1.5 A B A 和 B 的距离 d[AB]=1 A: T A G G B: T A C G
基于距离的 UPGMA 法 距离矩阵 A B C B 1 C 2 3 D 4 3 2 0.5 1 2 1.5 A B AB C C 2.5 D 3.5 2 AB 视为整体与 C 比较 d[(AB)C]=[d(AC)+d(BC)]/2=2.5 d[(AB)D]=[d(AD)+d(BD)]/2=3.5 C D
基于距离的 UPGMA 法 距离矩阵 A B C B 1 C 2 3 D 4 3 2 0.5 1 2 1.5 A B AB C C 2.5 D 3.5 2 CD 视为整体与 AB 比较 C D AB CD 3