Наряду со сходством сообществ можно говорить и об их несходстве, т.е. степени их «непохожести» друг на друга. Хотя сходство и несходство – это разные стороны одной монеты, именно степень несходства является основой для нескольких методов многомерной статистики, с помощью которых анализируются сообщества. Например, мы уже знакомы с анализом главных компонент, главной задачей которого является ординация тех или иных объектов в особой системе координат. При этом чем больше расстояние между точками-объектами в такой системе координат, тем больше различия между этими точками. Таким образом, мерой различий выступает расстояние в некоторой системе координат. Наиболее часто используется т.н. Евклидово расстояние (=метрика): Чтобы было проще разобраться с геометрическим смыслом Евклидова расстояния представим себе случай, когда в сообществе имеются только два вида. Тогда положение двух проб j и k в координатных осях численности этих двух видов можно представить так. Расстояние между ними будет представлять собой гипотенузу прямоугольного треугольника. Рассмотренную ситуацию легко можно перенести и на случай с тремя видами. Здесь расстояние тоже будет определяться суммой квадратов расстояний между точками вдоль каждой из осей. При увеличении числа видов графически изобразить расположение точек мы уже, конечно, не сможем, но смысл остается тем же. Евклидово расстояние не является единственным, с помощью которого можно описать расстояние между токами в пространстве. Широко используемой альтернативой является т.н. Манхэттенское расстояние (Manhattan distance) (=сити-блок метрика, от англ. city-block distance), которое представляет собой просто сумму расстояний от точки до точки вдоль координатных осей (не возведенных в квадрат!): Название этого расстояние происходит от единственно возможного способа, с помощью которого вы можете дойти от дома, стоящего на одной улице города до дома на другой улице при условии, что эти улицы перпендикулярны друг другу. Рассчитывая коэффициенты сходства/несходства сообществ, исследователь получает возможность делать соответствующие заключения относительно причин наблюдаемых различий (например, они могут быть вызваны загрязнением или другими стрессовыми воздействиями). Для этого достаточно получить матрицу сходства/несходства. Однако на практике простой анализ матрицы сходства/несходства часто оказывается затруднительным из-за большого числа проб (дат) и видов в них. Для избавления от подобной проблемы было разработано несколько методов классификации многомерных данных. С одним из них мы уже фактически познакомились – это метод главных компонент (при расчете осей главных компонент можно пользоваться не исходными численностями видов или другими вариантами их значимости, а матрицей сходства). Сейчас познакомимся с еще одним очень широко распространенным в экологических исследованиях методом классификации, а именно с иерархическим кластерным анализом.