Мы уже выяснили, что при различном уровне стрессовых воздействий сообщества будут различаться по своей структуре, отражая тем самым и качество среды. Оценить видовое разнообразие сообществ можно с помощью индексов разнообразия, сравнивая которые можно говорить и степени сходства/различия сообществ. Однако существуют и другие подходы к оценке сходства/различий между сообществами. С одним из таких подходов – методом главных компонент мы уже познакомились. Сегодня продолжим знакомство с другими методами. Строго говоря, полученная матрица не совсем корректно отражает сходства и различия между проанализированными пробами. Давайте разберемся почему. Начнем с того, что величина сходства между некоторыми пробами, похоже, оказалась заниженной. Например, пробы 2 и 3 явно сходны более чем на 50%, хотя в рассчитанной матрице сходство между ними составляет 42%. Но еще более существенно то, что значения коэффициента сходства в значительной мере определяются величинами численности видов 4 и 5 (эти виды будут вносить большой вклад в сумму, находящуюся в числителе формулы), что не совсем оправданно, т.к. роль других видов в детерминации величины сходства при этом снижается (например, сходство между пробами 2 и 4 выглядит явно завышенным). Избавиться от этой проблемы позволяет определенная трансформация исходных данных, которую следует выполнить перед расчетом матрицы сходства. Чаще всего для этого из исходных данных извлекают квадратный корень или корень 4-й степени. Извлечение корня снижает значимость наиболее обильных видов, одновременно придавая большую значимость видам с низкой численностью. Извлечение корня четвертой степени усиливает этот эффект еще больше. Жесткое снижение значимости наиболее обильных видов вызывает также логарифмирование исходных данных – log(x+1). Выполнив извлечение корня четвертой степени для данных из нашего примера, получим следующую матрицу: Год64687173
Проба1234
Вид
Echinoca.1.7000
Myrioche.2.1001.3
Labidopl.1.72.501.8
Amaeana01.93.51.7
Capitella03.44.31.2
Mytilus0000
А вот матрица сходства, рассчитанная на основе этих трансформированных данных: Проба1234
1-
225-
3067.9-
452.268.142-
Видим, что в целом коэффициенты сходства выросли. Но более важно то, что для некоторых станций ситуация поменялась кардинально (например, теперь S24 > S14, а S34 > S12). Таким образом, трансформация данных может в значительной мере повлиять на окончательные выводы относительно сходства сравниваемых сообществ. Однако ее обязательно нужно выполнять в случае с исходными данными, характеризующимися высокой дисперсией. Фактически, для таких данных ключевым является выбор способа трансформации, нежели выбор коэффициента сходства. Коэффициенты видового сходства сообществ. Мы уже говорили о том, что часто приходится иметь дело с матрицей данных, включающей 0 и 1, т.е. содержащей информацию о наличии или отсутствии того или иного вида в той или иной пробе. При построении матрицы сходства в таких случаях чаще всего используют два коэффициента – коэффициент Жаккара (Jaccard) и коэффициент Серенсена (Sörenson). В русскоязычной литературе последний называют еще коэффициентом Чекановского-Серенсена. Коэффициент Жаккара рассчитывается следующим образом: , где а и b – число видов в первой и второй из сравниваемых проб, а с – число общих видов в этих пробах. В формулу расчета коэффициента Серенсена входят те же элементы: