Відстань Геммінга

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Відстань Геммінга — число позицій, у яких відповідні цифри двох двійкових слів однакової довжини різні [1]. У загальнішому випадку відстань Геммінга застосовується для рядків однакової довжини будь-яких q-кових абеток і служить метрикою відмінності (функцією, що визначає відстань в метричному просторі) об'єктів однакової вимірності.

Спочатку метрика була сформульована Річардом Геммінгом під час його роботи в Bell Labs для визначення міри відмінності між кодовими комбінаціями (двійковими векторами) у векторному просторі кодових послідовностей, в цьому випадку відстанню Геммінга між двома двійковими послідовностями (векторами) і довжини називається кількість позицій, в яких вони різні — в такому формулюванні відстань Геммінга увійшла в словник алгоритмів і структур даних національного інституту стандартів і технологій США (en:Dictionary of Algorithms and Data Structures).

Приклади[ред.ред. код]

Властивості[ред.ред. код]

Відстань Геммінга має властивості метрики, задовольняючи таким умовам:

Відстань Геммінга в біоінформатиці та геноміці[ред.ред. код]

Для нуклеїнових кислот (ДНК та РНК) можливість гібридизації двох полінуклеотидних ланцюгів з утворенням вторинної структури — подвійної спіралі — залежить від ступеня комплементарності нуклеотидних послідовностей обох ланцюгів. При збільшенні відстані Геммінга кількість водневих зв'язків, утворених комплементарними парами основ зменшується і, відповідно, зменшується стабільність подвійного ланцюга. Починаючи з деякої граничної відстані Геммінга гібридизація стає неможливою.

При еволюційному розходженні гомологічних ДНК-послідовностей відстань Геммінга є мірою, за якою можна судити про час, що пройшов з моменту розбіжності гомологів, наприклад, про тривалість еволюційного відрізку, що розділяє гени-гомолог і ген-попередник.

Див. також[ред.ред. код]

Примітки[ред.ред. код]

  1. Hamming distance: The number of digit positions in which the corresponding digits of two binary words of the same length are different (Federal Standard 1037C ).

Література[ред.ред. код]