Что такое евклидово расстояние между векторами
Перейти к содержимому

Что такое евклидово расстояние между векторами

  • автор:

Что такое евклидово расстояние между векторами

МЕТОДЫ МНОГОМЕРНЫХ КЛАССИФИКАЦИЙ

Мера близости и расстояние между объектами

Для проведения классификации необходимо ввести понятие сходства или близости объектов по наблюдаемым переменным. В каждый кластер должны попасть объекты, имеющие сходные характеристики.

В кластерном анализе для количественной оценки близости вводится понятие метрики. Сходство и различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними. Если каждый объект описывается k признаками, то он может быть представлен как точка в k -мерном пространстве. Сходство с другими объектами будет определяться как соответствующее расстояние. В кластерном анализе используют различные меры расстояния между объектами.

Евклидово расстояние — наиболее общий тип расстояния. Является геометрическим расстоянием между точками в многомерном пространстве :

где : Xi , X j координаты i— го и j— го объектов в k- мерном пространстве ;

xil — xjl величина l— той компоненты у i -го (j— го) объекта ( l=1,2. k; i,j=1,2. n).

Квадрат евклидова расстояния — используется, чтобы придать большие веса более отдаленным друг от друга объектам : ρ ке (Xi , X j ) = ∑l(xil — xjl) 2 ,

где : Xi , X j координаты i— го и j— го объектов в k- мерном пространстве ;

xil — xjl величина l— той компоненты у i -го (j— го) объекта ( l=1,2. k; i,j=1,2. n).

Взвешенное евклидово расстояние — используется при задании произвольных весов для тех или иных признаков : ρ ве (Xi , X j ) = l wl * (xil — xjl) 2 ,

где : Xi , X j координаты i— го и j— го объектов в k- мерном пространстве ;

xil — xjl величина l— той компоненты у i -го (j— го) объекта ( l=1,2. k; i,j=1,2. n);

wl весовой коэффициент l— го признака .

Расстояние city-block ( городских кварталов) или манхэттенское расстояние — по сравнением с евклидовым расстоянием влияние отдельных больших разностей (выбросов) уменьшается, так как они не возводятся в квадрат : ρ c b (Xi , X j ) = ∑l | xil — xjl | ,

где : Xi , X j координаты i— го и j— го объектов в k- мерном пространстве ;

xil — xjl величина l— той компоненты у i -го (j— го) объекта ( l=1,2. k; i,j=1,2. n).

Расстояние Махаланобиса — применяют в случае зависимых компонент x1, x2, . xk вектора наблюдений и их различной значимости в решении вопроса классификации : ρm(Xi , X j ) = (Xi — X j ) T *C -1 * (Xi — X j ) ,

где : Xi , X j координаты i— го и j— го объектов в k— мерном пространстве ;

C -1 ковариационная матрица генеральной совокупности.

Оценка сходства между объектами сильно зависит от абсолютного значения признака и от степени его вариации в совокупности. Чтобы устранить подобное влияние на процедуру классификации, можно значения исходных переменных нормировать :

где xil — значение l— го признака i— го объекта ;

x l среднее арифметическое значение l -го признака ;

Sl =( ∑i( xil — x l) 2 /(n-1) ) 1/2 — стандартное отклонение l -го признака.

Выбор меры расстояния и весов для классифицирующих переменных — очень важный этап кластерного анализа, так как от этих процедур зависят состав и количество формируемых кластеров, а также степень сходства объектов внутри кластеров.

На первом этапе кластерного анализа n объектов в распоряжении исследователя имеется симметричная матрица расстояний ( матрица сходства) размерностью n*n. Эта матрица используется в процедурах иерархического агломеративного кластерного анализа.

Евклидово расстояние

В математике термин евкли́дово простра́нство может обозначать один из сходных и тесно связанных объектов:

В обоих случаях, n -мерное евклидово пространство обычно обозначается \mathbb E^n, хотя часто используется не вполне приемлемое обозначение  \mathbb R^n .

 \mathbb R^n

1. Конечномерное вещественное векторное пространство с введённым на нём (положительно определенным) скалярным произведением, порождающим норму:

\|x\|=\sqrt<\langle x, x \rangle></p>
<p>» width=»» height=»» />,</p>
<p>в простейшем случае (<i>евклидова норма</i>):</p><div class='code-block code-block-8' style='margin: 8px 0; clear: both;'>
<!-- 8pocketpc -->
<script src=

\|x\|=\sqrt<x_1^2+x_2^2+\dots +x_n^2></p>
<p> = \sqrt^n x_k^2>» width=»» height=»» /></p>
<p><img decoding=

где (в евклидовом пространстве всегда можно выбрать базис, в котором верен именно этот простейший вариант).

Иначе говоря евклидово пространство — конечномерное гильбертово пространство.

 \mathbb R^n

2. Метрическое пространство, которое является конечномерным векторным пространством над полем вещественных чисел с евклидовой метрикой, введённой по формуле:

d(x,y)=\sqrt<(x_1-y_1)^2+(x_2-y_2)^2+\dots+(x_n-y_n)^2></p>
<p> = \sqrt^n (x_k-y_k)^2>» width=»» height=»» />,</p><div class='code-block code-block-10' style='margin: 8px 0; clear: both;'>
<!-- 10pocketpc -->
<script src=

где x=(x_1,x_2,\dots, x_n)и  y=(y_1,y_2,\dots, y_n)\in \mathbb R^n, то есть с функцией расстояния, порождаемой описанной выше нормой.

Связанные определения

  • Под евклидовой метрикой может пониматься метрика, описанная выше, а также соответствующая риманова метрика.
  • Под локальной евклидовостью обычно имеют в виду то, что каждое касательное пространство риманова многообразия есть евклидово пространство со всеми вытекающими свойствами, например, возможностью (по гладкости метрики) ввести в малой окрестности точки координаты, в которых расстояние выражается (с точностью до какого-то порядка) в соответствии с описанным выше.
  • Метрическое пространство называют локально евклидовым также если возможно ввести на нём координаты, в которых метрика будет евклидовой (в смысле второго определения) всюду (или хотя бы на конечной области) — каковым, например, является риманово многообразие нулевой кривизны.

Примеры

Наглядными примерами евклидовых пространств могут служить пространства:

  • \R^1 размерности 1 (вещественная прямая)
  • \R^2 размерности 2 (евклидова плоскость)
  • \R^3
  • Евклидово пространство можно считать современной интерпретацией и обобщением (т.к. оно допускает размерности больше трех) классической (Евклидовой) геометрии.

Можно привести и несколько более абстрактные примеры:

  • пространство вещественных полиномов степени, не превосходящей n , со скалярным произведением, определенным как интеграл произведения по конечному отрезку (или по всей прямой, но с быстро спадающей весовой функцией)
  • вообще пространство всех линейных комбинаций конечного набора вещественных функций
  • пространство состояний конечномерной квантовой системы (или конечномерное подпространство полного пространства состояний) в вещественном представлении.

Не считается обычно евклидовым физическое 4-мерное пространство-время, т.к. основная метрика на нём, в соответствии с обычным в современной физике взглядом, псевдоевклидова. Хотя при желании евклидовская метрика может быть формально введена на нём тем или иным образом (если не пренебрегать гравитацией — то локально), что бывает иногда полезно, однако она не лоренц-инвариантна, что здесь очень сильно снижает её ценность с точки зрения современной физики.

См. также

  • Гильбертово пространство
  • Псевдоевклидово пространство
  • Евклидова геометрия
  • Евклидово поле

Ссылки

Wikimedia Foundation . 2010 .

  • Евклидова плоскость
  • Евклида алгоритм

Полезное

Смотреть что такое «Евклидово расстояние» в других словарях:

  • Евклидово пространство — (также Эвклидово пространство) в изначальном смысле, пространство, свойства которого описываются аксиомами евклидовой геометрии. В этом случае предполагается, что пространство имеет размерность 3. В современном понимании, в более общем… … Википедия
  • Расстояние в математике — Метрическим пространством называется множество, в котором определено расстояние между любой парой элементов. Содержание 1 Формальное определение 2 Обозначения 3 Примеры … Википедия
  • Евклидово пространство — пространство, свойства которого описываются аксиомами евклидовой геометрии. Упрощенно можно определить евклидово пространство, как пространство на плоскости или в трехмерном объеме, в которых заданы прямоугольные (декартовы) координаты, а… … Начала современного естествознания
  • Расстояние Чебышева — Определение Расстоянием Чебышева между n мерными числовыми векторами называется максимум модуля разности компонент этих векторов. Расстояние Чебышева задает метрику на . Это расстояние нередко обозначается через , поскольку является частным… … Википедия
  • Евклидово пространство — (в математике) пространство, свойства которого описываются аксиомами евклидовой геометрии (См. Евклидова геометрия). В более общем смысле Е. п. называется n мepное Векторное пространство, в котором возможно ввести некоторые специальные… … Большая советская энциклопедия
  • ЕВКЛИДОВО ПРОСТРАНСТВО — [по имени др. греч. математика Евклида (Eukleides; 3 в. до н. э.)] пространство, в т. ч. многомерное, в к ром возможно ввести координаты х1. хп так, что расстояние р (М ,М ) между точками М (х1 . х n) и М (х 1 , . xn ) может быть… … Большой энциклопедический политехнический словарь
  • Метод главных компонент — (англ. Principal component analysis, PCA) один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном (англ. Karl Pearson) в 1901 г. Применяется во многих областях,… … Википедия
  • Истинное ортогональное разложение — Метод Главных Компонент (англ. Principal components analysis, PCA) один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном (англ. Karl Pearson) в 1901 г. Применяется во многих… … Википедия
  • Метод Главных Компонент — (англ. Principal components analysis, PCA) один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном (англ. Karl Pearson) в 1901 г. Применяется во многих областях, таких как… … Википедия
  • Преобразование Карунена-Лоэва — Метод Главных Компонент (англ. Principal components analysis, PCA) один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном (англ. Karl Pearson) в 1901 г. Применяется во многих… … Википедия
  • Обратная связь: Техподдержка, Реклама на сайте
  • �� Путешествия

Экспорт словарей на сайты, сделанные на PHP,
WordPress, MODx.

  • Пометить текст и поделитьсяИскать в этом же словареИскать синонимы
  • Искать во всех словарях
  • Искать в переводах
  • Искать в ИнтернетеИскать в этой же категории

Расстояние Евклида (Euclid distance)

Расстояние Евклида — это геометрическое расстояние в многомерном пространстве. Оно вычисляется по теореме Пифагора.

Пусть в n-мерном пространстве заданы две точки: p ( p 1 , p 2 , . . . p n ) и q ( q 1 , q 2 , . . . q n ) . Тогда евклидово расстояние между ними вычисляется по следующей формуле:

d p q = √ n ∑ i = 1 ( p i − q i ) 2 ,

Например, расстояние Евклида между двумя точками a ( x a , y a , z a ) и b ( x b , y b , z b ) в 3-мерном пространстве ( X Y Z ) рассчитывается по формуле:

d a b = √ ( x a − x b ) 2 + ( y a − y b ) 2 + ( z a − z b ) 2 .

Евклидово расстояние является наиболее понятной и интерпретируемой мерой различия или близости объектов, представленных векторами признаков в многомерном пространстве, отражая интуитивные свойства расстояния между точками. Поэтому оно широко используется в анализе данных в качестве критерия для объединения наблюдений в классы и кластеры, оценки ошибок в предсказательной аналитике, а также в инструментах визуализации (например, картах Кохонена).

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science

Евклидово, L1 и Чебышёва — разбираемся, что это за расстояния и чем они друг от друга отличаются.

Не важно, начинаете вы осваивать Data Science или работаете в этой сфере не первый год, вам наверняка пригодятся эти метрики. Разбираемся, что они из себя представляют и чем отличаются друг от друга.

Евклидово расстояние (расстояние по прямой)

Евклидово расстояние самое интуитивное для понимания: именно Евклидову метрику мы представляем, когда кто-то просит нас измерить расстояние между точками.

Евклидово расстояние — это прямая линия между двумя точками с координатами X и Y. Например, одной из таких точек может быть город на карте с его координатами долготы и широты.

Евклидово расстояние характеризуется прямой линией. Допустим, вам нужно измерить расстояние по прямой между точками A и B на карте города, приведённой ниже.

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 1

Для расчёта Евклидового расстояния вам понадобятся лишь координаты этих двух точек. Дистанцию между ними можно будет рассчитать по формуле Пифагора.

Теорема Пифагора гласит, что можно рассчитать длину «диагональной стороны» (гипотенузы) прямого треугольника, зная длины его горизонтальной и вертикальной стороны (катетов). Формула выглядит так: a² + b² = c².

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 2

Прим. ред. В четвёртой строке вычислений допущена ошибка: (-260)^2 = 67 600, а не 76 600. Тогда результат будет равен ~321.

Расстояние L1 (расстояние городских кварталов)

Расстояние L1 также известно как расстояние городских кварталов, манхэттенское расстояние, расстояние такси, метрика прямоугольного города — оно измеряет дистанцию не по кратчайшей прямой, а по блокам. Расстояние L1 измеряет дистанцию между городскими блоками: это расстояние всех прямых линий пути.

На следующем изображении показано расстояние L1 между двумя точками.

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 3

Кроме показанного пути существует несколько альтернативных способов. Например, от точки A можно подняться на два блока вверх, а потом на три блока вправо, либо же на три блока вправо и два блока вверх.

Но расстояние L1 — это всё же просто дистанция, а поэтому траектория здесь не имеет значения. Единственное, что нужно понимать, это примерный путь: нужно пройти какое-то количество X блоков на восток и Y блоков на север. Сумма расстояний этих блоков и будет расстоянием L1 от точки A до точки B.

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 4

Расстояние Чебышёва (метрика шахматной доски)

Расстояние Чебышёва известно ещё как расстояние шахматной доски. Чтобы понять принцип такой метрики, нужно представить короля на шахматной доске — он может ходить во всех направлениях: вперёд, назад, влево, вправо и по диагонали.

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 5

Разница расстояния L1 и расстояния Чебышёва в том, что при переходе на одну клетку по диагонали в первом случае засчитывается два хода (например вверх и влево), а во втором случае засчитывается всего один ход.

Ещё эти оба расстояния отличаются от Евклидового расстояния тем, что у Евклидового движение по диагонали рассчитывается по теореме Пифагора.

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 6

Расстояние Чебышёва можно представить как проход по шахматной доске.

Вот ещё один пример представления расстояния Чебышёва. Допустим, у вас есть дрон с двумя независимыми моторами: первый мотор тянет дрон вперёд, второй — в сторону. Оба мотора могут работать одновременно и равномерно на максимуме своей мощности.

Поэтому дрон может передвинуться на одну клетку по диагонали так же быстро, как по горизонтали или вертикали.

Посмотрите ещё раз на карту города по расстоянию Чебышёва. Первый шаг — оба мотора работают одновременно, второй шаг идентичен первому, а на третьем шаге мотор, тянущий дрон вперёд, отключается, и дрон смещается в сторону.

Таким образом, расстояние Чебышёва определяется как самая большая дистанция на одной оси.

Евклидова, L1 и Чебышёва — 3 основные метрики, которые пригодятся в Data Science 7

Прим. ред. Полученный результат является условным и некорректно сравнивать его с другими результатами.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *