A similaridade é um critério para medir a distância entre dois vetores, sendo um conceito essencial na análise de agrupamentos. A distância Euclidiana está entre as medidas de similaridade mais comuns. Considere que a variável X represente a idade (em anos) e que a variável Y represente a média do rendimento semestral global (medido numa escala de 0 a 10) de estudantes de um Instituto Federal de Educação. A tabela a seguir apresenta dados observados para as variáveis X e Y para três estudantes desse Instituto:
Estudante Idade (X) Rendimento (Y) 1 21 7 2 22 8 3 18 6
A distância Euclidiana para esse conjunto de dados é igual a: