AI Glossary: What Is Approximate Nearest Neighbors (ANN)? Definition & Meaning

Vizinhos Mais Próximos Aproximados (RNA) refere-se a uma categoria de algorithms designed to quickly identify points in a dataset that are nearest to a specified query point, with a focus on efficiency over exact precision. In various applications such as recuperação de imagens, sistemas de recomendação, and processamento de linguagem natural, finding exact nearest neighbors can be computationally expensive, especially in large datasets. ANN algorithms aim to reduce the time and resources needed to obtain ‘good enough’ results.

Esses algoritmos funcionam com o princípio de que, ao invés de procurar em cada ponto de um conjunto de dados para determinar os mais próximos, eles utilizam várias técnicas para restringir o espaço de busca. Métodos comuns incluem:

Particionamento espacial: Dividing the dataset into smaller regions (like KD-trees or Ball trees) to limit the number of comparisons needed.
Técnicas de hashing: Using locality-sensitive hashing (LSH) to group similar items together, allowing for faster retrieval of approximate neighbors.
Métodos baseados em grafos: Constructing a graph where points are nodes connected based on their proximity, enabling quicker traversal to find approximate neighbors.

While ANN algorithms may not always provide the exact nearest neighbors, they are often sufficient for practical applications where speed is more critical than perfect accuracy. The trade-off between accuracy and performance is a central consideration when implementing these techniques. As the size of datasets continues to grow, ANN algorithms are becoming increasingly popular in aprendizado de máquina e mineração de dados.