Definição de busca híbrida

A busca híbrida é uma poderosa estratégia de recuperação de informações que combina duas ou mais técnicas de busca em um algoritmo de busca.

Normalmente, a busca híbrida combina busca por palavra-chave e busca semântica, utilizando técnicas avançadas de machine learning. A busca semântica recupera resultados com base no significado do texto, enquanto a busca de texto completo se concentra em correspondências exatas de palavras. A busca híbrida é vital para consultas conversacionais e aqueles momentos de 'como era o nome disso mesmo?' em que os usuários não digitam ou não conseguem inserir palavras-chave precisas.

Tanto a busca por palavra-chave quanto a busca semântica têm pontos fortes únicos. A busca por palavra-chave usa um algoritmo de classificação e termos específicos para determinar a relevância de um documento para uma busca de consulta. A busca semântica pega a consulta de busca e considera o contexto.

A busca híbrida melhora a precisão da busca ao combinar os pontos fortes da busca semântica e da busca tradicional. Ao equilibrar a compreensão semântica e respeitar os termos exatos da consulta, a busca híbrida fornece resultados que melhoram a experiência de busca do usuário.

Como funciona a busca híbrida

A busca híbrida combina a busca por palavra-chave e vetor para fornecer resultados de busca abrangentes. As incorporações vetoriais convertem dados, como frases ou fotos, em números que capturam seu significado e suas relações. Os dados são tokenizados, indexados e representados por incorporações numéricas. A busca vetorial pode capturar o significado em dados não estruturados. A busca vetorial supera as limitações da busca por palavra-chave, permitindo que os usuários busquem pelo que querem dizer, mesmo que não se lembrem de uma descrição precisa ou de uma palavra-chave exata. A busca híbrida pode analisar vetores densos e esparsos para obter os resultados mais relevantes.

Vetores densos

Vetores densos lidam com a compreensão semântica e consultas contextuais. Eles são comumente usados no machine learning moderno, especialmente para tarefas como gerar incorporações.

Vetores esparsos

Vetores esparsos lidam com a indexação tradicional baseada em palavras-chave e são escassamente preenchidos com informações. Esses vetores são frequentemente utilizados para grandes conjuntos de dados.

Processamento de consultas

O processamento de consultas na busca híbrida utiliza vetores esparsos para correspondência e priorização de palavras-chave exatas e vetores densos para compreensão semântica, capturando o significado e a intenção contextuais. Ao combinar esses dois tipos de vetores, a busca híbrida oferece resultados de busca abrangentes que equilibram especificidade e relevância. Para obter resultados, a busca híbrida usa a fusão de classificação recíproca (RRF) para combinar vários conjuntos de resultados (cada um com diferentes indicadores de relevância) em um único conjunto de resultados.

Busca híbrida com RAG

A geração aumentada de recuperação (RAG) é uma técnica de busca que utiliza dados privados ou proprietários para fornecer contexto que complementa a base de conhecimento original do seu LLM. A RAG é valiosa para consultas, pois permite que os sistemas de IA generativa usem fontes de informações externas para produzir respostas mais relevantes.

Usar a busca híbrida com RAG — e trazer fontes adicionais de dados — pode melhorar a relevância de uma experiência de busca adicionando contexto. Fontes de informações adicionais podem ser qualquer coisa que organizações ou clientes precisem para responder a uma consulta, desde novas informações na internet até documentos empresariais proprietários ou confidenciais.

O RAG oferece várias vantagens em relação aos modelos de linguagem que funcionam isoladamente. É uma opção econômica, requer menos computação e armazenamento, e garante que seu modelo possa acessar as informações mais atualizadas.

RAG em ação

Busca híbrida com a Elastic

A Elastic facilita a implementação da busca híbrida oferecendo busca semântica pronta para uso. Com Elastic, a busca híbrida pode ser realizada em uma plataforma, uma API, com velocidade e redimensionamento, proporcionando melhor relevância desde o início.

Usando o playground da Elastic, os desenvolvedores podem explorar o grounding de LLMs de sua escolha com seus próprios dados privados em uma interface de baixo código.

A Elastic ajuda desenvolvedores a simplificarem a construção de consultas com os recém-introduzidos recuperadores de consultas — padrão, kNN e RRF. Usando essas consultas, o Elastic compreende os dados selecionados e gerará automaticamente uma consulta unificada.