Desenvolvimentos na tecnologia de pesquisa de imagens ao longo dos anos

Criar uma tecnologia de pesquisa de imagens que atendesse ao modelo de comportamento humano foi uma longa jornada concentrada em um objetivo: permitir que as pessoas pesquisar por imagem sem usar palavras. Agora temos versões funcionais para este conceito. Agora você pode pesquisar fotos usando uma imagem, e os computadores estão melhores do que nunca para reconhecer e categorizar fotos.

No entanto, tem sido um longo caminho desde as pesquisas de texto até o reconhecimento avançado de imagens, e a tecnologia está em constante evolução. Aguarde se quiser saber mais sobre como um de nossos recursos mais usados, a pesquisa, evoluiu para atender às nossas necessidades individuais.

O início da descrição text-to-image

Para selecionar uma imagem, primeiro você precisava encontrar algumas palavras para descrever o que queria ver – por exemplo, “montanha mais alta”. Depois disso, você digitaria essas palavras em um mecanismo de busca. O mecanismo de busca procuraria uma imagem correspondente examinando o idioma das páginas que continham imagens – nomes de imagens, descrições e qualquer conteúdo textual que retornasse algo que parecesse replicar sua pesquisa com base em suas pistas de contexto.

No final da década de 1990, tudo começou quando o AltaVista introduziu uma opção de imagem em seu mecanismo de busca que permitia aos usuários digitar uma palavra de texto e receber fotos em troca. Foi uma abordagem rápida e fácil para trazer os visitantes às fotos que eles queriam. No início (pesquisa de imagens), como AltaVista, dependia de descrições de imagens ou texto comparável em páginas da web, em vez da capacidade de analisar a imagem por conta própria e conectá-la ao texto.

Reconhecendo a imagem digital: Avanços no reconhecimento

CBIR, ou recuperação de imagem baseada em conteúdo, foi o próximo passo para criar uma (melhor e mais intuitivabusca de fotos). Em vez de procurar palavras-chave ao redor da imagem, o CBIR analisa o conteúdo da imagem. A cor e a forma podem ser facilmente vinculadas a uma imagem sem explicação de texto adicional.

Os pesquisadores perceberam que obter qualidades de uma imagem, em vez de procurá-la por meio do descritor de texto, seria uma abordagem superior para pesquisar enquanto a descrição de texto para imagem era estabelecida. Essa pesquisa de atributos de texto para imagem não decolou imediatamente, embora tenha sido estabelecida e investigada cedo para superar algumas das limitações da conversão de texto em imagem digital.

Começou ajudando pequenas coleções de fotografias. Ainda assim, ele não foi capaz de escalar para as enormes quantidades de imagens que chegavam on-line na época, como o 1 bilhão de imagens indexadas pelo Google e Yahoo! em 2005. Em uma escala ampla, os atributos de texto de uma imagem (nome do arquivo, descrições da imagem, etc.) continuaram mais fáceis de trabalhar.

Além disso, faltava tecnologia para “descrever” as fotografias. Os computadores eram muito bons em classificar coisas como dimensões, mas zonas cinzentas começaram a se formar quando se tratava de reconhecer uma imagem. Imagens com alto contraste nos locais exatos podem ser colocadas juntas, mesmo que sejam de coisas diferentes. Essas questões limitaram o uso do CBIR na década de 2000, com a coleção mais extensa utilizando a tecnologia tendo apenas 3 milhões de fotos.

Um passo à frente na busca reversa e semelhante de imagens

Então veio uma das abordagens mais eficientes do CBIR até o momento: a pesquisa por imagem, na qual a entrada do usuário era uma imagem em vez de palavras. Como não dependia de um usuário para explicar a imagem que procurava com linguagem, isso removeu uma camada de suposição dos termos de pesquisa. Em vez disso, eles estavam contando com a própria imagem.

Existem motores de pesquisa por imagem para usar pesquisar por imagem. Reverse pesquisa por foto tem um caso de uso limitado; o serviço deve combinar uma imagem com outra imagem para encontrar imagens semelhantes. É uma técnica valiosa que ainda usamos hoje.

A fronteira final da pesquisa imagem a imagem

Cada versão de pesquisa por foto até agora teve uma coisa em comum: contamos com pessoas para escrever descrições de fotos em uma ou ambas as extremidades da pesquisa. Mesmo quando a busca por fotos semelhantes começou, ela se limitou a localizar a fonte de uma imagem ou a encontrar imagens semelhantes a uma encontrada usando uma sequência de palavras.

E era evidente que aqueles que trabalhavam com tecnologias de busca e reconhecimento de imagens sabiam disso e pretendiam lidar com isso com tecnologia melhor. É o que eles fizeram. Algoritmos de reconhecimento facial e busca imagem a imagem são dois desenvolvimentos significativos nesta área.

Conclusão 

A tecnologia pesquisa por foto é inegável. O foco está mudando das palavras para o visual. Os clientes querem – ninguém quer estimativas de suas pesquisas com base no contexto citado. Quando temos de lidar com imagens, não faz sentido convertê-las em palavras e depois devolvê-las.

O reconhecimento avançado de imagens substitui as palavras sempre que pode, desde o comércio até a pesquisa e o uso pessoal.

Comentários estão fechados.

Esse site usa cookie para melhor sua experiência AceitarLeia mais

Nossa Política de Privacidade.