Blog

Quais são as plataformas temáticas do centro do Google?

A relevância dos algoritmos de classificação em mecanismos de busca se tornou um tópico de interesse para profissionais de SEO após uma menção feita no recente podcast do Google Search Off The Record sobre a presença de Sistemas de Topicalidade Principal como parte dos algoritmos de classificação. Portanto, é importante considerar o potencial desses sistemas e seu impacto no SEO.

Não se tem muita informação sobre o que pode constituir parte desses sistemas principais de tópicos, porém é possível deduzir sua natureza. A documentação da pesquisa em nuvem comercial do Google apresenta uma definição de tópico que, embora não se aplique especificamente ao seu mecanismo de busca, oferece uma perspectiva útil do que o Google pode estar se referindo ao mencionar Sistemas Principais de Tópicos.

Assim é descrito o conceito de tópico na documentação em nuvem.

Atualidade se relaciona com a importância de um achado de estudo em relação às palavras-chave iniciais utilizadas.

Essa explicação clara aborda como as páginas web estão relacionadas à pesquisa de consultas nos resultados da pesquisa, sem necessidade de complicação adicional.

Como atingir a importância?

Uma maneira de começar a compreender um elemento dos Sistemas de Topicalidade do Google é analisar a maneira como os mecanismos de busca interpretam buscas e abordam tópicos em páginas da web.

  • Entendendo as pesquisas realizadas
  • Entender assuntos.

Entender pesquisas de busca.

Entender o que os usuários querem dizer pode ser definido como compreender o assunto que interessa a eles. Existe uma natureza classificatória na forma como as pessoas pesquisam, em que um usuário de mecanismo de busca pode utilizar uma consulta ambígua quando, na realidade, estão se referindo a algo mais específico.

O Google implementou o RankBrain como seu primeiro sistema de inteligência artificial, com o objetivo de aprimorar a compreensão dos conceitos subjacentes às pesquisas feitas pelos usuários. Em vez de se limitar apenas às palavras-chave, o RankBrain considera conceitos mais abstratos, o que permite ao mecanismo de busca fornecer resultados mais relevantes sobre o tema pesquisado.

O funcionamento do RankBrain foi explicado pelo Google da seguinte forma:

RankBrain ajuda a encontrar informações que anteriormente não podíamos acessar, pois compreende de forma mais abrangente a relação entre as palavras em uma pesquisa e os conceitos do mundo real. Por exemplo, ao pesquisar sobre o “título do consumidor no topo de uma cadeia alimentar”, nossos sistemas aprendem, ao ver essas palavras em várias páginas, que o conceito de cadeia alimentar está relacionado a animais e não a consumidores humanos. Ao analisar e associar essas palavras com conceitos semelhantes, o RankBrain deduz que a busca se refere ao que é conhecido como um “predador de topo”.

BERT é um modelo de deep learning desenvolvido pelo Google para auxiliar na compreensão do contexto das palavras em pesquisas, a fim de aprimorar a compreensão do tema geral do texto.

Entender assuntos.

Atualmente, os motores de busca modernos não parecem utilizar a Modelagem Tópica tanto devido ao uso da aprendizagem profunda e da inteligência artificial. No entanto, no passado, uma técnica estatística conhecida como Topic Modeling era empregada pelos mecanismos de busca para compreender o conteúdo das páginas web e relacioná-lo às consultas de pesquisa. Por volta dos anos 2000, o Latent Dirichlet Allocation (LDA) foi uma tecnologia inovadora que auxiliou os motores de busca a compreender os diversos tópicos.

Cerca de 2015, especialistas divulgaram estudos sobre o Modelo Variacional Neural de Documento (NVDM), que se mostrou uma forma ainda mais eficaz de retratar os temas fundamentais dos documentos.

Um dos mais recentes estudos de investigação é intitulado “Além de Sim e Não: Melhorando os Classificadores Zero-Shot LLM através de Rótulos de Relevância Detalhados”. Este artigo aborda o aprimoramento da utilização de Modelos de Linguagem de Grande Escala para a classificação de páginas da web, através de um processo de pontuação mais refinado. Propõe-se uma abordagem mais precisa que vai além de uma classificação binária de sim ou não, utilizando rótulos como “altamente relevante”, “Moderadamente Relevante” e “Não Relevante”.

Este estudo de pesquisa sustenta que…

Sugerimos adicionar etiquetas claras de importância nos comandos para os classificadores LLM, para que possam distinguir melhor entre os documentos com distintos graus de relevância para a pesquisa, resultando em um ranking mais exato.

Evitar a diminuição através da reflexão.

Os mecanismos de busca estão evoluindo além de simplesmente encontrar informações e têm avançado para responder a perguntas, um processo que tem se acelerado recentemente. Isso foi antecipado em um artigo de 2001 intitulado “Repensando a Busca: Transformando Amadores em Especialistas de Domínio”, que defendeu a importância de fornecer respostas mais humanas.

O artigo se inicia:

Paráfrase do texto: “Quando precisam de informação, os usuários geralmente procuram por especialistas no assunto, mas muitas vezes acabam recorrendo a sistemas de busca de informações. Os sistemas tradicionais de busca de informações não atendem diretamente às necessidades dos usuários, apenas oferecem referências para possíveis respostas confiáveis. Enquanto os sistemas de resposta a perguntas fornecem informações limitadas criadas por especialistas humanos sob demanda, mas não são ágeis nem escaláveis. Por outro lado, os modelos de linguagem pré-treinados têm a capacidade de gerar textos que respondam às necessidades de informação, porém atualmente têm limitações em relação ao conhecimento especializado – não possuem uma compreensão aprofundada do assunto.”

Resumo: O texto destaca que é prejudicial adotar uma abordagem simplista ao tentar entender como o Google classifica páginas da web, como por exemplo, focar demais em palavras-chave, elementos de título e títulos. As tecnologias atuais estão evoluindo rapidamente para compreender o mundo de forma mais ampla, sugerindo a importância de considerar os Sistemas de Topicalidade Core em um contexto que vai além dos métodos tradicionais de recuperação de informações.

Os mecanismos utilizados pelo Google para compreender os assuntos em páginas da web, que se alinham com as buscas realizadas, estão se tornando mais avançados. É interessante entender como o Google abordou essa questão no passado e como está lidando com isso atualmente.

Imagem principal fornecida por Shutterstock/Cookie Studio.

Artigos relacionados

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button