O Google recentemente fez uma atualização discreta em sua documentação do Google Search Central, informando que agora estão incluindo arquivos .csv em seu índice.
Isso oferece uma nova possibilidade de ser monitorado, ou seja, se um editor não deseja que seus arquivos .csv sejam rastreados, ele pode atualizar o arquivo robots.txt para remover esses arquivos.
Información en formato de valores separados por comas (CSV).
Os arquivos CSV são arquivos de texto utilizados para armazenar dados em um formato tabular que pode ser visualizado como uma planilha.
Os documentos em formato CSV armazenam informações em formato de texto simples, sem incluir formatação, imagens ou links interativos.
Eles são práticos para realizar tarefas como inserir uma série de endereços de sites a serem rastreados em programas como o Screaming Frog.
No entanto, eles também têm aplicação na organização de informações em uma planilha.
Novo é o índice do arquivo CSV.
A nova funcionalidade do Google de indexar arquivos CSV é inovadora, já que atualmente uma pesquisa por arquivos CSV usando o comando “filetype” no Google não retorna resultados.
Pesquisas semelhantes às indicadas atualmente não produzem resultados em formato CSV.
- Formato do documento:
- Formato de arquivo CSV em sites educacionais.
- Formato de arquivo CSV em sites com extensão “.com”.
O Google já utilizou arquivos CSV de forma não direta.
Uma observação interessante sobre a indexação de arquivos CSV feita pelo Google é que, ao que parece, o Dataset do Google já utilizou arquivos CSV em suas buscas, mas somente quando estão descritos com dados estruturados.
A documentação estruturada de dados do Dataset no antigo site do Google, acessível através do Archive.org, indica que os arquivos CSV são considerados um formato adequado para ser utilizado em ferramentas de busca de conjuntos de dados.
O emprego de informações dispostas em tabelas como resultado de pesquisa teve início em 2018, quando o Google informou que passaria a exibir esse tipo de informação nas buscas, desde que estivessem acompanhadas de dados estruturados.
Seguindo as informações fornecidas no documento original:
Os conjuntos de dados se tornam mais acessíveis quando são acompanhados por informações adicionais, como nome, descrição, criador e formatos de distribuição, apresentados de forma estruturada…
Aqui estão alguns exemplos do que pode ser considerado um conjunto de informações:
- Uma planilha ou um documento CSV contendo informações.
- Um conjunto estruturado de tabelas.
- Um documento em um formato exclusivo que armazena informações.
- Um conjunto de documentos que, quando reunidos, formam um conjunto de informações importantes.
- Um item organizado com informações em um formato diferente que precisa ser carregado em uma ferramenta específica para ser processado.
- Capturando informações por meio de imagens.
- Documentos ligados ao processo de aprendizado de máquina, como configurações de treinamento ou especificações de arquitetura de rede neural.
- “Qualquer informação que se assemelhe a um grupo de elementos para você.”
O Google fez uma atualização na documentação mencionada em 2022 e a direcionou para a nova Documentação Central de Busca.
A atualização da documentação enfatiza que o Google valoriza os dados estruturados ao incorporar arquivos CSV em sua interface de pesquisa de conjuntos de dados.
Essa alteração implica que o Google passará a indexar arquivos CSV e utilizá-los para resultados de pesquisa (além de dados tabulares encontrados em dados estruturados)?
Atualmente, a documentação explica o seguinte:
Encontrar conjuntos de dados é mais simples quando se incluem informações adicionais, como o nome, a descrição, o criador e os formatos de distribuição, como os dados estruturados.
O método do Google para encontrar conjuntos de dados utiliza schema.org e outros formatos de metadados que podem ser incluídos em páginas que descrevem conjuntos de dados…
Aqui estão alguns casos que podem ser considerados como um conjunto de informações:
Uma planilha ou um documento de formato CSV contendo informações…
Está se referindo ao CSV do Índice do Google em relação à última atualização?
Uma atualização do algoritmo principal ocorre quando o Google implementa mudanças significativas e comuns em seu algoritmo central.
Pode ser uma coincidência que a indexação de arquivos CSV e a atualização do algoritmo principal tenham ocorrido quase simultaneamente.
Mas é importante considerar se o Google aprimorou seu mecanismo de busca para indexar arquivos CSV ou se essa funcionalidade já estava disponível anteriormente.
Confira a lista atualizada de um tipo de arquivo que pode ser indexado.
Diferentes formatos de arquivo que podem ser encontrados pelo Google.
Consulte o documento principal que contém informações sobre o conjunto de dados da pesquisa do Google.
Coleção de dados estruturados (conjunto de dados, catálogo de dados, download de dados).
A imagem principal é fornecida pela Shutterstock e foi criada por Jane Kelly.