GPT-4 Com Visão: Exemplos, Restrições e Possíveis Perigos
OpenAI surpreendeu o mundo da tecnologia mais uma vez com seu mais recente avanço: o GPT-4 com Visão, também conhecido como GPT-4V.
GPT-4 tem a capacidade de escrever código com base em um design fornecido.
Greg Brockman, em 27 de setembro de 2023.
O GPT-4V é uma evolução do GPT-4 que inclui capacidades visuais, possibilitando a análise de imagens enviadas pelos usuários do ChatGPT Plus e Enterprise.
Contatando os clientes pagantes nas próximas quinze dias!
O tweet foi publicado por Greg Brockman em 27 de setembro de 2023.
A nova funcionalidade apresenta oportunidades significativas, porém também traz desafios para as organizações.
GPT-4 Com Ilustrações de Perspectiva
Conforme mais usuários conseguem utilizar o novo recurso, eles estão compartilhando exemplos do funcionamento do GPT-4 com o Vision.
O GPT-4 com Vision tem a capacidade de examinar a escrita à mão.
Muito legal. A inteligência artificial é mais eficiente em interpretar a caligrafia do que eu.
O Professor Breen questionou se o GPT-4 com capacidade de visão seria capaz de ler o manuscrito manuscrito à mão de Robert Boyle. É uma ótima pergunta!
É provável que seja altamente benéfico para diversas áreas acadêmicas, principalmente no que diz respeito à capacidade da inteligência artificial de interpretar e analisar textos.
— A postagem foi feita por Ethan Mollick no dia 27 de setembro de 2023.
Ele é capaz de desenvolver o código de um site a partir de um esboço feito em um guardanapo.
É impressionante a maneira como as pessoas utilizam o GPT-4 em conjunto com a Vision.
— Um tweet foi publicado por Hushen Savani em 27 de setembro de 2023.
Pode-se realizar a análise de memes.
Este é totalmente incontrolável. Estou totalmente sem capacidade de expressão.
Pietro Schirano publicou um tweet em 27 de setembro de 2023.
Adicionalmente a esses exemplos, realizei algumas avaliações básicas.
O GPT-4 com Vision tem a capacidade de redigir informações sobre produtos para serem utilizadas em páginas de vendas e listagens na Amazon.
Ele está disponível para auxiliá-lo na iniciação da programação elementar para um projeto específico do site, a partir de uma imagem da tela.
Ele é capaz de criar legendas inovadoras para o Instagram, incluindo sugestões de hashtags.
Ele tem a capacidade de redigir um artigo utilizando informações provenientes de um site ou livro digital, como por exemplo o Estado do SEO em 2024.
Assim como ocorre com todo o material produzido pela inteligência artificial, é fundamental revisar a saída do GPT-4 com atenção para garantir precisão, já que ainda pode gerar ilusões e trazer consigo outros potenciais riscos.
OpenAI expõe possíveis perigos associados ao GPT-4V.
A OpenAI divulgou um documento que descreve os possíveis perigos relacionados ao uso do GPT-4V, que englobam:
- A privacidade pode ser comprometida ao identificar indivíduos em imagens ou descobrir onde estão, o que pode afetar as práticas e conformidade com relação aos dados das empresas. O documento destaca que o GPT-4V tem a habilidade de reconhecer personalidades conhecidas e localizar imagens.
- Possíveis preconceitos durante a avaliação e entendimento da imagem podem ter impactos adversos em diversos grupos populacionais.
- Perigos de segurança ao fornecer orientações médicas imprecisas ou não confiáveis, instruções detalhadas para atividades perigosas, ou conteúdo que promova ódio ou violência.
- Pontos fracos em termos de segurança digital, como lidar com desafios CAPTCHA ou métodos de desbloqueio multimodais.
As limitações do modelo incluíram riscos, como a sua decisão de não realizar análise de imagens de pessoas.
Em linhas gerais, as empresas que desejam utilizar o GPT-4V para fins de marketing devem analisar e reduzir os possíveis riscos associados ao uso da inteligência artificial generativa, a fim de empregar a tecnologia de maneira ética e evitar consequências adversas para os consumidores e a imagem da marca.
A primeira colaboração da OpenAI para otimizar a preparação de imagens para a “agilidade de borda”.
A OpenAI informou que o GPT-4 com o modelo Vision será usado no Be My Eyes Virtual Voluntário, um assistente visual digital destinado a pessoas com deficiência visual.
Apesar de ainda estar em fase de testes, a tecnologia apresenta oportunidades promissoras. Por exemplo, ela poderia contribuir para melhorar a acessibilidade no serviço de atendimento ao cliente nas empresas.
Be My Eyes planeja experimentar a funcionalidade com clientes empresariais, destacando suas possíveis aplicações comerciais além de seu público-alvo principal.
O que está reservado para o GPT-4 na área de visão.
As possíveis utilidades inovadoras do GPT-4 With Vision para empresas, profissionais de marketing e especialistas em SEO são promissoras.
Entretanto, é importante que todos os usuários permaneçam atentos às possíveis preocupações relacionadas à privacidade, equidade e segurança cibernética apresentadas pelo GPT-4 com Vision e outros modelos de inteligência artificial.
Além da habilidade de inserir imagens, o OpenAI reativou a funcionalidade de navegar na web com o Bing através do ChatGPT.
Foto principal: Crédito da imagem para Tada Imagens/Shutterstock