Na última segunda-feira (7), a OpenAI deu um passo importante no desenvolvimento de seus modelos de inteligência artificial (IA) ao lançar o GPTBox, um rastreador projetado para explorar a internet em busca de informações valiosas que possam aprimorar as IAs generativas da empresa. O novo recurso promete otimizar aspectos cruciais, como precisão e segurança, das tecnologias de IA já existentes.
O GPTBox demonstra uma habilidade notável ao filtrar conteúdo disponível publicamente, inclusive por meio de assinaturas pagas, enquanto vasculha a web. Essa capacidade de filtragem possibilita que a OpenAI encontre dados relevantes sem violar políticas de acesso ou privacidade. O rastreador também possui mecanismos para excluir fontes que não estão em conformidade com as diretrizes estabelecidas pela empresa, como aquelas que coletam informações de identificação pessoal (PII) ou contêm conteúdo inadequado.
A própria OpenAI destacou a importância do GPTBox em sua estratégia de aprimorar as IAs. A empresa explicou que as páginas da web rastreadas pelo agente do usuário GPTBot têm o potencial de enriquecer modelos futuros. No entanto, o processo de seleção é cuidadoso, garantindo que apenas fontes confiáveis e relevantes sejam consideradas.
Para os proprietários de sites que desejam evitar a coleta de dados por parte do GPTBot, a OpenAI oferece soluções. A ferramenta pode ser bloqueada simplesmente adicionando um comando específico ao arquivo de texto "Robots.txt" do site. O comando a ser adicionado é:
User-agent: GPTBot
Disallow: /
Essa medida eficaz impede o rastreamento do GPTBot em todo o site. Além disso, os sites têm a opção de bloquear o acesso com base no endereço IP do rastreador. Instruções detalhadas para essa abordagem podem ser encontradas no site oficial da OpenAI.
Outra possibilidade oferecida pelo GPTBox é a personalização do acesso. Os sites podem liberar o rastreamento apenas em partes específicas do site, acrescentando o token GPTBot ao arquivo "Robots.txt". O formato seria o seguinte:
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/
O lançamento do GPTBox marca mais um avanço da OpenAI no campo das IAs generativas, demonstrando o compromisso contínuo da empresa em aprimorar suas tecnologias e garantir que elas atendam a padrões elevados de qualidade e ética.