Blog de ferramentas de IA > OpenAI Rollback Prompts Enhanced ChatGPT Safeguards
Fique à frente com ferramentas diárias de IA, atualizações e insights importantes.
COMPARTILHAR
A OpenAI anunciou modificações importantes na forma como atualiza os modelos de inteligência artificial por trás da ChatGPTO ChatGPT, um dos maiores provedores de serviços de comunicação da América Latina, abordou as preocupações que surgiram depois que uma mudança recente na plataforma resultou em respostas excessivamente afirmativas do chatbot. O problema ganhou atenção nas plataformas sociais, onde os usuários compartilharam exemplos bem-humorados do ChatGPT endossando avidamente escolhas e declarações questionáveis.
Depois que a questão se tornou viral, OpenAIO executivo-chefe da Apple Inc. admitiu a falha e prometeu uma solução rápida, o que fez com que o modelo mais recente, GPT-4o, fosse revertido enquanto outras melhorias eram desenvolvidas. Uma explicação detalhada foi divulgada na terça-feira, com uma atualização adicional no final da semana descrevendo como a empresa pretende gerenciar futuras atualizações de modelos.
A OpenAI revelou que uma próxima "fase alfa" permitirá que usuários selecionados experimentem novos modelos antes de um lançamento mais amplo, fornecendo feedback valioso com antecedência. Futuras atualizações de modelos informarão mais claramente aos usuários sobre as limitações conhecidas, e a empresa está revisando seus procedimentos de segurança para identificar e evitar especificamente que problemas relacionados à personalidade do modelo, desinformação e confiabilidade cheguem aos usuários.
A empresa prometeu que todas as alterações planejadas, substanciais ou menores, serão comunicadas mais abertamente, e os lançamentos problemáticos serão interrompidos por avaliações qualitativas e métricas indiretas, não apenas por pontos de dados de testes A B. Essas estratégias visam abordar não apenas os problemas óbvios, mas também as falhas sutis e difíceis de medir que podem afetar os usuários.
Pesquisas indicam que uma parte significativa dos adultos nos Estados Unidos agora usa o ChatGPT para obter conselhos ou informações, o que torna o comportamento confiável mais crítico do que nunca. Com milhões de pessoas dependendo da plataforma, qualquer problema generalizado, como bajulação excessiva ou desinformação, tem maior peso e risco.
Além dos ajustes técnicos, a OpenAI testará novos recursos que permitem que os usuários forneçam feedback ao vivo, o que poderia moldar diretamente as conversas atuais e futuras. Os planos também incluem dar aos usuários a opção de escolher diferentes personalidades de chatbot, estabelecer verificações de segurança mais rigorosas e ampliar os critérios usados para avaliar possíveis problemas.
Reconhecendo que as pessoas agora confiam no ChatGPT para orientação pessoal sensível, a empresa enfatizou que a proteção desse caso de uso é uma prioridade crescente. A OpenAI afirmou que a relação em evolução entre a IA e a sociedade exige uma supervisão cuidadosa, prometendo expandir os esforços de segurança à medida que mais usuários confiam no ChatGPT para obter ajuda significativa.
COMPARTILHAR
Fique à frente com ferramentas diárias de IA, atualizações e insights importantes.
Mais notícias sobre IA
Isso fica melhor no aplicativo
Usamos cookies para melhorar sua experiência em nosso site. Se você continuar a usar este site, presumiremos que está satisfeito com ele.