A OpenAI desenvolveu um novo chatbot chamado o3 para resolver questões de raciocínio lógico, envolvendo matemática e programação.
A empresa afirma que a nova tecnologia apresenta um avanço impressionante em comparação ao antecessor OpenAI o1.
No entanto, até o momento, a nova versão ainda não foi disponibilizada para o público e estaria restrita a testes, realizados por especialistas e pesquisadores de segurança digital e cibernética.
É possível se candidatar para participar da fase de testes através de um site disponibilizado pela OpenAI.
Mesmo que a IA ainda não tenha a mesma capacidade cognitiva dos seres humanos, ela já se assemelha quando cumpre com algumas tarefas.
A companhia ressaltou que o aumento nas capacidades da IA podem trazer riscos, tanto de desobediência quanto de mau uso da ferramenta:
“Os modelos ganham mais inteligência e autonomia, a escala de possíveis danos que podem ser causados pelas IAs por desalinhamento ou uso indevido aumenta drasticamente”.
Os desenvolvedores também anunciaram que estão tentando fazer um “alinhamento de valores” para que o próprio sistema reconheça perguntas maliciosas.
Diferentemente do processo das Inteligências Artificiais mais populares, como o Chat GPT, esse modelo não tenta responder às perguntas dos usuários de forma imediata.
Tanto a o1 como a o3 abordam os problemas de forma parecida com o que é feito pelo ser humano, dividindo a resposta em etapas, analisando seus erros e corrigindo.
É possível dizer que essas IAs estariam raciocinando e aprendendo, esse processo é conhecido como cadeia de pensamentos (chain of thought).
O tempo de resposta deverá aumentar, à medida que a o3 calcula diversos cenários possíveis dentro do processo de chain of thought antes de entregar a solução para o problema.
De acordo com os funcionários da Open IA que participaram do anúncio, o novo modelo consegue responder questões complexas de forma muito mais assertiva do que seu antecessor.
Durante o período de testes, a o3 foi utilizada para responder às perguntas da Olimpíada de Matemática dos EUA, conseguindo acertar 96,7% das questões.
A taxa de assertividade do modelo anterior para responder às questões da mesma competição foi de 83%.
O novo sistema apresentou um resultado melhor no GPQA Diamond, um teste para PhDs, saltando de 78% das qestões acertadas para 87,7%.
O o3 também pode ser considerado um dos melhores programadotes do mundo, já que conseguiu uma nota 2727 no SWE-Bench Verified.
Mesmo que o resultado tivesse 327 pontos a menos, o chatbot já apresentaria performance semelhante a 1% dos melhores programadores do mundo.
A o3 foi apresentada durante a 12ª edição do evento Shipmas, da OpenAI. A apresentação não mencionou uma possível data para a nova tecnologia chegar ao mercado.
Como um veículo independente, não aceitamos dinheiro público. O que financia nossa estrutura são as assinaturas de cada pessoa que acredita em nossa causa.
Quanto mais gente tivermos conosco nesta missão, mais longe iremos. Por isso, agradecemos o apoio de todos vocês.
Seja também um membro da Brasil Paralelo e nos ajude a expandir nosso jornalismo. Clique aqui.
Cupom aplicado 37% OFF
Cupom aplicado 62% OFF
MAIOR DESCONTO
Cupom aplicado 54% OFF
Assine e tenha 12 meses de acesso a todo o catálogo e aos próximos lançamentos da BP