ChatGPT vs DeepSeek: teste revela qual IA raciocina melhor para o mundo acadêmico

Olhar Digital

anteontem

Categoria

🤖

Tecnologia

Transcrição

Exibir transcrição completa do vídeo

00:00E usar um chatbot para ajudar em estudos é tentador.

00:05Você tem uma dúvida, pergunta para a tecnologia e rapidamente tem uma resposta.

00:12Mas um novo trabalho traz uma dica.

00:15Se você é professor, aluno ou pesquisador acadêmico, as IAs não são muito eficientes.

00:24Vamos ver.

00:24Obrigado.

00:54Jonas Gaur, professor assistente de ciência da computação e engenharia elétrica da Universidade de Maryland, explicou o método usado para fazer essa comparação.

01:03O teste, batizado de Reason's Benchmark, colocou os modelos para gerar citações e explicar raciocínios a partir de frases isoladas.

01:10O Omni-One acertou cerca de 65% das vezes e manteve um raciocínio mais claro, embora ainda cometesse erros em 35% dos casos.

01:19O DeepSeek R1, por outro lado, acertou apenas 35% e apresentou uma taxa de alucinação próxima de 85%.

01:27A diferença ficou ainda mais clara quando os pesquisadores pediram para os modelos conectar ideias complexas, como inteligência artificial, bancos de dados e cognição humana.

01:36O Omni-One não só entendeu as relações, como também explicou bem cada conexão.

01:40Já o R1, embora eficiente e acessível, demonstrou que enfrenta desafios para aprimorar esse tipo de raciocínio.

01:47A precisão das citações depende muito de como a inteligência artificial processa a informação.

01:52Quando tenta entender um parágrafo inteiro ou um texto completo de uma vez, a IA acaba generalizando demais e perde os detalhes importantes.

01:59Em vez de explicar certinho uma ideia específica, ela faz um resumo genérico, que nem sempre ajuda quem precisa da informação correta.

02:06O foco em frases isoladas mostrou como esse tipo de análise é essencial para entender a capacidade real de raciocínio dos modelos, segundo o professor.

02:13A OpenAI, lembrando, anunciou recentemente uma nova ferramenta de pesquisa profunda, capaz de gerar relatórios com citações e explicar o raciocínio por trás de cada resposta.

02:23Ainda é cedo para saber o impacto dessa novidade entre os pesquisadores, mas uma lição fica clara.

02:27Sempre vale a pena conferir duas vezes as fontes sugeridas por qualquer inteligência artificial.