Pular para o playerIr para o conteúdo principalPular para o rodapé
  • anteontem
Transcrição
00:00E usar um chatbot para ajudar em estudos é tentador.
00:05Você tem uma dúvida, pergunta para a tecnologia e rapidamente tem uma resposta.
00:12Mas um novo trabalho traz uma dica.
00:15Se você é professor, aluno ou pesquisador acadêmico, as IAs não são muito eficientes.
00:24Vamos ver.
00:24Obrigado.
00:54Jonas Gaur, professor assistente de ciência da computação e engenharia elétrica da Universidade de Maryland, explicou o método usado para fazer essa comparação.
01:03O teste, batizado de Reason's Benchmark, colocou os modelos para gerar citações e explicar raciocínios a partir de frases isoladas.
01:10O Omni-One acertou cerca de 65% das vezes e manteve um raciocínio mais claro, embora ainda cometesse erros em 35% dos casos.
01:19O DeepSeek R1, por outro lado, acertou apenas 35% e apresentou uma taxa de alucinação próxima de 85%.
01:27A diferença ficou ainda mais clara quando os pesquisadores pediram para os modelos conectar ideias complexas, como inteligência artificial, bancos de dados e cognição humana.
01:36O Omni-One não só entendeu as relações, como também explicou bem cada conexão.
01:40Já o R1, embora eficiente e acessível, demonstrou que enfrenta desafios para aprimorar esse tipo de raciocínio.
01:47A precisão das citações depende muito de como a inteligência artificial processa a informação.
01:52Quando tenta entender um parágrafo inteiro ou um texto completo de uma vez, a IA acaba generalizando demais e perde os detalhes importantes.
01:59Em vez de explicar certinho uma ideia específica, ela faz um resumo genérico, que nem sempre ajuda quem precisa da informação correta.
02:06O foco em frases isoladas mostrou como esse tipo de análise é essencial para entender a capacidade real de raciocínio dos modelos, segundo o professor.
02:13A OpenAI, lembrando, anunciou recentemente uma nova ferramenta de pesquisa profunda, capaz de gerar relatórios com citações e explicar o raciocínio por trás de cada resposta.
02:23Ainda é cedo para saber o impacto dessa novidade entre os pesquisadores, mas uma lição fica clara.
02:27Sempre vale a pena conferir duas vezes as fontes sugeridas por qualquer inteligência artificial.

Recomendado