DeepSeek R1: This Free AI Model is Mind-Blowing

Name: DeepSeek R1: This Free AI Model is Mind-Blowing
Uploaded: 2025-01-28T19:51:27+00:00
Duration: 7 min 37 s
Channel: Metatube
Description: What is DeepSeek R1? It's a new AI chatbot that's free, open-source, and is as powerful if not better than ChatGPT 4o. I've used it for a few days and here's my thoughts, opinions, and a setup guide to DeepSeek R1 AI.

Metatube

anteayer

What is DeepSeek R1? It's a new AI chatbot that's free, open-source, and is as powerful if not better than ChatGPT 4o. I've used it for a few days and here's my thoughts, opinions, and a setup guide to DeepSeek R1 AI.

Categoría

🤖

Tecnología

Transcripción

Mostrar la transcripción completa del vídeo

00:00Hola amigos, espero que estéis bien. En caso de que os haya olvidado, DeepSeek R1 ha estado haciendo ondas en la escena de la AI y la tecnología.

00:06Es un modelo de AI abierta que aparentemente fue desarrollado por menos de 6 millones de dólares,

00:11una fracción de los billones de dólares gastados por OpenAI y Google, por ejemplo, para crear sus modelos de AI.

00:17La buena noticia para todos nosotros es que DeepSeek es gratis de uso y se ha abierto a la aplicación más descargada

00:23en las tiendas de aplicaciones superando el chat GPT en días.

00:26Ahora es uno de los modelos de AI más avanzados, gratis y abiertos que podemos usar.

00:31He estado jugando con DeepSeek R1 durante un par de días y tengo que decir que es un juego cambiante,

00:37pero no sin sus fracases. Así que vamos a pasar por lo que DeepSeek R1 es capaz de y veamos qué es lo que se trata.

00:45Así que vamos a acelerar. Una de las principales razones por las que DeepSeek R1 es tan animada es porque

00:51no se basa en datos de labores de labores humanos caros o adecuado de supervisión,

00:57que es como la mayoría de los modelos de AI son entrenados y costan millones, si no billones.

01:02En lugar, DeepSeek R1 usa una fórmula de aprendizaje self-reinforzada sin la necesidad

01:08de supervisión humana y esfuerzo. Puedes pensar en adecuado de supervisión como enseñar a un niño a cocinar

01:14escribiendo una receta larga y precisa y luego mostrándolos paso a paso, mientras que el aprendizaje self-reinforzado

01:22permite al niño experimentar en la cocina y guiarlo lentamente cuando los platos no salen bien.

01:29Así que están aprendiendo a través de pruebas y errores y eso es exactamente como DeepSeek fue entrenado.

01:34Y los resultados de la benchmark son increíbles. En el benchmark de matemáticas AIME 2024, DeepSeek

01:40logra 71% de acuerdo, mientras que el GPT-01 mini logra 63.6% de acuerdo. Y en el benchmark de matemáticas 500,

01:49ganó a ambos el 01 mini y el 010912, pero performa peor en tareas de codaje en CodeForce

01:57y benchmark de live code. Pero, por supuesto, hay mucho más para los benchmark, así que volvamos al

02:02computador y te mostraré lo que encontré jugando con DeepSeek durante los últimos días.

02:08Pasando a deepseek.com, aquí es donde puedes crear un acuerdo o puedes ir adelante y

02:14descargar la aplicación en tu teléfono, pero actualmente sus servidores son super lentos debido a la

02:18demanda loca, así que recomiendo evitar enojar con un e-mail. Probablemente estarás esperando

02:24para siempre para un código de verificación de e-mail, así que recomiendo lograr directamente

02:28a través de un acuerdo de Google. Así que una vez que estás aquí, toque en el modelo DeepThink R1 aquí.

02:36Es un modelo de pensamiento avanzado similar al modelo de GPT-01, pero sin la restricción de 50 mensajes por semana de GPT-01

02:44y también R1 es capaz de trabajar al lado del botón de búsqueda de Internet, este botón

02:50aquí, simultáneamente, algo que creo que 01 todavía no puede hacer. Bien, el modelo R1 usa la

02:57forma de promover la cadena de pensamiento, lo cual básicamente encarga al modelo A1 de romper

03:01la raza en pasos simples para entender pasos. Esto no es nuevo, pero DeepThink R1 lo hace

03:07muy bien, así que utilicemos este simple problema de matemáticas como un ejemplo. La primera parte aquí es el

03:14problema para resolver y la segunda es el promedio que he añadido para mostrar su cadena de pensamientos,

03:21así que específicamente, solucionemos esto paso a paso. Para cada paso, explica tu pensamiento y

03:25muestra tus calculaciones. Pulsando entrar, puedes ver DeepThink pensando y respondiendo con

03:31sí mismo y esto es lo que hace diferente a R1. Transparentemente responde a cada paso

03:37individualmente y lo calcula en la misma respuesta en tiempo real, mientras que GPT a menudo puede ser

03:43un poco clínico y político. Encontré DeepThink R1 para ser directo, pero también

03:48es muy bueno para mostrar tu pensamiento y también puedes extraer tu pensamiento y enviarlo a otros

03:55modelos de inteligencia, algo que es único para DeepThink R1. La otra cosa genial es cómo DeepThink R1

04:01soluciona alucinaciones. Alucinaciones es un término para describir cuando la inteligencia te da una respuesta incorrecta

04:07y es un gran reto con los modelos de inteligencia actuales, pero he notado que R1 es particularmente

04:14bueno en entender por qué alucina, casi como si fuera realmente consciente y luego también se correcta.

04:22Empecé a grabar este clip específico cuando noté que me dio una respuesta incorrecta

04:28a la pregunta vaga de qué pasó con Hershey en 1998. Dice que Hershey lanzó Arm and Kisses en 1988,

04:36cuando en realidad fueron lanzados en 1990. Así que comenté el error y pregunté por qué

04:43hizo el error. A causa de su aproximación de pensamiento, es fascinante verlo ejecutar una búsqueda

04:49sobre este error, confirmando por qué hizo un error y luego se correcta aquí. Comparado con otros

04:55modelos de inteligencia, DeepThink R1 piensa mucho más naturalmente, casi como un ser humano, y elabora su error

05:02claramente, así que recomiendo muchísimo al R1 que se alucine cuando alucina y hazlo tú mismo.

05:09Parece ser más lento que el chat JBT 4.0, especialmente cuando se trata de tareas de código.

05:15He estado jugando con crear juegos en DeepSeek, como si le pediéramos a crear un juego de Tetris

05:23y luego tomar el código de Python y lo ejecutar en HTML, toma más tiempo que lo haría en 4.0

05:32antes de que puedas ver el juego directamente desde el chat. Así que si tienes tareas de código,

05:380, 1 y en particular Claude 3.5 Sonnet todavía hace un mejor trabajo en general y ayudará a eliminar

05:45la necesidad de descargar como un coder, pero si estás buscando una opción gratuita o una opción abierta,

05:52R1 aquí es definitivamente la manera de ir actualmente y vale la pena revisarla.

05:56Así que basado en mi corto tiempo con R1, siento que DeepSeek probablemente fue entrenado en

06:01JBT 4.0 para generar datos. Las respuestas en ambos modelos son muy similares y si estás preocupado

06:08por la privacidad, pero todavía quieres alucinar DeepSeek R1, puedes actualmente lo ejecutar localmente

06:13porque es abierta. Puedes descargar y usar la aplicación Olama para ejecutar este modelo R1 en

06:19un servidor local, así que todas tus preguntas y interacciones permanecen completamente privadas

06:24en lugar de en el cloud, pero es un modelo muy grande, así que necesitarás un monstruo de un

06:29setup para ejecutar su modelo R1 total localmente. Es aproximadamente 1,300 GB de VRAM que necesitarás

06:36para ejecutarlo completamente, pero hay versiones LLM destiladas de R1 que se ejecutan en una sola GPU.

06:43La versión 1.5B en particular funciona bien en mi MacStudio M2 Ultra, por ejemplo.

06:50Así que ese es mi primer vistazo a DeepSeek R1. Claramente hay algunas cosas increíbles sucediendo en el espacio AI.

06:58Cuando empecé a usar DeepSeek, estaba escéptico, pero muy rápidamente me di cuenta de que realmente es algo especial

07:04considerando que tiene un costo bajo para construir y que es gratuito para los usuarios. Es un momento muy emocionante

07:10en el espacio AI y estoy emocionado por ver cómo otros, como OpenAI, responden a DeepSeek. Si has llegado

07:16hasta el final de este video, comenta la palabra R1 y le daré un me gusta por hacerlo hasta el final de este video.

07:22Asegúrate de suscribirte para el contenido más reciente en tecnología y AI y como siempre, gracias por ver y te veré en el próximo video.

DeepSeek R1: This Free AI Model is Mind-Blowing

Categoría

Transcripción

Recomendada