What is DeepSeek R1? It's a new AI chatbot that's free, open-source, and is as powerful if not better than ChatGPT 4o. I've used it for a few days and here's my thoughts, opinions, and a setup guide to DeepSeek R1 AI.
Categoría
🤖
TecnologíaTranscripción
00:00Hola amigos, espero que estéis bien. En caso de que os haya olvidado, DeepSeek R1 ha estado haciendo ondas en la escena de la AI y la tecnología.
00:06Es un modelo de AI abierta que aparentemente fue desarrollado por menos de 6 millones de dólares,
00:11una fracción de los billones de dólares gastados por OpenAI y Google, por ejemplo, para crear sus modelos de AI.
00:17La buena noticia para todos nosotros es que DeepSeek es gratis de uso y se ha abierto a la aplicación más descargada
00:23en las tiendas de aplicaciones superando el chat GPT en días.
00:26Ahora es uno de los modelos de AI más avanzados, gratis y abiertos que podemos usar.
00:31He estado jugando con DeepSeek R1 durante un par de días y tengo que decir que es un juego cambiante,
00:37pero no sin sus fracases. Así que vamos a pasar por lo que DeepSeek R1 es capaz de y veamos qué es lo que se trata.
00:45Así que vamos a acelerar. Una de las principales razones por las que DeepSeek R1 es tan animada es porque
00:51no se basa en datos de labores de labores humanos caros o adecuado de supervisión,
00:57que es como la mayoría de los modelos de AI son entrenados y costan millones, si no billones.
01:02En lugar, DeepSeek R1 usa una fórmula de aprendizaje self-reinforzada sin la necesidad
01:08de supervisión humana y esfuerzo. Puedes pensar en adecuado de supervisión como enseñar a un niño a cocinar
01:14escribiendo una receta larga y precisa y luego mostrándolos paso a paso, mientras que el aprendizaje self-reinforzado
01:22permite al niño experimentar en la cocina y guiarlo lentamente cuando los platos no salen bien.
01:29Así que están aprendiendo a través de pruebas y errores y eso es exactamente como DeepSeek fue entrenado.
01:34Y los resultados de la benchmark son increíbles. En el benchmark de matemáticas AIME 2024, DeepSeek
01:40logra 71% de acuerdo, mientras que el GPT-01 mini logra 63.6% de acuerdo. Y en el benchmark de matemáticas 500,
01:49ganó a ambos el 01 mini y el 010912, pero performa peor en tareas de codaje en CodeForce
01:57y benchmark de live code. Pero, por supuesto, hay mucho más para los benchmark, así que volvamos al
02:02computador y te mostraré lo que encontré jugando con DeepSeek durante los últimos días.
02:08Pasando a deepseek.com, aquí es donde puedes crear un acuerdo o puedes ir adelante y
02:14descargar la aplicación en tu teléfono, pero actualmente sus servidores son super lentos debido a la
02:18demanda loca, así que recomiendo evitar enojar con un e-mail. Probablemente estarás esperando
02:24para siempre para un código de verificación de e-mail, así que recomiendo lograr directamente
02:28a través de un acuerdo de Google. Así que una vez que estás aquí, toque en el modelo DeepThink R1 aquí.
02:36Es un modelo de pensamiento avanzado similar al modelo de GPT-01, pero sin la restricción de 50 mensajes por semana de GPT-01
02:44y también R1 es capaz de trabajar al lado del botón de búsqueda de Internet, este botón
02:50aquí, simultáneamente, algo que creo que 01 todavía no puede hacer. Bien, el modelo R1 usa la
02:57forma de promover la cadena de pensamiento, lo cual básicamente encarga al modelo A1 de romper
03:01la raza en pasos simples para entender pasos. Esto no es nuevo, pero DeepThink R1 lo hace
03:07muy bien, así que utilicemos este simple problema de matemáticas como un ejemplo. La primera parte aquí es el
03:14problema para resolver y la segunda es el promedio que he añadido para mostrar su cadena de pensamientos,
03:21así que específicamente, solucionemos esto paso a paso. Para cada paso, explica tu pensamiento y
03:25muestra tus calculaciones. Pulsando entrar, puedes ver DeepThink pensando y respondiendo con
03:31sí mismo y esto es lo que hace diferente a R1. Transparentemente responde a cada paso
03:37individualmente y lo calcula en la misma respuesta en tiempo real, mientras que GPT a menudo puede ser
03:43un poco clínico y político. Encontré DeepThink R1 para ser directo, pero también
03:48es muy bueno para mostrar tu pensamiento y también puedes extraer tu pensamiento y enviarlo a otros
03:55modelos de inteligencia, algo que es único para DeepThink R1. La otra cosa genial es cómo DeepThink R1
04:01soluciona alucinaciones. Alucinaciones es un término para describir cuando la inteligencia te da una respuesta incorrecta
04:07y es un gran reto con los modelos de inteligencia actuales, pero he notado que R1 es particularmente
04:14bueno en entender por qué alucina, casi como si fuera realmente consciente y luego también se correcta.
04:22Empecé a grabar este clip específico cuando noté que me dio una respuesta incorrecta
04:28a la pregunta vaga de qué pasó con Hershey en 1998. Dice que Hershey lanzó Arm and Kisses en 1988,
04:36cuando en realidad fueron lanzados en 1990. Así que comenté el error y pregunté por qué
04:43hizo el error. A causa de su aproximación de pensamiento, es fascinante verlo ejecutar una búsqueda
04:49sobre este error, confirmando por qué hizo un error y luego se correcta aquí. Comparado con otros
04:55modelos de inteligencia, DeepThink R1 piensa mucho más naturalmente, casi como un ser humano, y elabora su error
05:02claramente, así que recomiendo muchísimo al R1 que se alucine cuando alucina y hazlo tú mismo.
05:09Parece ser más lento que el chat JBT 4.0, especialmente cuando se trata de tareas de código.
05:15He estado jugando con crear juegos en DeepSeek, como si le pediéramos a crear un juego de Tetris
05:23y luego tomar el código de Python y lo ejecutar en HTML, toma más tiempo que lo haría en 4.0
05:32antes de que puedas ver el juego directamente desde el chat. Así que si tienes tareas de código,
05:380, 1 y en particular Claude 3.5 Sonnet todavía hace un mejor trabajo en general y ayudará a eliminar
05:45la necesidad de descargar como un coder, pero si estás buscando una opción gratuita o una opción abierta,
05:52R1 aquí es definitivamente la manera de ir actualmente y vale la pena revisarla.
05:56Así que basado en mi corto tiempo con R1, siento que DeepSeek probablemente fue entrenado en
06:01JBT 4.0 para generar datos. Las respuestas en ambos modelos son muy similares y si estás preocupado
06:08por la privacidad, pero todavía quieres alucinar DeepSeek R1, puedes actualmente lo ejecutar localmente
06:13porque es abierta. Puedes descargar y usar la aplicación Olama para ejecutar este modelo R1 en
06:19un servidor local, así que todas tus preguntas y interacciones permanecen completamente privadas
06:24en lugar de en el cloud, pero es un modelo muy grande, así que necesitarás un monstruo de un
06:29setup para ejecutar su modelo R1 total localmente. Es aproximadamente 1,300 GB de VRAM que necesitarás
06:36para ejecutarlo completamente, pero hay versiones LLM destiladas de R1 que se ejecutan en una sola GPU.
06:43La versión 1.5B en particular funciona bien en mi MacStudio M2 Ultra, por ejemplo.
06:50Así que ese es mi primer vistazo a DeepSeek R1. Claramente hay algunas cosas increíbles sucediendo en el espacio AI.
06:58Cuando empecé a usar DeepSeek, estaba escéptico, pero muy rápidamente me di cuenta de que realmente es algo especial
07:04considerando que tiene un costo bajo para construir y que es gratuito para los usuarios. Es un momento muy emocionante
07:10en el espacio AI y estoy emocionado por ver cómo otros, como OpenAI, responden a DeepSeek. Si has llegado
07:16hasta el final de este video, comenta la palabra R1 y le daré un me gusta por hacerlo hasta el final de este video.
07:22Asegúrate de suscribirte para el contenido más reciente en tecnología y AI y como siempre, gracias por ver y te veré en el próximo video.