El Nasdaq cae un 3%, con los fabricantes de chips retrocediendo con fuerza en todo el mundo. Los proveedores eléctricos de firmas de IA y las empresas expuestas a los centros de datos también se desploman.
Su potente irrupción, que la ha convertido en la aplicación gratuita más descargada por los iPhone en EE UU, China y otros países, por delante de ChatGPT, ha sido todo un terremoto, porque necesita de chips menos potentes para funcionar, lo cual pone en entredicho el modelo de negocio de Nvidia, al cuestionar las enormes inversiones que están efectuando las tecnológicas en comprar sus semiconductores. Además, pone en duda la tesis de que las enormes barreras de entrada, a priori necesarias para competir, protegen el liderazgo de Nvidia.
La hasta hoy empresa más valiosa del mundo por valor en Bolsa, con casi 3,5 billones de dólares, ve sus acciones caer mediada la sesión más de un 15%, o lo que es lo mismo, más de 500.000 millones evaporados en una sola sesión. Es la mayor pérdida de valor por parte de una acción en la historia de la Bolsa, y el castigo la ha relegado al tercer puesto, por detrás de Apple y Microsoft.
RESUMEN
Contexto
- DeepSeek.- Surge como un potencial disruptor en el mercado tecnológico.
- TikTok.- Continúa la controversia por la prohibición temporal y búsqueda de un comprador estadounidense.
- Aranceles.- Incertidumbre sobre cómo Donald Trump podría utilizarlos como herramienta comercial, especialmente con China.
Impacto
en los Mercados
- Cisne Negro.- DeepSeek podría ser un evento inesperado que afecte negativamente a los mercados financieros, especialmente a las tecnológicas estadounidenses.
- Valoraciones Altas.- Debate sobre si las acciones están sobrevaloradas, especialmente los llamados Siete Magníficos: Nvidia, Apple, Microsoft, Alphabet, Amazon, Meta y Tesla.
- Riesgos.- Aumento de riesgos geopolíticos y la reaparición de la inflación debido a los aranceles.
Competencia
Tecnológica
- Temor a la Competencia China.- La llegada de DeepSeek intensifica los temores sobre la sobrevaloración de las tecnológicas estadounidenses y acelera la recogida de beneficios.
- Sector del Coche Eléctrico: Se observa una competencia similar en otros sectores, como el de vehículos eléctricos.
Cuestiones
Éticas y de Censura
- Uso de la Información.- Surgen preocupaciones sobre cómo se manejarán los datos de los usuarios en DeepSeek.
- Censura.- Ejemplos de elusión de respuestas sobre eventos sensibles, como la masacre de Tiananmen en 1989, plantean interrogantes sobre la libertad de información.
Conclusión
La llegada de DeepSeek
podría cambiar el panorama tecnológico y financiero, y plantea tanto riesgos
económicos como éticos relacionados con la información y la censura.
Fuente: El País.com
ANEXO
1
Si se usa la IA DeepSeek en su web o app, se envían los datos personales a China. Y como evitarlo instalando dicha IA, con privacidad y menos censura.
El tema del momento en el campo tecnológico sin duda es DeepSeek. Un chatbot de IA que llega desde China que se ha enfrentado directamente a ChatGPT dando un resultado realmente bueno y con un mayor rendimiento.
Y al igual que otras inteligencias artificiales, es mucha la información que compartimos a través de los diferentes prompts o consultas. En muchos casos información personal como nuestras costumbres, los viajes que tenemos pensados realizar y hasta introducimos imágenes con el objetivo de que las analice. Pero… ¿qué hacen con toda esta información?.
Siempre se ha dicho que lo barato es caro. Y que cuando algo es gratis el precio son nuestros datos personales.
Usar DeepSeek es sinónimo de regalar nuestros datos personales
Esta
misma pregunta nos la hicimos con ChatGPT tras ver que estábamos pasándonos con
la información que le estábamos proporcionando. Incluso muchas empresas
prohibieron su uso en el ámbito laboral para evitar que se filtrara la
información confidencial con la que se estaba trabajando en ese momento. Ahora
esta misma pregunta nos la hacemos con DeepSeek: ¿desaparece todo lo que le
decimos después de introducir el prompt o se queda almacenado para una tarea
secundaria?
Para
poder responder a esta pregunta nos tenemos que ir a la política de privacidad
de la compañía y la respuesta es clara: recopila una gran cantidad de datos de
todo lo que hacemos en la web del chatbot. Toda esta información se recopila
por parte de dos empresas: Hangzhou DeepSeek Artificial Intelligence Co., Ltd.
y Beijing DeepSeek Artificial Intelligence Co., Ltd.
La
información que "interesa" a las empresas detrás de DeepSeek son
todos los chats que se introducen (además de la información personal que
proporcionamos cuando nos registramos). Esto incluye los chats, los textos
generados, los audios y archivos que se carguen, el historial de uso...
Pero
no queda aquí. También tiene la capacidad de recopilar todos los datos que se
envíen a la compañía con el objetivo de conseguir algún tipo de asistencia
técnica. Tampoco nos podemos detener aquí, ya que también existe un apartado
denominado "información recopilada automáticamente" done se va a
agrupar la dirección IP, las cookies, los datos de diagnóstico y lo más grave
de todo: las pulsaciones de las teclas. Todo esto asociado a un ID de usuario.
Toda
esta información tiene un valor realmente alto, y es crítica. Con todos estos
datos lo que se hace es entrenar al modelo de IA y también se habla de
"supervisión de interacciones" lo que sugiere que alguien esté
revisando lo que escribimos.
Y
aunque esto parece realmente abusivo por parte de esta empresa, la realidad es
que todos los datos se van a poder compartir con otras compañías del mismo
grupo corporativo de DeepSeek. Algo ideal para poder cruzar la información
generada en DeepSeek con la generada en otra plataforma. Ya que toda esta se
asocia a un ID e usuario concreto.
Además
de ello, también se apunta a la posibilidad de compartir la información con las
autoridades locales como el gobierno de China. Esto ya fue causa de graves
problemas con otras aplicaciones chinas como TikTok. El hecho de que tuviera la
obligación de compartir los datos relevantes con el gobierno Chino hizo que
Estados Unidos alertara sobre el peligro en el campo de la seguridad nacional,
ya que veían como los datos de sus usuarios eran tratados por las autoridades
de otros países.
La
Unión Europea no tardará en actuar
Ante
esta gran cantidad de datos que le estamos proporcionando a DeepSeek es
imposible no pensar en lo que dirá la Unión Europea. La UE cuenta con unas
políticas muy estrictas en materia de protección de datos que ya causó muchos
problemas a diferentes compañías tecnológicas de Estados Unidos cuando
quisieron traer sus productos a España, por ejemplo.
DeepSeek,
igual que las otras, va a estar obligada a cumplir con el RGPD pese a contar
con los servidores en China. Esto mismo lo vimos con ChatGPT en Italia donde se
llegó a prohibir su uso hasta que se adaptara a la normativa europea en materia
de protección de datos.
Este
repunte de popularidad, y sobre todo tras analizar la cantidad de información
que recopila, nos hace pensar que la UE no tardará en investigar a DeepSeek
para que se ajuste a la normativa. Sobre todo cuando no se encuentra opción
para rechazar que nuestros datos se utilicen para mejorar el funcionamiento del
modelo o tener una forma fácil de eliminar los datos que tenga la compañía de
nosotros. Para ello solo se va a poder contactar con ellos a través de los
cauces disponibles.
Usar
DeepSeek de manera offline
Para
poder evitar esta filtración de datos, la solución pasa por usar el modelo de
DeepSeek de manera offline. En las últimas horas, hemos visto como han
aparecido diferentes tutoriales para poder descargar de manera local la
inteligencia artificial para usarla de manera segura. En Reddit sin ir más
lejos han aparecido más hilos, así como diferentes vídeos en YouTube.
En
uno de estos hilos se explica como para poder tener la IA offline se puede
descargar la aplicación de Cursor AI y dentro de esta instalar CodeGPT. Una vez
hecho esto, se requiere también tener instalado Ollama para poder ejecutar el
código de DeepSeek de manera local.
Una vez hecho esto, ya se puede entrar en la app de Cursor. Y al AI posteriormente en CodeGPT y ahí debe aparecer ya Ollama. Dentro de Ollama es donde vamos a poder buscar el modelo de DeepSeek R1 para descargarlo (es importante elegir qué entrenamiento quieres instalar) y ya se puede comenzar a usar.
Fuente:
Genbeta.com
ANEXO 2
DeepSeek. La IA que pone en jaque el futuro de NVIDIA y
ChatGPT
DeepSeek,
el chatbot inteligencia artificial desarrollado por la startup china con el
mismo nombre, está revolucionando el ecosistema de IA occidental. Sus claves
las encontramos en un modelo altamente optimizado, que ha superado a la última
versión de ChatGPT en diversas pruebas de rendimiento, y su acceso gratuito sin
ningún tipo de membresía VIP.
Esta
alternativa está abandonando el propio concepto de «alternativa» para
convertirse en la opción primordial para muchos usuarios alrededor del globo.
Tanto es así que los mercados bursátiles ya se están haciendo eco de su
funcionamiento y las acciones vinculadas a IA están cayendo en detrimento de
este nuevo chatbot con tintes de gigante.
¿En
qué destaca concretamente DeepSeek?
Según
los expertos de la Universidad Carlos III de Ingeniería Telemática, este modelo
de lenguaje ha sido desarrollado inicialmente para tareas complejas y técnicas
que requieren de un razonamiento profundo. Su fuerte son los problemas
matemáticos, la programación o el análisis de datos.
Esta
IA funciona gracias a una nueva arquitectura «MoE» (Mixture of Experts). En
otras palabras, en vez de usar un mismo modelo para procesar toda la
información, lo que hace es ir asignando cada una de las tareas a un modelo
«experto» especializado en dicha tarea. De esta forma ofrece resultados mucho
más precisos en cualquier situación.
A
diferencia de ChatGPT, la revolución que trae esta aplicación es que no
necesita ingentes volúmenes de datos para perfeccionar su aprendizaje y que
alcance un óptimo rendimiento.
Otra
característica que le ha hecho ganarse a gran parte de los usuarios es su
naturaleza de código abierto. Esto es el principal motivo de su gratuidad, y
permite la accesibilidad para entornos de distinta índole, como académicos o
corporativos. Esto democratiza el mundo del desarrollo informático y permite a
los desarrolladores más humildes no pagar ningún tipo de suscripción para
llevar a cabo sus proyectos.
Tabla
de rendimiento deepseek
En
la imagen de arriba, se presenta una tabla de Benchmark que evalúa el
rendimiento de distintas IA en cada categoría. En ella se incluyen más potentes
de ChatGPT, el gigante de IA occidental.
Entre
las distintas categorías, podemos encontrar:
- Comprensión de lenguaje (MMLU-Redux, DROP, IF-Eval…).- Miden la capacidad de los modelos para interpretar y procesar textos en inglés. DeepSeek obtiene el mejor rendimiento en 6 de las 10 pruebas, y obtiene igualmente un rendimiento óptimo en todas, excepto IF-Eval.
- Codificación (LiveCodeBench, Codeforces…).- Los resultados en este apartado miden la capacidad de la IA para trabajar con código, ideal para desarrolladores.La palma se la lleva la versión o1 de OpenAI. Sin embargo, DeepSeek mantiene todos sus parámetros en verde, lo que indica un rendimiento óptimo en cada prueba.
- Matemáticas (MATH-500, AIME 2024 y CNMO 2024).- Este apartado mide la resolución por parte de los diferentes modelos a la hora de resolver problemas matemáticos complejos. Dominio absoluto para DeepSeek, quien lidera los tres marcadores por encima de todos sus contrincantes. Alucinante si tenemos en cuenta la larga trayectoria y mejora de ChatGPT en este campo desde 2022.
- Chino.- Aquí se evalúa el rendimiento de los modelos de lenguaje para resolver problemas y comprender el idioma chino. El propio DeepSeek lidera los resultados con la mejor nota en los tres parámetros. Uno de ellos corresponde, curiosamente, a la versión anterior de DeepSeek (V3).
Actualmente
hay dos modelos de DeepSeek: V3 y R1. El V3, el más «antiguo», se ha enfrentado
en varias ocasiones a GPT-4o y a Llama 3.1, superando a ambos en todos los
aspectos. El modelo más nuevo, R1, ofrece unos resultados excelentes en los
benchmarks de rendimiento, y es capaz de trabajar con todo tipo de pruebas
lógicas, problemas matemáticos o de programación con una precisión nunca vista
hasta ahora.
Fuente:
softzone.es
ANEXO 3
Tras dar la vuelta a la industria IA, DeepSeek lanza Janus Pro, primer modelo que entiende y crea imágenes
En
plena resaca por su modelo R1, DeepSeek acaba de lanzar Janus Pro 7B, un modelo
de IA para generar imágenes a partir de texto y entender otras imágenes que se
le introduzcan. Y sí, también es de código abierto, aunque con un asterisco
similar al de Llama.
Por
qué es importante. Hasta ahora, los modelos multimodales han tenido que hacer
malabares entre la comprensión y la generación de imágenes, sacrificando
eficiencia o rendimiento. Janus Pro 7B resuelve este dilema con una nueva
propuesta: unifica la comprensión y generación de imágenes en una única
arquitectura.
El modelo introduce sistema de "doble vía" para procesamiento visual.
- Separa los caminos de codificación para entender y generar imágenes.
- Mantiene un único transformer para procesar toda la información.
- Utiliza SigLIP-L como codificador visual para imágenes de 384x384 píxeles.
Esta
resolución es su principal inconveniente, parece mucho más orientada a
experimentar y a usos de poca ambición que a las aplicaciones que podemos
asumir de otras propuestas como Midjourney o Freepik, que suelen partir de
1024x1024 píxeles. No obstante, Janus Pro no es un generador de imágenes al
uso, sino un modelo multimodal con varias capacidades.
Eso
sí, esta resolución permite un equilibrio óptimo entre calidad y velocidad de
procesamiento... para usos que se conformen con ella.
La arquitectura de Janus Pro 7B es relevante por su eficiencia.
- Tamaño compacto de 7.000 millones ("7B") de parámetros.
- Rendimiento superior a modelos específicos más grandes.
- Código abierto bajo licencia MIT para el repositorio, aunque el modelo en sí requiere aceptar la licencia DeepSeek.
La
licencia MIT permite a cualquiera usar, modificar y distribuir el código
libremente, incluso con fines comerciales, siempre que se mantenga el aviso de
copyright original. Es una de las licencias más permisivas que existen.
La
licencia DeepSeek, en cambio, es gratuita y permite usos comerciales, pero
incluye restricciones éticas específicas, como la prohibición de uso militar o
la generación de desinformación.
En perspectiva. Janus Pro 7B no es solo otro modelo multimodal, sino un nuevo paradigma en la arquitectura de las IA, que pueden ver y crear. Su enfoque unificado pero descentralizado bien puede acabar influyendo en futuros desarrollos.
El
modelo está construido sobre DeepSeek-LLM-7b-base, el modelo base de lenguaje
de la startup china, anunciado en agosto de 2024. De él hereda sus capacidades
de procesamiento de lenguaje mientras añade capacidades visuales avanzadas. Su
sistema de sub-muestreo de 16x para la generación de imágenes permite mantener
la eficiencia sin comprometer la calidad.
Fuente: Xataka