INFORMATICA Y SOCIEDAD: TECNOLOLOGIAS/INVERSIÓN. La irrupción de la IA china DeepSeek sacude las bolsas de valores amenazando el dominio de las IA estadounidense y otras tecnológicas.

27 de enero de 2025

TECNOLOLOGIAS/INVERSIÓN. La irrupción de la IA china DeepSeek sacude las bolsas de valores amenazando el dominio de las IA estadounidense y otras tecnológicas.

El Nasdaq cae un 3%, con los fabricantes de chips retrocediendo con fuerza en todo el mundo. Los proveedores eléctricos de firmas de IA y las empresas expuestas a los centros de datos también se desploman.

Una start up china de inteligencia artificial, DeepSeek (búsqueda profunda, en español), desconocida para el gran público hasta hace solo unos días, ha puesto este lunes patas arriba las Bolsas de Estados Unidos.

Su potente irrupción, que la ha convertido en la aplicación gratuita más descargada por los iPhone en EE UU, China y otros países, por delante de ChatGPT, ha sido todo un terremoto, porque necesita de chips menos potentes para funcionar, lo cual pone en entredicho el modelo de negocio de Nvidia, al cuestionar las enormes inversiones que están efectuando las tecnológicas en comprar sus semiconductores. Además, pone en duda la tesis de que las enormes barreras de entrada, a priori necesarias para competir, protegen el liderazgo de Nvidia.

La hasta hoy empresa más valiosa del mundo por valor en Bolsa, con casi 3,5 billones de dólares, ve sus acciones caer mediada la sesión más de un 15%, o lo que es lo mismo, más de 500.000 millones evaporados en una sola sesión. Es la mayor pérdida de valor por parte de una acción en la historia de la Bolsa, y el castigo la ha relegado al tercer puesto, por detrás de Apple y Microsoft.

RESUMEN

Contexto

DeepSeek.- Surge como un potencial disruptor en el mercado tecnológico.
TikTok.- Continúa la controversia por la prohibición temporal y búsqueda de un comprador estadounidense.
Aranceles.- Incertidumbre sobre cómo Donald Trump podría utilizarlos como herramienta comercial, especialmente con China.

Impacto en los Mercados

Cisne Negro.- DeepSeek podría ser un evento inesperado que afecte negativamente a los mercados financieros, especialmente a las tecnológicas estadounidenses.
Valoraciones Altas.- Debate sobre si las acciones están sobrevaloradas, especialmente los llamados Siete Magníficos: Nvidia, Apple, Microsoft, Alphabet, Amazon, Meta y Tesla.
Riesgos.- Aumento de riesgos geopolíticos y la reaparición de la inflación debido a los aranceles.

Competencia Tecnológica

Temor a la Competencia China.- La llegada de DeepSeek intensifica los temores sobre la sobrevaloración de las tecnológicas estadounidenses y acelera la recogida de beneficios.
Sector del Coche Eléctrico: Se observa una competencia similar en otros sectores, como el de vehículos eléctricos.

Cuestiones Éticas y de Censura

Uso de la Información.- Surgen preocupaciones sobre cómo se manejarán los datos de los usuarios en DeepSeek.
Censura.- Ejemplos de elusión de respuestas sobre eventos sensibles, como la masacre de Tiananmen en 1989, plantean interrogantes sobre la libertad de información.

Conclusión

La llegada de DeepSeek podría cambiar el panorama tecnológico y financiero, y plantea tanto riesgos económicos como éticos relacionados con la información y la censura.

Fuente: El País.com

ANEXO 1

Si se usa la IA DeepSeek en su web o app, se envían los datos personales a China. Y como evitarlo instalando dicha IA, con privacidad y menos censura.

El tema del momento en el campo tecnológico sin duda es DeepSeek. Un chatbot de IA que llega desde China que se ha enfrentado directamente a ChatGPT dando un resultado realmente bueno y con un mayor rendimiento.

Y al igual que otras inteligencias artificiales, es mucha la información que compartimos a través de los diferentes prompts o consultas. En muchos casos información personal como nuestras costumbres, los viajes que tenemos pensados realizar y hasta introducimos imágenes con el objetivo de que las analice. Pero… ¿qué hacen con toda esta información?.

Siempre se ha dicho que lo barato es caro. Y que cuando algo es gratis el precio son nuestros datos personales.

Usar DeepSeek es sinónimo de regalar nuestros datos personales

Esta misma pregunta nos la hicimos con ChatGPT tras ver que estábamos pasándonos con la información que le estábamos proporcionando. Incluso muchas empresas prohibieron su uso en el ámbito laboral para evitar que se filtrara la información confidencial con la que se estaba trabajando en ese momento. Ahora esta misma pregunta nos la hacemos con DeepSeek: ¿desaparece todo lo que le decimos después de introducir el prompt o se queda almacenado para una tarea secundaria?

Para poder responder a esta pregunta nos tenemos que ir a la política de privacidad de la compañía y la respuesta es clara: recopila una gran cantidad de datos de todo lo que hacemos en la web del chatbot. Toda esta información se recopila por parte de dos empresas: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. y Beijing DeepSeek Artificial Intelligence Co., Ltd.

La información que "interesa" a las empresas detrás de DeepSeek son todos los chats que se introducen (además de la información personal que proporcionamos cuando nos registramos). Esto incluye los chats, los textos generados, los audios y archivos que se carguen, el historial de uso...

Pero no queda aquí. También tiene la capacidad de recopilar todos los datos que se envíen a la compañía con el objetivo de conseguir algún tipo de asistencia técnica. Tampoco nos podemos detener aquí, ya que también existe un apartado denominado "información recopilada automáticamente" done se va a agrupar la dirección IP, las cookies, los datos de diagnóstico y lo más grave de todo: las pulsaciones de las teclas. Todo esto asociado a un ID de usuario.

Toda esta información tiene un valor realmente alto, y es crítica. Con todos estos datos lo que se hace es entrenar al modelo de IA y también se habla de "supervisión de interacciones" lo que sugiere que alguien esté revisando lo que escribimos.

Y aunque esto parece realmente abusivo por parte de esta empresa, la realidad es que todos los datos se van a poder compartir con otras compañías del mismo grupo corporativo de DeepSeek. Algo ideal para poder cruzar la información generada en DeepSeek con la generada en otra plataforma. Ya que toda esta se asocia a un ID e usuario concreto.

Además de ello, también se apunta a la posibilidad de compartir la información con las autoridades locales como el gobierno de China. Esto ya fue causa de graves problemas con otras aplicaciones chinas como TikTok. El hecho de que tuviera la obligación de compartir los datos relevantes con el gobierno Chino hizo que Estados Unidos alertara sobre el peligro en el campo de la seguridad nacional, ya que veían como los datos de sus usuarios eran tratados por las autoridades de otros países.

La Unión Europea no tardará en actuar

Ante esta gran cantidad de datos que le estamos proporcionando a DeepSeek es imposible no pensar en lo que dirá la Unión Europea. La UE cuenta con unas políticas muy estrictas en materia de protección de datos que ya causó muchos problemas a diferentes compañías tecnológicas de Estados Unidos cuando quisieron traer sus productos a España, por ejemplo.

DeepSeek, igual que las otras, va a estar obligada a cumplir con el RGPD pese a contar con los servidores en China. Esto mismo lo vimos con ChatGPT en Italia donde se llegó a prohibir su uso hasta que se adaptara a la normativa europea en materia de protección de datos.

Este repunte de popularidad, y sobre todo tras analizar la cantidad de información que recopila, nos hace pensar que la UE no tardará en investigar a DeepSeek para que se ajuste a la normativa. Sobre todo cuando no se encuentra opción para rechazar que nuestros datos se utilicen para mejorar el funcionamiento del modelo o tener una forma fácil de eliminar los datos que tenga la compañía de nosotros. Para ello solo se va a poder contactar con ellos a través de los cauces disponibles.

Usar DeepSeek de manera offline

Para poder evitar esta filtración de datos, la solución pasa por usar el modelo de DeepSeek de manera offline. En las últimas horas, hemos visto como han aparecido diferentes tutoriales para poder descargar de manera local la inteligencia artificial para usarla de manera segura. En Reddit sin ir más lejos han aparecido más hilos, así como diferentes vídeos en YouTube.

En uno de estos hilos se explica como para poder tener la IA offline se puede descargar la aplicación de Cursor AI y dentro de esta instalar CodeGPT. Una vez hecho esto, se requiere también tener instalado Ollama para poder ejecutar el código de DeepSeek de manera local.

Una vez hecho esto, ya se puede entrar en la app de Cursor. Y al AI posteriormente en CodeGPT y ahí debe aparecer ya Ollama. Dentro de Ollama es donde vamos a poder buscar el modelo de DeepSeek R1 para descargarlo (es importante elegir qué entrenamiento quieres instalar) y ya se puede comenzar a usar.

Fuente: Genbeta.com

ANEXO 2

DeepSeek. La IA que pone en jaque el futuro de NVIDIA y ChatGPT

DeepSeek, el chatbot inteligencia artificial desarrollado por la startup china con el mismo nombre, está revolucionando el ecosistema de IA occidental. Sus claves las encontramos en un modelo altamente optimizado, que ha superado a la última versión de ChatGPT en diversas pruebas de rendimiento, y su acceso gratuito sin ningún tipo de membresía VIP.

Esta alternativa está abandonando el propio concepto de «alternativa» para convertirse en la opción primordial para muchos usuarios alrededor del globo. Tanto es así que los mercados bursátiles ya se están haciendo eco de su funcionamiento y las acciones vinculadas a IA están cayendo en detrimento de este nuevo chatbot con tintes de gigante.

¿En qué destaca concretamente DeepSeek?

Según los expertos de la Universidad Carlos III de Ingeniería Telemática, este modelo de lenguaje ha sido desarrollado inicialmente para tareas complejas y técnicas que requieren de un razonamiento profundo. Su fuerte son los problemas matemáticos, la programación o el análisis de datos.

Esta IA funciona gracias a una nueva arquitectura «MoE» (Mixture of Experts). En otras palabras, en vez de usar un mismo modelo para procesar toda la información, lo que hace es ir asignando cada una de las tareas a un modelo «experto» especializado en dicha tarea. De esta forma ofrece resultados mucho más precisos en cualquier situación.

A diferencia de ChatGPT, la revolución que trae esta aplicación es que no necesita ingentes volúmenes de datos para perfeccionar su aprendizaje y que alcance un óptimo rendimiento.

Otra característica que le ha hecho ganarse a gran parte de los usuarios es su naturaleza de código abierto. Esto es el principal motivo de su gratuidad, y permite la accesibilidad para entornos de distinta índole, como académicos o corporativos. Esto democratiza el mundo del desarrollo informático y permite a los desarrolladores más humildes no pagar ningún tipo de suscripción para llevar a cabo sus proyectos.

Tabla de rendimiento deepseek

En la imagen de arriba, se presenta una tabla de Benchmark que evalúa el rendimiento de distintas IA en cada categoría. En ella se incluyen más potentes de ChatGPT, el gigante de IA occidental.

Entre las distintas categorías, podemos encontrar:

Comprensión de lenguaje (MMLU-Redux, DROP, IF-Eval…).- Miden la capacidad de los modelos para interpretar y procesar textos en inglés. DeepSeek obtiene el mejor rendimiento en 6 de las 10 pruebas, y obtiene igualmente un rendimiento óptimo en todas, excepto IF-Eval.
Codificación (LiveCodeBench, Codeforces…).- Los resultados en este apartado miden la capacidad de la IA para trabajar con código, ideal para desarrolladores.La palma se la lleva la versión o1 de OpenAI. Sin embargo, DeepSeek mantiene todos sus parámetros en verde, lo que indica un rendimiento óptimo en cada prueba.
Matemáticas (MATH-500, AIME 2024 y CNMO 2024).- Este apartado mide la resolución por parte de los diferentes modelos a la hora de resolver problemas matemáticos complejos. Dominio absoluto para DeepSeek, quien lidera los tres marcadores por encima de todos sus contrincantes. Alucinante si tenemos en cuenta la larga trayectoria y mejora de ChatGPT en este campo desde 2022.
Chino.- Aquí se evalúa el rendimiento de los modelos de lenguaje para resolver problemas y comprender el idioma chino. El propio DeepSeek lidera los resultados con la mejor nota en los tres parámetros. Uno de ellos corresponde, curiosamente, a la versión anterior de DeepSeek (V3).

Actualmente hay dos modelos de DeepSeek: V3 y R1. El V3, el más «antiguo», se ha enfrentado en varias ocasiones a GPT-4o y a Llama 3.1, superando a ambos en todos los aspectos. El modelo más nuevo, R1, ofrece unos resultados excelentes en los benchmarks de rendimiento, y es capaz de trabajar con todo tipo de pruebas lógicas, problemas matemáticos o de programación con una precisión nunca vista hasta ahora.

Fuente: softzone.es

ANEXO 3

Tras dar la vuelta a la industria IA, DeepSeek lanza Janus Pro, primer modelo que entiende y crea imágenes

DeepSeek lanza Janus Pro 7B, un modelo multimodal que unifica la comprensión y generación de imágenes, destacando por su eficiencia y arquitectura revolucionaria.

En plena resaca por su modelo R1, DeepSeek acaba de lanzar Janus Pro 7B, un modelo de IA para generar imágenes a partir de texto y entender otras imágenes que se le introduzcan. Y sí, también es de código abierto, aunque con un asterisco similar al de Llama.

Por qué es importante. Hasta ahora, los modelos multimodales han tenido que hacer malabares entre la comprensión y la generación de imágenes, sacrificando eficiencia o rendimiento. Janus Pro 7B resuelve este dilema con una nueva propuesta: unifica la comprensión y generación de imágenes en una única arquitectura.

El modelo introduce sistema de "doble vía" para procesamiento visual.

Separa los caminos de codificación para entender y generar imágenes.
Mantiene un único transformer para procesar toda la información.
Utiliza SigLIP-L como codificador visual para imágenes de 384x384 píxeles.

Esta resolución es su principal inconveniente, parece mucho más orientada a experimentar y a usos de poca ambición que a las aplicaciones que podemos asumir de otras propuestas como Midjourney o Freepik, que suelen partir de 1024x1024 píxeles. No obstante, Janus Pro no es un generador de imágenes al uso, sino un modelo multimodal con varias capacidades.

Eso sí, esta resolución permite un equilibrio óptimo entre calidad y velocidad de procesamiento... para usos que se conformen con ella.

La arquitectura de Janus Pro 7B es relevante por su eficiencia.

Tamaño compacto de 7.000 millones ("7B") de parámetros.
Rendimiento superior a modelos específicos más grandes.
Código abierto bajo licencia MIT para el repositorio, aunque el modelo en sí requiere aceptar la licencia DeepSeek.

La licencia MIT permite a cualquiera usar, modificar y distribuir el código libremente, incluso con fines comerciales, siempre que se mantenga el aviso de copyright original. Es una de las licencias más permisivas que existen.

La licencia DeepSeek, en cambio, es gratuita y permite usos comerciales, pero incluye restricciones éticas específicas, como la prohibición de uso militar o la generación de desinformación.

En perspectiva. Janus Pro 7B no es solo otro modelo multimodal, sino un nuevo paradigma en la arquitectura de las IA, que pueden ver y crear. Su enfoque unificado pero descentralizado bien puede acabar influyendo en futuros desarrollos.

El modelo está construido sobre DeepSeek-LLM-7b-base, el modelo base de lenguaje de la startup china, anunciado en agosto de 2024. De él hereda sus capacidades de procesamiento de lenguaje mientras añade capacidades visuales avanzadas. Su sistema de sub-muestreo de 16x para la generación de imágenes permite mantener la eficiencia sin comprometer la calidad.

Fuente: Xataka

27 de enero de 2025

TECNOLOLOGIAS/INVERSIÓN. La irrupción de la IA china DeepSeek sacude las bolsas de valores amenazando el dominio de las IA estadounidense y otras tecnológicas.

ENLACES DE INTERES / INTERESTING LINKS

ARTICULOS / POST