Microsoft lanza Phi-4-multimodal y Phi-4-mini: IA avanzada para desarrolladores

Microsoft ha anunciado el lanzamiento de Phi-4-multimodal y Phi-4-mini, dos nuevos modelos de lenguaje pequeños (SLM, por sus siglas en inglés) diseñados para ofrecer capacidades avanzadas de inteligencia artificial (IA) en texto, voz e imágenes. Estos modelos están orientados a desarrolladores y optimizados para escenarios con limitaciones de cómputo, permitiendo aplicaciones de IA en diversas industrias.

Phi-4-multimodal: IA integral para procesamiento de voz, imágenes y texto

El modelo Phi-4-multimodal cuenta con 5.600 millones de parámetros y se caracteriza por su capacidad para procesar simultáneamente imágenes, audio, gráficos, tablas y documentos dentro de una arquitectura unificada.

🔹 Características principales:

  • Procesamiento intermodal avanzado, permitiendo interacciones más naturales y sensibles al contexto.
  • Supera a modelos especializados como WhisperV3 y SeamlessM4T-v2-Large en tareas de reconocimiento automático de voz y traducción.
  • Baja latencia y alta eficiencia, optimizando la ejecución en dispositivos con menor carga computacional.
  • Capacidad de resumen de voz, alcanzando niveles de rendimiento comparables a GPT-4o.

A pesar de su rendimiento sobresaliente, Microsoft reconoce que todavía hay margen de mejora en respuesta a preguntas, en comparación con modelos como Gemini-2.0-Flash.

Phi-4-mini: Modelo compacto y eficiente para tareas basadas en texto

El Phi-4-mini es un modelo más liviano, con 3.800 millones de parámetros, diseñado para ofrecer alta velocidad y eficiencia en tareas de texto.

🔹 Características clave:

  • Capacidad de responder consultas agrupadas, con un vocabulario de 200.000 palabras.
  • Optimizado para tareas de texto, superando a modelos más grandes en razonamiento, matemáticas, seguimiento de instrucciones y codificación.
  • Soporta secuencias de hasta 128.000 tokens, garantizando alta precisión y escalabilidad en aplicaciones avanzadas de IA.
  • Integración en interfaces de programación estructuradas, facilitando su implementación en diversas plataformas.

Disponibilidad y acceso

Microsoft ha confirmado que ambos modelos ya están disponibles en Azure AI Foundry, Hugging Face y Nvidia API Catalog, ofreciendo a los desarrolladores una experiencia multimodal completa para potenciar sus proyectos de IA.

Inserta este artículo con este código HTML:

<a href="https://www.redimin.cl/microsoft-phi-4-multimodal-mini-inteligencia-artificial/">Microsoft lanza Phi-4-multimodal y Phi-4-mini: IA avanzada para desarrolladores</a>

¡Descubre la última edición de REDIMIN!

Explora los temas más recientes en minería y tecnología en nuestra nueva edición. Haz clic en el enlace para leerla ahora.

Leer la Última Edición

¿Quieres que tu empresa tenga presencia en REDIMIN?

En REDIMIN, conectamos a tu marca con una audiencia especializada en el sector minero y contamos con más de 1 millón de usuarios activos al mes. Genera oportunidades para destacar tu empresa en un mercado clave y aprovecha nuestro alcance para maximizar tu visibilidad.

Ver Opciones de Publicidad
Compartir este Artículo
Salir de la versión móvil