Microsoft ha anunciado el lanzamiento de Phi-4-multimodal y Phi-4-mini, dos nuevos modelos de lenguaje pequeños (SLM, por sus siglas en inglés) diseñados para ofrecer capacidades avanzadas de inteligencia artificial (IA) en texto, voz e imágenes. Estos modelos están orientados a desarrolladores y optimizados para escenarios con limitaciones de cómputo, permitiendo aplicaciones de IA en diversas industrias.
Phi-4-multimodal: IA integral para procesamiento de voz, imágenes y texto
El modelo Phi-4-multimodal cuenta con 5.600 millones de parámetros y se caracteriza por su capacidad para procesar simultáneamente imágenes, audio, gráficos, tablas y documentos dentro de una arquitectura unificada.
🔹 Características principales:
- Procesamiento intermodal avanzado, permitiendo interacciones más naturales y sensibles al contexto.
- Supera a modelos especializados como WhisperV3 y SeamlessM4T-v2-Large en tareas de reconocimiento automático de voz y traducción.
- Baja latencia y alta eficiencia, optimizando la ejecución en dispositivos con menor carga computacional.
- Capacidad de resumen de voz, alcanzando niveles de rendimiento comparables a GPT-4o.
A pesar de su rendimiento sobresaliente, Microsoft reconoce que todavía hay margen de mejora en respuesta a preguntas, en comparación con modelos como Gemini-2.0-Flash.
Phi-4-mini: Modelo compacto y eficiente para tareas basadas en texto
El Phi-4-mini es un modelo más liviano, con 3.800 millones de parámetros, diseñado para ofrecer alta velocidad y eficiencia en tareas de texto.
🔹 Características clave:
- Capacidad de responder consultas agrupadas, con un vocabulario de 200.000 palabras.
- Optimizado para tareas de texto, superando a modelos más grandes en razonamiento, matemáticas, seguimiento de instrucciones y codificación.
- Soporta secuencias de hasta 128.000 tokens, garantizando alta precisión y escalabilidad en aplicaciones avanzadas de IA.
- Integración en interfaces de programación estructuradas, facilitando su implementación en diversas plataformas.
Disponibilidad y acceso
Microsoft ha confirmado que ambos modelos ya están disponibles en Azure AI Foundry, Hugging Face y Nvidia API Catalog, ofreciendo a los desarrolladores una experiencia multimodal completa para potenciar sus proyectos de IA.
Inserta este artículo con este código HTML:
<a href="https://www.redimin.cl/microsoft-phi-4-multimodal-mini-inteligencia-artificial/">Microsoft lanza Phi-4-multimodal y Phi-4-mini: IA avanzada para desarrolladores</a>
¡Descubre la última edición de REDIMIN!
Explora los temas más recientes en minería y tecnología en nuestra nueva edición. Haz clic en el enlace para leerla ahora.
Leer la Última Edición¿Quieres que tu empresa tenga presencia en REDIMIN?
En REDIMIN, conectamos a tu marca con una audiencia especializada en el sector minero y contamos con más de 1 millón de usuarios activos al mes. Genera oportunidades para destacar tu empresa en un mercado clave y aprovecha nuestro alcance para maximizar tu visibilidad.
Ver Opciones de Publicidad