Junior Ml Infrastructure Engineer Comunidad De Madrid
GPU Solutions
Full-time
Informática y tecnología
Location
, comunidad de madrid, spain, comunidad de madrid, Spain
Posted
July 02, 2026
Job Description
Sobre nosotros
En GPU Solutions operamos infraestructura de cómputo de última generación, incluyendo NVIDIA B200, para servir modelos de IA en producción. Somos un equipo pequeño donde cada persona tiene impacto directo sobre el producto y las decisiones técnicas.
El puesto
Buscamos a alguien al inicio de su carrera con ganas de especializarse en inference serving sobre hardware top de gama. Vas a trabajar mano a mano con modelos de lenguaje y visión grandes, desplegándolos, optimizándolos y midiendo su rendimiento sobre B200. No te vamos a pedir que llegues sabiéndolo todo: te vamos a pedir que aprendas veloz y traigas iniciativa.
Qué harás
- Desplegar y servir modelos (LLMs, VLMs, modelos de difusión) usando frameworks como vLLM, TensorRT-LLM, SGLang o Triton Inference Server.
- Optimizar latencia y throughput mediante cuantización (FP8, INT4), batching ágil y paralelismo de tensores.
- Monitorizar GPUs, diagnosticar cue...