Inférence IA : phase clé où un modèle répond en temps réel aux données nouvelles ; enjeux, coûts et performances redessinent ...
Quand il est question d’IA générative et de grands modèles de langage, difficile de ne pas évoquer Nvidia. Le concepteur fabless d’accélérateurs de calcul est devenu la coqueluche des marchés ...
Evoquer l'intelligence artificielle revient souvent à porter l'attention sur l'entraînement d'énormes modèles de deep learning, mobilisant des milliers de GPU pendant plusieurs semaines. Pourtant, la ...
Swami Sivasubramanian, VP AI et Ddta d'AWS, annonce l'arrivée de nouvelles fonctionnalités pour entraîner et inférer plus facilement les modèles d'IA générative tout en réduisant (encore) les coûts.
À l’occasion du Red Hat Summit 2025, l’éditeur open source met en avant son Red Hat AI Inference Server, de nouveaux modèles validés par des tiers, et l’intégration des API Llama Stack (Meta) et MCP ...
En douze ans d’existence, Clarifai a bâti une plateforme consacrée à la préparation de données, à l’entraînement et à l’inférence de modèles d’IA. Plus particulièrement, l’entreprise a rapidement été ...
Red Hat, Inc. a annoncé Red Hat AI Inference Server, une étape importante vers la démocratisation de l'IA générative (gen AI) dans le cloud hybride. Nouvelle offre de Red Hat AI, ce serveur ...
La plupart des modèles d'IA étant entraînés et déployés, les GPUs sont-ils encore au goût du jour pour faire face à la prochaine évolution de l'intelligence artificielle: l'inférence. Il ne fait aucun ...
Le fabricant d'ordinateurs d'IA affirme que son service d'inférence est beaucoup plus rapide et qu'il rend possible de nouveaux types d'IA « agentique ». Le marché des prédictions issues de ...
Selon un communiqué de presse de l’entreprise, la plateforme Rubin prétend réduire les coûts d’inférence par token jusqu’à 10 fois et nécessite 4 fois moins de GPU pour entraîner des modèles de type ...
En réalité, le paysage est plus complexe : il faut souvent arbitrer différentes offres de cloud spécialisé en IA, des solutions de cloud souverain, des infrastructures hybrides, etc. Le deuxième ...