WWDC 2026 : une bonne année pour développer de l'IA on-device

Brouillon rédigé avec l'IA ; recherche, édition et vérification des faits par moi — comment j'écris.

L'année où toute la stack a bougé

La plupart des années, une ou deux choses qui m'intéressent bougent, et le reste reste en place. WWDC 2026 n'a pas été comme ça : les modèles ont bougé, le runtime qui les porte a bougé, la façon dont je les livre a bougé, la couche applicative a bougé, et les outils dans lesquels j'écris tout cela ont bougé — en une seule semaine. Pour quelqu'un dont le produit entier repose sur l'IA on-device sur Apple Silicon, c'est à peu près aussi bon que possible.

Ce qui suit est un tour d'horizon de tout ce que la conférence de cette année change pour ce que je construis, et une explication de la raison pour laquelle, réserves comprises, j'en suis sorti optimiste. Les bêtas sont disponibles maintenant, avec une disponibilité générale cet automne.

Les modèles ont gagné en maturité

Le framework Foundation Models a reçu cette année le plus grand ensemble de changements, et la plupart vont dans le même sens : plus de choix, moins de plomberie.

Il existe maintenant un protocole public, si bien qu'une seule LanguageModelSession peut être adossée au modèle on-device, au modèle plus grand d'Apple sur Private Cloud Compute, à un modèle MLX téléchargé, ou — via les packages Swift d'Anthropic et Google — à Claude et Gemini. Le modèle on-device accepte désormais les images en entrée, et le framework embarque des outils intégrés que le modèle peut appeler : OCR, un lecteur de codes-barres et un outil de recherche appuyé sur Spotlight pour de la recherche entièrement locale.

Le changement auquel je reviens sans cesse, c'est que Private Cloud Compute est maintenant disponible pour les développeurs — sans API key à stocker, et gratuit dans certaines limites pour les plus petits développeurs. Pendant deux ans, mon modèle mental était strictement binaire : soit un petit modèle sur l'appareil de l'utilisateur, soit mon propre service cloud, avec les clés et la facture qui vont avec. Un palier intermédiaire, respectueux de la confidentialité, que je n'ai pas à construire moi-même est franchement bienvenu, à condition que je dise clairement dans l'interface ce qui s'exécute où.

Un runtime plus rapide et plus accessible

Sous tout cela se trouve MLX, le runtime avec lequel je livre réellement un modèle 3B. Il est devenu plus rapide cette année : prise en charge de Metal 4, GPU Neural Accelerators, et entraînement qui s'étend sur plusieurs Mac via Thunderbolt. Un runtime de production qui devient plus rapide sans aucun travail de ma part est une amélioration que j'accepte volontiers.

La portée plus large est la partie la plus intéressante. MLXLanguageModel connecte tout le catalogue mlx-community sur Hugging Face — des milliers de modèles pré-quantifiés — à cette même API de session. Prototyper un nouveau modèle signifiait autrefois câbler un runtime ; aujourd'hui, cela revient presque à changer une chaîne de caractères, ce qui est un vrai raccourci pour les parties du travail qui sont purement expérimentales.

Mesurer ce que j'estimais à la main

Dans mes notes de terrain sur le runtime, j'ai admis deux habitudes un peu embarrassantes : compter les tokens à la main à travers le chat template, et ne jamais avoir déterminé un temps de traitement exact. La version de cette année corrige discrètement les deux. Le framework expose contextSize et tokenCount(for:), et les réponses transportent maintenant une valeur usage — avec le nombre de tokens d'entrée servis depuis le cache et le nombre de tokens de sortie dépensés en raisonnement. C'est précisément la mesure que j'approximais dans des lignes de log.

Il y a aussi un nouveau framework Swift Evaluations pour quantifier la qualité d'une fonctionnalité et détecter les régressions lorsque les prompts changent. C'est l'annonce qui m'a le plus marqué. J'avais déjà construit pour le pipeline de Narration Room un banc de tuning inspiré de DSPy : des fixtures de référence qui associent l'entrée de chaque étape à une sortie attendue et à des seuils, chaque étape évaluée et exécutée plusieurs fois pour observer la variance d'une exécution à l'autre, puis une étape de comparaison qui signale quand un changement de prompt dégrade discrètement une métrique. Le framework d'Apple couvre la partie « mesure » de cette même idée, fournie maintenant en natif. Le mien va un cran plus loin et optimise aussi — un modèle enseignant propose des réécritures de prompt et ne garde que celles qui obtiennent un meilleur score — ce qu'Apple n'a pas livré, donc je ne vais pas l'abandonner. Mais voir un framework Apple arriver exactement à la forme que j'avais fait tourner dans un projet annexe est rassurant ; cela suggère que j'étais sur une piste raisonnable, et pas seulement en train de satisfaire une préférence personnelle. C'est la partie de cette version que j'ai le plus hâte d'adopter.

Une livraison plus intelligente

Livrer un modèle de plusieurs gigaoctets est un problème à part entière, comme je l'ai décrit en détail dans un article précédent. Cette année, iOS 27 ajoute des asset packs localisés à Managed Background Assets, afin qu'un utilisateur ne télécharge que ce que sa langue exige, plutôt que l'ensemble du téléchargement. Mes propres modèles ne sont pas indexés par langue, donc ce n'est pas parfaitement adapté à mon cas, mais des téléchargements plus petits et plus sélectifs sont exactement l'axe auquel je réfléchissais, et je suis content de voir Apple avancer dans cette direction.

Une couche applicative plus agréable

C'est la collection de petites améliorations qui s'accumulent. Dans SwiftData, @Attribute(.codable) est un moyen validé de persister un type valeur Codable sans le promouvoir au rang d'entité — exactement l'échappatoire que je voulais pour stocker une valeur structurée à côté de sa ligne.

SwiftUI a gagné plusieurs améliorations de confort : des raffinements Liquid Glass que vos vues adoptent automatiquement sans code supplémentaire, un modificateur reorderable() pour le drag-to-reorder, AsyncImage avec cache intégré, et un contrôle plus fin des barres d'outils quand l'interface change de taille. Aucun de ces éléments ne fait un titre à lui seul, mais ensemble ils suppriment une série de petits agacements — ce qui compte beaucoup dans une année de travail applicatif qui se sent plus légère.

Un vrai chemin vers la découvrabilité

C'est un point que je vais suivre avec attention. App Intents a gagné des App Schemas et Entity Schemas, qui permettent à une app de contribuer son propre contenu à l'index sémantique de Spotlight et d'exposer des actions en langage naturel à Siri et Apple Intelligence. Pour une app dont tout l'objet est le contenu créé par l'utilisateur, un moyen pris en charge de rendre ce contenu recherchable et actionnable depuis l'extérieur de l'app est exactement le genre de capacité que je suis content de voir arriver sur la plateforme. Je ne promets rien ici ; je note simplement que le chemin est maintenant documenté.

Les outils m'ont rejoint là où je travaille

Xcode 27 est l'endroit où j'en attendais peu et où j'ai été agréablement surpris. Le changement le plus important pour ma façon de travailler est que les coding agents vivent maintenant dans l'éditeur. La conversation se trouve dans un panneau d'éditeur à côté de votre code, une commande /plan rassemble le contexte avant tout changement, et l'agent peut lancer des sous-agents pour explorer en parallèle. Je travaille déjà avec des coding agents tous les jours, donc voir Xcode me rejoindre là où je travaille, plutôt que dans une fenêtre séparée, est une vraie amélioration.

Deux autres changements parlent directement à mon workflow. La localisation a maintenant un agent qui lit votre code et met en place un String Catalog, avec un bouton Generate Translations qui s'appuie sur le contexte du projet et sur des consignes de style par langue. Je livre en anglais, français et allemand, donc je l'accueille volontiers — même si, pour tout ce qui est publié, je continuerai à finir les traductions à la main, parce que le ton sur trois langues reste une affaire de jugement humain. L'Organizer repensé ajoute aussi une métrique de stockage qui détaille l'espace occupé par une app et ses données sur l'appareil. Quand une app télécharge des gigaoctets de poids de modèle, savoir précisément où part cet espace est loin d'être un luxe.

Dictée et voix

La dictée et les voix ont reçu une vraie attention cette année. iOS 27 introduit une expérience de dictée système plus intelligente intégrée au clavier — qui gère la ponctuation, les majuscules et les corrections pendant que vous parlez — et la voix de Siri est devenue plus naturelle, avec un débit et une expressivité réglables. La limite, c'est le matériel : la dictée plus capable et les voix expressives tournent sur un modèle on-device plus grand qui nécessite un appareil récent avec environ 12 Go de mémoire unifiée, elles sont donc limitées aux iPhone, iPad et Mac les plus récents.

Pour un développeur qui construit sur les technologies vocales, le tableau est plus mesuré. Ce sont des fonctionnalités système et grand public — un meilleur clavier, une voix de Siri plus naturelle — plutôt qu'un nouveau framework Speech à appeler directement. La session développeur la plus proche du sujet vocal cette année portait sur les sous-titres générés, qui s'appuient sur la même transcription on-device plutôt que d'introduire une nouvelle API. La base de ma propre transcription reste le SpeechAnalyzer de l'an dernier, et je continue à livrer ma propre synthèse plutôt que les voix système. C'était donc une année substantielle pour la voix côté utilisateur, et plus stable côté développeur.

Ce que tout cela donne

Avec un peu de recul, le thème est difficile à manquer : la plateforme s'est rapprochée du type d'application que je construis déjà — on-device d'abord, flexible sur les modèles, attentive à la confidentialité, avec le runtime, la livraison et les outils qui avancent ensemble. Une bonne partie de l'infrastructure que j'avais montée à la main a maintenant un équivalent officiel, et ce n'est pas une mauvaise nouvelle. C'est la chose la plus utile qu'une plateforme puisse faire : vous enlever le travail fastidieux pour que vous puissiez passer l'année sur les parties qui vous appartiennent vraiment.

C'est pour cela que je suis sorti de cette année franchement optimiste. Il reste beaucoup à livrer, et je croirai au niveau de finition final quand je l'aurai sous les doigts sur de vrais appareils. Mais comme point de départ pour l'année de construction qui vient, je le prends volontiers.

La suite

Si ce genre de notes de terrain vous est utile, la newsletter est le meilleur moyen de ne pas manquer la suivante.