Retour au blog

Arrêtez de dimensionner vos serveurs dans un tableur

Vous n’avez pas sur-provisionné parce que vous êtes nul en planification de capacité. Vous avez sur-provisionné parce que la tarification vous punit quand vous vous trompez, et que la seule erreur pas chère, c’est de voir trop grand.

Réfléchissez aux incitations. Voyez trop petit, et votre service s’écroule à 2 h du matin, votre pager hurle, et redimensionner veut dire un arrêt, un reboot et une fenêtre d’indisponibilité qu’il faut planifier. Voyez trop grand, et vous payez un peu plus à chaque heure, pour toujours, et personne ne le remarque. Une erreur vous réveille la nuit. L’autre n’apparaît que comme une erreur d’arrondi sur une facture que personne ne lit ligne par ligne. Alors tout le monde arrondit à la hausse. Les 30 % de marge sur chaque machine, ce n’est pas de la fainéantise — c’est la réponse rationnelle à une douleur asymétrique.

Le labyrinthe du catalogue

Et puis il y a le catalogue. Vous ne choisissez pas le CPU et la RAM. Vous choisissez une forme : une lettre, un chiffre, un suffixe de génération qui encode un rapport mémoire/cœurs que vous devez deviner par rétro-ingénierie à partir d’une grille tarifaire. Il vous faut 6 cœurs et 40 Go. Le 6-et-40 n’existe pas. Il y a une machine 8 cœurs / 32 Go et une machine 8 cœurs / 64 Go, alors vous prenez celle de 64 et vous payez des cœurs dont vous n’avez pas besoin, ou bien vous prenez une famille optimisée mémoire et vous payez plus cher les cœurs dont vous avez bel et bien besoin.

Le catalogue existe pour faire passer un problème continu — « combien de compute je veux » — pour un menu. Les menus sont plus faciles à tarifer et plus durs à optimiser. C’est tout l’intérêt. Chaque forme que vous ne pouvez pas obtenir est une forme qui vous pousse vers la suivante, qui coûte plus cher.

La facturation à l’heure récompense l’arrondi vers le haut

La facturation à l’heure achève le travail. Une machine qui tourne 70 minutes est facturée deux heures. Un job batch qui prend 12 minutes est facturé une heure. Du coup, vous arrêtez d’allumer et d’éteindre des machines, parce que la granularité rend le travail éphémère hors de prix. Vous laissez la machine tourner. Vous gardez la marge. L’incrément de facturation vous conditionne discrètement à traiter le compute jetable comme du permanent.

Et puis l’autoscaling, pour réparer ce que la tarification a cassé

L’autoscaling est vendu comme la solution, mais regardez ce que c’est vraiment : une boucle de contrôle que vous devez désormais piloter pour esquiver un modèle de tarification. Vous écrivez des politiques de scaling. Vous réglez les cooldowns pour éviter le yo-yo. Vous modélisez le temps de chauffe pour que les nouvelles instances soient prêtes avant l’arrivée de la charge, ce qui veut dire que vous pré-provisionnez pour scaler, c’est-à-dire l’arrondi vers le haut déguisé. Vous ajoutez un load balancer, des health checks et un dashboard pour surveiller l’autoscaler que vous avez construit pour surveiller la charge. La taxe de complexité est bien réelle, et vous la payez en heures d’ingénierie pour récupérer l’argent que la tarification vous a pris au départ.

Ce que nous avons fait à la place

On pense que tout ça disparaît en grande partie si la tarification arrête de punir la justesse. Alors Kaligon Cloud facture à la seconde, et le compteur à la seconde est plafonné au mois — après environ 730 heures, le compteur s’arrête, donc une machine que vous laissez tourner se stabilise tout simplement à un tarif mensuel fixe. Un job de 12 minutes coûte 12 minutes. Pas d’arrondi à deux heures, aucune raison de laisser des choses allumées.

Il n’y a pas de catalogue d’instances. Vous fixez les cœurs et la RAM où vous voulez — de 1 à 96 vCPU, de 1 à 512 Go — et vous pouvez redimensionner à chaud une machine en marche au lieu de deviner à la création et de vivre avec. Bougez les curseurs dans le configurateur de tarifs et l’estimation se met à jour au fil de l’eau, pour que vous dimensionniez face à un vrai chiffre, et non à un tableur que vous reconstruisez chaque trimestre.

Un tarif fixe par ressource. Pas de paliers réservés, pas d’enchères spot, pas de remises pour engagement à prévoir trois ans à l’avance. Le but n’est pas d’être malin sur les coûts — c’est de faire en sorte que l’estimation honnête soit la moins chère. Provisionnez ce dont vous avez besoin, redimensionnez quand vous vous êtes trompé, et payez ce que vous avez consommé plutôt que ce que vous aviez peur d’avoir à consommer.

Vous pouvez supprimer le tableur de dimensionnement. De toute façon, on n’allait jamais le lire.