Hello,Nous avons viré tes 2 boss. Je te nomme VP IT Operations.Ta mission: Mener à bien le projet Phoenix. C'est notre priorité absolue.Si on échoue, dans 6 mois c'est la faillite.J'ai besoin de quelqu'un de confiance pour faire les bonnes choses au bon moment.— Steve
URGENT: Système de paie crashé.526 employés ne pourront pas être payés.Les syndicats vont nous clouer au piloriRéunion dans 30 minutes. - Le CFO (Dick)
Enquête avec les responsables Ops (Wes - Directeur IT, Patty - Resp. Changements, Brent - Tech Lead Ops)
Entretien avec les métiers : la service comptabilité nous remonte que les heures travaillées dans leur logiciel de paie contiennent des caractères spéciaux. Uniquement cette colonne-là.
On demande ensuite la liste des changements sur le système de paie à La responsable des changements (Patty)
Brouillard total sur ce qui a été fait, il va falloir scruter à la loupe les 37 changements
"Vendredi soir, un dev' de l'équipe du CISO (Chief Information Security Officer) m'a posé une question bizarre sur une structure de table pour l'app timekeeping - je l'ai rembaré parce que je lançais la migration du SAN, mais c'était une histoire d'encodage"
Nous devions traiter des problèmes RGPD depuis des mois. Mais comme personne ne priorise mes demandes sur la sécurité, elles n'ont jamais été traitées. Nous avons le cabinet d'audit qui vient nous contrôler la semaine prochaine. Si nous ne corrigions pas les points remontés, nous nous exposions à de grosses sanctions financières doublé d'une très mauvaise pub
Tester où ? On n'a pas d'environnement de test.
Wes (Directeur Ops): Jamais eu le budget pour le mettre en place.
"Pas incroyable comme performance pour notre premier jour en tant que VP of IT Operations."
"37 changements cette semaine sur le système de paie. Personne ne sait lesquels."
"Si vous ne pouvez pas le voir, vous ne pouvez pas le gérer"
"Pas le temps de tester, pas d'env de dev, ça devait prendre 30 minutes..."
"Si l'IT nous fournit les environnements virtualisés pour nos tests... on livre vendredi."
🎯 Dev : "On a fini!"
Ops : "On ne peut même pas commencer"
"Done means released. You can't call something done until it's delivering value to users in production."
"Améliorer le travail quotidien est encore plus important que de l'effectuer."
"Cessez de dépendre de l'inspection pour atteindre la qualité. Construisez la qualité dans le produit dès le départ."
name: CI/CD Pipeline
on:
push:
branches: [main]
pull_request:
jobs:
build-and-test:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- name:2024-01-15 14:23:45 ERROR PaymentService: Card declined user=123http_requests_total{status="500"} 42memory_usage_bytes 1073741824Request #abc123├─ API Gateway (2ms)├─ Auth Service (15ms)├─ Payment (200ms) ← LENT# prometheus.yml
scrape_configs:
- job_name: 'phoenix-app'
static_configs:
- targets: ['app:8080']
metrics_path: /metrics
# alert-rules.yml
groups:
- name: phoenix
rules:
- alert: HighMemoryUsage
expr: memory_usage_percent > 80
for: 5m
labels:
severity: warning
- alert: HighErrorRate
expr: rate(http_errors_total[5m]) > 0.05
for: 2m
labels:
severity: critical
🚨 ALERT: HighMemoryUsage
Service: payment-service
Current: 85% (threshold: 80%)
Duration: 5 minutes
→ Action: Investigate memory leak
"Il importe peu de ce que vous améliorez, tant que vous améliorez quelque chose." — Mike Rother
"Les déploiements sont dangereux...
→ Déployons moins souvent !"
💡 Révélation (contre-intuitive)
"Les déploiements sont dangereux...
→ Déployons plus souvent !"
"If it hurts, do it more often"→ Vous allez déployer 100× plus souvent !
"Il importe peu de ce que vous améliorez, tant que vous améliorez quelque chose."— Mike Rother