Le SRE ou site reliability engineering est une discipline, largement documentée par Google, visant à implémenter les méthodes du développement logiciel aux problématiques d’infrastructure. Elle correspond à une façon d’implémenter un modèle devOps, basée sur la mesure permanente de tout ce qui est réalisé. Pour résumer, le Head of SRE doit définir une manière de travailler entre équipes infrastructure et développement. Il interagit directement avec l’équipe d’ingénierie logicielle et le CTO pour faire en sorte que tout ce qui est fait soit mesuré, pour permettre une prise d’actions rapides et éclairées sur la qualité de ce qui est produit.
Strategy : en plus des missions propres au manager Tech (people management, etc), le Head of SRE doit définir une méthodologie capable d’établir une balance équilibrée entre temps nécessaire aux développeurs pour produire des fonctionnalités et temps de travail sur la fiabilité du système. Pour y parvenir, il définit une toolkit, notamment en faisant le choix : de l’opérateur cloud à utiliser, des outils de monitoring, d’observabilité et d’infrastructure as code (permet de coder l’interface avec le système fournisseur de cloud computing). Pour être optimale, sa stratégie doit s’aligner à celle de l’entreprise sur l’exploitation de la donnée, l’organisation de ses équipes.
DevOps : le Head of SRE apportera également son expertise sur l’architecture de l’infrastructure technique, pour laquelle il doit établir une vision, et disposer d’une connaissance solide du cloud computing et des services que ces plateformes fournissent, afin de définir une manière de les exploiter avec ses équipes. Là où un Engineering Manager aura plutôt une mission d’organisation et de développement, le SRE apportera son expertise sur l’infrastructure et ses contraintes, pour venir consolider la partie Engineering.
Performance : il devra à la fois contrôler la performance des applicatifs qui tournent sur l’infrastructure, mais aussi la mesure de la reliability (fiabilité de ces applicatifs), qui se mesure à la fois en taux de réponse (latence) et en pourcentage d’erreur, qui sont les deux metrics fondamentales à une équipe SRE.
Aujourd’hui, la méthode SRE s’installe dans de plus en plus de structures, pour gagner en efficacité lors de leur passage sur des plateformes de cloud computing. Ce métier étant récent, il n’a pas encore d’évolution directe, bien que l’on puisse en envisager à l’avenir.
En rapport constant avec les métiers du développement, ses évolutions seront donc quasiment identiques : VP Engineering, CTO. Son background sera différent, mais sa perception sera la même, et il est très fréquent qu’un SRE emprunte cette même direction.
Sur la partie technique, on comptera essentiellement sa maîtrise des outils d’infrastructure. Il devra également être doué d’une forte culture Tech/data et maîtriser les outils d’exploitation cloud. Une excellente compréhension des modèles d’organisation des équipes d’ingénierie logicielle est indispensable.
Côté soft skills, il devra faire preuve de beaucoup de pédagogie pour oraliser un sujet aussi complexe que le cloud computing, et s’associer des compétences communes à tout Manager d’une équipe Tech.
Strategy : en plus des missions propres au manager Tech (people management, etc), le Head of SRE doit définir une méthodologie capable d’établir une balance équilibrée entre temps nécessaire aux développeurs pour produire des fonctionnalités et temps de travail sur la fiabilité du système. Pour y parvenir, il définit une toolkit, notamment en faisant le choix : de l’opérateur cloud à utiliser, des outils de monitoring, d’observabilité et d’infrastructure as code (permet de coder l’interface avec le système fournisseur de cloud computing). Pour être optimale, sa stratégie doit s’aligner à celle de l’entreprise sur l’exploitation de la donnée, l’organisation de ses équipes.
DevOps : le Head of SRE apportera également son expertise sur l’architecture de l’infrastructure technique, pour laquelle il doit établir une vision, et disposer d’une connaissance solide du cloud computing et des services que ces plateformes fournissent, afin de définir une manière de les exploiter avec ses équipes. Là où un Engineering Manager aura plutôt une mission d’organisation et de développement, le SRE apportera son expertise sur l’infrastructure et ses contraintes, pour venir consolider la partie Engineering.
Performance : il devra à la fois contrôler la performance des applicatifs qui tournent sur l’infrastructure, mais aussi la mesure de la reliability (fiabilité de ces applicatifs), qui se mesure à la fois en taux de réponse (latence) et en pourcentage d’erreur, qui sont les deux metrics fondamentales à une équipe SRE.
Aujourd’hui, la méthode SRE s’installe dans de plus en plus de structures, pour gagner en efficacité lors de leur passage sur des plateformes de cloud computing. Ce métier étant récent, il n’a pas encore d’évolution directe, bien que l’on puisse en envisager à l’avenir.
En rapport constant avec les métiers du développement, ses évolutions seront donc quasiment identiques : VP Engineering, CTO. Son background sera différent, mais sa perception sera la même, et il est très fréquent qu’un SRE emprunte cette même direction.
Sur la partie technique, on comptera essentiellement sa maîtrise des outils d’infrastructure. Il devra également être doué d’une forte culture Tech/data et maîtriser les outils d’exploitation cloud. Une excellente compréhension des modèles d’organisation des équipes d’ingénierie logicielle est indispensable.
Côté soft skills, il devra faire preuve de beaucoup de pédagogie pour oraliser un sujet aussi complexe que le cloud computing, et s’associer des compétences communes à tout Manager d’une équipe Tech.