DevOps - Start-Up Spécialisée en Deep Learning - Fullremote H/F
Octopus It
full-remotemidpermanentdevopsbackend Anywhere in the World 28 days ago via WWR
See how well this job matches your profile
Sign up to get an AI match score and generate a tailored application in seconds.
Get your match scoreTags
DevOpsMLOpsKubernetesKubeflowCI/CDTerraformArgoCDMonitoringAWSGCP
About the role
Poste
DevOps / MLOps (2e DevOps/MLOps) — start-up deep learning, full-remote.
Missions / Responsabilités
- Créer, maintenir et mettre à jour l’infrastructure cloud.
- Mettre en place et faire évoluer des processus CI/CD automatisés pour permettre des itérations rapides et un déploiement continu des modèles.
- Déployer et améliorer des systèmes complets de monitoring, analyse et alerting.
- Collaborer avec l’équipe Data Science pour comprendre les workloads ML (poids des modèles/artefacts, prédictions, masques, images, etc.) et adapter/créer les outils nécessaires.
- Former et soutenir l’équipe technique sur le cloud et les pratiques DevOps/MLOps.
- Assurer une veille technologique et expérimenter des outils de production, en particulier pour les spécificités ML/Deep Learning/Vision.
- Être capable de réagir en cas d’incident (y compris potentiellement on-call en période d’été) et de mener des investigations rapides.
Exigences
- Au moins 2 ans d’expérience en tant que DevOps / SRE / MLOps ou similaire.
- Expérience Kubernetes.
- Expérience avec AWS ou GCP.
- Expérience avec une chaîne CI/CD.
- Python.
- Docker.
Stack (actuelle)
- Kubernetes, Kubeflow, Helm, Terraform, ArgoCD, Argo Workflows
- Prometheus, Grafana, Datadog
- Node.js, Python, Flask
- Pub/Sub, FileStore, S3, GCS (gs)
- PostgreSQL, GitHub, Slack
About Octopus It
Octopus IT est une start-up créée en 2018 qui développe une plateforme de deep learning pour fournir des services de prédiction à grande échelle dans l’agriculture. Ses clients utilisent une application mobile pour diagnostiquer leurs cultures à partir d’images, tandis que la plateforme s’appuie notamment sur Kubernetes et Kubeflow pour industrialiser et déployer des modèles ML en continu.
Scraped 4/1/2026