Détection et classification d’éléments dans un document

Description

Dans ce projet, nous avons travaillé avec une organisation européenne de premier plan pour améliorer leurs processus de détection et classification d’éléments textuels et graphiques. Notre mission était de développer une solution pour détecter et classifier automatiquement des textes, des titres et des schémas eux-mêmes.

Business goals

Une loupe se tient devant des documents virtuels dont le contenu est surligné de différentes couleurs.

DATA

  • Des millions de documents contenant des textes dans diverses orientations et formats
  • Schémas et tableaux et illustrations intégrés dans les documents

ENVIRONNEMENT TECHNIQUE​​

  • Google Cloud Platform (GCP) : Hébergement et gestion de l’infrastructure sur le cloud pour le traitement des données.

  • Vertex AI : Utilisé pour le training des modèles, offrant des outils avancés et une intégration efficace avec GCP.

  • Python et Poetry : Python pour le développement, avec Poetry pour la gestion des dépendances.

  • Kubernetes, Triton et FastAPI : Kubernetes pour l’orchestration des conteneurs, Triton Inference Server pour l’optimisation des modèles, et FastAPI pour la création d’APIs rapides.

Algorithm & models

  • Framework de computer vision pour la détection d’objets (Yolo)
  • Modèles de classification pour distinguer les différentes sections des documents