SPRING BATCH & TRAITEMENTS MASSIFS - Exemple 2

Formation Java / Spring Boot – Traitements industriels & batch

Objectifs

comprendre ce qu’est un traitement batch
comprendre la différence entre :
- API REST temps réel
- traitement batch asynchrone
comprendre l’architecture de Spring Batch
manipuler :
- Job
- Step
- ItemReader
- ItemProcessor
- ItemWriter
comprendre la gestion transactionnelle des traitements massifs
gérer :
- erreurs
- reprise sur incident
- gestion de volume
implémenter un batch réaliste sur des fichiers conséquents
tester un batch localement
préparer des traitements industriels type fin de journée bancaire

1) Pourquoi Spring Batch ?

Dans un système bancaire, d’assurance ou de gestion complexe avec de gros fichiers à traiter périodiquement, le Batch est bienvenu pour :

calcul des intérêts nocturnes
clôture de comptes
génération d’écritures comptables
exportation vers des systèmes externes
importation massive de données sous différentes formes

Du coup, ces traitements :

ne sont pas de type REST
ne sont pas interactifs
traitent des milliers voire millions de lignes…

2) API vs Batch – différence clé

On pourrait remplacer Temps réel par Synchrone dans le tableau ci-dessous :

API REST	Batch
Temps réel	Asynchrone
Utilisateur actif	Traitement planifié
Petits volumes	Gros volumes
Réponse immédiate	Traitement long

Spring Boot gère l’API et Spring Batch gère les traitements lourds.

3) Architecture Spring Batch

Un traitement batch est structuré ainsi :

Job
 └── Step
      ├── ItemReader
      ├── ItemProcessor
      └── ItemWriter

3.1 Job

Le Job représente un traitement complet (Calcul intérêts journaliers).

3.2 Step

Le Step est une étape d’un job et peut correspondre à :

une combinaison de lecture + traitement + écriture
ou une tâche simple

3.3 Reader / Processor / Writer

Reader : lit les données (BD, fichier CSV, etc.)
Processor : applique la logique métier
Writer : écrit le résultat (BD, fichier, etc.)

4) Dépendance Maven

<dependency>
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-batch</artifactId>
</dependency>

5) Exemple concret – Calcul d’intérêts journaliers

Cas métier, chaque nuit vous devez :

calculer les intérêts des comptes épargne
mettre à jour le solde

6) Configuration de base

@Configuration
@EnableBatchProcessing
public class BatchConfig {
}

7) ItemReader – lecture en base

@Bean
public JpaPagingItemReader<CompteEpargne> reader(EntityManagerFactory emf) {
    JpaPagingItemReader<CompteEpargne> reader = 
        new JpaPagingItemReader<>();

    reader.setEntityManagerFactory(emf);
    reader.setQueryString("SELECT c FROM CompteEpargne c");
    reader.setPageSize(10);

    return reader;
}

8) ItemProcessor – logique métier

@Bean
public ItemProcessor<CompteEpargne, CompteEpargne> processor() {
    return compte -> {
        BigDecimal taux = new BigDecimal("0.01");
        BigDecimal interet = compte.getSolde().multiply(taux);
        compte.crediter(interet);
        return compte;
    };
}

9) ItemWriter – sauvegarde

@Bean
public JpaItemWriter<CompteEpargne> writer(EntityManagerFactory emf) {
    JpaItemWriter<CompteEpargne> writer = new JpaItemWriter<>();
    writer.setEntityManagerFactory(emf);
    return writer;
}

10) Définition du Step (étape)

Encore le pattern Builder.

@Bean
public Step calculInteretsStep(
        JobRepository jobRepository,
        PlatformTransactionManager transactionManager,
        ItemReader<CompteEpargne> reader,
        ItemProcessor<CompteEpargne, CompteEpargne> processor,
        ItemWriter<CompteEpargne> writer) {

    return new StepBuilder("calculInteretsStep", jobRepository)
        .<CompteEpargne, CompteEpargne>chunk(10, transactionManager)
        .reader(reader)
        .processor(processor)
        .writer(writer)
        .build();
}

11) Définition du Job

@Bean
public Job calculInteretsJob(JobRepository jobRepository, Step calculInteretsStep) {

    return new JobBuilder("calculInteretsJob", jobRepository)
        .start(calculInteretsStep)
        .build();
}

12) Comprendre le chunk

.chunk(10, transactionManager)

Signifie :

traiter 10 éléments seulement
valider transaction
poursuivre…

13) Gestion des erreurs

Vous devez ajouter :

.faultTolerant()
.skip(Exception.class)
.skipLimit(5)

Cela permet de :

ignorer certaines erreurs
continuer le traitement

14) Travaux pratiques

TP 1 – Batch intérêts journaliers

implémenter Reader
implémenter Processor
implémenter Writer
tester sur 100 comptes

TP 2 – Gestion d’erreur contrôlée

Consignes :

provoquer une exception sur un compte spécifique
vérifier que le batch continue

TP 3 – Batch export CSV ou autre

Objectif :

lire comptes en base de données
écrire fichier CSV avec le Writer ci-dessous :

@Bean
public FlatFileItemWriter<Compte> csvWriter() {
    FlatFileItemWriter<Compte> writer = new FlatFileItemWriter<>();
    writer.setResource(new FileSystemResource("comptes.csv"));
    writer.setLineAggregator(compte -> compte.getNumero() + ";" + compte.getSolde());
    return writer;
}

TP 4 – Batch import CSV

Objectif :

lire fichier CSV
insérer en base ou sauvegarder dans un autre format de fichier

Reader CSV ci-dessous :

@Bean
public FlatFileItemReader<CompteDTO> csvReader() {
    FlatFileItemReader<CompteDTO> reader = 
        new FlatFileItemReader<>();
    reader.setResource(new FileSystemResource("input.csv"));
    return reader;
}

15) Gestion transactionnelle avancée

Pour chaque chunk :

Transaction indépendante
Rollback si erreur
Reprise possible

Spring Batch stocke l’état en base :

Tables :

BATCH_JOB_INSTANCE
BATCH_JOB_EXECUTION
BATCH_STEP_EXECUTION

La reprise après crash est possible !

16) Tests des Batch

exécuter via une ligne de commande
vérifier vos logs
vérifier les données en base
simuler un arrêt brutal

17) Erreurs fréquentes

Chunk trop grand
Mauvaise gestion de la mémoire
Logique métier dans Reader
Oublier la gestion d’erreurs
Ne pas tester sur un gros volume de données
Confondre batch et REST
Ignorer les logs
Mauvaise configuration transactionnelle
Ne pas surveiller la erformance
Sous-estimer la complexité en prod

18) État de votre projet

Votre projet est désormais :

REST sécurisé
persistant PostgreSQL-ready
batch-capable
transactionnel
proche d’une application réelle

Synthèse

Vous savez maintenant :

concevoir un traitement batch robuste
structurer Reader/Processor/Writer
gérer les transactions et les erreurs
traiter de gros volumes
préparer un environnement batch

Prochainement

On abordera (optionnel) :

logging avancé
monitoring
Actuator
métriques
gestion des performances
préparation production