Phase 0 · Chapter 0.02

AI Lifecycle Overview

একটি ML model শুধু train হয় না — সেটার একটা পুরো জীবনচক্র থাকে। এই chapter সেই 8 ধাপের সম্পূর্ণ map।

Hook · গল্প

একটি model-এর জন্মদিন থেকে অবসর

ভাবুন একটি model হলো একজন employee। তাকে hire করতে হয় (problem framing), train করতে হয় (training), performance review হয় (evaluation), promotion হয় (deployment), এবং একদিন retire-ও হয় (replaced by new version)। MLOps মূলত এই সম্পূর্ণ HR system — কিন্তু মডেলের জন্য।

Concept

AI Lifecycle কি?

AI lifecycle হলো একটি repeatable loop যেখানে data → model → service → feedback → আবার data — এই চক্র চলতেই থাকে। Traditional software-এ deploy করলেই শেষ, কিন্তু ML-এ deploy করার পর থেকেই আসল কাজ শুরু হয়।

Step-by-step

8 Stage Lifecycle

1Problem Framing

Business সমস্যাকে ML সমস্যায় রূপ দেওয়া — classification, regression, ranking ইত্যাদি।

2Data Collection

Source identify, ingestion pipeline এবং versioning (DVC, LakeFS)।

3Data Preparation

Cleaning, feature engineering, train/val/test split, schema validation।

4Model Training

Experiment tracking (MLflow, W&B), hyperparameter search।

5Evaluation

Offline metrics, business metric mapping, fairness check।

6Packaging & Registry

Pickle / ONNX, model registry-তে version tag।

7Deployment

FastAPI + Docker + Kubernetes বা serverless serving।

8Monitoring & Retraining

Drift, latency, accuracy track — trigger হলে retrain।

Intuition

Loop, না Line

অনেকেই lifecycle-কে straight line ভাবে — train → deploy → শেষ। বাস্তবে এটা একটি loop। প্রতিটি deployment থেকে নতুন data আসে, সেই data থেকে drift detect হয়, drift থেকে retraining trigger হয়, এবং আবার নতুন version deploy হয়।

Continuous Loop

Data → Train → Evaluate → Deploy → Monitor → Drift → Retrain → Deploy → …

Real-world

Industry তে কেমন দেখায়

Airbnb Bighead — সম্পূর্ণ lifecycle automate, prototype থেকে production এক click।
Meta FBLearner — daily হাজারো model retrain হয় এই platform-এ।
Google TFX — open-source end-to-end lifecycle framework।

Code · Bangla ব্যাখ্যাসহ

Mini lifecycle script

একটি ছোট script যেখানে আমরা data load → train → evaluate → save — চারটি ধাপ একসাথে।

pythonproduction

# lifecycle.py
import joblib, json
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 1. Data
X, y = load_iris(return_X_y=True)
Xtr, Xte, ytr, yte = train_test_split(X, y, test_size=0.2, random_state=42)

# 2. Train
model = RandomForestClassifier(n_estimators=100).fit(Xtr, ytr)

# 3. Evaluate
acc = accuracy_score(yte, model.predict(Xte))
print(f"Accuracy: {acc:.3f}")

# 4. Package
joblib.dump(model, "model.joblib")
with open("metrics.json", "w") as f:
    json.dump({"accuracy": acc}, f)

ব্যাখ্যা: এই script-এ একটি mini-lifecycle implement করা হয়েছে — data, train, evaluate, package। Production system-এ এই প্রতিটা step আলাদা service হিসেবে চলে এবং orchestrator (Airflow, Kubeflow) তাদের connect করে।

Common Mistakes

সচরাচর ভুল

Lifecycle-কে one-time project ভাবা — আসলে এটা continuous।
Evaluation metrics business metric-এর সাথে align না করা।
Data versioning skip করা — পরে কোন data থেকে এই মডেল এসেছিল বোঝা যায় না।
Monitoring stage সম্পূর্ণ skip করা।

Practice Tasks

অনুশীলন

উপরের lifecycle.py চালান এবং metrics.json দেখুন।
n_estimators পরিবর্তন করে দেখুন accuracy কেমন বদলায় — এটাই experiment tracking-এর basis।
প্রতিটি lifecycle stage-এর জন্য একটি আলাদা folder বানিয়ে কোড organize করুন।

Mini Project

Mini Project — Lifecycle Logger

একটি Python script লিখুন যা প্রতিটি lifecycle stage execute করার সময় timestamp ও duration log করবে একটি lifecycle.log file-এ। এটাই future-এ MLflow tracking-এর foundation।

Summary

এই chapter থেকে যা শিখলাম

AI lifecycle 8টি stage — সবগুলো interconnected।
এটা loop, line না — continuous improvement-ই core।
প্রতিটি stage আলাদা tool ও responsibility-এর জায়গা।

← Roadmap-এ ফিরুন পরবর্তী: Chapter 0-03 — Python for AI Systems