Kết nối Notebook với ML Flow.
Giới thiệu
Thực hiện kết nối Notebook với ML Flow sau khi user đã tạo thành công ML Flow để train model và log metrics/params
Notebook trên hệ thống đã có sẵn file demo.ipynb với hướng dẫn:
"Insert the code block from MLflow deployment info below and run before other cells to use it"
Bạn chỉ cần dán đoạn code kết nối vào cell đầu tiên rồi chạy trước tất cả các cell khác.
Các bước thực hiện
- Bước 1 — Lấy đoạn code kết nối từ MLflow deployment
- Vào trang MLflow deployment của bạn trên platform
- Chọn deployment đang chạy → mở tab Info hoặc Connection
- Tìm mục Python Example — đây là đoạn code kết nối sẵn
Lưu ý: URI
svc.cluster.locallà địa chỉ nội bộ — chỉ hoạt động từ bên trong Notebook trên cùng hệ thống. Không dùng được từ máy tính cá nhân bên ngoài.
- Bước 2 — Mở Notebook
Truy cập Notebook của bạn -> mở file demo.ipynb (hoặc tạo notebook mới).
- Bước 3 — Dán code vào cell đầu tiên
Tìm cell đầu tiên có nội dung placeholder:
# Insert here and run
# import mlflow
# mlflow.set_tracking_uri(http://<URL>.com:80)
Xóa toàn bộ nội dung cell đó, rồi dán đoạn code lấy từ Bước 1:
import mlflow
mlflow.set_tracking_uri("<URI>")
- Bước 4 — Chạy cell kết nối TRƯỚC TIÊN
Chọn cell vừa dán → nhấn Shift + Enter (hoặc nhấn nút ▶ trên toolbar).
Kiểm tra kết nối thành công bằng cách thêm dòng xác nhận:
import mlflow
mlflow.set_tracking_uri("<URI>")
# Xác nhận kết nối
print("Tracking URI:", mlflow.get_tracking_uri())
print("Kết nối thành công!")
Output kỳ vọng:
Tracking URI: <URI>
Kết nối thành công!
- Bước 5 — Chạy các cell còn lại bình thường
Sau khi cell kết nối đã chạy xong, tiếp tục chạy các cell bên dưới như bình thường. Tất cả các lệnh mlflow.log_* sẽ tự động ghi vào MLflow server vừa kết nối.
Lỗi thường gặp
| Lỗi | Nguyên nhân | Cách xử lý |
|---|---|---|
ConnectionError / Max retries exceeded | MLflow deployment chưa chạy hoặc URI sai | Kiểm tra deployment đang Running, copy lại URI |
ModuleNotFoundError: mlflow | Thư viện chưa cài | Chạy !pip install mlflow -q trong một cell |
| Metrics không xuất hiện trên MLflow UI | Cell kết nối chưa được chạy trước | Chạy lại cell 1 rồi chạy lại toàn bộ notebook |
Run is already active | Notebook bị restart giữa chừng | Chạy mlflow.end_run() rồi thử lại |