ML Training Management - Summit Health

Training Pipeline

Data Extraction

Initializing...

Data Selection

Select Batches

Training Config

Configure Parameters

Teraq Sync

Synchronize Data

Training

Model Training

ML Model Performance Evaluation

MedHELM LLM-Jury Evaluation

Deployment

Model Ready

Available Batches

Selected Batches

Total Documents

Active Training Jobs

Data Selection

Training Configuration

Training Process Control

Stored Models

Training Jobs

Model Evaluation

Fact Extraction

Model Results

Billing & API

Quantum ML Training

Select Datasets for Training

Select datasets and batches from batch review to use for model training. Data will be synchronized with Teraq.

Public Medical Datasets

MIMIC-III

Medical Information Mart for Intensive Care III

Click to select

MIMIC-IV

Medical Information Mart for Intensive Care IV

Click to select

Your Batch Review Data

Loading available batches...

Training Configuration

Model Name Enter a name for your trained model

Base Model Select base model for training

Training Type Classical training uses LoRA/QLoRA for efficiency

Instance Type Select the compute instance for training

Compression Ratio Model size reduction (2x-5x)

Epochs

Selected Batches

No batches selected. Go to Data Selection tab to select batches.

Start TensorBoard for visualization TensorBoard will show real-time training metrics, loss curves, and more. Available for all instance types.

Training Process Control

TinyLlama-1.1B Medical Pre-training with Nemotron 49B medical data extraction

Phase 1 - Causal Language Modeling (CLM)

Checking status...

Loading training process information...

Current Step

of 5,000

Progress

Completion

Training Loss

Latest Value

Time per Step

Average

Estimated Time

Remaining

Memory Usage

RAM Used

CPU Usage

Utilization

Runtime

Since Start

Instance & Resource Monitoring

Active Training Processes

Loading active processes...

System Resources - Summit Backend

CPU Usage

System-wide

Memory Usage

RAM

Disk Usage

Storage

Running Processes

Training Jobs

📊 Overall Training Progress 0%

Datasets: MIMIC-III + MIMIC-IV (Combined)

Model Configuration

Model: TinyLlama-1.1B-Chat-v1.0

Base Model: TinyLlama/TinyLlama-1.1B-Chat-v1.0

Parameters: 1.10B

Batch Size: 32

Sequence Length: 256 tokens

Dataset: MIMIC-III (59,569 docs)

Training Details

Start Time: --

Last Update: --

Checkpoints: 0

Output Directory: /home/ec2-user/Training_Data/models/tinyllama-1b-medical-phase1

Teraq.ai Synchronization

Status: Not synced

Active Jobs: 0

Last Sync: --

Model Reduction: --

📺 Training Terminal Output

Loading terminal output...

Log file: -- Lines: -- | Size: --

📊 TensorBoard Visualization

Real-time training metrics, loss curves, and performance visualization

Checking TensorBoard status...

Loading TensorBoard information...

Stored Training Models

Overview of all trained models with metadata from database.

Loading stored models...

Active Training Jobs

Monitor training jobs synchronized with Teraq platform.

Job ID	Model Name	Status	Progress	Started	Duration	Actions
Loading training jobs...

ML Model Performance Evaluation

Evaluate trained models using MedHELM LLM-jury evaluation protocol. Based on MedHELM: Holistic Evaluation of Large Language Models for Medical Tasks (Bedi et al., 2025).

Select Model for Evaluation

Evaluation Metrics (MedHELM LLM-Jury)

Based on MedHELM (Bedi et al., 2025) - arXiv:2505.23802. Uses LLM-jury evaluation with three criteria. Final score is the mean of all three metrics (equal weighting).

Accuracy (33.3%)

Factual correctness and adherence to medical guidelines

Completeness (33.3%)

Thoroughness in addressing all aspects of the query

Clarity (33.3%)

Organization, readability, and easy to understand language

Run Evaluation

Evaluation Dataset

Custom Dataset Path (if custom selected)

Enhanced Fact Extraction

Extract medical facts from clinical notes using enhanced rule-based extraction with optional AWS Comprehend Medical and John Snow Labs integration. Supports 500+ medications, enhanced negation detection, and multi-source extraction.

Extraction Method

Rule-Based (Enhanced)

500+ medications, 20+ negation patterns. Free, fast, 85% precision.

AWS Comprehend Medical

Cloud-based, 92% precision. Requires AWS credentials.

John Snow Labs

State-of-the-art, 95% precision. Requires license.

Clinical Note Input

Clinical Note Text

📊 Create FactEHR Dataset from PhysioNet

Generate FactEHR-style datasets from PhysioNet clinical notes. Select a dataset source and extraction method.

Dataset Source

Sample Size

Note Types

Discharge Summary Progress Note Nursing/Other

✨ Enhanced Features

📚 500+ Medications

Comprehensive drug dictionary covering all major medication categories

🚫 Enhanced Negation

20+ negation patterns to filter out negated conditions and medications

☁️ AWS Integration

Optional AWS Comprehend Medical for cloud-based high-quality extraction

🔬 John Snow Labs

Optional state-of-the-art medical NLP with 95% precision

Model Training Results

View metrics and performance of trained models.

Select a completed training job to view results.

💰 Billing & API Documentation

Complete API documentation for external parties to integrate with Summit Health ML Training API, including billing and cost allocation.

📚 Quick Links

📖 Full API Documentation

Complete HTML documentation with all endpoints, examples, and billing information

🔑 Authentication

API Key or OAuth 2.0 required for all requests

💰 Billing

Automatic cost allocation to user_id and billing_account

🚀 Quick Start

Base URL: https://your-backend-server.com

API Version: v1

Content-Type: application/json

📋 Key Endpoints

POST /api/training/start

Start a new training job with billing allocation

Parameters: instance_type, datasets, user_id, billing_account

GET /api/training/process-status

Check training job status and progress

Parameters: job_id

GET /api/training/cost-tracking/user-costs

Get cost breakdown for user or billing account

Parameters: user_id, billing_account, start_date, end_date

💰 Pricing Structure

Resource Type	Pricing	Description
Classical CPU	$5.00/hour	Standard CPU training instances
48 vCPU	$7.50/hour	High-performance 48-core instances (3x faster)
Trainium	$15.00/hour	AWS Trainium instances for accelerated training
Base Cost	$10.00/job	One-time setup cost per training job
Storage	$0.10/GB/month	Model storage cost

💻 Code Example

import requests

API_BASE_URL = "https://your-backend-server.com"
API_KEY = "YOUR_API_KEY"

# Start training with billing allocation
response = requests.post(
    f"{API_BASE_URL}/api/training/start",
    params={
        "instance_type": "48vcpu",
        "datasets": "MIMICIII,MIMIC4"
    },
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    },
    json={
        "user_id": "external_user_123",
        "billing_account": "account_abc"
    }
)

result = response.json()
job_id = result["job_id"]
print(f"Training started: {job_id}")

💡 Note: All costs are automatically tracked and allocated to the provided user_id and billing_account. You can query costs at any time using the billing endpoints.

📞 Support

For API access, billing questions, or technical support:

Email: api-support@summithealth.ai
Documentation: View Full Documentation

⚛️ Quantum ML Training

Advanced quantum-enhanced machine learning solutions for clinical data analysis and survival prediction.

⚛️ Quantum LLM Training

Leverage quantum computing principles to enhance LLM training with improved efficiency and performance.

View Details →

🏥 CIBMTR Quantum Survival Analytics

Enhanced QBoost for rare disease survival prediction with validated clinical impact.

View Details →

Summit Health

Quick Stats

Training Pipeline

Data Extraction

Data Selection

Training Config

Teraq Sync

Training

ML Model Performance Evaluation

Deployment

Available Batches

Selected Batches

Total Documents

Active Training Jobs

Select Datasets for Training

Public Medical Datasets

MIMIC-III

MIMIC-IV

Your Batch Review Data

Training Configuration

Training Process Control

TinyLlama-1.1B Medical Pre-training with Nemotron 49B medical data extraction

Instance & Resource Monitoring

Active Training Processes

System Resources - Summit Backend

Model Configuration

Training Details

Teraq.ai Synchronization

📺 Training Terminal Output

📊 Training Progress Visualization

📊 TensorBoard Visualization

TensorBoard Dashboard

Stored Training Models

Active Training Jobs

ML Model Performance Evaluation

Select Model for Evaluation

Evaluation Metrics (MedHELM LLM-Jury)

Accuracy (33.3%)

Completeness (33.3%)

Clarity (33.3%)

Run Evaluation

Evaluation Status

Evaluation Results

Enhanced Fact Extraction

Extraction Method

Clinical Note Input

Extraction Status

Extracted Facts

📊 Create FactEHR Dataset from PhysioNet

✨ Enhanced Features

📚 500+ Medications

🚫 Enhanced Negation

☁️ AWS Integration

🔬 John Snow Labs

Model Training Results

💰 Billing & API Documentation

📚 Quick Links

🚀 Quick Start

📋 Key Endpoints

💰 Pricing Structure

💻 Code Example

📞 Support

⚛️ Quantum ML Training

⚛️ Quantum LLM Training

🏥 CIBMTR Quantum Survival Analytics