# LLM Latency Benchmark Report

**Generated**: 2026-01-27 05:35:08

## Summary

| Model | TTFT (median) | Total (median) | Tokens/sec | Success |
|-------|---------------|----------------|------------|---------|
| anthropic/claude-haiku-4-5-20251001 | 523ms | 3420ms | 103.6 | 100% |

## Detailed Results

### anthropic/claude-haiku-4-5-20251001

**TTFT (Time to First Token)**
- Min: 433ms
- Max: 614ms
- Mean: 523ms
- Median: 523ms
- Stdev: 128ms

**Total Response Time**
- Min: 3370ms
- Max: 3469ms
- Mean: 3420ms
- Median: 3420ms
- Stdev: 70ms

**Individual Runs**

- Run 1: TTFT=614ms, Total=3469ms, Tokens=300, 105.1 tok/s
- Run 2: TTFT=433ms, Total=3370ms, Tokens=300, 102.1 tok/s

## Configuration

- **Prompt**: "Explain how a CPU cache works in 3 paragraphs."
- **Max Tokens**: 300
- **Timeout**: 60s