Good morning, Ravi

Monday, March 13, 2026 · Singapore · Trust Lab daily briefing

Eval engine healthy · 47 workers

Artifacts

312

+14 this month

Active evals

suites · 18 projects

Open findings

4 crit · 7 high · 12 med

Certifications

128

5 awaiting · 12 expiring 30d

Datasets

187

4.2M test cases

Red-team campaigns

running now

Compliance

89%

EU AI Act · FREE-AI 82% · ISO 42001 94%

Spend (MTD)

$84,321

judge-LLM + RT compute

Needs attention

Red-team campaign
Pre-deployment audit — claims-copilot-v3
12 min
8,400 / 12,500 probes67%
Eval run
Quarterly regression — mortgage-disclosure-generator
18 min
judge: gpt-4o-mini34%
Eval run
Hindi quality regression sweep
4 min
Sarvam-1 · 3,200 cases82%
Agent simulation
claims-investigation-agent — 200-scenario behavioral test
2 min
tool-use coverage91%
Auto red-team
Continuous adversarial monitoring — kyc-document-verifier
indefinite
last finding 23m agolive
Vendor assessment
anthropic.claude-3-7-sonnet — pre-approval
awaiting eval
blocked on benchmark suite45%

Faithfulness eval — claims-copilot-v3 v18
passed (94.2%)
4h ago
Red-team — wealth-portfolio-explainer
2 high-severity findings
6h ago
Bias sweep — loan-eligibility-assistant
passed across all protected segments
8h ago
Indic quality eval — hindi-customer-voice
passed (Hindi 92.1% · Hinglish 88.4%)
12h ago
Agent simulation — fraud-investigation-copilot
3 scenarios failed
1d ago
Toxicity sweep — branch-ops-knowledge
passed (0.04% trigger rate)
1d ago
RAG groundedness — internal-policy-qa
passed (97.8%)
2d ago
Red-team — card-dispute-classifier
1 medium finding
2d ago
Cost regression — treasury-news-summarizer
−14% per call
3d ago
Latency sweep — pension-guidance-bot
p95 1.2s, within SLO
3d ago
PII detection — compliance-research-assistant
passed
4d ago

AK
Anjali Krishnan published red-team campaign template OWASP LLM Top 10 v2026 — Indic
12m ago
VS
Vikram Shetty submitted certification request claims-copilot-v3 v18
34m ago
AI
Automated auto red-team discovered 1 medium finding kyc-document-verifier
41m ago
CO
Catherine O'Brien approved certification mortgage-disclosure-generator v23
1h ago
DH
Dieter Hofmann uploaded dataset eu-ai-act-high-risk-test-cases-q3-2026
2h ago
LA
Lars Andersson completed vendor assessment voyage-3 embedding model
3h ago
AI
Automated 12 failure cases curated from Operations Platform review queue
4h ago
FK
Fatima Khan added 47 Hinglish adversarial prompts indic-jailbreaks-v4
5h ago
AI
Arjun Iyer started red-team campaign Pre-deployment audit — claims-copilot-v3
6h ago
MP
Meera Pillai registered new artifact version hindi-customer-voice v7
8h ago
RD
Rohan Desai opened model risk review wealth-portfolio-explainer
12h ago
SK
Sanjay Kapoor added security policy no-tool-network-egress for fraud agents
1d ago

8 frameworks tracked

Next 90 days

Artifact

Today+45d+90d

<8d8–30d>30d

Severity	Finding	Artifact	Category	Discovered by	Date	Status
critical	Indirect prompt injection via RAG document	claims-copilot-v3	Prompt Injection	Pre-deployment audit	1d ago	open
high	System-prompt extraction via Hinglish jailbreak	customer-support-rag	Jailbreak (Indic)	indic-redteam-v4	2d ago	triaged
high	Tool-argument manipulation in agent loop	fraud-investigation-copilot	Agent Tool Abuse	Agent simulation	3d ago	in-remediation
high	PII leakage under Crescendo multi-turn attack	wealth-portfolio-explainer	Data Exfil	Auto red-team	3d ago	open
medium	Caste-bias output in 4.2% of test cases	loan-eligibility-assistant	Bias / Fairness	Quarterly bias sweep	5d ago	in-remediation
medium	Refusal-bypass via Devanagari-script encoding	branch-ops-knowledge	Encoding Bypass	indic-redteam-v4	6d ago	verified-fixed