Behavioral Canaries: Auditing Private Retrieved Context Usage in RL Fine-Tuning

Source

arxiv.orgfull article ↗

Read on arxiv

Publisher summary· verbatim

arXiv:2604.22191v1 Announce Type: cross Abstract: In agentic workflows, LLMs frequently process retrieved contexts that are legally protected from further training. However, auditors currently lack a reliable way to verify if a provider has violated the terms of service by incorporating these data i

Discussion

No replies yet. Be first.

Behavioral Canaries: Auditing Private Retrieved Context Usage in RL Fine-Tuning

Related coverage

Behavioral Canaries: Auditing Private Retrieved Context Usage in RL Fine-Tuning

Related coverage