Back to archive

Fable 5 może być „przycięty” - a Ty nawet się o tym nie dowiesz

Fable 5 może być „przycięty” - a Ty nawet się o tym nie dowiesz

https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

implemented new interventions that limit Claude’s effectiveness for requests targeting frontier LLM development (for example, on building pretraining pipelines, distributed training infrastructure, or ML accelerator design). Using Claude to develop competing models already violates our Terms of Service, but enforcing this restriction through our safeguards avoids accelerating the actors most willing to violate these terms. Unlike our interventions for cybersecurity, biology and chemistry, and distillation attempts, these safeguards will not be visible to the user. Fable 5 will not fall back to a different model. Instead, the safeguards will limit effectiveness through methods such as prompt modification, steering vectors, or parameter-efficient fine-tuning (PEFT). These interventions will not affect the vast majority of coding work. We estimate they will impact ~0.03% of traffic, concentrated in fewer than 0.1% of organizations

Po prostu dostaniesz odpowiedź, która może być gorsza - i nie będziesz wiedzieć, czy model naprawdę nie potrafił, czy został przyhamowany. To ważny moment, i zły kierunek bo przesuwamy się od jawnych blokad do niewidzialnego sterowania możliwościami modelu.

42 AI