Anthropic hat neue KI-Politikrahmen vorgeschlagen, da fortschrittliche Systeme stärkere Fähigkeiten erlangen.
Das Unternehmen möchte, dass Regierungen Regeln für Frontier-Modelle festlegen und Arbeitnehmer auf die wirtschaftlichen Auswirkungen von KI vorbereiten. Sein Plan umfasst gefährliche Einsätze, unabhängige Tests, Cybersicherheit und öffentliche Resilienz.
Anthropic stellte zwei Vorschläge im Rahmen seines Plans „Policy on the AI Exponential" vor. Das Advanced AI Framework konzentriert sich auf leistungsstarke Modelle, während das Economic Policy Framework Arbeitnehmer und gemeinsame finanzielle Vorteile adressiert. Das Unternehmen argumentierte, dass KI sich jetzt schneller bewegt als aktuelle politische Entscheidungssysteme. Es sagte auch, dass Regierungen Befugnisse benötigen, um gefährliche Modell-Einsätze zu blockieren oder abzuschrecken.
Im Rahmen des Plans würden zivilrechtliche Strafen an den globalen Jahresumsatz geknüpft. Wiederholte Verstöße würden höhere Strafen nach sich ziehen, basierend auf dem vorgeschlagenen Rahmen. Der Rahmen fordert auch, dass Frontier-Entwickler Modelle vor der Veröffentlichung testen. Entwickler würden Zusammenfassungen, Sicherheitsrahmen und Systemkarten für leistungsstarke KI-Systeme veröffentlichen.
Unabhängige Evaluatoren würden Modelltests und Risikoberichte überprüfen. Anthropic möchte auch, dass Entwickler starke Sicherheitsprogramme für Modellgewichte und Trainingssysteme aufrechterhalten. Der Vorschlag unterstützt Transparenzgesetze in Bundesstaaten wie Kalifornien und New York. Das Unternehmen argumentierte jedoch, dass öffentliche Offenlegung allein nicht mehr mit der Geschwindigkeit der KI-Entwicklung Schritt hält.
Die vorgeschlagenen Regeln würden nur für die fortschrittlichsten KI-Systeme gelten. Anthropic setzte die Schwelle bei Modellen, die mit mehr als 10²⁵ Gleitkommaoperationen trainiert wurden. Der Rahmen würde auch Unternehmen abdecken, die mehr als 500 Millionen US-Dollar an KI-bezogenen Einnahmen erzielen. Unternehmen, die mehr als 1 Milliarde US-Dollar für KI-Forschung und -Entwicklung ausgeben, würden ebenfalls darunter fallen.
Anthropic nannte vier Hauptrisikobereiche in dem Vorschlag. Dazu gehören biologisches Risiko, Cyber-Risiko, Kontrollverlust und automatisierte KI-Forschung. Beim biologischen Risiko warnte das Unternehmen, dass unsichere Systeme Angreifern helfen könnten, schädliche Viren zu entwickeln. Es merkte auch an, dass ähnliche KI-Werkzeuge die Arzneimittelentdeckung unterstützen können.
Beim Cyber-Risiko können Frontier-Modelle ernsthafte Software-Schwachstellen in großem Maßstab finden. Anthropic sagte, dass diese Fähigkeiten Bedenken für Krankenhäuser, Energienetze und andere wichtige Systeme aufwerfen. Das Unternehmen hob auch Risiken durch Systeme hervor, die außerhalb der Entwicklerkontrolle agieren. Automatisierte KI-Forschung könnte biologische, Cyber- und Kontrollrisiken erhöhen, wenn Sicherheitsvorkehrungen versagen.
Anthropic möchte, dass Frontier-Entwickler regelmäßige Risikoberichte veröffentlichen. Diese Berichte würden die allgemeine Risikolage des Entwicklers und die Sicherheitsarbeit am Modell beschreiben. Der Rahmen fordert auch mindestens einen qualifizierten unabhängigen Evaluator. Dieser Evaluator würde Unternehmensbewertungen überprüfen und Erkenntnisse zu Modell-Risikoberichten veröffentlichen.
Regierungen und die Industrie würden auch Standards für diese Evaluatoren festlegen. Der Vorschlag besagt, dass Evaluatoren Finanzierung und Zugang zu Frontier-Modellen benötigen. Sicherheitsregeln bilden einen weiteren wichtigen Teil des Rahmens. Entwickler würden ihre gesamte Entwicklungsumgebung vor externen Angreifern und Insider-Bedrohungen schützen.
Unternehmen würden ihre Sicherheitsprogramme öffentlich auf hohem Niveau beschreiben. Sie würden auch mehr Details mit einer benannten Regierungsbehörde teilen, wenn dies angefordert wird. Anthropic sagte, dass politische Entscheidungsträger mit leichteren Regeln beginnen und diese im Laufe der Zeit anpassen könnten. Der Rahmen besagt, dass die Regulierung den Modellfähigkeiten und Bewertungsstandards folgen sollte.
Der zweite Teil des Rahmens konzentriert sich auf die öffentliche Resilienz. Anthropic empfahl eine stärkere Planung für biologische, Cyber- und kontrollbezogene KI-Risiken. Für die Biologie umfasst der Vorschlag die Gensyntheseüberprüfung und eine Frühwarn-Bioüberwachung. Er erwähnt auch Schutzausrüstungsvorräte und Werkzeuge zur Reduzierung der Luftübertragung.
Für den Cyber-Bereich fordert der Rahmen stärkere Internetsoftware und Unterstützung für Betreiber kritischer Infrastrukturen. Er empfiehlt auch den Ersatz von Legacy-Systemen in wesentlichen Infrastrukturen. Regierungen sollten auch Frontier-Cyber-Fähigkeiten durch eine dedizierte Funktion verfolgen. Anthropic schlug gemeinsame Arbeit zwischen Regierung und Industrie zu Modellsicherheitsvorkehrungen vor.
Das Unternehmen sagte, dass die Arbeit zu Kontrollverlust- und automatisierten Forschungsrisiken noch weniger entwickelt ist. Es forderte bessere Werkzeuge zur Erkennung, Eindämmung oder Abschaltung unsicherer Systeme. Anthropic forderte politische Entscheidungsträger zum Handeln auf, während sich die Modellfähigkeiten weiter verbessern. Das Unternehmen sagte, dass die KI-Governance mit der Technologie Schritt halten muss.


