Technologische Neuigkeiten, Bewertungen und Tipps!

Lernen Sie Magnushammer kennen: Ein transformatorbasierter Ansatz zur Prämissenauswahl

Hinweis: Der folgende Artikel hilft Ihnen dabei: Lernen Sie Magnushammer kennen: Ein transformatorbasierter Ansatz zur Prämissenauswahl

Der Schwerpunkt der künstlichen Intelligenz liegt auf der Automatisierung des mathematischen Denkens. In jüngerer Zeit hat maschinelles Lernen sowohl der informellen als auch der formalen Beweisführung von Theoremen große Vorteile gebracht. Die letztgenannte Methode, die sie in dieser Forschung verwenden, ermöglicht es Beweisassistenten, mit Modellen des maschinellen Lernens zu interagieren, um von solchen Modellen erstellte Beweise automatisch zu überprüfen. Mathematik ist hierarchisch, weil sie auf einem vorhandenen Wissensbestand aufbaut und diesen aufbaut. Daher wird der Beweis einer mathematischen Behauptung als kreativer Prozess angesehen, der unter anderem Intuition, Einsicht und eine kluge Wahl der Taktik erfordert.

Diese Fähigkeiten können bei der Auswahl relevanter Fakten hilfreich sein, die, wenn sie in einem bestimmten Stadium angewendet werden, den Fall weiterentwickeln und schließlich auf das gewünschte Ergebnis hinweisen. Als Prämissenauswahl bezeichnet man dieses Verfahren in automatisierten Argumentationssystemen. Für die Prämissenauswahl gibt es mehrere Tools, darunter eine Familie von Geräten, die als „Hämmer“ bekannt sind und automatische Theorembeweiser in interaktive Beweishelfer integrieren. Ein solches Werkzeug, Sledgehammer, erlangte bei Isabelle große Popularität, wo es zur Erstellung eines beträchtlichen Teils des Archive of Formal Proofs, Isabelles Beweiskorpus, verwendet wurde.

Obwohl Hämmer in andere Proof-Assistenten implementiert wurden, werden sie derzeit nicht von allen Proof-Assistenten unterstützt. Dies liegt daran, dass die Hammer-Implementierung aufgrund der Vielfalt der Beweisobjektstrukturen und der komplizierten Übersetzungsverfahren, die über verschiedene Logiken hinweg erforderlich sind, schwierig ist. Daher besteht ein dringender Bedarf an einem effizienten Prämissenauswahltool, das mit allen Beweishilfsmitteln funktioniert und kaum Anpassungen erfordert. In dieser Arbeit stellen Forscher von GoogleAI Magnushammer vor, ein universelles, datengesteuertes, transformatorbasiertes Prämissenauswahltool. Sie zeigen, dass die Prämissenauswahl effizient und mit wenig domänenspezifischem Fachwissen durchgeführt werden kann.

Magnushammer hat zwei Abrufphasen, die jeweils durch kontrastives Lernen trainiert werden. In der SELECT-Stufe wählen sie bei gegebenem Beweisstatus die 1024 Prämissen aus dem Theorem aus, die für den Beweis am relevantesten sind (bestimmt durch die Kosinusähnlichkeit ihrer Einbettungen) (Datenbank bis zu 433 KB). Im zweiten Schritt, RERANK, ordnen sie die abgerufenen Räumlichkeiten mithilfe einer präziseren, aber kostspieligeren Verarbeitung neu. Mithilfe einer Transformatorarchitektur ermöglichten sie den Beweisstatus-Tokens, sich direkt mit den abgerufenen Prämissen-Tokens zu befassen und so einen Relevanzwert zu erzeugen. Magnushammer übertrifft Sledgehammers Testquote von 38,3 % bei weitem und erreicht im PISA-Benchmark einen Wert von 59,5 %.

Sie zeigen, dass die Beweisrate von Magnushammer bei jedem Rechenbudget die von Sledgehammer deutlich übertrifft, wie in Abbildung 1 dargestellt. Ein neuronal-symbolisches Modell namens Thor verfügt über eine Sledgehammer-Komponente, die durch eine Magnushammer-Komponente ersetzt wird, wodurch der Stand der Technik erhöht wird. The-Art-Proof-Rate von 57,0 % auf 71,0 %. Um diese Ergebnisse zu erhalten, wurden der Isabelle-Theorembeweis und seine menschenbeweisfähigen Bibliotheken nach einem Datensatz zur Prämissenauswahl durchsucht. Die Sammlung umfasst 433.000 verschiedene Prämissen unter 4,4 Millionen Beispielen für Prämissenauswahlinstanzen. Dies ist der größte Prämissenauswahldatensatz seiner Art, der ihnen bekannt ist.

Ihre Beiträge lassen sich wie folgt zusammenfassen:

• Als allgemeine, datengesteuerte Strategie für die Prämissenauswahl schlagen sie die Verwendung kontrastiv trainierter Transformatoren vor. Magnushammer, der von ihnen entwickelte Ansatz, übertrifft Sledgehammer, das am weitesten verbreitete Tool zur Auswahl symbolischer Prämissen, mit einer Nachweisquote von 59,5 % beim PISA-Benchmark bei weitem.

• So weit sie wussten, extrahierten sie den größten verfügbaren Datensatz zur Prämissenauswahl und stellten ihn zur Verfügung. Es verfügt über 433.000 unterschiedliche Prämissen und 4,4 Millionen Prämissenauswahlinstanzen. Sie gehen davon aus, dass dieser Datensatz für die Weiterentwicklung der gegenwärtigen und zukünftigen Forschung auf diesem Gebiet nützlich sein wird.

• Sie untersuchen die Skalierbarkeit von Magnushammer hinsichtlich Modellgröße, Datensatzgröße und Rechenbudget für die Inferenzzeit. Ihre Analyse legt nahe, dass das Hinzufügen von mehr Computerleistung zu noch größeren Gewinnen führen könnte.

Besuche die Papier. Alle Anerkennung für diese Forschung gebührt den Forschern dieses Projekts. Vergessen Sie auch nicht, mitzumachen unser 15k+ ML SubReddit, Discord-KanalUnd E-Mail-Newsletterwo wir die neuesten Nachrichten aus der KI-Forschung, coole KI-Projekte und mehr teilen.

➡️ Ultimativer Leitfaden zur Datenkennzeichnung beim maschinellen Lernen

Table of Contents