Die KI-Abteilung des Facebook-Mutterkonzerns Meta hat ein neues großes Sprachmodell namens Galactica vorgestellt, das primär auf einem Corpus (natur-)wissenschaftlicher Forschungsliteratur trainiert wurde. Das Modell soll Wissenschaftler und Studierende unterstützen, indem es Zitate vorhersagt, LaTeX erzeugt, logische Schlüsse zieht, Dokumente erstellt, Moleküle generiert und Protein-Annotationen erzeugt.
Das Modell ist in fünf Größen zwischen 120 Millionen und 120 Milliarden Parametern verfügbar und soll in Aufgaben in den MINT-Fächern (Mathematik, Informatik, Naturwissenschaften und Technik-/Ingenieurswissenschaften) besonders gut abschneiden. Es ist offenbar Open Source, jedoch bestehen einige Ungereimtheiten bezüglich der Lizenz.
Kritiker warnen jedoch vor "Bullshit"-Output und der Nutzung hat einen Haken. Die KI kann wahr nicht von unwahr unterscheiden und verbreitet auch Unwahrheiten. Dies zeigte sich zum Beispiel anhand eines Artikels, den die KI verfasst hat, über das Bärenleben im Weltraum.
Das Meta-AI-Team hat Galactica mit 48 Millionen Beispielen wissenschaftlicher Texte trainiert, zum Beispiel mit Artikeln oder Lehrbüchern. Die KI sollte unter anderem Wiki-Artikel und wissenschaftlichen Code erstellen können. Trotzdem wurde die öffentliche Demo nach nur drei Tagen entfernt, da die KI mindless und biased Output produzierte.
Forscher kritisieren Galactica als potenzielle Gefahr für die Wissenschaft, da es kein hilfreiches Werkzeug für die wissenschaftliche Arbeit ist. Meta-Chefwissenschaftler Yann LeCun verteidigt Galactica jedoch als eine Hilfe für das Verfassen von wissenschaftlichen Texten.
Insgesamt bleibt abzuwarten, wie Galactica in Zukunft entwickelt wird und ob es tatsächlich ein nützliches Werkzeug für Wissenschaftler und Studierende werden kann.
* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.