CodeGeeX ist ein groß angelegtes, multilinguales Code-Generierungsmodell mit 13 Milliarden Parametern, das auf einem großen Code-Korpus von mehr als 20 Programmiersprachen trainiert wurde. Das Modell hat mehrere einzigartige Merkmale, darunter die Fähigkeit, ausführbare Programme in verschiedenen Programmiersprachen zu generieren und Code-Snippets zwischen verschiedenen Sprachen zu übersetzen.
CodeGeeX ist open-source und cross-plattformfähig, was bedeutet, dass alle Codes und Modellgewichte öffentlich zugänglich sind. Das Modell unterstützt sowohl Ascend- als auch NVIDIA-Plattformen und ermöglicht die Inferenz auf einem einzelnen Ascend 910, NVIDIA V100 oder A100.
Um die Bewertung von multilingualen Code-Generierungs- und Übersetzungsmodellen zu standardisieren, haben wir den HumanEval-X-Benchmark entwickelt und veröffentlicht. Der HumanEval-X-Benchmark enthält 820 von Menschen erstellte Codier-Probleme in 5 Programmiersprachen (Python, C++, Java, JavaScript und Go), jeweils mit Tests und Lösungen.
* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.