Carnegie Mellon University 15.03.2022, 10:03 Uhr

PolyCoder: Quelloffener KI-Code-Generator

PolyCoder ist ein quelloffener KI-Code-Generator, der mit 249 GByte Daten in zwölf Programmiersprachen trainiert wurde und laut Forschern C-Code mit großer Genauigkeit verfasst.
(Quelle: youtube.com)
KI-Systeme, die auf Aufforderung in verschiedenen Programmiersprachen schreiben können versprechen, die Entwicklungskosten zu senken und es Programmierern zu ermöglichen, sich auf kreative, weniger repetitive Aufgaben zu konzentrieren. Doch während Forschungslabore wie OpenAI und das von Alphabet unterstützte DeepMind leistungsstarke KI zur Codegenerierung entwickelt haben, sind viele der leistungsfähigsten Systeme nicht als Open Source verfügbar. So wurden beispielsweise die Trainingsdaten für Codex von OpenAI, das die Copilot-Funktion von GitHub antreibt, nicht öffentlich zugänglich gemacht, was Forscher daran hindert, das KI-Modell fein abzustimmen oder Aspekte wie die Interpretierbarkeit zu untersuchen.
Die Forscher der Carnegie Mellon University Frank Xu, Uri Alon, Graham Neubig und Vincent Hellendoorn - PolyCoder, haben ein Modell entwickelt, das auf dem GPT-2-Sprachmodell von OpenAI basiert und mit einer Datenbank mit 249 GByte Code in zwölf Programmiersprachen trainiert wurde. Auch wenn PolyCoder nicht bei jeder Aufgabe die Leistung der besten Codegeneratoren erreicht, behaupten die Forscher, dass PolyCoder in der Lage ist, C mit größerer Genauigkeit zu schreiben als alle bekannten Modelle, einschließlich Codex.
Mehr über das Projekt PolyCoder erfahren Sie in diesem englischsprachigen Artikel von Kyle Wiggers und in diesem kurzen Youtube-Video.


Das könnte Sie auch interessieren