OpenAI Codex a pour principale mission de retranscrire des commandes simples de l’anglais vers le code, au travers d’une douzaine de langages de programmation. Il représente, comme le rappelle Supinfo, un dérivé du réseau de neurones GPT-3 qui a été développé par OpenAI. Nous vous proposons de découvrir plus en détail cet outil d’autocomplétion issu de la technologie sous-jacente GitHub Copilot.

OpenAI Codex, pour générer des codes

Greg Brockman, le cofondateur et CTO d’OpenAI, explique que « tout ce que nous faisons, c’est formater l’instruction envoyée au modèle un peu comme une docstring Python, de sorte qu’elle ressemble à un commentaire. Le modèle génère du code que nous exécutons par la suite ». Le code engendré est ainsi affiché depuis la même interface utilisateur pour des raisons d’interprétabilité.

Pour rappel, OpenAI Codex a été essentiellement entraîné sur Python ainsi que sur TypeScript, JavaScript, Ruby et Go. Il est à noter qu’il supporte également Swift, Shell, PHP ou encore Perl. Son principal avantage est en effet qu’il permet d’incorporer le code généré dans une application existante.

La portée d’OpenAI Codex

Le champ d’action d’OpenAI Codex est très vaste. Ainsi, au cours d’une démonstration, Greg Brockman a formaté un texte à la voix, développé un jeu vidéo basique ou encore déployé un exemple d’Hello Word sur un serveur Python. Mais les possibilités sont encore bien plus nombreuses : Open AI Codex peut en effet convertir un programme Python en Ruby ou exécuter des opérations analytiques simples. Le CTO a d’ailleurs déclaré que « nous n’avons qu’effleuré la surface de ce qui peut être fait. Codex est très bon pour résoudre un petit problème à la fois. Si vous lui en demandez trop d’un coup, il échouera ». C’est pourquoi il est à ce jour recommandé d’effectuer de petites commandes.

Codex va toutefois poursuivre son évolution. Il devrait ainsi pouvoir enrichir un kit d’outils low-code/no-code ainsi qu’une chaîne d’outils d’un développeur. Il sera alors possible de compléter le code, de lancer des tests, de convertir des commentaires en code… Pour ce faire, Codex possède une capacité de mémoire de sorte à comprendre le contexte des commandes mais aussi de rectifier une instruction.

Wojciech Zaremba, cofondateur et PDG d’OpenAI, explique qu’« aujourd’hui, nous présentons un modèle [Codex] capable de résoudre 37 % des problèmes ».

Du côté de la propriété du code qui a été généré, GitHub indique qu’elle appartient à l’utilisateur. Ce dernier doit ainsi se charger de le tester, de le vérifier mais aussi de le sécuriser. Les chercheurs d’OpenAI précisent que « les hôtes et services adjacents au réseau sont protégés par des règles de pare-feu basées sur eBPF qui empêchent les connexions entrantes et sortantes, à l’exception de celles requises pour le contrôle de l’expérience ». En ce qui concerne les éventuels usages de Codex par des cyberattaquants, les spécialistes affichent une certaine confiance : « Même si cela est préoccupant, sur la base de nos tests, nous pensons qu’au niveau actuel de leurs capacités, les modèles Codex ne réduisent pas de manière significative la barrière à l’entrée pour le développement de logiciels malveillants ».

Laisser un commentaire