code-llm-papers-guide

Code LLM Papers Guide

Overview

This curated collection covers LLMs for code — from foundational models (Codex, CodeGen, StarCoder) through code generation, completion, repair, translation, and understanding. Accompanies a TMLR survey paper providing systematic categorization. Tracks 500+ papers across pre-training, fine-tuning, evaluation, and application of code-focused language models.

Taxonomy

Code LLMs
├── Pre-training
│   ├── Encoder-only (CodeBERT, GraphCodeBERT)
│   ├── Decoder-only (Codex, CodeGen, StarCoder, DeepSeek-Coder)
│   └── Encoder-Decoder (CodeT5, PLBART)
├── Fine-tuning & Alignment
│   ├── Instruction tuning (WizardCoder, Magicoder)
│   ├── RLHF for code (CodeRL)
│   └── Self-play (AlphaCode)
├── Applications

code-llm-papers-guide

Code LLM Papers Guide

Overview

Taxonomy

More from wentorai/research-plugins

academic-paper-summarizer

academic-translation-guide

academic-writing-refiner

academic-citation-manager

abstract-writing-guide

ai-writing-humanizer