LLM Alignment & Reasoning

Adversarial Testing

Initializing search

LLM Alignment & Reasoning

Home
Alignment Methods
Alignment Methods
- RLHF
  RLHF
  - RLHF Pipeline
  - RL Optimization Methods
    RL Optimization Methods
    
    PPO
    
    DPO
    
    GRPO
    
    REINFORCE
    
    RLOO
    
    DAPO
  - KL Penalty & Reward Hacking
- Alternate Approaches
  Alternate Approaches
- Safety & Evaluation
  Safety & Evaluation
Reasoning Techniques
Reasoning Techniques
- Prompting Based Techniques
  Prompting Based Techniques
- Iterative Refinement
  Iterative Refinement
  - Self-Critic Methods
  - Debate & Multi-Agent
- Advanced Reasoning Methods
  Advanced Reasoning Methods
  - STAR-Self Taught Reasoner
  - System2 Attention
- Test-Time Compute Scaling
  Test-Time Compute Scaling
Evaluation & Metrics
Evaluation & Metrics
- Alignment Evaluation
- Verification Metrics
Case Studies
Case Studies
- Deepseek RL Finetuning
References

Adversarial Testing