LLM 9

[Paper Review] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning Feb 17, 2025
[Paper Review] Qwen 2.5 Feb 4, 2025
[Paper Review] Llama 3 Jan 20, 2025
[Paper Review] Llama 2: Open Foundation and Fine-Tuned Chat Models Jul 15, 2024
[Paper Review] QLoRA: Efficient Finetuning of Quantized LLMs May 6, 2024
[Paper Review] Alpaca: A Strong, Replicable Instruction-Following Model Apr 21, 2024
[Paper Review] LLaMA: Open and Efficient Foundation Language Models Apr 9, 2024
[Paper Review] LoRA: Low-Rank Adaptation of Large Language Models Mar 15, 2024
[Paper Review] GPT-3: Language Models are Few-Shot Learners Feb 19, 2024