admin – Page 619 – Own Your AI

Research Papers

Specific versus General Principles for Constitutional AI

Research Papers

Towards Understanding Sycophancy in Language Models

Research Papers

Studying Large Language Model Generalization with Influence Functions

Research Papers

Tracing Model Outputs to the Training Data

Research Papers

Question Decomposition Improves the Faithfulness of Model-Generated Reasoning

Research Papers

Constitutional AI: Harmlessness from AI Feedback

Research Papers

Measuring Progress on Scalable Oversight for Large Language Models

Research Papers

Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback

Research Papers

Language Models (Mostly) Know What They Know

Research Papers

Project Vend: Can Claude run a small shop? (And why does that matter?)

Previous 1 … 617 618 619 620 621 … 650 Next