Stanford Autonomous Agent Lab

university

https://www.autonomousagents.stanford.edu/

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

fagunpatel98 updated a dataset 13 days ago

SAA-Lab/SLPHelmOutputs

sangttruong authored a paper about 2 months ago

ResearchCodeBench: Benchmarking LLMs on Implementing Novel Machine Learning Research Code

sangttruong authored a paper about 2 months ago

Reliable and Efficient Amortized Model-based Evaluation

View all activity

fagunpatel98

updated a dataset 13 days ago

SAA-Lab/SLPHelmOutputs

Preview • Updated 13 days ago • 2.83k

sangttruong

authored 2 papers about 2 months ago

ResearchCodeBench: Benchmarking LLMs on Implementing Novel Machine Learning Research Code

Paper • 2506.02314 • Published Jun 2

Reliable and Efficient Amortized Model-based Evaluation

Paper • 2503.13335 • Published Mar 17

Asap7772

authored a paper 6 months ago

Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs

Paper • 2503.01307 • Published Mar 3 • 39

violetxi

authored 2 papers 7 months ago

Hypothetical Minds: Scaffolding Theory of Mind for Multi-Agent Tasks with Large Language Models

Paper • 2407.07086 • Published Jul 9, 2024

Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published Jan 8 • 99

Asap7772

authored a paper 7 months ago

Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Though

Paper • 2501.04682 • Published Jan 8 • 99

Asap7772

authored a paper 11 months ago

Adaptive Inference-Time Compute: LLMs Can Predict if They Can Do Better, Even Mid-Generation

Paper • 2410.02725 • Published Oct 3, 2024 • 1

Asap7772

authored 4 papers about 1 year ago

martinakaduc

authored a paper over 1 year ago

Crossing Linguistic Horizons: Finetuning and Comprehensive Evaluation of Vietnamese Large Language Models

Paper • 2403.02715 • Published Mar 5, 2024 • 3

sangttruong

authored a paper over 1 year ago

Crossing Linguistic Horizons: Finetuning and Comprehensive Evaluation of Vietnamese Large Language Models

Paper • 2403.02715 • Published Mar 5, 2024 • 3

Asap7772

authored a paper almost 2 years ago

Robotic Offline RL from Internet Videos via Value-Function Pre-Training

Paper • 2309.13041 • Published Sep 22, 2023 • 8

sangttruong

authored a paper about 2 years ago

DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT Models

Paper • 2306.11698 • Published Jun 20, 2023 • 12

AI & ML interests

Recent Activity

Team members 8

SAA-Lab's activity