David Chan's picture

8 8 2

David Chan

davidchan

·

https://dchan.cc

DavidMChan

AI & ML interests

Vision + Language

Recent Activity

upvoted a paper 8 days ago

REOrdering Patches Improves Vision Models

upvoted a paper 8 days ago

Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint

commented on a paper 8 days ago

Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint

View all activity

Organizations

davidchan's activity

upvoted 2 papers 8 days ago

REOrdering Patches Improves Vision Models

Paper • 2505.23751 • Published 9 days ago • 16

Puzzled by Puzzles: When Vision-Language Models Can't Take a Hint

Paper • 2505.23759 • Published 9 days ago • 5

upvoted a paper about 2 months ago

Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling

Paper • 2504.13169 • Published Apr 17 • 39

upvoted a paper 3 months ago

TULIP: Towards Unified Language-Image Pretraining

Paper • 2503.15485 • Published Mar 19 • 49

upvoted a paper 7 months ago

Analyzing The Language of Visual Tokens

Paper • 2411.05001 • Published Nov 7, 2024 • 25

upvoted a paper 9 months ago

CLAIR-A: Leveraging Large Language Models to Judge Audio Captions

Paper • 2409.12962 • Published Sep 19, 2024 • 2

upvoted an article 11 months ago

Article

Are We Ready for Multi-Image Reasoning? Launching VHs: The Visual Haystacks Benchmark!

By

•

Jul 23, 2024

• 3

upvoted a paper over 1 year ago

ANIM-400K: A Large-Scale Dataset for Automated End-To-End Dubbing of Video

Paper • 2401.05314 • Published Jan 10, 2024 • 12