4 569 397

r PRO

oceansweep

AI & ML interests

None yet

Recent Activity

liked a model about 2 hours ago

rednote-hilab/dots.llm1.base

liked a model about 16 hours ago

mlx-community/gemma-3-27b-it-4bit-DWQ

liked a model about 20 hours ago

Qwen/Qwen3-Embedding-0.6B

View all activity

Organizations

None yet

oceansweep's activity

liked a model about 2 hours ago

rednote-hilab/dots.llm1.base

Text Generation • Updated about 14 hours ago • 19 • 19

liked a model about 16 hours ago

mlx-community/gemma-3-27b-it-4bit-DWQ

Text Generation • Updated 23 days ago • 710 • 2

liked a model about 20 hours ago

Qwen/Qwen3-Embedding-0.6B

Feature Extraction • Updated about 13 hours ago • 3.88k • 102

liked a model 1 day ago

Qwen/Qwen3-Embedding-0.6B-GGUF

Updated about 10 hours ago • 2.43k • 187

upvoted a paper 1 day ago

Quantitative LLM Judges

Paper • 2506.02945 • Published 3 days ago • 4

liked a model 2 days ago

Banafo/Kroko-ASR

Automatic Speech Recognition • Updated Mar 27 • 46

liked a model 3 days ago

nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

Image-Text-to-Text • Updated 1 day ago • 1.82k • 72

upvoted 2 papers 4 days ago

Table-R1: Inference-Time Scaling for Table Reasoning

Paper • 2505.23621 • Published 8 days ago • 88

Role-Playing Evaluation for Large Language Models

Paper • 2505.13157 • Published 18 days ago • 7

upvoted 6 papers 6 days ago

ATLAS: Learning to Optimally Memorize the Context at Test Time

Paper • 2505.23735 • Published 8 days ago • 22

Multi-Domain Explainability of Preferences

Paper • 2505.20088 • Published 11 days ago • 21

FAMA: The First Large-Scale Open-Science Speech Foundation Model for English and Italian

Paper • 2505.22759 • Published 9 days ago • 20

liked a Space 7 days ago

SLM RAG Arena

🤼

Compare model summaries for accuracy

liked a model 9 days ago

deepseek-ai/DeepSeek-R1-0528

Text Generation • Updated 8 days ago • 74.7k • • 1.8k

liked a model 10 days ago

eurecom-ds/Phi-3-mini-4k-socratic

Text Generation • Updated Jan 6 • 46 • 2

upvoted 2 papers 13 days ago

Backdoor Cleaning without External Guidance in MLLM Fine-tuning

Paper • 2505.16916 • Published 15 days ago • 16

VideoGameQA-Bench: Evaluating Vision-Language Models for Video Game Quality Assurance

Paper • 2505.15952 • Published 16 days ago • 19