3 2 12

Ye Zhiling

yzlnew

https://yzlnew.com

yzlnew

AI & ML interests

Deep Learning

Recent Activity

new activity 3 days ago

deepseek-ai/DeepSeek-R1-0528-Qwen3-8B:DeepSeek-R1-Lite

liked a Space 3 days ago

enzostvs/deepsite

new activity 11 days ago

nanotron/ultrascale-playbook:Typo on ZeRO-1

View all activity

Organizations

None yet

yzlnew's activity

New activity in deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 3 days ago

DeepSeek-R1-Lite

❤️ 🔥 19

#6 opened 8 days ago by

Dampfinchen

liked a Space 3 days ago

7.75k

DeepSite

🐳

Generate any application with DeepSeek

New activity in nanotron/ultrascale-playbook 11 days ago

Typo on ZeRO-1

#112 opened 11 days ago by

yzlnew

liked a dataset 15 days ago

nvidia/OpenCodeReasoning

Viewer • Updated May 4 • 753k • 10.7k • 457

liked a Space 3 months ago

2.66k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

liked a model 3 months ago

Qwen/QwQ-32B

Text Generation • Updated Mar 11 • 304k • • 2.77k

liked a dataset 4 months ago

Congliu/Chinese-DeepSeek-R1-Distill-data-110k

Viewer • Updated Feb 21 • 110k • 1.62k • 667

liked a model 4 months ago

deepseek-ai/DeepSeek-V3

Text Generation • Updated Mar 27 • 2.4M • • 3.87k

liked a model 6 months ago

Datou1111/shou_xin

Text-to-Image • Updated Mar 16 • 97 • • 875

upvoted an article 6 months ago

Article

🐺🐦‍⬛ LLM Comparison/Test: 25 SOTA LLMs (including QwQ) through 59 MMLU-Pro CS benchmark runs

•

Dec 4, 2024

• 79

upvoted an article 8 months ago

Article

A Short Summary of Chinese AI Global Expansion

•

Oct 3, 2024

• 23

liked 2 datasets 10 months ago

HuggingFaceTB/cosmopedia

Viewer • Updated Aug 12, 2024 • 31.1M • 7.15k • 615

argilla/magpie-ultra-v0.1

Viewer • Updated Nov 26, 2024 • 50k • 376 • 221

liked 2 datasets over 1 year ago

EleutherAI/proof-pile-2

Updated Oct 25, 2023 • 5.68k • 200

Skywork/SkyPile-150B

Viewer • Updated Dec 7, 2023 • 1.76M • 6.38k • 370

commented a paper almost 2 years ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 171 •

liked a Space over 2 years ago

Latex Ocr

👀