16 23

王欣怡

lilym61

AI & ML interests

None yet

Recent Activity

upvoted a paper about 12 hours ago

ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence

upvoted a paper about 23 hours ago

DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning

liked a model 3 days ago

openbmb/BitCPM-CANN-8B

View all activity

Organizations

None yet

upvoted a paper about 12 hours ago

ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence

Paper • 2605.26340 • Published 4 days ago • 25

upvoted a paper about 23 hours ago

DVAO: Dynamic Variance-adaptive Advantage Optimization for Multi-reward Reinforcement Learning

Paper • 2605.25604 • Published 4 days ago • 129

liked a model 3 days ago

openbmb/BitCPM-CANN-8B

Text Generation • Updated 4 days ago • 2.44k • 97

liked a model 4 days ago

tencent/Hy-MT2-1.8B

Translation • 2B • Updated 2 days ago • 14.6k • • 1.08k

upvoted 3 papers 7 days ago

Overcoming Catastrophic Forgetting in Visual Continual Learning with Reinforcement Fine-Tuning

Paper • 2605.09640 • Published 19 days ago • 8

Video2GUI: Synthesizing Large-Scale Interaction Trajectories for Generalized GUI Agent Pretraining

Paper • 2605.14747 • Published 15 days ago • 144

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Paper • 2605.11609 • Published 17 days ago • 193

liked a dataset 7 days ago

chaiting/175_non_sub_p_41

Viewer • Updated 7 days ago • 5k • 4 • 1

upvoted a paper 10 days ago

MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents

Paper • 2605.09530 • Published 19 days ago • 146

liked a dataset 14 days ago

Yarina/Meta_Kaggle_Dataset_Archive_2026-03-12

Preview • Updated Mar 13 • 782 • 5

liked a model 15 days ago

openbmb/MiniCPM-V-4.6

Image-Text-to-Text • 1B • Updated 9 days ago • 389k • 1.05k

liked a dataset 17 days ago

destatis/preise-ueberblick-originalwert

Viewer • Updated 8 days ago • 1.02k • 141 • 1

liked a dataset 21 days ago

raymondt/xuahyja-text

Updated 42 minutes ago • 6.59k • 2

liked a dataset 27 days ago

fineinstructions/fineinstructions_nemotron

Viewer • Updated Jan 30 • 1.23B • 534k • 23

upvoted 2 papers about 1 month ago

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 242

PRL-Bench: A Comprehensive Benchmark Evaluating LLMs' Capabilities in Frontier Physics Research

Paper • 2604.15411 • Published Apr 16 • 4

liked a model about 1 month ago

tencent/HY-World-2.0

Image-to-3D • Updated 8 days ago • 2.98k • 657

upvoted a paper about 1 month ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

Paper • 2604.11626 • Published Apr 13 • 102

liked a model about 1 month ago

google/electra-base-discriminator

Updated Feb 29, 2024 • 56.7M • 117

liked a model about 2 months ago

answerdotai/ModernBERT-base

Fill-Mask • 0.1B • Updated Jan 15, 2025 • 2.13M • 1.05k

王欣怡

AI & ML interests

Recent Activity

Organizations

lilym61's activity