美团 LongCat 团队发布 VitaBench:基于复杂生活场景的交互式 Agent 评测基准


这是一个从 https://tech.meituan.com/2025/11/02/vitabench-agent.html 下的原始话题分离的讨论话题