首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
您的位置: 首页 > 开源 >

开源

  • OpenAI开源浏览智能体评测基准BrowseComp

    当地时间4月10日,美国开放人工智能研究中心(OpenAI)宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示,一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试(如SimpleQA)主要衡量模型检索基本

    2025-04-11 08:39:00