首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
您的位置: 首页 > 实时讯息 >

OpenAI开源浏览智能体评测基准BrowseComp

0次浏览     发布时间:2025-04-11 08:39:00    

当地时间4月10日,美国开放人工智能研究中心(OpenAI)宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示,一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试(如SimpleQA)主要衡量模型检索基本孤立事实的能力,这类测试已被具备快速浏览工具(如支持浏览功能的GPT-4o)的模型所饱和。为了衡量AI智能体在互联网上定位难以查找、相互关联信息的能力,现开源基准测试BrowseComp。

相关文章

  • 远望谷预计今年上半年净利同比增35.06%至91.34% 扣非净利扭亏为盈

    7月14日晚间,远望谷(002161)发布2025年半年度业绩预告,预计实现净利润6000万元至8500万元,同比增长35.06%至91.34%;扣非净利润950万元至1400万元,同比实现扭亏为盈。公告显示,业绩增长主要得益于远望谷紧密围绕发展战略和经营管理目标开展各项工作,积极推进主营业务板块业

    2025-07-14 23:23:00

  • 本土供应链赋能科技世运,成都世运会运动员专属“AI陪练”来了

    距离2025成都世运会开幕还有不到一个月,世运村的科技氛围已悄然升温。近日,红星新闻记者获悉,由成都本土企业——光耀恒拓(成都)人工智能科技有限公司(下称:光耀恒拓)自主研发的“耀动魔方”智能运动设备,将于近日正式进驻世运村,化身“智慧陪练”,成为运动员放松训练、体验智能运动的独特窗口。值得一提的是

    2025-07-13 23:32:00

  • 重庆市首届师范生“育德能力”基本功大赛举行

    中国教育报-中国教育新闻网讯(记者 杨国良)7月10日,重庆市首届师范生“育德能力”基本功大赛决赛在重庆师范大学初等教育学院举行。来自重庆师范大学、重庆第二师范学院、重庆文理学院等10所高校的46名优秀师范生同台竞技。本次决赛由重庆市教育科学研究院主办,重庆师范大学初等教育学院、重庆市儿童发展与教师

    2025-07-11 18:10:00

  • 智启津门·数聚上合 | 数实融合:天津制造的智慧基因

    平均每9秒,一台笔记本电脑即可下线。在天津一家“黑灯工厂”,很多生产环节可由自动化设备按照系统指令自行完成;这里还是一家“零碳工厂”,园区有90个零碳应用和减排的场景,装机容量4兆瓦,每年发电约500万度。近年来,天津坚持数字化智能化赋能,加快推动数字经济与实体经济深度融合。2025年内,天津将新培

    2025-07-11 10:30:00

  • 至像科技勇立 AI 时代潮头, 携手飞书共赴数字未来

    在AI技术浪潮重塑商业格局的今天,企业如何借助创新工具实现数智化转型,成为各界关注焦点。2025年7月9日,飞书在上海世博中心举办了“2025飞书未来无限大会”。吸引了超过2000名来自科技、制造、互联网等行业的代表参会。携手行业先锋,共探AI时代数智化未来至像科技作为飞书的重要伙伴参加本次大会。至

    2025-07-10 16:32:00

  • 【牢记嘱托 感恩奋进】从“天边”到“身边” 河北加速推进北斗规模应用

    当前,全球数字化发展日益加快,时空信息、定位导航服务成为重要的新型基础设施。习近平总书记强调,要让"北斗系统造福中国人民"。牢记总书记嘱托,我省积极推动北斗系统的规模应用,一批涉及产业发展、大众消费、智慧城市、现代农业等领域的北斗规模应用场景正加速落地。进入汛期,水文监测就是"预警哨兵",对防汛度汛

    2025-07-10 09:32:00