SWE-Lancer

SWE-Lancer

About

SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。

Categories

AI 编程开发模型国外精选编程研究基准测试软件工程模型评估经济影响

Tags

免费使用科学上网无需登录

Other

收录日期:2025-11-23 16:20:28

相关推荐

一站式编程工具导航

一站式编程工具导航平台,收录最新、最全的开发资源。深度覆盖Python、Java、C++、C#、Web前端等主流编程语言,提供高效检索与下载服务,致力于成为程序员的首选工具站。

Contacts

备案号:

粤ICP备2024207953号

© Copyright 2024 - 2026 prog.quicknavig.com. All rights reserved.

友情链接: