SWE-Lancer
About
SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。
Categories
Tags
免费使用科学上网无需登录
Other
收录日期:2025-11-23 16:20:28
相关推荐
Claudable一款功能强大的基于 Next.js 的 Web 应用构建器,它结合了Claude Code(也支持 Cursor CLI!)的先进 AI 代理功能和Lovable简洁直观的应用构建体验。只需描述您的应用创意——例如“我想要一个带有深色模式的任务管理应用”——Claudable 即可立即生成代码并向您展示应用的实时预览。
codeFuse网上销售获客,用AI 创造你的网站,满意就上线
JamGPTAI Debug调试助手,快速找到解决方案
Google Antigravity谷歌推出的 AI IDE 编程智能体
Firebase Studio谷歌推出的AI编程工具,一站式开发全栈应用
Gemini CLIGemini CLI 是一个开源 AI 代理,可将 Gemini 的强大功能直接带入您的终端。它提供了对 Gemini 的轻量级访问,为您提供从提示到我们模型的最直接路径。
Qodo面向多语言和多IDE的AI智能编程助手平台,支持代码编写、测试、审查与质量提升。
Windsurf由 Codeium 推出的 AI 驱动的集成开发环境(IDE),旨在提升开发者的编程效率和协作体验。
C知道由CSDN和外部合作伙伴联合研发的生成式AI产品
CodexOpenAI旗下AI代码生成训练模型
Kiro由亚马逊云科技开发的AI Agent IDE。Kiro通过规范驱动的开发方式为AI编码带来结构,帮助你完成最出色的工作。
Warp内置AI命令搜索!21世纪的终端工具- ClineCline 是一个开源的 AI 编程助手,以 VSCode 插件的形式提供安装使用。
LocofyAI无代码工具将Figma、Adobe XD和Sketch设计转换成前端代码
v0.devAI生成前端React/UI组件,由Vercel推出- OpenAI o1 APIOpenAI o1 是一个高性能的AI模型,旨在处理复杂的多步骤任务,并提供先进的准确性。它是o1-preview的后继产品,已经用于构建代理应用程序,以简化客户支持、优化供应链决策和预测复杂的金融趋势。o1模型具有生产就绪的关键特性,包括函数调用、结构化输出、开发者消息、视觉能力等。o1-2024-12-17版本在多个基准测试中创下了新的最高成绩,提高了成本效率和性能。
CodigaAI代码实时分析
HeyCLI自然语言转义为CLI命令
CodeArts Doer华为推出的一站式AI编程助手- 百度飞桨飞桨致力于让深度学习技术的创新与应用更简单。
热门工具
- TailwindFlex汇集 3000+ Tailwind CSS 模板,涵盖 Grid/Card/Hero/FAQ 等全套组件。一键复制代码,直接集成到项目中,让开发更简单!
- daisyui最佳 Tailwind 组件库 - Tailwind CSS 的免费 UI 组件
SvelteKit基于Svelte的开源框架,用于构建现代Web应用程序,支持服务器端渲染(SSR)、静态站点生成(SSG)和客户端渲染等多种模式。- tailwind-kit超过 200 个免费开源组件和模板,用于 Tailwind CSS 构建漂亮的 UI。所有这些都经过完全编码,并可与 React、Angular 和 VueJS 配合使用。
HeroUI美观、快速、现代的 React UI 库,用于构建易于访问和可定制的 Web 应用程序。
RemixRemix是一个全栈Web框架,它让你专注于用户界面,并反向推导Web标准,从而打造快速、流畅且稳定的用户体验。
Vuestic Admin一个完全免费的VUE3开源管理模板.
Tailwind CSS原子类的CSS框架,用于快速构建现代网站。
vue-antd-admin开箱即用的中台前端/设计解决方案
Naive Admin中后台框架,多生态支持包含Ant Design Vue,Element Plus等,全面的系统配置,优质模板,常用组件,真正一站式开箱即用























