登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
Open R1 项目进展第三期
Open R1 项目进展第三期
[ 复制链接 ]
钿稳铆
2025-6-1 18:38:14
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
Open R1 项目进展第三期
本次更新带来三大突破性进展:
CodeForces-CoTs 数据集
: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
IOI 基准测试
: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准
OlympicCoder 模型
: 7B/32B 双版本代码模型,在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型
下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能,其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型)
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
Open
R1
项目进展
三期
相关帖子
DeepSeek-R1源码解读
DeepSeek-R1详解
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
[JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
P6071 『MdOI R1』Treequery
高通QCS8550开发板 + DeepSeek-R1:打造智能化商场导购实践
Open JDK 和 Oracle JDK傻傻分不清楚
DolphinScheduler依赖机制、Open-Falcon告警推送与监控的优化实践
基于DeepSeek-R1 15b微调训练自主的领域大模型,附带工程代码
Open-AutoGLM项目衍生自研app测试思路
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
科技
DeepSeek-R1源码解读
2
449
濮阳雅爱
2025-06-20
业界
DeepSeek-R1详解
4
216
刘凤
2025-08-01
业界
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
4
581
蒙飘
2025-09-04
安全
[JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
3
159
郗新语
2025-09-19
安全
P6071 『MdOI R1』Treequery
4
286
鲫疹
2025-09-24
安全
高通QCS8550开发板 + DeepSeek-R1:打造智能化商场导购实践
4
358
仇华乐
2025-09-26
业界
Open JDK 和 Oracle JDK傻傻分不清楚
5
654
秦欣艷
2025-09-28
安全
DolphinScheduler依赖机制、Open-Falcon告警推送与监控的优化实践
3
867
司寇涵涵
2025-10-23
业界
基于DeepSeek-R1 15b微调训练自主的领域大模型,附带工程代码
5
1020
稿辏付
2025-11-18
安全
Open-AutoGLM项目衍生自研app测试思路
0
965
施婉秀
2025-12-16
回复
(2)
焦和玉
2025-10-16 15:42:07
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
嗣伐
5 天前
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢分享
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
签约作者
程序园优秀签约作者
发帖
钿稳铆
5 天前
关注
0
粉丝关注
34
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994893
kk14977
6845358
4
xiangqian
638210
5
韶又彤
9997
6
宋子
9982
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
102
ROS2概念之DDS
124
具身智能:零基础入门睿尔曼机械臂(四)—
392
Streamlit + LangChain 1.0 简单实现智能问
477
Oracle性能诊断与SQL优化:从9i到19c的技术
914
具身智能:零基础入门睿尔曼机械臂(五)—
220
NGD-SLAM(二)
397
[表单]HTML Learn Data Day 1
162
Oracle等待事件:性能诊断与优化的核心指南
591
“静态回调+上下文指针”模式实现回调机制
106
从 Tool Calling 到 A2A,再到 MCP. 大模型
379
BUUCTF 0ctf_2018_heapstorm2 PWN house of
294
仅通过一句提示词,就可以让大模型变得更有
984
生成式引擎优化(GEO优化)全维度技术指南
548
GEO优化实战指南2025:六大服务商核心能力
763
原始类型与泛型对比笔记
687
印度股票数据 API 对接实战指南(含实时行
661
Apipost分支功能:为API开发打造专属的成本
332
OpenCVSharp:学习人脸检测例子
553
JSAPIThree 加载单体三维模型学习笔记:Sim
127
读捍卫隐私09匿名指南