开云体育官方7B专业领域大模型能打DeepSeek- R1？测试甚至不如QwQ：32B

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

开云体育官方7B专业领域大模型能打DeepSeek- R1？测试甚至不如QwQ：32B

2025-03-31

浏览次数：次

返回列表

　　开云体育[永久网址:363050.com]成立于2022年在中国，是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网，欢迎注册体验！我记得大模型刚刚兴起的时候，各行各业开启了“大练”行业大模型的热潮，能源、医疗、金融、政务、法律等等，每一个领域都有一堆行业大模型。后来各路通用大模型大放异彩，行业大模型有点沉寂了，尤其是 DeepSeek 来了之后，通用、推理大模型太能打了，训练领域大模型还不如直接接入 DeepSeek 靠谱了。

　　但是事物都有两面性， DeepSeek R1 带火了知识蒸馏，反而降低了行业大模型微调技术难度和成本。这不，上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组刚以 Qwen2.5-7B-Instruct 为基座，通过高质量的可验证金融问题微调训练出了 Fin-R1，号称在多个金融领域基准测试上的表现达到参评模型的 SOTA 水平。

　　我看了他们的技术报告：，数据蒸馏过程确实采用了 DeepSeek - R1 官方提供的思路。

　　训练过程分两个阶段：1、通过高质量金融推理数据的 SFT (Supervised Fine-Tuning) 帮助模型初步提升金融推理能力；2、在 GRPO（Group Relative Policy Optimization) 算法的基础上结合格式奖励和准确度奖励进行强化学习，以此进一步提升金融推理任务的准确性和泛化能力。