开云体育

开云体育官方美籍华裔女院士依靠Qwen模型复刻Deepseek成本不到50美元!

2025-05-09
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!美国科技巨头英伟达“应声倒地”,单日市值蒸发接近6000亿美元,创下史上最大单日跌幅记录。

  就在这时,一位美籍华裔女科学家站了出来,用了50美元成功复刻了DeepSeek!

  李飞飞出生于1976年的北京,成长在一个知识分子家庭,那种浓厚的学术氛围滋养着她的求知欲。

  小时候的李飞飞,对知识的渴望简直超乎寻常小朋友,但凡有学习的机会,她都紧紧抓住。

  那时候国内的经济虽然潜力巨大,但仍在发展阶段,教育资源不像现在这么丰富。

  因此李飞飞16岁时选择远赴美国求学,在美国新泽西州定居,并加入美国国籍。

  上世纪90年代,美国科研环境优势明显,顶尖高校云集,科研设备先进,如同科技领域的 “超级航母”,吸引了大批中国人才。

  此后李飞飞的学术之路就像开了加速器,在人工智能领域崭露头角,做出了颇多的研究成果,2020年被选为美国国家工程院院士。

  同时她也在美国找到了自己的意中人,她的丈夫是一位机器人专家,叫西尔维奥・萨瓦雷塞,两人的工作领域可谓相辅相成。

  2025年2月6日,AI界传来重磅新闻:李飞飞和斯坦福大学的研究团队,用不到50美元的成本,成功训练出名为s1的人工智能推理模型。

  翻译:DeepSeek r1令人兴奋,但缺少OpenAI的测试时缩放图,且需要大量数据。我们推出s1,仅用1000个样本以及一种简单的测试时干预方法,就重现了o1-preview的缩放特性与性能表现。

  该模型出炉后迅速被拿来和DeepSeek 作比较,结果显示它在数学和编码能力方面与后者平分秋色。

  随着《科创板日报》记者深入调查以及业内人士的解读,事情的真相逐渐浮出水面。

  原来,s1模型并非平地起高楼,而是基于阿里云通义千问(Qwen)模型进行监督微调得到的。

  按照业内普遍认知,这点数据量在AI训练中实在是少得可怜,根本不足以研发出一个具备推理能力的模型。

  这1000个样本数据的作用更像是给蛋糕点缀的樱桃,而不是制作蛋糕的主要原料。

  这种低成本训练很依赖已有的强大基座模型,要是没有别人给它打地基的话就不行了。

  不过,哪怕s1模型的低成本训练备受质疑,但它的研究思路还是有很多可取之处的。

  因为AI领域这些年一直在研究的重要项目之一,便是如何高质量、低成本地训练。

  李飞飞这次的成功意义不浅,相当于只要有一个国家在AI领域实现技术突破,就很可能会被其他国家低成本复刻。

  然而这样的人才却加入了美国国籍,还代表美国与中国竞争,让许多网友心中不忿。

  比如吴恩达、亚历山大·王、贾扬清等人,都是是AI领域响当当的大神级人物。

  有人觉得他们享受了美国优越的科研资源和环境,取得的成果很大程度上得益于美国提供的平台。

  部分人认为,既然他们选择加入美国国籍,就意味着在一定程度上与祖国拉开了距离。

  这和我们中国人心中的家国情怀格格不入,更多的人所崇敬的还是钱学森这样的人。

  不过换个角度看,他们在国际上取得的成就,提升了华裔群体在科技领域的声誉。

  这种竞争带来的压力,也使得国内AI领域的从业者不敢懈怠,从而屡屡产生新突破。

  参考信源:2025-02-06 华尔街见闻——成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了

  2025-01-28 中国新闻网——Deepseek爆火,英伟达股价暴跌,白宫回应

搜索