开云体育

DeepSeek:不应被神化的技术与现实开云体育

2025-03-05
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!引子:我们总是对从 0 到 1 的创新满怀期待,渴望见证石破天惊的突破。但客观来讲,迈出第一步和迈出第一万步,在本质上并没有区别,每一步都同样重要。

  新年伊始,本该沉浸在休息放松的惬意时光里,可面对读者们热情满满的催更,实在让我难以招架,尤其是关于DeepSeek的讨论呼声,热度简直居高不下。本以为只有科技圈对它格外关注,结果在一个搞笑博主的评论区里,都能看到网友焦急地发问:“你怎么还不讲 DeepSeek?它血洗美国股市,把美国人的幻想都干碎了,那些欧美科技公司都坐不住啦!” 这关注度,着实超乎想象!

  这股 “DeepSeek 热” 不仅没有降温,反而愈演愈烈。各种夸张的言论甚嚣尘上:

  仿佛一夜之间,DeepSeek 成了改写科技史的超级英雄。更离谱的是,还有人编造出 DeepSeek 遭受境外大规模网络攻击,中国红客高手隐迹江湖出手相救的热血爽文剧情,这想象力,不去写小说都可惜了。

  舆论的走向愈发失控,我们似乎只要一谈到 DeepSeek,就会陷入一种盲目狂热的情绪之中。不可否认,DeepSeek 自身实力确实出色,加上这几年 AI 行业本就火爆,这些因素都为它的热度添了一把柴。但其中地缘因素的推动作用也不容忽视,很多人内心深处渴望听到一个 “歪果仁怕了、服了” 的科技故事,DeepSeek 的出现,就像是一场及时雨,满足了大家这种心理需求。

  媒体和公众人物也纷纷下场,为这种情绪推波助澜,把对 DeepSeek 的讨论上升到哲学、国运、历史走向的高度。这些讨论在流量的放大镜下,被不断放大、断章取义,让一款 AI 模型背负了远超它本身的地位、责任和期待,硬生生地被推上了神坛。

  可神坛之上,真的是一片坦途吗?回顾过往,我们不难发现,被捧得越高,往往摔得就越惨,“伤仲永”“泡沫破裂” 的舆论反噬屡见不鲜。对于刚刚崭露头角的 DeepSeek 和它的研发团队来说,这种过度追捧带来的负面影响,很可能远远超过正面意义。

  所以,是时候冷静下来,拆掉这座舆论堆砌的神坛,还 DeepSeek 一个真实、朴素的面貌,基于客观的共识,重新审视它。

  先抛出一个可能会让不少人惊讶的观点:与社交媒体上那些夸张的说法不同,DeepSeek 其实并没有实现从 0 到 1 的核心技术突破。

  DeepSeek 爆火之后,研发团队和科技产业的相关人士都在强调中国 AI 不能只是亦步亦趋,必须要完成从 0 到 1 的蜕变。这个观点无疑是正确的,可就目前的情况来看,DeepSeek 还难以成为这个观点的有力例证。

  所谓的核心技术突破,要么是主要技术路径发生根本性变化,要么是达成的效果有质的飞跃。DeepSeek 目前最引人注目的技术能力,一个是 R1 模型带火的思维链推理过程,另一个是其联网检索的RAG效果表现出色。

  但这两条技术路线都不是 DeepSeek 的首创。思维链的兴起,一般认为是 OpenAI 发布的 o1 模型引发的。去年 9 月 o1 模型公布后,全球主流大模型纷纷跟进,推出了类似的思维链、推理大模型等能力,虽然各家的名称可能不太一样,但整体技术路线高度一致。DeepSeek 确实把思维链的过程展示得更加完整、详细,可仔细观察就会发现,其中大模型幻觉的问题依然十分严重。

  在联网检索方面,其他厂商也早就开始布局,也就是所谓的 RAG 检索-增强-生成机制。这项技术最初是为了解决大模型缺乏实时信息的问题,同时帮助矫正大模型幻觉。早在 2023 年,百度发布文心一言时,RAG 就已经是其核心能力的重要组成部分。

  不过,没有从 0 到 1 的创新,并不代表没有创新。DeepSeek 在模型能力的优化上付出了诸多努力,做了大量开拓性工作,比如通过 GRPO 算法让模型运行更加高效。可以说,DeepSeek 集成了业界主流且经过验证的技术路线,并在此基础上实现了模型优化、能力提升和用户体验升级。

  我们总是对从 0 到 1 的创新满怀期待,渴望见证石破天惊的突破。但客观来讲,迈出第一步和迈出第一万步,在本质上并没有区别,每一步都同样重要。

  那么,DeepSeek 究竟凭什么能引发全球关注呢?在经过一个春节的疯狂发酵后,很多人可能都快忘记了它最初出圈的原因 —— 通过软件和架构创新,以极低的算力成本完成了 DeepSeek - V3 模型的训练。

  DeepSeek - V3 是我们现在使用的 R1 模型的基础模型。从研发团队发表的论文中可以了解到,他们仅仅花费了 550 万美元的算力训练成本,就完成了 6710 亿参数大模型的训练。即便这个统计只涵盖了基础模型训练的算力成本,不包括后续应用模型的强化学习、模型推理,以及人才成本、综合成本等项目,但这已经足以颠覆大模型训练的主流成本模型。

  最终,DeepSeek 实现的效果基本达到了以 o1 为代表的主流大模型水平。虽然在模型效果上很难说全面超越了其他模型,但它确实凭借软件算法的革新,实现了硬件成本的大幅下降,让低成本模型的效果不逊色于高成本模型,也让开源模型的效果逐渐追赶闭源模型。

  而 DeepSeek “降低 AI 算力成本” 的这一突破,恰好发生在全球主流 AI 玩家疯狂囤积高端 GPU,以此构筑产业护城河,以及美国对中国禁售高端 AI 芯片,企图打压中国 AI 发展的关键节点上。这就使得 DeepSeek 被赋予了实现 AI 民主化,甚至助力打破地缘科技垄断的特殊意义,于是就有了中国 AI 大模型让美国股市遭遇震荡的戏剧性一幕。

  DeepSeek 实现的训练效率提升与训练成本下降,在特殊的产业环境和国际环境下引发了连锁反应。但问题是,很多平时不太关注 AI 的朋友,可能根本不知道 AI 大模型算力越大效果越好的 Scaling Laws,也不了解算力垄断和禁售的背景信息,只知道短视频里说 DeepSeek 横空出世,把外国人都吓得不轻。这种缺乏前因后果的片面认知,给 DeepSeek 凭空塑造了一座不属于它的神坛。

  推而广之,我们很多人都热衷于追捧那些天才式、戏剧化的创新。但在现实世界里,往往只有通过不断地工程化实践,持续调优、降本、提效,技术创新才有可能得到广泛应用和普及。就像我们都知道爱迪生发明了电灯,却容易忽略大规模电网建设对降低电力成本的巨大作用。要是每家都得自己发电,那世界恐怕真的会陷入一片黑暗。

  “我们把成本打下来了。” 这句看似荒诞、俗套,甚至带点反讽意味的话,恰恰是中国产业化能力的真实写照。我们不妨大大方方地承认,包括 DeepSeek 在内的中国 AI,在未来很长一段时间里,最擅长的就是把成本狠狠降下来。

  DeepSeek 爆火之后,很多人都将其归功于技术的巨大胜利,甚至有人预言 AI 的崛起会让人文学科和人文工作失去价值,“DeepSeek 来了,学文科还有意义吗?” 这样的话题还登上了热搜。

  但只要我们多使用 DeepSeek,仔细分析它与其他模型的差异,就会发现一个截然不同的观点:DeepSeek 恰恰证明了文科与人文能力,在 AI 时代有着不可替代的重要性。

  随机询问一些人对 DeepSeek 的使用体验,他们大多会说跟 DeepSeek 对话感觉更有人情味。但这种人味,并非源于理解、推理等 AI 技术层面,而是模型在对话过程中展现出了丰富的幽默感、网感,以及更符合年轻群体的对话习惯。此外,DeepSeek 还具有相对精妙的修辞能力、优美的文笔和不错的综合人文素养。

  这些能力,让 DeepSeek 更契合年轻用户的对话习惯和审美需求,能够给出更具话题度和传播度的回答。可关键在于,这些能力与技术的关联不大,更多地与训练语料的选取等人文能力密切相关。

  比如,让 DeepSeek 写首诗,它能写出文艺青年喜爱的语调与修辞;而其他主流国内大模型,虽然也能写得平仄工整、辞藻华丽,却总给人一种打油诗般的 “老干体” 感觉。再比如,让 DeepSeek 预测未来趋势等问题,它的回答就像网络科幻小说,虽然经不起仔细推敲,但就是能让年轻人觉得特别厉害、特别燃。

  这些优点的背后,是研发团队的年轻化、高审美,以及对模型训练过程中人文要素的重视。反观很多主流大模型,由于最终听取汇报的领导层普遍是 45 岁以上、缺乏人文学科背景的中年男士,导致大模型对话充满 “官腔”,让人提不起兴趣。与其说是年轻人在支持 DeepSeek,不如说是年轻人在支持自己的话语权和审美权。

  顺便提一句,DeepSeek 目前还有些 “百无禁忌”,但监管迟早会介入,大家也不必对 AI 的犀利和大胆抱有过多幻想。

  DeepSeek 以一种巧妙的方式,实现了更好的用户对话体验和更优秀的传播效果。这或许能促使 AI 公司反思产品体验,重视人文能力的培养。如果我们只一味地吹嘘 DeepSeek 的技术,而忽略了它在人文体验方面的优势,那可就太可惜了。

  综合以上这些方面,我们可以勾勒出一个完整、真实的 DeepSeek,它不再被神圣的光晕笼罩:

  它是一次综合性的突破,融合了技术创新、人文素养、开源和低成本策略等要素,并且在特殊的产业周期和国际环境背景下被不断放大。

  DeepSeek 不是石破天惊的技术革命,但它足够成熟,也足够有新意。这也在一定程度上解释了,为什么欧美的 AI 大佬与专家,对它的评价比较一致:令人印象深刻。

  DeepSeek 没有一步登天,我们也不必幻想一步登天。它只是前进了一大步,我们完全可以为这一步的迈出而感到自信和骄傲。

  这种片面的言论。事实上,中国有着清晰的 AI 产业格局,坚实的自主化 AI 软硬件体系,数十万 AI 开发者,以及积极的 AI 政策导向。这些都是孕育更多优秀 AI 成果的肥沃土壤。有了这些因素的支撑,我坚信会有更多像 DeepSeek 这样的优秀成果不断涌现,直到 AI 工业革命全面开启,直到 AGI 的曙光真正降临。

  所以,何不把 DeepSeek 带下神坛?理性、从容地看待它,用好它,用好中国 AI 事业的一切成果,这才是 AI 在中国真正成熟的标志。

  王阳明说:“山高万仞,只登一步。”DeepSeek 这一步,有着它独特的意义。迈出这一步后,我们不妨停下来,听听山风,享受一下阶段性的成果。但同时也要清醒地认识到,我们还在攀登的路上。休息好了,高兴够了,我们唯一要做的,就是坚定地迈出下一步。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  政府工作报告:城乡居民基础养老金最低标准再提高20元 适当提高退休人员基本养老金

  网传上海一男子指着瘫痪父亲大骂:老**想死是不是?再不醒过来接回家等死

  美国驻华大使馆账号“跳反”了?发布白宫会晤的报道,几千条评论清一色的反对

  早鸟价倒计时2天·ISAR文凭全阶课程丨双导师技术流·哥本哈根占星学院院长邓肯与海星程首度联合授课!

  苹果64GB时代结束:iPhone 和 iPad 全系标配 128GB 存储空间

搜索