闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚敐澶婄闁挎繂鎲涢幘缁樼厱闁靛牆鎳庨顓㈡煛鐏炲墽娲存鐐达耿閹崇娀顢楁径瀣撴粓姊绘担瑙勫仩闁告柨绉堕幑銏ゅ礃椤斿槈锕傛煕閺囥劌鐏犻柛鎰ㄥ亾婵$偑鍊栭崝锕€顭块埀顒傜磼椤旂厧顣崇紒杈ㄦ尰閹峰懘骞撻幒宥咁棜婵犵數濮伴崹鐓庘枖濞戙埄鏁勯柛鏇ㄥ幗瀹曟煡鏌涢埄鍐姇闁绘挸绻橀弻娑㈩敃閿濆洨鐣洪梺闈╃稻濡炰粙寮诲☉銏℃櫜闁告侗鍠涚涵鈧紓鍌欐祰妞村摜鏁敓鐘茬畺闁冲搫鎳忛ˉ鍫熺箾閹寸偛绗氶柣搴濆嵆濮婄粯鎷呴崨濠冨創闂佹椿鍓欓妶绋跨暦娴兼潙鍐€妞ゆ挾濮寸粊锕傛⒑绾懏褰х紒鐘冲灩缁鈽夐姀鈾€鎷婚梺鍓插亞閸犳捇鍩婇弴鐔翠簻闁哄倸鐏濋顓熸叏婵犲嫮甯涢柟宄版嚇瀹曘劍绻濋崒娑欑暭婵犵數鍎戠徊钘壝洪敃鈧—鍐╃鐎n偅娅滈梺缁樺姈濞兼瑧娆㈤悙鐑樼厵闂侇叏绠戦崝锕傛煥閺囩偛鈧綊鎮¢弴銏$厸闁搞儯鍎辨俊濂告煟韫囨洖啸缂佽鲸甯¢、鏇㈠閳跺灕鍥ㄧ厸閻忕偛澧介妴鎺懨归悪鍛洭缂佽鲸甯℃慨鈧柨娑樺濞堥箖姊绘担绛嬪殭閻庢稈鏅濋崰濠傤吋閸モ晝鐓撻梺纭呮彧缁犳垿鎮″鈧弻鐔告綇妤e啯顎嶉梺绋匡功閸忔﹢寮婚敐澶婄闁绘垵娲ら崣鏇犵磽娴f垝鍚柡浣筋嚙椤繐煤椤忓嫬绐涙繝鐢靛Т鐎涒晠鎮鹃柨瀣瘈闁汇垽娼ф禒婊堟煥閺囨ê鈧繈銆佸鑸垫櫜闁糕剝鐟ч惁鍫濃攽椤旀枻渚涢柛鎾寸懃閻g敻宕卞☉娆屾嫼闂傚倸鐗婄粙鎾剁不閸愭祴鏀介柣鎰ㄦ櫅娴滈箖姊绘担鍛婃喐闁稿濮撮埢鏂库槈閵忕姷鍘撮梺纭呮彧闂勫嫰宕戦幇顔剧=濞达綀鍋傞幋锔界叆妞ゆ挾鍋愰弨浠嬫煟閹邦垰鐨烘繝鈧幘顔界厱濠电姴鍟扮粻鐐烘煏閸℃洜绐旀鐐达耿瀵剟濡烽敂缁樼秾濠电姷顣藉Σ鍛村垂閸洖缁╅梺顒€绉村Λ姗€鏌嶈閸撶喎顫忔繝姘<婵﹩鍓︽禒鐓庘攽閻愯尙婀撮柛鏂跨Ф缁顓奸崶鈺冪厯闁圭厧鐡ㄩ幐濠氭倵婵犳碍鍊甸柣銏ゆ涧椤h偐绱掔拠鎻掓殭妞ゎ亜鍟村畷鎰版偄閾忕懓鏁舵繝鐢靛Т閻ュ寮舵惔鎾充壕闁哄洢鍨圭粻鐘荤叓閸ャ劎鈽夐柣鎾存礋閺岀喖鎮滃Ο鐑橆唴閻熸粎澧楃敮妤呭疾閺屻儲鐓曟い鎰╁€曞▍蹇斾繆椤愩垹顏慨濠冩そ瀹曘劍绻濋崘顏咁吇闂備胶顢婂▍鏇㈠箲閸ヮ剙鏄ラ柣鎰惈缁狅綁鏌ㄩ弮鍌滃笡闁哄應鏅犲娲礂闂傜鍩呴梺绋块绾绢厾鍒掑▎鎾崇倞妞ゆ帊璁查幏濠氭⒑閹肩偛鍔€閻忕偤鏁弸鍛存⒒娴e憡鎯堥柡鍫墰缁瑩骞樼€靛壊娴勯梺鎸庢礀閸婂摜绮诲杈ㄥ枑鐎广儱鎲涢幒妤€閱囬柕澶涜吂閹疯櫣绱撻崒娆戝妽閽冮亶鏌i幘鍗炲姕濞e洤锕、鏇㈡晲閸モ晝鏉介柣搴㈩問閸犳盯顢氳椤㈡ɑ绺界粙鍧楀敹濡炪倖鍔х紞鍡涘焵椤掆偓濞差厼顫忕紒妯诲闁告稑锕ら弳鍫ユ⒑鐟欏嫭鍊愮紒鐘崇墪閻i攱瀵奸弶鎴濆敤閻熸粍绮撳畷鐢稿即閻愨晜鏂€闂佺粯锚绾绢參銆傞弻銉︾厸闁告侗鍠氶崣鈧梺鍝勬湰缁嬫垿鍩ユ径鎰煑婵☆垵鍋愬▔鍧楁⒒娴h櫣甯涙い銊ユ閻f繄绮欏▎鐐稁婵°倧绠掗敓銉︾瑜版帗鐓欓柣鎴灻悘锝夋煕閻樿韬慨濠冩そ瀹曘劍绻涢幒婵呴偗濠碘€崇埣楠炴牗鎷呯喊妯轰壕濞撴埃鍋撶€殿噮鍣e畷濂告偄閸涘⿴浠ч梻鍌欐祰濞夋洟宕抽敃鍌氱闁跨噦鎷�
闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚敐澶婄闁挎繂鎲涢幘缁樼厱闁靛牆鎳庨顓㈡煛鐏炲墽娲存鐐达耿閹崇娀顢楁径瀣撴粓姊绘担瑙勫仩闁告柨绉堕幑銏ゅ礃椤斿槈锕傛煕閺囥劌鐏犻柛鎰ㄥ亾婵$偑鍊栭崝锕€顭块埀顒傜磼椤旂厧顣崇紒杈ㄦ尰閹峰懘骞撻幒宥咁棜婵犵數濮伴崹鐓庘枖濞戙埄鏁勯柛鈩冪☉閻鐓崶銊︾叄缂佽妫濋弻锝夊箛闁附婢撻梺鎼炲€栭悷銉╂箒濠电姴锕ら悧蹇涙偩閻戞ɑ鍙忓┑鐘插暞閵囨繃顨ラ悙鏉戝闁诡垱妫冮弫鎰板炊閳哄倹鐦旈梻鍌氬€烽懗鑸电仚濡炪倖鍨靛ú顓炵暦閹存績妲堥柕蹇婃櫆閺咁亪姊洪棃娑辨Т闁哄懏绋撶划鍫⑩偓锝庡亖娴滄粓鏌″鍐ㄥ闁汇劍鍨块弻锝夊Χ閸屾矮澹曢梻鍌氬€搁崐椋庣矆娴e湱鐝跺┑鐘叉处閸嬪倿鏌涢鐘插姎缁炬儳顭烽弻娑樷槈閸楃偛绠伴梺鍝勵儏缁夊綊骞冨鈧幃娆撳箵閹哄棙瀵栫紓鍌欒濡狙囧磻閹剧粯鈷掑ù锝呮贡濠€浠嬫煕閵娿劍顥夊畝锝堝劵椤︽煡鏌i埥鍡楀籍婵﹦绮幏鍛存偡闁箑娈濇繝鐢靛仦缁佹挳寮插┑鍫濆灊濠电姵鑹剧粻锝夋煥閺傚灝甯ㄩ柛瀣崌閺佸啴宕掑槌栧敹闂佺澹堥幓顏嗙礊娴e壊鐎舵い鏂跨毞閺€浠嬫煟閹邦剙绾фい銉у仱閺岀喓绮欏▎鍓у悑闂佺硶鏅滈惄顖炵嵁閹烘嚦鏃€鎷呴崫鍕疄闂備浇顕х换鎺楀磻閻愯尙鏆︽俊顖濆吹閻濊埖鎱ㄥ璇蹭壕闂佸搫鑻粔鐑铰ㄦ笟鈧弻娑㈠箻鐎靛憡鍒涢悗瑙勬礃椤ㄥ懘锝炲⿰鍫濈劦妞ゆ帒瀚畵渚€鏌涢幇闈涙灍闁稿﹦鍏橀弻锝夊箣閻愬棙鍨甸埢宥夊炊椤掍讲鎷洪梻渚囧亞閸嬫盯鎳熼娑欐珷闁圭虎鍠楅悡鍐煏婢舵ê鐏i柣锝囨暩閳ь剝顫夊ú鏍礊婵犲洢鈧礁鈻庨幘婢勩劎鎲稿澶婂嚑婵炴垯鍨洪悡娆撴煣韫囷絽浜炲褏鏁婚弻娑㈠煛鐎n剛鐦堥悗瑙勬礃閿曘垽銆侀弮鍫濈妞ゆ劑鍎辨慨宀勬⒒閸屾艾鈧悂宕愰幖浣哥9濡炲娴烽惌鍡椼€掑锝呬壕濡ょ姷鍋為悧鐘汇€侀弴姘辩Т闂佹悶鍎崝宀勵敋闁秵鐓涘璺侯儏閻忋儵鏌f惔顔煎籍闁诡喖鍢查オ浼村川椤撗勬瘔闂佹眹鍩勯崹杈╂暜閹烘挻娅忛梻浣告惈鐞氼偊宕曢弻銉﹀亗闁靛鏅滈悡娑㈡煕閵夈垺娅呭ù鐘崇矒閺屽秷顧侀柛鎾寸懅缁辩偞绻濋崶褏鐣洪梺璺ㄥ枔婵敻宕戦崟顖涚厱闊洦鑹炬禍褰掓煕濡吋鏆柡宀嬬稻閹棃鏁愰崱妯荤槑闂佸搫顑愭禍婵嬪Φ閸曨剚鍎熼柨娑樺閸旑垶姊洪崫鍕缂佸鍏樼瘬濞撴埃鍋撻柡灞剧洴楠炴﹢宕¢悙宸綆婵°倗濮烽崑娑氭崲濮椻偓瀵偊骞樼紒妯绘闂佽法鍣﹂幏锟�
射频微波器件采购网,轻松满足您的射频微波器件采购需求
轻松满足您的射频微波器件采购需求
整合全球优质射频微波芯片代理商现货渠道
聚焦知名射频微波器件品牌,强大的现货交付能力
射频微波器件优势现货
射频微波行业新闻头条|射频微波器件采购网
AI 公司集体 "平替":小模型训练成本降至百万级 大模型退烧
(2025年4月7日更新)

3月10日消息,如今开发人工智能的成本正降至历史新低。更低廉的人工智能开发技术的确让开发者欢欣鼓舞,但这并非全然利好。随着成本降至谷底,大科技公司在基础模型上的高昂投资必须得到合理解释。

射频微波器件采购网(www.ic-king.com)专注整合国内外厂商的现货渠道,实时查询射频微波器件代理商的真实库存,提供合理的行业价格,放心采购射频微波器件,是国内专业的射频微波芯片采购平台

以下为翻译内容:

打造一家人工智能公司究竟要花多少钱?随着大语言模型的研发成本越来越低,这个数字每天都在下降。

人工智能算力成本持续下降,此外用极低成本训练出优质大模型的“模型蒸馏技术”在不断普及。新型廉价开发技术令AI开发者欢欣鼓舞,但这并非全然利好,也让一些企业感到寒意。这项历史悠久的技术正被赋予新价值:对多数人是福音,对特定群体意味着复杂挑战,而对AI未来则意义深远。

蒸馏技术解构

人工智能开发者和专家表示,蒸馏技术的本质在于运用一个模型提升另一个模型。让一个较大的“教师”模型生成应答与推理路径,再让一个较小的“学生”模型模仿其行为模式。

据传中国公司DeepSeek(深度求索)以约500万美元成本训练出与OpenAI抗衡的模型,在业界引起轩然大波。该消息引发股市恐慌,因担忧芯片需求下降,英伟达市值惨跌6000亿美元(但此预测尚未成真)。

加州大学伯克利分校的研究团队则在今年1月份发布研究,表明他们用不到1000美元的算力成本就训练出两个新模型。今年2月份,斯坦福大学、华盛顿大学以及艾伦人工智能研究所的研究人员更进一步,只用更低成本就训练出一个可用的推理模型。

这些突破都得益于蒸馏技术。

这项技术通常会搭配微调技术(fine-tuning),能以远低于其他方法的成本在训练阶段提升模型性能。开发者常用这两种技术赋予模型特定的专业知识或技能。例如,可以将Meta开发的通用基础模型蒸馏成精通美国税法的专家系统;或者利用DeepSeek的R1推理模型对Llama进行蒸馏,从而增强后者的推理能力,让Llama在生成答案需要更长时间时,能逐步展示推理过程。

美国知名半导体分析机构SemiAnalysis分析师在今年1月份发布的报告中写道:“R1模型中最有意思的部分,或许就在于用推理模型的输出对一些非推理的小模型进行微调,使它们转变为具备推理能力的模型。”

除了价格低廉外,DeepSeek还把R1推理模型作为教师,发布其他开源模型的蒸馏版本。DeepSeek的全尺寸模型以及Llama的最大版本规模太过庞大,仅有特定硬件能支持模型运行,而蒸馏技术也有助于解决这一问题。图灵资本(Touring Capital)合伙人萨米尔·库马尔(Samir Kumar)表示:“经过蒸馏的模型体积更小、参数更少、内存占用更低,甚至可以在手机或边缘设备上运行。”

DeepSeek的突破性在于,经过蒸馏的模型性能并未因规模缩减而下降,反而有所提升。

蒸馏技术虽非新生事物,却已悄然蜕变

蒸馏技术最早出现在2015年,源于谷歌人工智能元老杰夫·迪恩(Jeff Dean)、杰弗里·辛顿(Geoffrey Hinton)以及谷歌DeepMind研究副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)共同Telit Cinterion代理商撰写的一篇论文中。维尼亚尔斯近期透露,该论文曾被NeurIPS顶会拒稿,理由是该技术“对领域影响有限”。十年后,蒸馏技术却突然成为AI讨论的核心议题。与过去相比,如今蒸馏技术的威力提升源于可用作教师模型的开源模型在数量与质量上的飞跃。今年1月份,IBM LLM Granite技术管理总监凯特·索尔(Kate Soule)在播客中表示:“DeepSeek通过MIT许可开源迄今最强大的模型,实质上正在侵蚀各大厂商守护核心模型的紧闭大门。”

蒸馏技术的应用边界索尔提到,互联网开源模型库Hugging Face平台上充斥着诸如Meta Llama和阿里巴巴Qwen等传统模型的蒸馏版本。实际上,Hugging Face存储的约150万个模型中,有3万个名称中带有“distill”字样,这通常表明它们经过了蒸馏。但目前尚无蒸馏模型进入Hugging Face的榜单前列。正如实体店里的一元店,蒸馏技术虽具顶尖性价比,但可选范围有限且存在缺陷:专精某项任务的蒸馏模型在其他领域的表现可能会弱化。

苹果公司研究人员曾尝试构建“蒸馏扩展定律”,通过教师模型的规模、目标模型规模和算力投入等参数预测蒸馏效果。他们发现,在特定条件下,当使用高质量的教师模型时,蒸馏效果优于传统的监督学习,但当教师模型过大时,性能提升将停滞。

尽管如此,这一技术仍有助于缩短从概念到原型的距离,普遍降低人工智能创业门槛。但多位人工智能专家强调,这种捷径并不否定昂贵基础模型的必要性,但却是动摇了大模型厂商的盈利前景。

基础模型还有出路吗?英伟达首席执行官黄仁勋在公司最新财报发布后接受采访时表示:“如今全球几乎所有AI开发者都在使用DeepSeek的R1来蒸馏新模型。”蒸馏技术带来了机遇,但对OpenAI和Anthropic等公司耗巨资开发的专有大模型构成了威胁,有可能遭到对抗。云平台Hyperbolic联合创始人张杰表示:“我认为基础模型将会越来越趋于同质化。预训练模型的能力存在天花板,我们正逼近这个极限。”张杰认为,大语言模型巨头的出路在于打造受欢迎的产品而非模型本身,这或许解释了Meta选择部分开源Llama模型的战略考量。

此外,基础模型公司还可以采用更激进的策略。匿名谷歌DeepMind研究员表示,具备推理能力的模型可以通过隐藏推理步骤或“痕迹”来防止被蒸馏。虽然OpenAI在大型o1推理模型中隐藏了完整的推理路径,但新发布的o3-mini版本则展示了这些信息。特朗普政府人工智能政策顾问戴维·萨克斯(David Sacks)在今年1月份接受采访时说:“未来几个月,头部人工智能公司将围剿蒸馏技术。”

不过,在开源人工智能的“狂野西部”,要通过限制蒸馏来遏制技术扩散谈何容易。IBM LLM Granite的索尔直言:“Hugging Face充斥着大量GPT模型生成的、未经授权的格式化训练数据集。这早已经是公开的秘密。”

Anthropic和OpenAI均未对此置评。

射频微波器件型号搜索排行榜:
领先的购买射频微波芯片等元器件的现货平台
射频微波器件采购网专注整合国内外授权元器件代理商的现货资源,轻松采购元器件,是国内专业的射频微波器件采购平台