点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

首页> 时评频道> 百家争鸣 > 正文

大模型身瘦路更宽

来源:经济日报2025-01-26 09:59

  作者:佘惠敏

  春节将至,中国人工智能(AI)公司密集发放节日大礼包,展现出2025年大模型竞争的新动向。仅1月20日一天就有4家公司推出新品:深度求索公司DeepSeek发布了DeepSeek-R1模型,月之暗面公司Kimi推出了k1.5多模态思考模型,两家公司新模型性能都对标OpenAI o1正式版。MiniMax海螺上线语音功能,字节豆包上线实时语音大模型,很明显是在对标OpenAI的实时语音功能。

  自2022年11月美国人工智能公司OpenAI发布GPT-3.0引燃全球AI大模型热潮以来,全球科技厂商纷纷入局,密集上线大模型。

  OpenAI的火爆来自“大力出奇迹”路线,以规模作为大模型的制胜法宝。但这也让AI大模型的发展陷入了一个怪圈:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种“军备竞赛”型开发模式,带来了惊人的能源消耗和训练成本,难以为继。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。

  而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术,开启了大模型“瘦身”新风尚,走出一条“小而强”的新路径。以DeepSeek为例,R1在多个基准测试中与美国OpenAI公司的o1持平,但成本仅为o1的三十分之一。模型性能的追赶速度也很快,OpenAI推出正式版o1模型是在2024年12月,仅仅1个多月后,DeepSeek就发布了性能相当的R1模型。

  DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。因为更小的模型意味着更低的部署成本、更快的响应速度和更广泛的应用场景。在医疗、教育、制造等诸多领域,轻量级AI模型都将带来革命性的转变。

  从信息技术发展历史看,“小型化”进程也是大势所趋。计算机曾是占据整个房间的大型机,后来发展成可作为桌面设备的电脑,又进化为便携式笔记本。手机从古早的砖头式“大哥大”,改进为小巧的功能机,又进化至如今的智能终端。DeepSeek的成果,标志着AI大模型正在经历类似的进化过程。这种“小而强”的AI模型,将推动人工智能从实验室走向千家万户,从云端走向边缘端。

  模型并非越大越好,而是越精越妙。大模型“瘦身”促进了AI技术的创新和突破。为了在减少参数的同时保持甚至提升模型性能,研究人员不得不深入挖掘模型架构的优化空间,探索更高效的算法和训练方法。这一过程推动了人工智能基础理论的发展,也为相关技术的跨领域应用开创了新局面。

  当然,大模型“瘦身”没到终点站,仍面临诸多挑战。如何在保证模型性能的前提下实现最大程度的“瘦身”,是当前需要解决的关键问题。同时,“瘦身”后的模型如何在不同场景下保证适应性和稳定性,也需要进一步验证和优化。

  在快节奏的商业环境中,高效、灵活、低成本的解决方案更具竞争力。追求极致性价比,一向是中国公司的强项。在诸多中国公司的竞争中,AI大模型正从曾经的“庞然大物”逐渐蜕变为轻盈高效的“智慧精灵”,在保持强大认知能力的同时,大大降低了计算资源的消耗。中国公司也从模仿者和追随者,逐渐转变为创新者和引领者。展望未来,大模型“瘦身”后必将走向更宽广的坦途。(佘惠敏)

[ 责编:刘朝 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 准大学生“体验服”

  • 睡眠管理师

独家策划

推荐阅读
值此庆祝中国共产党成立104周年之际,回溯党的来时路,展望党的新征程,我们需要以更加强烈的历史主动精神推进中国式现代化,奋力实现中华民族伟大复兴的中国梦。
2025-07-02 09:25
发展数字经济是我国把握新一轮科技革命和产业变革新机遇的战略选择。面对创新涌现、迭代迅速的发展态势,我国积极顺应数字经济发展规律,审时度势调整发展政策。
2025-04-21 09:48
建立粮食产销区省际横向利益补偿机制,关键在于推进科技和改革双轮驱动。其中,改革的核心在于粮食政策创设与制度创新,调动和保护好农民种粮积极性,让农民种粮有奔头,让政府抓粮有动力。
2025-03-26 16:25
在当前中国的发展进程中,新型城镇化和乡村全面振兴是两个至关重要的战略方向。这两大战略的实施,不仅关系到中国现代化进程的推进,也是实现全体人民共同富裕的关键步骤。
2025-03-21 16:18
城市是科研机构、人才、设施等创新要素最为集中的地方;城市自身的高质量发展离不开创新。城市的创新及发展,既需要制定明确的目标,还需要遵循一定的规律和原则。
2025-03-18 09:13
全过程人民民主以聚焦民生的方式促进机会公平、打破利益藩篱,让维护社会正义的机制更加完善,持续性地疏浚社会成员上升发展流动渠道,确保每个个体都拥有人生出彩、梦想成真的机会。
2025-03-03 10:49
契合数字化、智能化的传播格局,适应Z世代拥抱变革、表达活跃、实践奋进的代际特征,以更鲜活的话语、多元的样态实现有效触达,彰显理论的生命力与引领力,是做好新时代理论传播的应有之义。
2025-01-22 11:22
人工智能产业作为国民经济最重要的先导产业、基础产业和战略性产业,正在通过生产要素、生产资料更新、重组,生产关系、生产制度重塑,成为最具潜力、带动力和深刻影响力的新质生产力引航。
2024-12-23 13:29
共建“一带一路”的主要目标之一是通过政策沟通、设施联通、贸易畅通、资金融通、民心相通,实现共建国家的共同发展与繁荣。经过11年的共同努力,一大批标志性项目相继建成并投入运营,为共建国家带来了许多实实在在的利益。
2024-12-16 17:13
经济学在应对气候变化中的角色,应该是在科学决定气候目标的基础上,主要研究如何以成本最小化的方式实现该目标,而不是将经济考虑凌驾于科学之上,由经济学决定温升应该控制到什么程度。
2024-11-26 15:50
数字丝路是我国新时期发展的战略性选择,是构建网络空间命运共同体的新阶段。数字丝路贸易的伟大实践正在使古老的丝路焕发出新的光辉。
2024-10-10 16:04
党的十八大以来,我国国际关系学科建设显著加强,发展目标、主要任务、建设路径都更加明确,要求更加清晰,学科建设明显提速,突出体现在学术创新、实践支撑、人才培养等方面。
2024-10-04 10:01
新型城镇化进程的学科建设涵盖了高等教育体系中为适应新型城镇化发展需求而设立的大量相关专业和研究方向,在实践中也是由一个庞大的职业群体共同推进着与中国现代化进程相伴的城镇化进程。
2024-10-03 09:55
新时代中国式现代化的伟大实践,为理论创造提供了强大动力和广阔空间,为建构中国自主的知识体系奠定了坚实基础。
2024-09-19 11:05
随着技术的不断进步和应用的深入,数智化将为经济社会发展全面绿色转型带来更多的机遇和动力,助力中国实现美丽中国建设和“双碳”目标,为全球绿色低碳可持续发展贡献更大力量。
2024-08-15 10:22
网络梗”越来越成为网络空间讲好正能量故事的优良载体。加强“梗能力”建设,是推动党的创新理论高质量传播的重要途径。
2024-08-06 10:17
与“修昔底德陷阱”的预设恰恰相反,构建人类命运共同体遵循共商共建共享原则,推动平等有序的世界多极化和普惠包容的经济全球化向前发展。
2024-08-02 15:08
“碳中和”背景下,有必要将具有高碳汇水平且集中分布的区域纳入生态保护红线范围当中,实施具有规范性和制度化的用途管制策略。
2024-08-01 09:52
数字治理,本质上是数字技术向多元治理主体赋能增效的过程,其目的是在数据收集、分析、利用的基础上,从多个层面对治理系统的感知、决策和执行能力进行提升。
2024-07-10 17:13
在面对错综复杂的国际环境和百年未有之大变局时,我们更需要的是中国特色大国外交的理念,而非吸引眼球的所谓“理论”。
2024-06-21 16:53
加载更多