AI(人工智能)开源,正从技术理想转变为浙江的战略抉择。
近期,浙江省省长刘捷在“开局起步‘十五五’”浙江专场新闻发布会上表示,“着力营造最优开源开放生态”。浙江省“十五五”规划纲要中,六次提及“开源”,频次之高、着墨之重,前所未有。
目前,DeepSeek、千问等浙产开源AI大模型,引领全球开源生态。同时,魔搭社区、Datawhale、观猹等一批AI开源社区在杭州兴起,开发者线上与线下协作,催生出新的创新生态。
浙江为何作出这一抉择?这又将如何重塑地方创新生态、改变产业发展方式,并带来哪些更为深刻的变化?
连日来,记者加入线上社区,走访线下空间,与开发者、研究员、专家学者等对谈,探寻AI开源背后的战略深意。
开源账怎么算
何为开源?开源,即“开放源代码”,是助推计算机领域发展的重要技术文化。
采访中,浙江大学的一名AI研究员推荐了传奇程序员埃里克·雷蒙德写于20多年前的文章《大教堂与集市》,其中有形象比喻:闭源,像造大教堂,管理严密、结构封闭集中;开源,如集市,人人参与、协作开发,在创新和纠错上更胜一筹。
回顾改革开放史,浙江人似乎与“集市”有不解之缘,从义乌小商品城到淘宝网,正是开放协作的“集市”带来了蓬勃的发展机遇。
在AI领域,浙江为什么又选择“集市”模式?这背后的大账应该怎么算?
记者调查发现,开源,既有技术理想主义的情怀,长期来看也符合商业逻辑。
在杭州城西阿里云园区,目前中国最大的模型开源社区魔搭社区运营负责人石洪竺,打开手机相册,回忆了一段开源往事。
时间回到2022年2月,距离ChatGPT发布还有9个月。那时,AI大模型还只停留在学术圈和大厂实验室。据相关人士回忆,当时担任阿里云智能首席技术官(CTO)的周靖人提出了“Model as a Service”(MaaS,模型即服务)理念,他画了一张流程图,阐释对这一设想的系统思考,并计划将重金研发的模型开源,搭建起开源生态。
“让AI更加普惠,这需要勇气。”石洪竺说。
反对意见不难预料。开源意味着短期收入受损,竞争对手可能站在你的肩膀上超越你。但当时管理层坚持一个判断:模型会成为核心生产工具,开源更利于它普及,反过来推动创新。
2022年11月3日,杭州云栖大会,魔搭社区正式上线时,阿里巴巴贡献了各个领域的开源模型超过300个,其中近一半是当时的SOTA(当时最高水平的)模型,仅27天后,OpenAI旗下ChatGPT横空出世,引爆全球AI热潮。但OpenAI选择了闭源,恰与其公司名字背道而驰。这在短期确实建立起了商业优势,公司估值扶摇直上。
此时,AI成为全球竞争的焦点领域,另一家浙江公司,悄然走上了“开源创新”之路。2023年7月,杭州深度求索公司(DeepSeek)成立,确立“开源、降本、普惠”原则。
谈及开源与闭源之争,中国人工智能学会教育工委主任、浙江大学本科生院院长吴飞认为:“开源的本质是开放知识与创造能力。AI技术具有先行者引领的溢出效应,若不主动构建开源生态,就会被别人抢占高地、主导技术方向。”
这3年多来,是AI领域技术快速迭代的时期。OpenAI等大厂用闭源保护短期技术优势的同时,也在把全球开发者推向那些愿意开放的平台。
这种迁移,已经在浙江上演。
2025年1月,DeepSeek-R1发布,性能直追当时OpenAI-o1模型。DeepSeek-R1上线当天同步开源全部模型权重。不到一个月,DeepSeek全球累计下载量突破1.1亿次。
DeepSeek资深研究员陈德里说,开源是DeepSeek自创立之初就坚定的路线,“在与社区技术开发者交流中,我们收获了很多有意义的反馈,这反过来也推动了DeepSeek自身的发展。”
目前,魔搭社区已汇聚国内外各个版本模型超过19万个,服务超过2500万全球用户。更关键的是,开源生态的反哺效应开始显现,外部开发者基于开源模型的改进、应用和反馈,加速了千问系列模型的迭代速度。MaaS的理念被业界广泛认可并使用。
过去一年,以DeepSeek、千问为代表,我国开源大模型下载量全球居首。其中,千问全球衍生模型数量超20万,下载量超10亿。
这让人想起10多年前,谷歌通过开源安卓操作系统,占领了移动互联网入口。数字经济的过往历史表明,把技术底座开放,让全球开发者在此基础上测试、优化、建立生态,有可能会兑现出更庞大的价值。
通过开源,技术门槛被拉低,越来越多以个人为代表的创新主体涌入,浙江怎么接住这些涌进来的创造者,形成更大的价值,是当下的现实挑战。