炜烨智算周韡韡:算力不是统统短缺,而是结构性短缺
专题:服贸会2025中国AIGC创新应用论坛
中国国际就业贸易交游会-2025中国AIGC创新应用论坛于2025年9月12日在北京举行。主题为“从大模子到智能体,运行AI重生态”。炜烨智算董事长兼CEO,商汤科技副总裁大安装作事群,中国电子商会算力产业专科委员会副理事长周韡韡出席并演讲。

以下为演讲实录:
诸位尊敬的稀客,宇宙上昼好!我是Zoe周韡韡。今天再次站在服贸会的讲台,情绪荒谬昂然。三年前,我第一次以演讲嘉宾的身份来到这里时,“算力”对许多东谈主来说,如故一个生疏而远方的见地。那时,我和团队刚刚完成英伟达北京AI创新赋能中心的落地,请托了国内首个基于英伟达SuperPOD架构的专科AI张望平台。也恰是从那时起,服贸会成为我每年讲述进展、分享想考的“大科场”。
回望往日的三年时期里,算力从无东谈主问津到炙手可热,从期间话题走向产业中枢。但热度的背后,问题也相继而至:算力到底缺不缺?国产芯片到底能不成用?智算中心究竟能不成盈利?这些疑问,险些萦绕在每一个行业东谈主的心中。
我今天就想要分享我和我的团队在濒临这些问题的时候,包括在鼓动构建下一代的AIDC的过程中的一些想考和实践。
发轫,算力缺不缺?确定是缺,况且是结构性短缺!许多东谈主可能会问:既然算力如斯紧缺,为什么还有智算中心闲置,甚而金融机构的从业者告诉咱们说,即等于在北上广深这些方位照旧出现了算力的不良钞票,这个背后的真相,算力资源濒临的是一个严重的错配和区域发展的不平衡。
咱们不错把算力类比为电力。AI期间的到来,加速了五行八作的分娩力创新。改日,AI用具会像水、电、互联网一样渗入进总计行业。咱们的国度电网基建照旧相等发达,但咱们依然看到:中西部地区气候水电充足,而江浙沪却用电急切。
算力相同如斯——不是统统短缺,而是结构性短缺。
许多传统数据中心莫得跟上AI负载的需求,而新建的智算中心又穷乏期间与运营才气,导致“有算力无场景、有场景无算力”。这恰是现时许多算力平台无法实现盈利的中枢原因。
其次、国产芯片能不成用?商汤始终以来对险些市面上总计的国产芯片进行追踪和适配的检测,咱们的谜底不光是能用,况且正在成为推理期间的主力。真话实说,时期放到1年多前,国产芯片照实还很难餍足AI斥地者的需求,然则今天咱们不错相等确定地说,国产芯片不仅能用,况且正在成为鼓动AI应用爆发的一个关节力量。
因为咱们的AI正在从“张望期间”进入“推理期间”。 张望需要极高的算力聚合度和生态训诫度,而推理更依赖散播式算力和能效比——这恰是国产芯片的上风战场。
咱们的国产芯片在张望场景和举座领路中距离国际先进制程的旗舰居品还有显着差距,但每家芯片王人有在特定单任务场景下优于甚而遥遥当先的领路,通过云管平台把任务识别,分发给最合适的GPU集群扩展,即使在张望场景,通过异构会通调停期间,将国产芯片与国际高性能芯片协同使用,既餍足需求,也鼓动自主可控。
在商汤大安装,在炜烨智算进行想到纳管的许多机房,咱们恰是通过这么的期间旅途,实现了多个国产芯片花样标大边界落地。这不是息争,而是通过时间优化实现的分娩力升级。
今天是服贸会,咱们神色的是“就业”与“贸易”。算力要真实成为可清爽、可普惠的就业,需依靠两大创新:期间创新栽种就业品性,贸易创新拓宽使用东谈主群。
下一代的AIDC应该有什么特色?云请托、异构调停、token结算是三大关节词
云请托:算力推行是就业,而非硬件。裸金属期间已成往日,客户需要的是更方便、更平稳的云体验。商汤大安装云管平台2.0实现了从张望到推理的全进程云原生请托,平稳性高达99.998%。
炜烨智算在往日三个月为北京电信提供的客户就业数据浮现,张望任务中断率大幅度裁减,研发后果栽种三倍。请宇宙记取:集群“抖一抖”的代价,远越过有限范围内的房钱扣头。
其次是异构会通调停,在改日算力架构必是多元会通的。通过系统和软件界说算力,咱们将不同架构芯片(英伟达、国产芯片、ASIC等)和洽调停,最大化资源后果。在大型多模态模子张望花样中,咱们通过智能调停系统将任务理会到4种不同芯片架构上扩展,举座后果栽种65%,资本裁减42%。这就是所谓“让专科的芯片干专科的事”。
临了少许是Token结算,这是算力贸易化的关节冲破。OpenAI前不久文牍其Token资本大幅裁减,而国内咫尺能真实以Token输出模式提供算力就业的平台仍稀稀拉拉。
炜烨智算基于商汤大安装云管平台2.0,推出了国内稀缺的Token结算就业,用户按推行使用量付费,无需承担固定钞票参加风险,极大裁减创业门槛。而Token售卖结合训推一体,栽种GPU使用后果,相较于传统包节点售卖口头不错让投资方的收益灵验栽种3倍以上,亦然栽种AIDC盈利的关节钥匙。
如果说咱们的期间创新是为了让斥地者用得好,咱们的贸易创新,其实就是为了能够让宇宙用得起。算力不好卖,说到根柢上的原因,其实就是算力太贵了,尤其是关于许多的初创企业来讲。但恰是这些初创企业,如果咱们说AI的护城河是生态的话,他们才是构建AI护城河中枢的种子用户,只好优化他们的现款流和迈入这个行业初学的门槛,才能够真实的把AI的生态把它作念到活起来。
这边我不错给宇宙分享一个小的故事,在许多年前英伟达有作念过一个剑桥1号,在剑桥这个方位投建了600P的智算中心。比起当今国内的边界,这个智算中心的体量相等小,然则其时的算力相等的稀缺。是以英伟达就薄情了一个点,我不错相对微微扣头的口头让一些需要算力的企业入驻到我的智算中心内部来,然则交换的要求是企业斥地的必须得是新花样,第二,新花样要给我1%的股权。在这里边有一家企业叫阿兹利康弃取入住了剑桥1号,接下来的时期宇宙王人知谈。阿兹利康研发出了新冠的疫苗,这个居品的出现让花样标剑桥1号投资者把蓝本瞻望10年才能收回的资本,在当年就完成了。
受此启发,咱们推出“算力银行”模式,模仿硅谷银行的创新精神,构建“存取投贷”新机制:
宇宙知谈许多的算力企业和上市公司有相等丰足的实力,也有传统的国央企进行了智算中心的投建,然则这内部会濒临跨行业运营的难题。企业这个时候不错把他们闲置的算力存入咱们所料理的算力银行,由咱们来进行纳管运维,栽种钞票的愚弄后果。以咱们的招引企业为例,它是一个传统的制造业企业,它有200台的就业器的集群,之前的时候不要说给我方寻找客户了,然则在进行市集拓展的时候只可眼睁睁的看着这些钞票在我方的账面上进行折旧,和咱们进行算力的银行存入招引以后,发轫咱们为它装上了咱们的云管平台,对它进行纳管,引入了外部客户资源进行分享联动调停,进入咱们的算力池,在这之后通盘集群的使用后果栽种到了75%,况且咱们不错给不同类型的客户王人提供一个最低王人不会低于4%,在4%基础以上的年化的收益,同期客户还有不错保留我方钞票处置权,不错将这个算力随时的薄情。
另外一个就是算力投资,咱们是不错用算力的口头进行入股去参投一些初创性的企业,通盘关于初创型企业的花样评估,全程是通过区块链进行料理,AI Agent援助咱们决策,作念到快速的放款。也不错弃取结伴运营+分款的口头,在咱们这种招引的客户内部,比如说一个AI的制药企业,原来是要费钱我方去购买硬件,这种口头让它省俭了初期2千万的硬件的参加,这个资金就不错用往返引进最中枢的花样斥地AI东谈主才,让它的研发周期得到了6个月以上的栽种。
另外一个是算力信贷的模式,咱们不错给初创型企业提供算力信用卡一样的弹性的租借贷,支抓最短1个小时起租,客户还不错按月付息,期末还本这么活泼的口头去结算,其中就比如说咱们有一个客户是作念AI的视觉创业斥地、AI Agent斥地。通过这么的模式,在测试阶段只须支付到传统的算力租借的资本价钱的30%,就不错去完成通盘的斥地,在和它的客户进行交互之后再向咱们付款,这个时候现款流的压力得到了显着的下落。在完成上线居品之后再进行付款,不错匡助斥地者加速他们业务的收入、业务的融资进程,他们通盘的资金情况好,也返还给咱们的法例就是一个高于传统租借模式的房钱收益。
诚然咱们前边讲到的一系列的创新模式,王人是要依托于前边提到的期间就业的创新,超越是弃取物理集群的分享+资源逻辑的闭塞架构,增多智算中心弹性的调停,因为客户在通盘斥地的过程中间,它关于算力集群大小的使用,其实许多时候并不是一条直线,比较起来那些大厂是时高时低,呈现波谷情景。这个时候如果一个集群和就业商能够提供雅致的交心调停,是不错有劲的餍足客户需求的同期,主如果匡助他们裁减我方的斥地资本。
到当今为止,咱们通过算力银行的模式照旧匡助了越过相等多家的客户,按照市集价钱,梗概30%傍边的价值,赢得了优质算力的支抓。像文旅类,销耗类的Agent斥地者,举座资源的愚弄率从之前行业平均的40%栽种到了75%以上,咱们招引的企业斥地者们他们年内的估值平均的增长也王人在2倍以上。
其实算力普惠的实现,不单是靠基础技艺降本增效,也有模子的优化,孑然一体,算电的协同,动力的创新、金融用具介入一系列为技能。国产替代当今正在进行中的照旧不单是是硬件层面,跟着RISC V的一步步发展,很快的改日,提醒集层面的自主可控正在成为表率。咱们也从来不缺有创意的金融处分决策,缺的是既懂产业又懂金融,能将金融用具串珠成链适配于算力就业的想到者、扩展者。
实现算力的普惠不单是靠基础技艺的降本增效,还有模子的优化、基模一体、算电协同、动力创新,包括一系列金融技能的引入。国产替代当今正在进行中的,照旧不单是是硬件层面,而是跟着RISC-V一步步的发展,咱们不错看到在很快的改日,提醒级层面的自主可控一定会成为国度再一次推出的表率。
在咱们这边市集上也从来王人不缺有创意的金融的处分决策,缺的是既懂算力产业,又懂金融,能够把金融用具串珠成链,真实适配于算力就业行业的想到者、扩展者。咱们的算力不应该成为繁重创新发展的高墙,而是应该成为撑抓想象的基石。作念一个真实的正心、正面的AGI期间的共建者,把算力卖出去、管起来、用得快,用算力去赋能AI生态的发展,我认为才是咱们接下来改日的发展主见。
临了我想跟宇宙说一说,我从事算力行业3年以来的一些从业感受,其实东谈主工智能这个见地出现到当今照旧越过70年了,当今是进入了一个发展的快车谈,咱们看到许多的从业者、斥地者、企业,有的是在颂扬声中出走国际,有的是在窘境中不断的摔倒又再一次的站起来负重前行,应该说当今是一个骁雄和袼褙辈出,祈望与欲望交汇,争议颂扬并存的时期。然则在这个期间内部,才华和资质是不错拆伙的,小早好意思的企业是不错弯谈超车的,始终主义的创业者最终是会被咱们这个市集投来神色和认同的。世俗咱们把这么的期间叫作念黄金期间,算力就像是这个AGI黄金期间的呼吸生涯权,咱们频繁说如果算力不目田,这数据无趣味,总计的斥地更是无从谈起。
咱们但愿把这么的呼吸生涯权攥在我方的手里,不错攥得更紧少许,也但愿算力就业这个行业能够因为我和我团队的到来,在咱们到来之前和来到之后,有那么少许不一样。
临了想要感谢服贸会这个平台,见证我沿路从当初所谓的中国算力第一妖股的操盘手,到当今能够有少许行业言语权的从业者这么的成长,也但愿来岁的大考,能够再一次在这里和宇宙讲述分享,谢谢宇宙,我是周韡韡。
新浪声明:总计会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之主见,并不料味着赞同其不雅点或说明其面孔。

拖累剪辑:王翔
下一篇:没有了