主页 > 快资讯 > 正文

广发证券:SRAM提升AI推理速度 相关架构进入主流大厂视野

2026-02-27 16:27:33来源:同花顺编辑:李川峰

扫一扫

分享文章到微信

扫一扫

关注豌豆财经网微信公众号

  广发证券发布研报称,在大模型应用中,相比依赖外置HBM,SRAM可显著降低权重与激活数据的访延迟与抖动,从而改善Time-to-First-Token与尾时延表现。目前,Groq与Cerebras都相继推出基于SRAMAI芯片。SRAM架构进入主流视野,根据Groq官网以及市场媒体报道,英伟达此前斥资200亿美元获得Groq的知识产权的非独家授权;OpenAI与Cerebras签署100亿美元合同,部署多达750兆瓦的定制AI芯片。

  广发证券主要观点如下:

   SRAM是片上高带宽存储层

  存储分级为SRAM、HBM、DRAM和SSD,其中SRAM(静态随机存取存储器)集成在CPU、GPU计算核心附近的片上存储,具备纳秒级访问时延与高度确定性的带宽特性,带宽高但容量小、成本高。

   SRAM可提升AI推理速度

  在大模型应用中,相比依赖外置HBM,SRAM可显著降低权重与激活数据的访延迟与抖动,从而改善Time-to-First-Token与尾时延表现。Groq和Cerebras两家明星创业公司都推出了基于SRAM的AI芯片。

  根据Groq官网,其LPU单芯片内集成约230MB片上SRAM,存储带宽高达80TB/s(GPU片外HBM的内存带宽约为8TB/s)。以Llama3.370B模型为例,根据Artificial Analysis的独立基准测试,GroqLPU芯片在不同上下文长度下均能维持稳定推理速度,达275-276token/s,显著优于其他推理平台。

  根据Cerebras官网,其晶圆级引擎3(WSE-3)芯片集成44GB SRAM,片上存储带宽达21PB/s,在OpenAI GPTOSS120B推理任务中实现>3000tokens/s的输出速度,较主流GPU云推理快约15×。此外,2026年2月,OpenAI推出首个运行在Cerebras Systems AI加速器上的模型GPT-5.3-Codex-Spark预览版,支持>1000tokens/s的代码生成响应速度,为用户提供更具交互性的编程体验。

   SRAM架构进入主流视野

  根据Groq官网、半导体行业观察公众号数据,2025年12月,英伟达斥资200亿美元获得Groq的知识产权的非独家授权,其中包括其语言处理单元(LPU)和配套软件库,并引入Groq核心工程团队。根据Openai官网、芯东西公众号数据,2026年2月,Cerebras宣布完成10亿美元F轮融资,估值达230亿美元,此外,OpenAI与Cerebras签署100亿美元合同,部署多达750兆瓦的定制AI芯片。

  投资建议

  AI的Memory时刻,AI记忆持续扩展模型能力边界,AI Agent等应用加速落地。AI记忆相关上游基础设施价值量、重要性将不断提升,建议关注产业链核心受益标的。

  风险提示

  AI产业发展以及需求不及预期;AI服务器出货量不及预期,国产厂商技术和产品进展不及预期。

     投稿邮箱:lukejiwang@163.com   详情访问豌豆财经网:http://www.wdyxw.com.cn

相关推荐
东方证券:地缘政治、供应链韧性日益成为资产 东方证券:地缘政治、供应链韧性日益成为资产

上证报中国证券网讯(记者李雨琪)2月26日至27日,由东方证券研究所主办的“地

快资讯2026-02-27

华金证券:线控底盘迈入放量周期 市场规模将进 华金证券:线控底盘迈入放量周期 市场规模将进

华金证券发布研报称,根据亿欧智库预计,2025年中国乘用车智能底盘市场规模

快资讯2026-02-27

招商证券:春节长假催化下休闲需求集中释放 收 招商证券:春节长假催化下休闲需求集中释放 收

招商证券发布研报称,春节期间国内收入及人次均增长显著,且创历史新高,出

快资讯2026-02-27

东吴证券:端云协同驱动AI入口重塑 端侧模型牵 东吴证券:端云协同驱动AI入口重塑 端侧模型牵

东吴证券发布研报称,云端大模型作为端侧AI能力演进的源头变量,其评价体系

快资讯2026-02-27

国联民生证券:北美发电景气度持续高涨 看好燃 国联民生证券:北美发电景气度持续高涨 看好燃

国联民生(601456)证券发布研报称,近期,特朗普指出,电网老化已无法满足美

快资讯2026-02-27

西南证券:工程机械1月迎开门红 行业维持高景气 西南证券:工程机械1月迎开门红 行业维持高景气

西南证券发布研报称,1月挖机与装载机内外销高增,“更新周期+外需拉动”仍

快资讯2026-02-27

国盛证券:消费级3D打印受益于供需共振 行业龙 国盛证券:消费级3D打印受益于供需共振 行业龙

国盛证券(002670)发布研报称,3D打印核心增量价值为即时性经济性及对情感需

快资讯2026-02-27

国联民生证券:北美缺电重塑格局 聚焦SOFC和ML 国联民生证券:北美缺电重塑格局 聚焦SOFC和ML

国联民生(601456)证券发布研报称,当前北美地区电力供给趋紧,而AI数据中心

快资讯2026-02-27

中邮证券:siRNA药物机制优势突出 递送为核心技 中邮证券:siRNA药物机制优势突出 递送为核心技

中邮证券发布研报称,siRNA药物可精准沉默致病蛋白,优势显著,递送系统为核

快资讯2026-02-27

华龙证券:商业航天快速发展 火箭及卫星制造率 华龙证券:商业航天快速发展 火箭及卫星制造率

华龙证券发布研报称,商业航天加速发展,市场规模持续提升,维持行业“推荐

快资讯2026-02-27