对字节跳动自研芯片项目最新进展的了解?
目前项目在上半年规划了两次试流片。第一次试流片的测试已基本结束,第二次试流片已经投片。 2027年的量产规模预计将有较大提升。
在合作模式与成本方面,量产管理费用和代工厂的代工费用在2026年没有变化,2027年将继续按比例计算,这两部分费用的浮动空间较小。近期新增了存储堆栈的采购费用,目前从海力士采购,这部 分费用将计入渠道的收入。
针对两次试流片,目标是什么?
第二次流片的核心目标是提升良率和优化功耗。预估第二次流片的良率能提升几个百分点。在功耗方面 ,目标是提升功耗效率,即降低功耗。
针对2027年规划,相较于之前的预期有了几乎翻倍的提升,其背后的主要驱动因素是什么?这批芯 片的预期用途是否仍以推理为主?
产量预估提升主要源于两方面因素。从需求侧看,字节跳动此前曾尝试通过其他渠道采购H100,但目 前来看H100、H200均无法获得,因此需要加大自研芯片的采购量。从供给侧看,韩国的6纳米晶圆产 能在2027年预计会增加,即代工厂能提供更多的产能。基于这两方面因素,整体上调了2027年产量预估。
2027年针对相应的Die的初步规划仍是采用双Die合封的方式来做推理芯片。不过,其中存在一个变数 ,即是否会将其中的一部分用于制造训练卡,这尚未最终确定。
决定是否将部分自研芯片用于训练的变数主要有哪些?
主要变数在于字节跳动现有训练资源的损耗情况。字节跳动此前采购了一批H100,但这批芯片本身存 在损耗。尽管将自研芯片改造为训练卡的效率不如阉割版的H100,但考虑到2027年很可能无法采购到新的H100,且现有库存又有损耗,在损耗较大且无法补充 的情况下,字节跳动可能不得不将部分首批自研芯片改造为训练卡,以满足其训练需求。
自研芯片在后续的量产和交付过程中,预计可能面临哪些主要困难或风险?
未来可能遇到的主要瓶颈在于运输环节,即相应海外的进出口限制可能导致交付延迟。
字节自研芯片的封装和测试环节是如何在国内和海外分工的?
封装主要在海外进行,测试环节则分布在国内外。国内主要承担部分仿真测试,以及需要用到国内设 备和数据的测试环节。由于芯片运回国内需要通过特定渠道,时间窗口较少,因此许多硬件相关的测试在 国外已经完成。
字节跳动采购寒武纪MLU690芯片的预期用途是什么?其在视频生成等场景的测试表现如何?
根据测试结果,MLU690不适合用于SeeDance类的正式推理工作。此前测试的MLU590在推理方面表 现不佳,处理一个10秒视频的耗时超过一小时,不具备应用价值。MLU690在未经超频优化的中等数据 量测试中,推理耗时约40分钟,若加上超频和最新的工具链优化,有望缩短至20分钟,处于勉强可用 的状态,但此时功耗会超过200瓦,可能导致芯片磨损过快,影响使用寿命。
因 此 , MLU690的主要应用场景首先是豆包业务, 这是确定会使用的 。 在视频生成方面 , 它可能 被用于辅助训练 , 因为其推理成本 ( 考虑使用周期 ) 过高 。 在训练方面 , MLU690在与 H100 构建的异构集群中,能够以几乎零磨损的状态满足pefl阶段的算力需求。在decoder阶段,其训练效率可达到同等晶体管数量H100 的四分之一,与昇腾芯片处于相似的训练等级,但功耗更高。
除了字节跳动,阿里自研芯片项目有何最新动态?
阿里巴巴方面变化较大的是蚂蚁集团的“密算”片。这款用于稳定币业务的非对称加密卡,相应今年产 量上调。蚂蚁密算会分批次增加云端计算卡,在一个批次部署完成后,会进入一个无需增加新卡的阶段,直 到下一个周期才需要继续生产。因此,需求呈现阶段性特征,而非持续不断。
考虑到当前国内Al算力供不应求的状况,为何平头哥会将其预定的国内先进产能分配给蚂蚁密算?
此次产能分配主要源于两个层面的原因。首先,平头哥的战略重心发生了转移。平头哥其更先进的PPU产品实际上可以采用更先进的海外制程工艺。目前,平头哥由于获得了更先进的制程,其对国内7nm产能的依赖性随之降低;其次,这与阿里集团内部的资源再分配有关。
了解到似乎沐曦对其C600芯片今年的预期出货量仅为数万颗,这与为其分配的小几十万颗Die的产能似乎不匹配,应如何理解这种差异?
这种差异可能存在以下几种解释。首先,沐曦可能会将这部分产能用于生产其他产品,例如其C500系列芯片。这部分产能同样可以用于生产C500系列产品,技术上的改造成本并不大。其次,如果沐曦无 法完全利用这部分产能,他们可能会通过芯原或其他渠道,将剩余的产能转交给其他有需求的公司。尽管最初的方案是为C600设计的,但产能的最终用途具有一定的灵活性。
综合来看,2026年以及2027年韩国能为国内提供的产能估计?
2026年,韩国为国内供应的芯片产能主要看6nm及以下先进制程,预计今年能生产并顺利运回国内 的芯片总量在百万颗Die级别。对于4nm制程,今年尚无确定产量。展望2027年,预计产能将有数倍增长。
通过韩国为国内厂商进行芯片代工存在哪些潜在风险?如果风险发生,将产生何种影响?
主要存在三类风险。
第一类是渠道失灵的风险,这是最大但发生概率较小的风险。芯片从韩国运出后,需经过新加坡等中 转地进行封装,在此过程中可能遭遇美国的长臂管辖。美方可能以其他名义扣留货物进行检查,一旦发 现技术超标,可能导致货物被扣留三个月以上。虽然通过渠道可以避免被直接以“超标”为由进行检查 ,但无法完全排除被抽查的可能。一旦发生,对依赖芯片进行模型训练的客户将造成巨大损失。 第二类风险是韩国工厂自身的扩产计划受阻。其产能扩张依赖于光刻机等关键设备的供应,如果其扩 产进度不及预期,国内获取的产能可能会少于计划。这类风险发生的可能性比第一类略高,但由于可以 较早预见,供应链有时间进行调整,因此造成的损失相对较小。
第三类风险源于人际关系的不确定性。目前能够顺利流片,很大程度上依赖于国内一些公司核心团队 成员与韩国代工厂股东在美国半导体圈内建立的良好私人信任关系,而非稳固的公司间协议。如果这些关 键人物之间的关系发生变故,可能会直接影响到合作的稳定性。

夜雨聆风