|
银河证券关于DeepSeek的报告总结:
DeepSeek的技术创新与成本优势
DeepSeek通过算法及工程创新,显著降低了训练与推理成本,推动了AI应用与硬件的普及和落地。其主要技术创新包括:
- 架构创新:采用MLA和DeepSeekMoE技术,并引入无辅助损失负载均衡策略。
- 高效预训练:设计了FP8训练混合精度框架和DualPipe算法,优化训练效率。
- 知识蒸馏:将LongChain-of-Thought (CoT)模型的推理能力集成到标准LLM中。
这些创新使得DeepSeek在性能提升的同时,仅用2048块英伟达H800 GPU,耗费557.6万美元就完成了同等规模模型的训练。
对各行业的影响
电子板块
DeepSeek从预训练转向推理侧,通过增加模型规模和优化任务设计,提升了推理能力,推动AI硬件的落地与普及。
通信板块
推理侧算力需求增加,利好国产光芯片。运营商凭借数据优势和接口优势,将推动AI应用普及,同时带动光模块产业链快速发展。
计算机板块
投资机会从训练算力转向推理算力,从高端GPU向ASIC芯片过渡,从基础设施向应用侧过渡。
传媒板块
DeepSeek加速了大模型的推陈出新,推动AI+在影视、广告、社交陪伴等领域的应用落地。
投资建议
银河证券建议关注以下方向:
- 电子板块:消费电子产业链和AI终端硬件。
- 通信板块:运营商、光模块和光芯片。
- 计算机板块:边缘算力、AI应用开发、数据服务与处理、端侧AI设备。
- 传媒板块:AI+赋能的细分子领域。
风险提示
报告指出,国际经济形势复杂化、AI硬件发展不及预期、AI产业链上下游短期波动以及AI应用发展不及预期等风险。
|
|