https://www.softbank.jp/en/corp/news/press/sbkk/2025/20251029_01/


在日本国内完成端到端开发与运营的安全生成式 AI 基础模型,
由国产大语言模型 “Sarashina” 驱动

2025 年 10 月 29 日
SoftBank Corp.

SoftBank Corp.(以下简称“SoftBank”)宣布,其面向电信行业的生成式 AI 基础模型 “Large Telecom Model(LTM)”1,通过整合由 SoftBank 子公司 SB Intuitions Corp.(以下简称“SB Intuitions”) 开发、具备强大日语能力的国产大语言模型(LLM)“Sarashina”*,已演进为一款日本本土开发的 AI 模型。此次演进实现了 在日本国内完成的端到端安全数据处理。SoftBank 依托自身庞大的专有网络数据,以及多年积累的网络设计、管理与运维经验,在日本国内的数据中心内完成训练与推理,构建了一套安全、可靠的生成式 AI 基础模型。

SoftBank 已开始在内部使用这一演进为日本国产 AI 模型的 LTM,以提升移动通信网络运维的效率与智能化水平。在大型活动期间进行通信质量预测的应用验证中,SoftBank 确认该模型与活动当日的实际测量数据相比,预测准确率 超过 90%

此外,SoftBank 还通过引入 强化学习*2 进一步增强 LTM 的能力,构建可持续进化的自主学习环境,使 AI 能够不断优化通信网络。


通过国产大语言模型 Sarashina 实现日本本土 AI 模型

自 2024 年起,SoftBank 着手开发 LTM,旨在提升移动通信网络运维的效率与智能化程度。借助 LTM,过去需要人工或仅部分自动化、耗时数天的网络运维工作,如今可在数分钟内完成,同时保持同等精度。这不仅降低了人为错误和对个人经验的依赖,也显著缩短了整体运维时间。

此前,LTM 基于通用型大语言模型构建,在许可和合规性方面存在一定挑战;同时,这类模型主要基于英文数据训练,难以准确理解和表达日语中复杂的语义细节与语境。

为解决上述问题,SoftBank 将 SB Intuitions 开发、具备卓越日语处理能力的国产大语言模型 Sarashina 集成至 LTM 中。该整合实现了从数据训练到实际运行 完全在日本国内完成的 AI 处理流程,从而构建了一款能够安全处理敏感信息的日本国产 AI 模型。全新的 LTM 能够准确理解日本特有的复杂语境与专业技术术语,为运维工作提供更高级的支持,显著提升效率与便利性。

此外,由于系统可在高度安全的环境中运行,SoftBank 也在考虑未来向外部合作伙伴拓展相关服务。


通过 LTM 提升网络运维的效率与智能化水平

SoftBank 已开始在内部使用这一国产化的 LTM,并持续推进其能力提升与应用范围扩展。目前,围绕 基站配置优化通信质量提升 等应用场景的验证测试正在进行中。

例如,在大型活动期间优化基站配置,需要对快速变化的网络状况进行准确预测,并提前理解活动当天的环境特征。为满足这些需求,SoftBank 对 LTM 进行了定制化微调,开发了 “通信质量预测模型”,该模型专门用于预测任意时间点的基站通信质量。通过输入目标区域的预期终端连接数量、基站频段以及可调配置参数等信息,模型即可输出通信质量预测结果。

在实际应用中,SoftBank 将该模型用于预测 2025 年 9 月 27 日 于东京北区举办的 北区烟花大会 期间的通信质量。由于该区域容易出现业务量集中和多基站信号叠加的情况,SoftBank 向 LTM 提供了 超过 1,000 种模拟基站条件,用于预测各基站连接数变化。将预测结果与活动当天的实际测量数据进行对比后发现,该模型在各频段的通信质量预测准确率 超过 90%

在这里插入图片描述


通过强化学习增强 LTM 能力

为进一步提升 LTM 的能力,SoftBank 将其升级为一种 推理模型(Reasoning Model),融合了 *思维链(Chain of Thought,CoT)3 生成与 强化学习(Reinforcement Learning,RL) 的洞察。全新的推理模型能够执行传统非推理模型难以胜任的高级推断任务,例如数学计算与逻辑分析。此外,通过将模型的思考过程进行可视化,人类操作人员如今可以回溯并分析 LTM 作出决策时所依据的推理逻辑。

SoftBank 还在探索将推理模型开发中采用的强化学习技术应用于 LTM 的新使用场景。其中一项举措是基于 无线电波传播仿真器 的计算结果来设定强化学习的奖励机制,从而构建一个使 LTM 能够持续学习并实现最优无线电环境的学习体系。由此,LTM 不再仅仅通过传统的 监督学习*4 来模仿专家判断,而有望 超越人类专家经验,实现更高水平的运维优化。

SoftBank 将继续在完全基于日本国内运行的国产 AI 模型所提供的安全训练与推理环境下,拓展 LTM 的应用领域。通过这些努力,SoftBank 旨在减少对个人经验的依赖、降低运维负担,并提升网络管理的整体效率。同时,通过进一步推进 LTM 的内部应用,SoftBank 也希望为用户提供更高质量的移动通信服务。此外,SoftBank 还将加强与高校及研究机构的合作,引入最新技术,不断提升 AI 模型的精度与性能。

SoftBank Corp. 执行副总裁兼 CTO 佃秀之(Hideyuki Tsukuda) 表示:
“LTM 是 SoftBank 为提升网络运维效率与智能化水平而自主研发的生成式 AI 基础模型。我们长期致力于自动化,而 LTM 使基于 AI 的自主运维成为可能,能够复现资深工程师的专业知识与决策能力,从而推动基站优化并提升通信质量。
未来,随着 LTM 演进为日本本土开发的 AI 模型,我们将能够在安全前提下充分利用内部专业知识和敏感数据,进一步增强网络运维的可靠性。”


【注释】
*1 有关 “Large Telecom Model(LTM)” 的更多信息,请参阅 2025 年 3 月 19 日发布的新闻稿:《Development of “Large Telecom Model” (LTM), a Generative AI Foundation Model for the Telecommunications Industry》。
*2 强化学习:一种使 AI 通过采取行动并以结果为依据获得“奖励”,从而自主学习并逐步最大化奖励的学习方法。
*3 思维链(Chain of Thought,CoT):指 AI 在给出最终答案之前,先生成逐步推理过程(一系列中间思考步骤)的方法。
*4 监督学习:一种利用预先标注好的正确数据(训练数据)进行学习的方法,使模型输出逐渐逼近正确答案。

SoftBank、SoftBank 名称及标识为 SoftBank Group Corp. 在日本及其他国家注册或使用的商标。
本新闻稿中提及的其他公司、产品及服务名称均为其各自公司的注册商标或商标。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐