近日,我校计算机黄色网址 博士生张宇同学的科研成果获得包括Elon Musk在内的众多国际学术界和产业界顶级AI人士的详细解读和高度认可,张宇和他的导师付国宏教授的这些系列研究成果是深度学习Transformer时代可以写进教科书、具有里程碑意义、影响深远的工作。
作为张宇同学的博士导师,付国宏教授是我校引进的江苏省双创人才,是我国人工智能、大模型和自然语言处理领域著名学者,深耕该领域30余年,对该领域有深刻独到的见解。付老师精准把握该领域学术界和产业界的国际前沿和最新动态,践行我校张桥校长“把企业实验室建到高校,把高校课堂搬到企业”这一AI时代创新式人才培养理念,探索出一条AGI时代“高校企业AI人才深度融合培养”新范式。
在博士生培养方面,付老师注重价值引领与能力塑造并重,系统提升学生的科学思维、问题发现与原始创新能力,以及技术研发和工程实践能力。同时,他为学生营造了一个开放包容的科研环境,打造了一个两段式培养模式:在校阶段打好基础,选好题,给出技术方案,并小规模验证;随后将学生送到AI头部企业,依托其大科学装置、大平台、大算力条件,推动学校的科研成果在企业大工程中落地,实现“科研、技术、工程、产业、人才培养”的闭环。
张宇同学正是在这一理念下培养起来的。张宇分别于2014年和2018年在我校计算机黄色网址 就读本科和硕士。2021年师从付国宏教授读博士,研究方向为人工智能、深度学习和大模型。2024年在张宇博士论文研究进入中期的关键时刻,付老师基于2023年底启动的“门控线性注意力”研究的初步结果以及对第三次AI浪潮的算法-算力-数据三要素轮转的内在规律进行理性分析,敏锐地意识到大模型迭代范式从“堆算力、堆数据”转向“底层算法优化”的潜在趋势,果断为张宇调整博士课题研究方向,由原定的“非自回归高效文本生成”全面转向“面向大语言模型的高效线性注意力机制研究”,并确定线性注意力机制-高效并行算法-模型架构&规模化-超长上下文应用的技术路线。同时,为了确保张宇能心无旁骛地投身高效线性注意力研究,为其定制开放包容的培养模式,不拘一格、不唯论文,努力为其营造自由探索的氛围,以充分释放其技术创新潜力。

在学校得到全面培养并发表第一篇高水平论文后,于2023年付老师把张宇同学送到北京月之暗面(Moonshot AI)等企业开展实习合作研究。校企合作不仅为张宇同学的高效线性模型技术突破提供了不可或缺的算力保障,更为重要的是校企合作的环境极大地发掘了张宇的潜力。正是有月之暗面等企业的稳定算力和高水平技术团队的支持,张宇同学得以潜心大模型底层架构和算法探索,相继完成三项著名工作:门控槽注意力GSA(2024年)、KimiLinear(2025年)和注意力残差机制AttnRes(2026年),形成完整的高效线性注意力模型技术体系。张宇同学不负期望,完美地完成了博士中期时付老师的全部规划。

月之暗面创始人杨植麟在2026年3月18日在英伟达GTC大会上发表了题为《How We Scaled Kimi K2.5》的现场演讲,并披露了Kimi开源大模型新架构演进的三条核心技术,即模型优化器MuonClip、线性模型架构KimiLinear和注意力残差(AttnRes)。作为KimiLinear的一作和注意力残差AttnRes共同一作,张宇为Kimi大模型核心技术做出了关键贡献。特别是AttnRes的发布,吸引了埃隆·马斯克、杰瑞·特沃雷克(前OpenAI核心成员、"推理模型之父")、安德烈·卡帕西(OpenAI联合创始人、前特斯拉AI高级总监)等全球顶尖AI专家的高度评价。杰瑞·特沃雷克更直言:深度学习2.0时代即将来临。

在深耕高效线性模型创新的同时,在导师指导下,张宇积极投身相应的开源生态建设,并长期担任知名开源项目Flash Linear Attention(FLA)的主要维护者。目前,FLA项目在GitHub上已获得超过4000颗星(Stars),凭借工业级的代码质量与极致效率,成为连接学术界与工业界的重要纽带。该库已被通义千问(Qwen)、蚂蚁集团、Grok等国内外知名科技公司大模型团队深度采用。特别是其重点维护的Gated DeltaNet更是成为Qwen 3.5的主要架构,有力支撑了国产大模型的自主创新与迭代升级。

张宇同学是我校本硕博全流程自主培养的杰出学生代表,能取得这样的成绩绝非偶然。这一切的背后是苏州大学计算机黄色网址 自然语言处理优势学科的长期沉淀、高水平导师团队持续建设和校企融合创新实践同频共振的结果。苏州大学计算机黄色网址 是我国最早开展中文信息处理研究的单位之一,有近30 年的研究积淀。作为苏大计算机黄色网址 的特色和优势学科方向,该方向拥有近30名教师和200余名硕博士生组成的研究团队,先后获得国家杰青项目和优青项目各1 项,自然科学基金重点项目4 项,面上和青年项目20 多项,获2025年度吴文俊人工智能科技进步特等奖一项,与阿里、华为等多家企业建立联合实验室。
张宇同学的成长与成绩,不仅是我校高端人才培养成果的生动缩影,同时也是我校产学研深度融合实践的有力见证。AGI时代高端复合人才培养新模式和校企融合技术创新新范式是高校面临的两大课题。我校计算机黄色网址 将抓住这一历史机遇,优化人才培养机制,拓展科研实践平台,为我国AI人才培养、技术创新和产业发展贡献苏大的智慧与力量。