水华青年计划 · V1.0

实习生行政管理引导手册

欢迎加入团队!本手册涵盖日常考勤、用餐、宿舍及信息安全等核心事项,请仔细阅读并遵照执行。

考勤管理

弹性上下班
工作时间  周一至周五,弹性上班时间为 09:00–09:30,下班时间为 18:00–18:30
请假流程  如需请假或特殊情况无法按时到岗,请提前在企业微信发起请假流程。
设备提示  公司暂不提供电脑,请自带笔记本电脑到岗,确保日常工作正常开展。

用餐安排

楼下合作餐厅 · 加班专项补贴
加班用餐时间
19:00 以后
餐标补贴
¥30 / 天
晚餐合作餐厅  楼下"山村人家"餐厅,凭公司工牌或实习证明享受合作价,餐标上限 30元/天,超出部分自理。
午餐自行安排  公司周边餐饮选择丰富,午休时间 12:00–13:00,请合理控制用餐时间。

宿舍管理

x人间过渡 · 最长x个月
住宿类型  公司为有需求的实习生提供 x人间集体宿舍,作为过渡住所,过渡期最长 x个月
申请时间  如需住宿,请在入职报到前联系招聘老师或人事陈老师确认,逾期可能无法安排。
宿舍使用规范

保持宿舍整洁有序,公共区域物品归位;遵守楼栋门禁时间及住宿楼相关管理规定。

爱护公共设施,损坏公物须照价赔偿;宿舍内禁止使用大功率电器(如电热锅、热得快等)。

严禁在宿舍内留宿外来人员;如遇紧急情况或设施故障,请及时联系人力资源部处理。

温馨提示

过渡期结束后,请自行安排住所,如有特殊困难可提前与人事沟通协商。

信息安全

保密义务 · 数据合规
薪酬保密  公司实行薪酬保密制度,严禁向任何同事或外部人员透露本人薪资及他人薪资信息。
业务数据  工作中接触到的客户资料、产品数据、代码及内部文件等,未经授权不得对外传阅、复制或转发。
设备与账号  工作账号及内网系统仅限本人使用,禁止将账号密码告知他人;离座时请锁定屏幕,防止信息泄露。
外发限制  严禁将内部文件上传至未经授权的第三方云盘或个人存储空间,如需对外共享请事先获得上级批准。
违规后果  违反信息安全规定者,公司将依据相关制度予以处理,情节严重者解除实习协议,并依法追究法律责任。
帝欧水华集团

水华青年计划

引导手册 V1.0  ·  2026-5
计划概览

目的

寻找并吸纳具备AI技术发展潜力和极客特质的学生,开展AI相关研究项目,为水华智能集团的AI业务储备优秀青年人才。

目标

1年内建立"水华青年俱乐部"常态化运营;1-2年内与四川所有985、211院校建立常态化合作机制。

人才标准

激情自驱、开放创新、认知深刻、深耕专业、钻研技术、坚韧不拔、团队合作;对AI有可验证的实践经验和项目。

组织方式

内部"水华青年计划"试点

  1. 由AI事业集群招聘或技术主管推荐3-5名具备青年画像的员工,经专家委员会评审后组成内部"青年俱乐部"。
  2. 活动形式包含大咖分享、项目交流、主题挑战赛、参与公司实战业务等,每季度举办一次。
  3. 成员可向"导师委员会"申报课题或项目,经审批后拨付项目资金,按进度提交阶段性成果汇报。
  4. 运营机制成熟后,可扩大到全集团范围内全面铺开。

外部目标高校实施方式

  1. 立足川内高校学科特色(电子科大、川大、西南交大),以校园学生组织为载体,寻找匹配的管理或技术人才。
  2. 以"社团活动+合作项目+人才培养"为主要方式,启动阶段先建立组织据点,尽快启动与公司的合作项目。
  3. 模型跑通后,可逐步在外省具备AI优势的985、211院校开展合作。
水华青年计划导师委员会

对内部小组或学生组织提供的兴趣方向进行评审,在实施过程中给予协助和辅导。项目运作由内部小组或学生组织独立负责,导师委员会仅给予建议,不进行干预。

导师委员会对阶段性结课成果进行验收,并对下阶段研究方向给予建议和评审。

委员会成员(5-6名技术领导或专家)

朱江 洪锐 曹若谋 庄景轩 张子凡 余强

兴趣方向和验收结果评审达到4票视为通过;董事长对评审结果有一票否决权。

AI应用研究方向
方向1 · 自主智能体
方向2 · 智能体集群
方向3 · 多模态智能体
方向4 · 视频模型微调
方向5 · 控制引导视频
方向6 · 数字人编排

自主型智能体(Autonomous Agents)的自我进化机制研究

导师:洪锐

构建一套能够"在实践中学习"的智能体框架,实现在复杂工程任务或科研辅助任务中的高度自治。

  • 异构工具调度与精确调用:探索智能体在海量API库中进行语义筛选、参数对齐及异常捕获的机制。
  • 基于环境反馈的自我迭代:研究智能体如何根据工具执行后的逻辑反馈、环境状态变化,自主进行"反思-纠错-策略优化"的闭环迭代。
  • 长程记忆管理:开发高效的记忆检索与压缩算法,支撑智能体在长期任务中保持上下文一致性。
复杂任务规划 工具学习 自我迭代闭环

大规模智能体集群(Multi-Agent Systems)的协同编排与管理

导师:洪锐

探索群体智能的涌现规律,建立可扩展的智能体协作模式,支撑万级智能体的协同作业。

  • 动态任务分解与角色分配:研究针对复杂项目需求的拓扑拆解,根据智能体能力画像进行动态分发。
  • 通信协议与冲突解决机制:构建轻量化、高鲁棒性的智能体间通信架构,解决指令竞争与逻辑死锁。
  • 集群监控与效能评估:开发智能体集群的实时状态监控系统,量化评估协作损耗与任务产出比。
分布式协同 动态治理 群体智能涌现

多模态智能体(Multimodal Agents)的跨空间理解与交互

导师:洪锐

开发具备"视觉直觉"和"空间常识"的下一代智能体,使其在自动驾驶模拟、虚拟制片、工业巡检等领域具备深度感知与决策能力。

  • 视觉-文本-动作对齐:研究智能体如何将复杂视觉信息转化为可行动的指令逻辑。
  • 空间几何理解与导航:探索智能体在三维环境中的避障、定位及物体操作逻辑,建立精确的空间思维链。
  • 动态视频理解与实时交互:针对动态视频流进行关键帧提取与意图预测,实现对现实世界动态的实时反馈。
LMM大语言多模态模型 3D空间推理 时空感知

开源视频生成大模型的参数高效微调(PEFT)技术研究

导师:洪锐

实现一套在有限算力下(单机多卡环境),仅需少量特定风格视频数据即可完成高质量、无伪影模型定制的微调框架。

  • 时空解耦的微调策略:探索哪些层对风格和动作的敏感度更高,研究基于LoRA、DoRA或QLoRA的层级化微调方案。
  • 运动模块的轻量化设计:研究如何训练可插拔的运动模块,在不改变底座模型权重的条件下赋予视频特定的运镜或动态规律。
  • 低显存环境下的训练优化:针对消费级显卡,研究深度算子融合与梯度检查点技术的应用。
LoRA变体 时序一致性 算力优化

基于控制引导(Control-Guided)的视频模型二次开发

导师:程忠

开发一套具备高可控性的视频微调工具链,支持从"随机生成"向"工业级精准创作"的跨越。

  • 多源条件约束嵌入:研究如何将草图、深度图、Canny边缘等控制信号融入视频生成过程,保持时序上的空间连续性。
  • 长视频生成的时序平滑算法:开发基于流匹配或滑动窗口的平滑控制技术,解决长视频生成中的"崩坏"现象。
  • IP-Adapter在视频流中的迁移:探索通过一张参考图实现视频全流程的人物一致性微调。
ControlNet-Video 精准生成 跨模态约束

数字人智能编排与调度

导师:曹若谋
  • 模块化封装技术:制定智能体、技能标准化接入规范,实现能力模块解耦,支持新增模块快速无缝接入平台。
  • 可视化流程编排技术:搭建支持拖拽式流程编辑、条件分支、循环逻辑的编排引擎。
  • 数字人定制生成技术:基于编排流程自动封装生成专属数字人,支持角色配置、能力权限划分。
  • 统一调度管控技术:构建多数字人并发管理、流量分配、任务调度、运行监控的调度中心。
资源管理功能 流程编排功能 数字人生成功能 统一门户功能 运维监控功能 权限管控功能
AI集群研究方向
方向1 · PD分离
方向2 · GPUStack
方向3 · 文档驱动开发
方向4 · 推理框架效能
方向5 · eBPF打点
方向6 · KV Cache监控
方向7 · 成本计价器

PD分离及mooncake Prefill-as-a-Service研究与测试

导师:张子凡

研究基于mooncake的分布式KV缓存及大规模Token服务系统中Prefill/Decode分离架构相关理论;通过在测试环境中模拟该架构,了解其部署及高可用性问题,为后期生产环境建设提供技术参考。

相关理论架构研究 模拟环境测试报告

GPUStack 高可用性部署架构研究与测试

导师:张子凡

GPUStack是一套用于管理GPU资源构建推理服务后端并对外提供Token服务的开源软件系统。此项研究重点集中于架构、代码及需要增补的功能研究,以及生产环境高可用性部署模式研究与测试。

架构与代码研究 高可用性部署测试报告

现代软件开发——文档驱动型AI编程方法研究与实践

主导师:张子凡 / 次导师:李明

研究如何让Coding Agent能够仅凭几行需求就一次性生成整个程序。核心在于如何合理利用上下文窗口,让Agent拿到尽量精简干净的上下文,在200K窗口内严格按照规格生成制成品;大型程序则切分为多个小阶段,每阶段在一个窗口内完成,最终由总体蓝图完成组装。

自动化文档编排驱动开发工具 Sample项目验证报告

相同硬件环境下同一模型在不同推理框架下Token产出效能研究与测试

主导师:张子凡 / 次牵头:袁东陵

在完全一致的硬件环境下,将主流开源模型分别部署于vLLM、TGI、TensorRT-LLM、LMDeploy等推理框架,横向对比各框架在不同并发与序列长度场景下的综合表现。

  • 构建标准化、可复现的测试基线环境。
  • 设计覆盖不同并发数(1/8/32/128)、短/长序列、流式/批量推理等多维度测试场景。
  • 实现自动化压测脚本,统一采集TPS、TTFT、P99延迟、显存峰值等核心指标。
  • 分析各框架底层机制差异对效能的影响,输出结构化对比报告与可视化图表。
≥4个主流推理框架 ≥12种测试场景组合 结果波动≤2% Grafana可视化Dashboard

基于eBPF的Token工厂网络传输延迟自动打点工具

导师:余强

在不修改推理框架代码的前提下,利用eBPF hook内核网络栈,自动测量每个请求从进入节点到离开节点的TCP RTT及重传次数,并关联请求ID(从HTTP header中提取),生成延迟报表。

性能开销 <2% CPU 延迟误差 <10μs 支持内核5.10+ Prometheus metrics输出

推理框架中KV Cache显存碎片的实时监控与可视化工具

导师:余强

开发一个轻量级Python/C++工具,能够实时监控vLLM或TGI等推理框架中的KV Cache显存使用情况,包括碎片率、块分配热力图、交换活动等,并提供简单的Web可视化界面。

采样开销 <0.5% GPU时间 碎片率误差 <5% 支持vLLM 0.4+ 和 TGI 1.0+

Token工厂请求级别的成本统计与计价器(Metering)系统

导师:余强

开发一个sidecar容器或异步服务,从推理网关日志中提取每个请求的prompt长度、生成token数量、实际耗时、模型版本,根据预设定价公式计算成本并汇总到数据库,提供查询API。

  • 解析网关日志(JSON格式,含request_id、model_name、prompt_tokens等字段)。
  • 设计定价公式配置文件(YAML),支持阶梯定价、折扣码等。
  • 将计费记录写入ClickHouse或PostgreSQL,支持按用户、时间、模型聚合。
  • 提供gRPC查询接口及简单的Grafana面板。
计费延迟≤5秒 单实例≥20K req/s 查询QPS≥1000 账单误差≤0.1%