欢迎加入团队!本手册涵盖日常考勤、用餐、宿舍及信息安全等核心事项,请仔细阅读并遵照执行。
保持宿舍整洁有序,公共区域物品归位;遵守楼栋门禁时间及住宿楼相关管理规定。
爱护公共设施,损坏公物须照价赔偿;宿舍内禁止使用大功率电器(如电热锅、热得快等)。
严禁在宿舍内留宿外来人员;如遇紧急情况或设施故障,请及时联系人力资源部处理。
过渡期结束后,请自行安排住所,如有特殊困难可提前与人事沟通协商。
寻找并吸纳具备AI技术发展潜力和极客特质的学生,开展AI相关研究项目,为水华智能集团的AI业务储备优秀青年人才。
1年内建立"水华青年俱乐部"常态化运营;1-2年内与四川所有985、211院校建立常态化合作机制。
激情自驱、开放创新、认知深刻、深耕专业、钻研技术、坚韧不拔、团队合作;对AI有可验证的实践经验和项目。
对内部小组或学生组织提供的兴趣方向进行评审,在实施过程中给予协助和辅导。项目运作由内部小组或学生组织独立负责,导师委员会仅给予建议,不进行干预。
导师委员会对阶段性结课成果进行验收,并对下阶段研究方向给予建议和评审。
委员会成员(5-6名技术领导或专家)
兴趣方向和验收结果评审达到4票视为通过;董事长对评审结果有一票否决权。
构建一套能够"在实践中学习"的智能体框架,实现在复杂工程任务或科研辅助任务中的高度自治。
探索群体智能的涌现规律,建立可扩展的智能体协作模式,支撑万级智能体的协同作业。
开发具备"视觉直觉"和"空间常识"的下一代智能体,使其在自动驾驶模拟、虚拟制片、工业巡检等领域具备深度感知与决策能力。
实现一套在有限算力下(单机多卡环境),仅需少量特定风格视频数据即可完成高质量、无伪影模型定制的微调框架。
开发一套具备高可控性的视频微调工具链,支持从"随机生成"向"工业级精准创作"的跨越。
研究基于mooncake的分布式KV缓存及大规模Token服务系统中Prefill/Decode分离架构相关理论;通过在测试环境中模拟该架构,了解其部署及高可用性问题,为后期生产环境建设提供技术参考。
PrfaaS新架构论文:KVCache跨数据中心传输打通,吞吐提升54%,仅用100Gbps普通网络
GPUStack是一套用于管理GPU资源构建推理服务后端并对外提供Token服务的开源软件系统。此项研究重点集中于架构、代码及需要增补的功能研究,以及生产环境高可用性部署模式研究与测试。
www.gpustack.ai
研究如何让Coding Agent能够仅凭几行需求就一次性生成整个程序。核心在于如何合理利用上下文窗口,让Agent拿到尽量精简干净的上下文,在200K窗口内严格按照规格生成制成品;大型程序则切分为多个小阶段,每阶段在一个窗口内完成,最终由总体蓝图完成组装。
在完全一致的硬件环境下,将主流开源模型分别部署于vLLM、TGI、TensorRT-LLM、LMDeploy等推理框架,横向对比各框架在不同并发与序列长度场景下的综合表现。
在不修改推理框架代码的前提下,利用eBPF hook内核网络栈,自动测量每个请求从进入节点到离开节点的TCP RTT及重传次数,并关联请求ID(从HTTP header中提取),生成延迟报表。
开发一个轻量级Python/C++工具,能够实时监控vLLM或TGI等推理框架中的KV Cache显存使用情况,包括碎片率、块分配热力图、交换活动等,并提供简单的Web可视化界面。
开发一个sidecar容器或异步服务,从推理网关日志中提取每个请求的prompt长度、生成token数量、实际耗时、模型版本,根据预设定价公式计算成本并汇总到数据库,提供查询API。