第263章 2020的深红（3 / 4）_科技入侵现代

为鹅厂工作超过五年的算法工程师，还是和ai沾点边的，最近可不是一般的抢手。

等到了这之后，他才意识到，这不是流放，而是史无前例的一次会战啊，针对人工智能的会战。

因为这里来了太多从事人工智能相关工作的同事，不管是不是和LLM相关，都跑到这里来干LLM。

甚至连鹅厂人工智能领域的负责人，2021年年初受聘腾讯历史上最高专业职级17级研究员的张老大都来了。

但凡鹅厂内部，他能叫得出点名号的，都在申海了。

“鹅厂会战？”赵松下心想，“这可有点罕见，可LLM真的是靠会战能搞定的吗？”

在互联网行业，一般有什么项目要上线，上线前夕集合其他组的力量，然后大家的工作强度和工作时长会提高，喜欢叫做会战，意思是聚集力量打赢这场仗。

百团大战、滴滴快的之争都属于这类。

但这样的会战，在拼多多、美团、淘宝、京东这类电商里比较多见，毕竟每年都有双十一，每年都有618.

对腾讯来说还真不多见，就算是重要游戏上线，认为会是腾讯内部又一款现金奶牛，也不至于如此大费周章。

显然这次不同寻常。

直到在公司见到林燃之后，赵松下才知道为什么不同寻常。

“我说怎么安保这么严格，这都放开了还天天要你扫码，安检还得把包打开来，严格程度堪比机场，原来教授在这里，教授在这里就不奇怪了。”

&nny体现出了对林燃的无条件信任，相信对方能够带领腾讯在人工智能的登月再度突围，给予了一切能给的资源支持。

赵松下或者说所有腾讯参与进来的工程师内心都会有所怀疑，那就是你很牛没错，航天和数学领域的顶级大佬，也有GrhAI的博士学位，但你真的能驾驭LLM，能搞出和ChatGPT相提并论的大模型吗？

更进一步来说，大家从安排的住宿时间就能够看出来，公司提供的住宿半年时间，意味着腾讯给如此多资源的时长是半年，半年就要看到成果。

大家内心都会有所疑惑。

“诸位，我就不做太多自我介绍，我叫林燃，这次由我带领大家进行我们自己大模型的研究，我把它叫做阿尔法。

我的目标是在三个月内，构造出一款比GPT更好的生成式人工智能。

我们拥有的算力比不上OpenAI，那么我们就要从算法的层面做优化，要从数据的角度做优化。

同时我们还需要解决ChatGPT存在的问题，要消除人工智能的幻觉，要提供更智能的回答，要具备更优秀的能力。

总之在未来半年时间里，我需要各位的配合和协助。

我固然是大脑，我来构建它的算法和底层架构，但需要各位配合，做其他工作。”

在大模型上，大脑固然是最重要的，但其他的工作也不可或缺，像数据准备，模型集成和部署，代码生成测试与调试，全栈开发和自动化。

需要这些工作，帮助LLM从实验室走向实际应用。

“我们可以采取将模型分解为多个专家子模块，仅激活部分参数，路由机制选择专家处理输入，扩展到动态MoE，再引入自适应路由，进一步降低推理成本.”

“压缩Key-Value缓存，通过潜在表示减少注意力机制的内存占用，同时保持多头并行，再通过集成知识图谱的方式来缓解幻觉，同时优化低算力训练”

“使用8位浮点格式进行计算，结合更高精度积累以避免精度损失，细粒度量化策略扩展到FP4/INT8混合”

&nE中无辅助损失的均衡策略，确保专家利用率高，