应用•共9篇
机器学习、AI工具、大模型应用
从模型集成到智能体协同:AI应用架构的演进观察
最近在重构我们的推荐系统时,我深切体会到AI应用架构正在发生一场静默但深刻的变革。传统那种"一个模型打天下"的思路已经难以应对复杂的业务场景,取而代之的是更加灵活、更具协作性的架构模式。模型集成...
智能体工作流:从单一任务到自主协作的范式转变
从工具到伙伴的进化轨迹最近在项目中部署了几个基于大语言模型的智能体,深刻感受到了行业正在发生的根本性变化。过去我们更多地把AI当作工具——输入指令,获得输出。但现在,智能体正在演变为能够自主规划...
AI推理性能优化的四个务实技巧
在部署和优化多个AI项目的过程中,我逐渐积累了一些提升推理性能的有效方法。这些技巧可能不那么高大上,但确实在实践中帮我解决了真实问题。模型精度的合理选择很多人一提到性能优化就想到模型压缩,但其实...
AI工具选型实战:从需求匹配到效率提升
引言在日常的开发工作中,我们经常面临选择合适的AI工具来提高工作效率的挑战。面对琳琅满目的AI应用,如何根据具体需求做出明智的选择?本文基于我在多个项目中的实践经验,分享一些实用的选型思路和工具...
从原型到产品:一个AI驱动的智能文档解析器的工程实践
引子:为何选择这个方向?在最近的一个项目中,我们团队面临一个棘手的问题:客户有海量的、格式不一的PDF和扫描文档(如合同、报告、发票),需要从中快速、准确地提取结构化信息(如公司名、金额、日期)...
从零搭建一个生产可用的AI对话服务:我的踩坑与填坑之旅
引子:一个看似简单的需求上周,产品经理跑来跟我说:“我们能不能在用户帮助中心集成一个智能客服?就像ChatGPT那样,能回答用户关于我们产品的问题。”听起来很酷对吧?但当我真正开始动手时,才发现...
vLLM推理优化:PagedAttention实战
为什么传统推理OOM?KV Cache占用显存70%+批量请求时显存碎片化严重长文本推理速度断崖式下降PagedAttention核心改造from vllm import LLM, Sampli...
AI应用面试突围:从技术细节到架构思维的实战拆解
AI应用面试突围:从技术细节到架构思维的实战拆解最近帮团队面试了20多位AI应用方向的候选人,发现很多人在技术细节和架构思维上存在明显断层。结合2024年AI工程化趋势,我总结了几个最具区分度的...
AI应用性能优化实战:从推理加速到内存管理的深度调优
AI应用性能优化实战:从推理加速到内存管理的深度调优在实际部署AI应用时,我们常常面临性能瓶颈。根据斯坦福DAWNBench的测试数据,相同模型在不同优化策略下,推理延迟可相差5-8倍。通过系统...