阮咸AI助手,新增Qwen3.6: 27b本地模型 阮咸AI助手v1.0.5版本将会新增Qwen3.6: 27b本地模型(Q4量化),主要应用在诸如混合数据分析、资金分析、python/C++ 程序自动编译等较为复杂的应用场景。 注:阮咸AI助手用户可以从魔塔社区下载任意模型放入阮咸AI助手指定目录,无需配置环境,几千款模型,可立即调取使用(注意模型和硬件上限之间需要匹配) 工作流参数配置: 经优化,使用轻便笔记本电脑,搭配桌面算力(32GB),输出平均速度在55 Tokens/秒。每天一个关于本地大模型的热知识(一): 本地大模型都是有上下文限制的,主流开源大模型的上下文64K~256K,换成数据容量大概就是120KB~512KB,也就是每次发送给大模型的数据量不能超过该值,一旦超过该值,要么它只分析最后一段,要么就开始抽风不知所云。 所以想把几百M甚至几十G的取证数据一次性抛给大模型让他去分析,在没有专业辅助工具的前提下,原生的大模型就算是671B体量的也是处理不了的。 大模型能做的就是,理解你的意图,然后主动分析当前可以用哪些工具,然后主动调用这些工具的多个接口、方法去调取处理数据,然后汇总结果,所以用哪个大模型并不是关键,关键的是能被它调用的诸多碎片化工具,这些工具就叫MCP。 有了MCP工具,对于大模型来说,就可以充分放飞自我了,但是人的表达能力参差不齐,大模型理解的和人表达语义间可能会存在一定的差异,就会导致,大模型在胡乱执行,这时候就要规范它的行为,让它朝着我们实际的目标执行,简单规范就叫做提示词,复杂规范就称作skill。前一段时间爆火的小龙虾,就是到了这一步,集成了MCP也集成了skill。 那么大模型处理问题不一定是单一问题,很有可能就是多重逻辑问题、循环问题、复杂问题,对于这些问题,大模型在没有条理性规范的前提下,就会懵逼,这一步干完了下一步干啥?怎么干?受上下文限制,它还会偶尔遗忘,所以将前后所有的工作帮他穿起来,一步一步引导它,走完一步走下一步,这个规范就叫做工作流。 所以像之前某单位 XXX万搞个服务器部署了一个deepseek-R1:671B; 结果也只能聊个天。。。。别的啥也干不了。 明天我们讲:2B;4B;8B这种小模型和35B;70B以及300B;600B这种大模型有什么本质区别。关注阮咸科技