AI工具之deepseek体验打开软件,有10个主要按键,分别是历史记录与设置、新对话、快速模式、专家模式、深度思考、智能搜索、文件上传、文字输入、语音输入还有停止答案生成。历史记录与设置按键,是历史对话、账号管理、功能设计与软件信息,的入口。不仅能将关键对话置顶,同时能存留很久的历史对话。分享链接可以用来进行协同工作,群策群力。语言、外观和字体功能,影响不大,用户使用AI工具,更关心的是能力,等产品稳定市场和能力后,才会在交互上面寻求突破。新对话,顾名思义,就是创建一个新对话。在右上角,类似放大镜的搜索图标,中间加了一个“+”。当想提问新内容,但是,不想在同一个对话框中继续询问,避免污染问题和对话,防止以后找不到提问过的对话,会考虑新建一个对话。快速模式,就是快速给你答案,避免长时间的等待,延迟低。前两年,在deepseek刚出来那会,一个问题有时需要等待很久,系统提示服务器繁忙,然后,会选择在夜间或者早晨提问。避免白天和上班族,出现提问冲突的情况。快速模式,更适合查找资料,翻译,以及简单问题分析判断。也支持图片、文件中信息的识别与整合。但是,对于图片来说,更多的是识别其中的文字,而非看懂图像内容。专家模式,侧重复杂问题解决,包括深度推理、代码编写、方案制作、数学推理、长文分析和论文编写等。它回答的问题准确性相对高,牺牲响应速度,需要等待几十秒,用于查询资料和分析问题。专家模式在上下文窗口方面,也比快速模式的token数量多。在知识库更新截止时间上,快速模式是2026年4月,而专家模式是2025年5月。在使用这两种模式的时候,会存在一个问题,一旦新对话建立并确定对话模式,就无法改变。除非重新开始对话,否则会一直是快速模式,或专家模式。深度思考,通过思维链机制,拆解复杂问题,推导得出结论。调用的知识库,是模型训练时学习到的知识,在模型中闭环处理,不涉及外部数据。有利有弊,高消耗和慢响应的弊端下,逻辑严密就是它的优势。但,也只是相对没有选择“深度思考”功能的对话来说。所谓的准确性,在答案验证和数学题解答上面,精准程度还有待研究。智能搜索,借助检索增强生成(RAG)技术,把互联网最新信息和专业数据库作为资料库,在解答用户问题的时候,会去查阅调用。它是一种开环的工作环境。快速模式和专家模式时,都可以选择打开或关闭,深度思考、智能搜索,这两个功能。但是,深度思考和智能搜索的工作环境是不同的,一个闭环处理,一个开环处理,一个借由训练所得知识,一个把互联网作为资料库。很难界定,同一个问题下,这两种功能的四个开关状态下,得到的结果是否准确合理。四种状态下生成的答案,可靠性有多少。所以有了下面两个功能4种状态下,答案可靠性的探究。模式1适用场景,偏向于已存在的既定事实,比如通用知识和翻译,逻辑推理。模式2适用场景,是天气预报、新闻等实时性高内容的查询。模式3适用场景,是逻辑性高,时效性不重要的内容,数学、代码、法律案例分析。模式4适用场景,是全方面的,因为功能齐全,实时网络和深度推理,都能驾驭,在复杂场景下做问题分析与方案产出。这四种模式的分界是不明显的,基础模型的强大与搜索后的智能处理,模糊了四者的界限。两个功能开关,说到底是对API的调用,都在影响使用体验,只是不那么明显。可能是询问的问题浅显,所以让deepseek在计算资源、响应时间、回答结构与方案上,发挥的空间较小。他们在同时开启的情况下,工作流程是先触发智能搜索,去互联网搜集实时的素材,然后比对素材,留下真实合适的素材,进行推理分析,最后给出回答。文件上传,是将图片和文件,发送到对话框,用来作为对话的素材和问题。图片只能OCR提取文字,不理解真实的内容。不能将图片中的图表摘抄下来,并生成excel文档。在进行文件上传的时候,需要等待较长时间,如果后续是几个G的文件,时间会更长。文字输入,键盘样式的图标,打开后是系统输入法,用来输出文字。也可以用系统语音识别输出问题。语音输入,长按按键,开始说话,识别语音并生成问题。停止答案生成,是在问题开始生成后,右下角出现的停止按键。一方面减少提出错误问题到答案生成的这段时间,另一方面提升用户交互体验。体验的过程中,涉及的问题不多,比较浅显,后续要继续挖掘用户心理,解决用户需求。还有的问题没有发现。