AI 大模型 333 题备份清单
这份文档只保存 AI 大模型题目备份清单,方便后续做知识点覆盖、补齐和扩写对照;不放题解答案。
题目清单
1. 什么是词嵌入(Word Embedding)?有哪些常见的词嵌入方法?
中等 | #5097 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
2. 是否使用 Word2Vec 训练过数据?在这个过程中,如何获取语料?如何选择超参数?语料、词表和维度大小如何确定?怎样把握训练时长?
困难 | #5098 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
3. Word2Vec 有哪些加速方法?
困难 | #5099 | 自然语言处理(NLP) / 词嵌入 / Word2Vec
4. Word2Vec 如何获取词向量?如何评估该训练得到的词向量的好坏?
中等 | #5100 | 自然语言处理(NLP) / 词嵌入 / Word2Vec / 词向量
5. 解释 hierarchical softmax 的流程,以及它有什么优点?
困难 | #5101 | 自然语言处理(NLP) / 词嵌入 / Word2Vec / hierarchical softmax
6. 说一说负采样技术在 Word2Vec 中的运用。
中等 | #5102 | 自然语言处理(NLP) / 词嵌入 / Word2Vec / 负采样
7. CBOW 和 Skip-gram 分别更适合哪些应用场景?
中等 | #5103 | 自然语言处理(NLP) / CBOW / Skip-gram
8. 说说 GloVE 技术,怎样进行训练?有哪些应用场景?相比 Word2Vec 有哪些优缺点?
困难 | #5104 | 自然语言处理(NLP) / Word2Vec / GloVE
9. 说说 FastText 技术,是否比 Word2Vec 更优越?哪些情况下更适合使用 FastText
困难 | #5105 | 自然语言处理(NLP) / Word2Vec / FastText
10. 聊一聊 ELMo 技术,它有哪些优缺点?可以做到一词多义吗?为什么?
困难 | #5106 | 自然语言处理(NLP) / ELMo
11. 说说 LSTM 的基本原理。
简单 | #5107 | 自然语言处理(NLP) / LSTM
12. 与循环神经网络(RNN)相比,LSTM 是如何解决梯度消失问题的?
中等 | #5108 | 自然语言处理(NLP) / LSTM / RNN / 梯度消失
13. 解释一个 LSTM 单元(LSTM cell)的基本组成,以及它们各自的作用。
中等 | #5109 | 自然语言处理(NLP) / LSTM
14. LSTM 中,隐藏状态(hidden state)和单元状态(cell state)有什么区别?
中等 | #5110 | 自然语言处理(NLP) / LSTM
15. LSTM 和 GRU 有什么区别?
中等 | #5111 | 自然语言处理(NLP) / LSTM / GRU
16. 请解释 LSTM 和 GRU 网络在处理序列数据中的应用。
中等 | #5112 | 自然语言处理(NLP) / LSTM / GRU
17. 什么是注意力机制?它是如何改善 NLP 模型性能的?
中等 | #5113 | 自然语言处理(NLP) / 注意力机制
18. 请描述 BERT 模型的架构和应用场景。
中等 | #5114 | 自然语言处理(NLP) / BERT
19. BERT 是如何处理自然语言文本中不常见词或者罕见词的?
中等 | #5115 | 自然语言处理(NLP) / BERT
20. Word2Vec 到 BERT 有怎样的改进?
中等 | #5116 | 自然语言处理(NLP) / BERT / Word2Vec
21. BERT 怎样进行 mask 相比 CBOW 有什么区别?
中等 | #5117 | 自然语言处理(NLP) / BERT / CBOW
22. 你有什么办法可以比较好地解决 BERT 输入长度的限制?
困难 | #5118 | 自然语言处理(NLP) / BERT
23. 说说你是怎样有效地优化和微调 BERT,以应对你做过的一些特定的 NLP 任务的?
困难 | #5119 | 自然语言处理(NLP) / BERT
24. 如何比较文本的相似度?
简单 | #5120 | 自然语言处理(NLP) / 文本分类
25. 支持向量机可以用于文本分类任务吗?若可以,请说明。
简单 | #5121 | 自然语言处理(NLP) / 文本分类 / 支持向量机
26. 在文本分类任务中,如何处理高维和稀疏数据?
中等 | #5122 | 自然语言处理(NLP) / 文本分类
27. 在文本分类任务中,如何处理样本(类别)不平衡的问题?
中等 | #5123 | 自然语言处理(NLP) / 文本分类
28. 现有文本分类算法在处理多语种文本数据时可能遭遇哪些挑战?
中等 | #5124 | 自然语言处理(NLP) / 文本分类
29. 简述 Word Embedding 可以怎样运用于文本分类任务?
中等 | #5125 | 自然语言处理(NLP) / 文本分类 / Word Embedding
30. 简述 LLaMA(Large Language Model Meta AI)的基本原理。
中等 | #5126 | 自然语言处理(NLP) / 大语言模型
31. LLaMA 模型中,输入句子的长度理论上是否可以无限长?
困难 | #5127 | 自然语言处理(NLP) / 大语言模型
32. 了解 LLaMA 中的旋转位置编码吗?
中等 | #5128 | 自然语言处理(NLP) / 大语言模型 / 旋转位置编码
33. LLaMA 有哪些实际应用?
简单 | #5129 | 自然语言处理(NLP) / 大语言模型
34. 聊一聊 Transformer 的架构和基本原理。
中等 | #5178 | Transformer
35. 使用 Transformer 解决了 RNN 面临的一些什么问题?
简单 | #5179 | Transformer / RNN
36. Transformer 的哪个部分最占用显存?
中等 | #5180 | Transformer
37. Transformer 的位置编码是怎样的?
简单 | #5181 | Transformer / 位置编码
38. Transformer 在计算 attention 的时候使用的是点乘还是加法?请说明理由。
中等 | #5182 | Transformer
39. self attention 中的 K 和 Q 是用来做什么的?
简单 | #5183 | Transformer / 自注意力机制
40. K 和 Q 可以使用同一个值通过对自身进行点乘得到吗?
中等 | #5184 | Transformer
41. 如果让 K 和 Q 变成同一个矩阵,你觉得对模型性能会带来怎样的影响?
困难 | #5185 | Transformer
42. 为什么 Transformer 采用多头注意力机制?
中等 | #5186 | Transformer / 自注意力机制 / 多头注意力机制
43. 在不考虑计算量的情况下,head 能否无限增多?
中等 | #5187 | Transformer / 多头注意力机制
44. 在进行多头注意力的时候需要对每个 head 进行降维吗?
中等 | #5188 | Transformer / 多头注意力机制
45. 讲一下你对 Transformer 的 Encoder 模块的理解。
中等 | #5189 | Transformer / Encoder
46. Transformer 中,Decoder 阶段的多头自注意力和 Encoder 阶段的多头自注意力是相同的吗?
中等 | #5190 | Transformer / Encoder / Decoder / 多头自注意力机制
47. 了解 Transformer 模型训练中的梯度裁剪(Gradient Clipping)吗?
中等 | #5191 | Transformer / 梯度裁剪
48. Transformer 为什么采用 Layer Normalization 而不是 Batch Normalization
中等 | #5192 | Transformer / normalization
49. Transformer 中的注意力遮蔽(Attention Masking)的工作原理是什么?
中等 | #5193 | Transformer / 注意力遮蔽
50. 什么是自回归属性(autoregressive property)?
中等 | #5194 | Transformer / 自回归属性
51. Transformer 中如何实现序列到序列的映射?
中等 | #5195 | Transformer / 编解码器
52. Transformer 中的"残差连接"可以缓解梯度消失问题吗?
中等 | #5196 | Transformer / 残差连接 / 梯度消失
53. Transformer 中,如何处理大型数据集?
中等 | #5197 | Transformer
54. Transformer 模型训练完成后,如何评估其性能和效果?
中等 | #5198 | Transformer
55. Transformer 模型的性能瓶颈在哪?
中等 | #5199 | Transformer
56. 你觉得可以怎样缓解这个性能瓶颈?
困难 | #5200 | Transformer
57. Transformer 和 LLM 有哪些区别
简单 | #5201 | Transformer / LLM
58. 了解 ViT(Vision Transformer) 吗?
中等 | #5202 | Vision Transformer
59. 了解 ViLT(Vision-and-Language Transformer) 吗?
困难 | #5203 | ViLT
60. ViLT 模型是如何将 Transformer 应用于图像识别任务的
中等 | #5204 | ViLT / 图像识别
61. chatGLM 和 GPT 在结构上有什么区别?
中等 | #5205 | Transformer / 语言模型
62. 请解释大模型微调(Fine-tuning)的原理,并说明在什么业务场景下需要微调而不是直接使用基础模型?
简单 | #11326 | 大模型
63. 什么是向量数据库?在基于大模型的应用开发中,向量数据库主要解决什么问题?
中等 | #11327 | 大模型
64. 解释LangChain框架中的Chain和Agent概念,并举例说明各自的应用场景
中等 | #11328 | 大模型
65. 什么是大模型的涌现能力?列举三种典型表现并解释其可能成因
中等 | #11329 | 大模型
66. 要让AI生成一个带表单验证的Vue3组件,请写出包含以下要素的Prompt
中等 | #11340 | 大模型
67. 假设需要让大模型生成一个React表单组件代码,请设计一个包含上下文约束的Prompt(需包含数据验证、错误提示等要求)
中等 | #11341 | 大模型
68. 请描述使用LangChain构建一个文档问答系统的关键技术组件及实现步骤
中等 | #11342 | 大模型
69. 假设要开发一个智能工单分类系统,请拆解AI可参与的环节并说明技术选型思路
中等 | #11343 | 大模型
70. 当需要处理超长大模型上下文窗口限制时,有哪些可行的工程解决方案?
中等 | #11344 | 大模型
71. 现场实操:给定一个包含数据Schema的API文档,请使用AI工具在15分钟内生成符合RESTful规范的CRUD接口代码,并解释关键实现逻辑
中等 | #11345 | 大模型
72. 请举例说明假设在电商系统中,哪些功能适合直接使用大模型完成,哪些需要结合工程化手段?
困难 | #11346 | 大模型
73. 假设请你设计一个医疗问诊系统,如何平衡AI幻觉带来的风险与效率提升?需要哪些技术手段?
困难 | #11347 | 大模型
74. 设计智能客服系统时,如何通过知识库构建解决长尾问题?请描述具体实现步骤
困难 | #11349 | 大模型
75. 当大模型API响应延迟超过1秒时,前端可以采取哪些优化策略保证用户体验?
中等 | #11351 | 大模型
76. 使用LangChain时,如何实现多路召回结果的动态权重分配?
中等 | #11352 | 大模型
77. 当大模型上下文窗口扩展到100万token时,哪些现有业务场景可能发生质变?
中等 | #11354 | 大模型
78. 当发现RAG系统召回结果与用户query意图不匹配时,有哪些可能的改进方向?
中等 | #11355 | 大模型
79. 使用LangChain实现RAG系统时,如何处理PDF文档中的表格数据召回问题?
中等 | #11356 | 大模型
80. 什么是 RAG?RAG 的主要流程是什么?
简单 | #11451 | AI / 大模型 / RAG
81. 什么是 RAG 中的 Rerank?具体需要怎么做?
中等 | #11456 | AI / 大模型 / RAG
82. 什么混合检索?在基于大模型的应用开发中,混合检索主要解决什么问题?
中等 | #11464 | AI / 大模型 / RAG
83. RAG 的完整流程是怎么样的?
简单 | #11469 | AI / 大模型 / RAG
84. 在 RAG 应用中为了优化检索精度,其中的数据清洗和预处理怎么做?
中等 | #11471 | AI / 大模型 / RAG
85. 什么查询扩展?为什么在 RAG 应用中需要查询扩展?
中等 | #11480 | AI / 大模型 / RAG
86. 什么自查询?为什么在 RAG 中需要自查询?
简单 | #11481 | AI / 大模型 / RAG
87. 什么提示压缩?为什么在 RAG 中需要提示压缩?
简单 | #11486 | AI / 大模型 / RAG
88. 如何进行 RAG 调优后的效果评估?请给出真实应用场景中采用的效果评估标准与方法
中等 | #11529 | AI / 大模型 / RAG
89. 什么是 RAG 中的分块?为什么需要分块?
简单 | #11532 | AI / 大模型 / RAG
90. 在 RAG 中,常见的分块策略有哪些?分别有什么区别?
简单 | #11534 | AI / 大模型 / RAG
91. 在 RAG 中的 Embedding 嵌入是什么?
简单 | #11535 | AI / 大模型 / RAG
92. 在 RAG 中,你知道有哪些 Embedding Model 嵌入模型?
简单 | #11549 | AI / 大模型 / RAG
93. 在 RAG 中,你如何选择 Embedding Model 嵌入模型,需要考虑哪些因素?
中等 | #11550 | AI / 大模型 / RAG
94. 在 RAG 中,索引流程中的文档解析你们怎么做的?
中等 | #11551 | AI / 大模型 / RAG
95. 你都了解哪些向量数据库?如何选型?
中等 | #11554 | AI / 大模型
96. 向量数据库原理是什么? 请简述下它的原理
中等 | #11567 | AI / 大模型 / RAG / 向量数据库
97. 向量数据库中的 HNSW、LSH、PQ 分别是什么意思?
中等 | #11568 | AI / 大模型 / RAG / 向量数据库
98. 向量数据库中的 ANN 是什么?为什么需要用它?
中等 | #11570 | AI / 大模型 / RAG / 向量数据库
99. 向量数据库的工作流程有哪些?请简述下
中等 | #11571 | AI / 大模型 / RAG / 向量数据库
100. 什么是 MCP 协议,它在 AI 大模型系统中的作用是什么?
简单 | #11573 | 大模型 / AI / MCP / 协议原理 / 系统设计 / 场景题
101. MCP 架构包含哪些核心组件?
简单 | #11574 | 大模型 / AI / MCP / 系统架构
102. MCP 协议支持哪两种模式?
简单 | #11575 | 大模型 / AI / MCP / 协议设计
103. MCP 与 Function Calling 的区别是什么?
简单 | #11576 | 大模型 / AI / MCP / Function Calling
104. MCP 的工作流程是什么?
简单 | #11577 | 大模型 / AI / MCP / 协议原理
105. 在 Spring AI 框架中如何集成 MCP?
简单 | #11578 | 大模型 / AI / MCP / Spring / Spring AI / Java
106. MCP 协议安全性设计包含哪些层面?
简单 | #11579 | 大模型 / AI / MCP / 安全性
107. 如何将已有的应用转换成 MCP 服务?
简单 | #11580 | 大模型 / AI / MCP / 开发实践
108. 什么是大模型微调?与预训练的核心区别是什么?
简单 | #11581 | 大模型 / AI / 微调 / 预训练
109. 常见的微调任务有哪些?
简单 | #11582 | 大模型 / AI / 微调
110. 常见的微调方法有哪些?
简单 | #11583 | 大模型 / AI / 微调
111. PEFT 是什么?为什么需要 PEFT?
中等 | #11584 | 大模型 / AI / 微调 / PEFT
112. 参数高效微调(PEFT)的核心思路是什么?列举 3 种典型方法
中等 | #11585 | 大模型 / AI / 微调 / PEFT
113. PEFT 和全量微调的区别?
中等 | #11586 | 大模型 / AI / 微调 / PEFT
114. 在进行 Fine-Tuning 时,如何选择适合的预训练模型?
中等 | #11587 | 大模型 / AI / 微调 / 预训练模型
115. 微调中常用的优化器有哪些?
中等 | #11588 | 大模型 / AI / 微调 / 优化器
116. 如何判断微调效果是否达到预期?
中等 | #11589 | 大模型 / AI / 微调 / 评估指标
117. 介绍几种常见的微调策略的优缺点
中等 | #11590 | 大模型 / AI / 微调 / 训练策略
118. 什么是低秩适配(LoRA)技术?如何结合 LoRA 技术进行微调?
困难 | #11591 | 大模型 / AI / 微调 / LoRA / PEFT
119. 微调的过拟合风险如何通过正则化缓解?
困难 | #11592 | 大模型 / AI / 微调
120. 请详细讨论微调时如何防止灾难性遗忘问题?
困难 | #11593 | 大模型 / AI / 微调
121. 在多模态微调(如图文生成)中,如何确保文本和图像数据的对齐质量?
困难 | #11594 | 大模型 / AI / 微调 / 多模
122. 向量数据库中,常见的向量搜索方法:余弦相似度、欧几里得距离和曼哈顿距离分别是什么?有什么区别?
中等 | #11595 | AI / 大模型 / RAG / 向量数据库
123. 在 RAG 应用的过程中,关于提示工程的设计有什么心得和技巧吗?
中等 | #11605 | AI / 大模型 / RAG / 提示工程
124. 什么是 Advanced RAG?
中等 | #11607 | AI / 大模型 / RAG
125. 什么是 Modular RAG?
中等 | #11608 | AI / 大模型 / RAG
126. 什么是护栏技术?
简单 | #11626 | AI / 大模型
127. 什么是 GPTCache?
简单 | #11627 | AI / 大模型
128. 什么是 GPT Structured Outputs?
简单 | #11628 | AI / 大模型
129. 什么是 LangChain?
简单 | #11629 | AI / 大模型 / LangChain
130. 什么是 LangGraph ?
简单 | #11630 | AI / 大模型 / LangChain / LangGraph
131. LangGraph 编排的原理是什么?
简单 | #11633 | AI / 大模型 / LangChain / LangGraph
132. LangChain 和 LangGraph 有什么区别?
简单 | #11634 | AI / 大模型 / LangChain / LangGraph
133. 什么是 Manus?说说你对它的了解
简单 | #11635 | AI / 大模型 / Manus
134. Computer Use 是什么?说说它的原理
中等 | #11636 | AI / 大模型
135. ReAct 是什么?说说它的原理
简单 | #11637 | AI / 大模型
136. 在大模型应用中,通常如何实现长短期记忆机制?
中等 | #11639 | AI / 大模型
137. Copilot 模式和 Agent 模式的区别是什么?
中等 | #11640 | AI / 大模型
138. 参数高效微调(PEFT)如何减少计算成本?
困难 | #11641 | 大模型 / AI / 微调
139. 冻结层在微调中的作用是什么?
困难 | #11642 | 大模型 / AI / 微调
140. 为什么需要混合精度训练?
困难 | #11643 | 大模型 / AI / 微调
141. 模型输出重复和幻觉如何微调解决?
困难 | #11644 | 大模型 / AI / 微调
142. SFT 指令微调数据如何构建?
困难 | #11645 | 大模型 / AI / 微调
143. 指令微调的好处?
困难 | #11646 | 大模型 / AI / 微调
144. 什么是大模型 Agent?它与传统的 AI 系统有什么不同?
简单 | #11647 | 大模型 / AI / Agent
145. LLM Agent 的基本架构有哪些组成部分?
简单 | #11648 | 大模型 / AI / Agent
146. LLM Agent 常见功能有哪些?
简单 | #11649 | 大模型 / AI / Agent
147. Agent智能体的工作过程是怎样的?
中等 | #11650 | 大模型 / AI / Agent
148. 如何让 LLM Agent 具备长期记忆能力?
困难 | #11651 | 大模型 / AI / Agent
149. LLM Agent 如何进行动态 API 调用?
中等 | #11652 | 大模型 / AI / Agent
150. LLM Agent 在多模态任务中如何执行推理?
困难 | #11653 | 大模型 / AI / Agent
151. 市面上有哪些主流的 LLM Agent 框架?各自的特点是什么?
简单 | #11654 | 大模型 / AI / Agent
152. LangChain 的核心组件有哪些?
中等 | #11656 | 大模型 / AI / Agent / LangChain
153. LangChain核心架构是什么样的
中等 | #11657 | 大模型 / AI / Agent / LangChain
154. 什么是 LangChain Agent
简单 | #11658 | 大模型 / AI / Agent / LangChain
155. 什么是 LangChain model
简单 | #11659 | 大模型 / AI / Agent / LangChain
156. LlamaIndex 如何与 LangChain 结合?
困难 | #11660 | 大模型 / AI / Agent / LangChain / LlamaIndex
157. AutoGPT 如何实现自主决策?
困难 | #11661 | 大模型 / AI / Agent / LangChain / AutoGPT
158. 什么是 A2A 协议,它的核心架构及主要组件有哪些?
中等 | #11662 | 大模型 / AI / A2A / 系统架构
159. A2A 协议有哪五大设计原则?
中等 | #11663 | 大模型 / AI / A2A / 系统架构
160. A2A 协议的工作原理是怎样的?
简单 | #11664 | 大模型 / AI / A2A / 技术栈
161. A2A 协议的工作流程是怎样的?
简单 | #11665 | 大模型 / AI / A2A
162. 大模型的结构化输出指的是什么?
简单 | #11666 | AI / 大模型
163. A2A 协议 与 MCP 协议的关系是怎样的?
中等 | #11667 | 大模型 / AI / A2A / MCP
164. 什么是 Google ADK?
简单 | #11715 | AI / 大模型
165. 什么是 Spring AI 框架?它有哪些核心特性?
简单 | #11757 | 后端
166. 你在 AI 超级智能体项目中如何利用 Spring AI 开发应用?用到了哪些特性?
简单 | #11758 | 后端
167. 如何实现程序和 AI 大模型的集成?有哪些方式?
简单 | #11759 | 后端
168. 如何实现 AI 多轮对话功能?如何解决对话记忆持久化问题?
中等 | #11761 | 后端
169. 什么是结构化输出?Spring AI 是怎么实现结构化输出的?
中等 | #11763 | 后端
170. 什么是 Re-Reading?如何基于 Spring AI 实现 Re-Reading Advisor?
中等 | #11764 | 后端
171. RAG 的文档处理流程是怎样的?
中等 | #11766 | 后端
172. 什么是查询重写?它有什么作用?如何基于 Spring AI 实现查询重写?
中等 | #11773 | 后端
173. 什么是上下文查询增强?它有什么作用?如何基于 Spring AI 实现上下文查询增强来处理无关问题?
中等 | #11775 | 后端
174. 什么是 Spring AI 提出的模块化 RAG 架构?预检索、检索和后检索阶段各自负责什么?
中等 | #11776 | 后端
175. 什么是工具调用 Tool Calling?如何利用 Spring AI 实现工具调用?
中等 | #11777 | 后端
176. 什么是 ReAct?如何基于 ReAct 模式构建具备自主规划能力的 AI 智能体?
困难 | #11787 | 后端
177. 什么是 OpenManus?它的实现原理是什么?
困难 | #11788 | 后端
178. 什么是 CoT 思维链?如何实现 CoT 思维链?
困难 | #11790 | 后端
179. 如何保证 AI 应用的性能和稳定性?
中等 | #11795 | 后端
180. 有哪些设计和优化 Prompt 的技巧?请举例说明
中等 | #11802 | 通用
181. 如何优化 RAG 的检索效果?
困难 | #11803 | 通用
182. 什么是 CoT 思维链和 ReAct 模式?它们如何提高 AI 推理能力?
困难 | #11804 | 通用
183. 本地部署大模型和调用云端大模型各有什么优缺点?
困难 | #11805 | 通用
184. 如何进行 AI 应用的测试和效果评估?
困难 | #11806 | 通用
185. 提示词优化考虑哪些维度?你们提示词模板有哪些字段?
中等 | #11856 | AI / 大模型
186. 你有多个知识库,做 RAG 的时候,怎么保证查询效率和准确性兼容,并尽可能减少幻觉?
中等 | #11857 | AI / 大模型 / RAG
187. Agent 死循环问题有遇到过吗?如何解决?
中等 | #11859 | 后端 / AI / 大模型 / 场景题
188. 如果一个GPU集群的LLM处理能力为1000tokenss,那1000个用户同时并发访问,响应给每个用户的性能只有1 tokens吗?怎么分析性能瓶颈
中等 | #11871 | 后端 / 场景题 / 大模型
189. 什么是 RAG 检索增强生成?它解决了大模型的哪些问题?
简单 | #12643 | RAG / RAG 基础
190. RAG 的完整工作流程是怎样的?核心步骤有哪些?
简单 | #12644 | RAG / RAG 流程
191. RAG 中的 Embedding 向量化是什么?如何工作的?
简单 | #12645 | RAG / Embedding
192. RAG 为什么需要向量数据库?它和传统数据库有什么区别?
简单 | #12646 | RAG / 向量数据库
193. RAG 和模型微调 Fine-tuning 有什么区别?如何选择?
简单 | #12647 | RAG / Fine-tuning
194. RAG 中如何计算文本相似度?常见算法有哪些?
简单 | #12648 | RAG / 相似度计算
195. RAG 系统中为什么要进行文档切割?有哪些切割策略?
简单 | #12649 | RAG / 文档切割
196. RAG 检索中的 Top-K 是什么意思?K 值如何确定?
简单 | #12650 | RAG / Top-K
197. 如何为 RAG 系统选择合适的 Embedding 模型?
中等 | #12651 | RAG / Embedding 模型选择
198. RAG 系统如何处理 PDF、Word、Markdown 等不同格式文档?
中等 | #12652 | RAG / 文档处理
199. RAG 中文档切割的 chunk_size 和 overlap 应该如何设置?
中等 | #12653 | RAG / 文档切割参数
200. 如何构建和使用向量索引?HNSW 和 IVF 有什么区别?
中等 | #12654 | RAG / 向量索引
201. 什么是 RAG 混合检索?如何实现向量检索和关键词检索结合?
中等 | #12655 | RAG / 混合检索
202. RAG 检索时相似度阈值如何设置?设置不当有什么影响?
中等 | #12656 | RAG / 相似度阈值
203. RAG 系统如何利用元数据过滤提升检索精度?
中等 | #12657 | RAG / 元数据过滤
204. RAG 中如何设计 Prompt 来有效利用检索到的文档?
中等 | #12658 | RAG / Prompt 设计
205. 如何处理 RAG 检索不到相关文档的情况?
中等 | #12659 | RAG / 检索失败处理
206. RAG 系统如何标注信息来源和提供引用?
中等 | #12660 | RAG / 引用标注
207. RAG 中如何实现向量数据库的增量更新?
中等 | #12661 | RAG / 增量更新
208. 如何为 RAG 项目选择向量数据库?Milvus、Pinecone、Chroma 怎么选?
中等 | #12662 | RAG / 向量数据库选型
209. RAG 中的查询重写 Query Rewriting 是什么?如何优化检索效果?
困难 | #12663 | RAG / 查询重写
210. RAG 为什么需要重排序 Reranking?如何实现?
困难 | #12664 | RAG / 重排序
211. 如何评估 RAG 系统的效果?检索和生成分别看哪些指标?
困难 | #12665 | RAG / 效果评估
212. 如何减少 RAG 系统的幻觉问题?有哪些实用方法?
困难 | #12666 | RAG / 幻觉问题
213. RAG 系统在生产环境中如何优化性能和降低成本?
困难 | #12667 | RAG / 性能优化
214. 什么是 Prompt Engineering 提示词工程?它的核心价值是什么?
简单 | #12999 | Prompt / 提示词工程基础
215. Prompt 提示词的基本结构包括哪些部分?
简单 | #13000 | Prompt / 提示词结构
216. Token 是什么?如何计算和控制 Token 数量?
简单 | #13001 | Prompt / Token
217. 什么是上下文窗口 Context Window?它有什么限制?
简单 | #13002 | Prompt / 上下文窗口
218. 如何让 AI 输出指定格式的内容,比如 JSON、表格、Markdown?
简单 | #13003 | Prompt / 格式控制
219. 什么是角色扮演 Role Playing?如何在提示词中使用?
简单 | #13004 | Prompt / 角色扮演
220. 提示词中的分隔符有什么作用?如何使用?
简单 | #13005 | Prompt / 分隔符
221. 如何在提示词中设置约束条件和输出要求?
简单 | #13006 | Prompt / 约束条件
222. 什么是系统提示词 System Prompt?它和用户提示词有什么区别?
简单 | #13007 | Prompt / System Prompt
223. 什么是 Few-shot Learning?Zero-shot、One-shot、Few-shot 有什么区别?
中等 | #13008 | Prompt / Few-shot Learning
224. 如何选择和设计 Few-shot 示例以提升效果?
中等 | #13009 | Prompt / Few-shot 示例设计
225. 什么是 CoT 思维链?它的工作原理是什么?
中等 | #13010 | Prompt / CoT 思维链
226. 零样本 CoT 和少样本 CoT 有什么区别?各自适合什么场景?
中等 | #13011 | Prompt / CoT 类型
227. 如何让 AI 一步步思考来提升推理能力?
中等 | #13012 | Prompt / 推理引导
228. 什么是自洽性?如何应用?
中等 | #13013 | Prompt / 自洽性
229. 如何设计提示词来减少 AI 的幻觉问题?
中等 | #13014 | Prompt / 幻觉问题
230. temperature 和 top_p 参数有什么作用?如何选择合适的值?
中等 | #13015 | Prompt / 模型参数
231. 什么是提示词模板?如何设计可复用的提示词模板?
中等 | #13016 | Prompt / 提示词模板
232. 如何使用提示词实现任务分解?
中等 | #13017 | Prompt / 任务分解
233. 什么是负面提示词?在什么场景下使用?
中等 | #13018 | Prompt / 负面提示词
234. 如何优化过长的提示词?提示词压缩有哪些技巧?
中等 | #13019 | Prompt / 提示词压缩
235. 什么是提示词链接?如何实现?
中等 | #13020 | Prompt / 提示词链接
236. 如何为不同领域设计专用提示词?比如编程、创作、数据分析
中等 | #13021 | Prompt / 领域专用提示词
237. 如何让 AI 进行自我反思和迭代优化?
中等 | #13022 | Prompt / 自我反思
238. 如何系统地评估和优化提示词的效果?
困难 | #13023 | Prompt / 效果评估
239. 提示词注入攻击是什么?如何防范?
困难 | #13024 | Prompt / 安全防护
240. 在实际项目中如何进行提示词的 AB 测试和迭代?
困难 | #13025 | Prompt / A/B 测试
241. 如何处理提示词优化中的常见问题?比如输出不准确、不完整、格式错误
困难 | #13026 | Prompt / 问题诊断
242. 什么是思维树 Tree of Thoughts?它相比 CoT 有什么优势?
困难 | #13027 | Prompt / 思维树
243. 如何结合 RAG 和 Fine-tuning 来提升提示词效果?
困难 | #13028 | Prompt / RAG / Fine-tuning
244. LangChain 是什么?它主要用来解决什么问题?
简单 | #13029 | LangChain / LangChain 基础
245. LangChain 中的 Chain 是什么?有哪些常见类型?
简单 | #13030 | LangChain / Chain 链式调用
246. 什么是 LangChain 中的 Agent?它和 Chain 有什么区别?
中等 | #13031 | LangChain / Agent 智能体
247. LangChain 的 Memory 组件有什么作用?常见的 Memory 类型有哪些?
中等 | #13032 | LangChain / Memory 记忆机制
248. 在 LangChain 中如何实现流式输出?
中等 | #13033 | LangChain / 流式输出
249. 如何在 LangChain 中自定义 Tool 工具?
中等 | #13034 | LangChain / Tool 工具
250. 什么是 RAG?在 LangChain 中如何实现 RAG 应用?
中等 | #13035 | LangChain / RAG 检索增强
251. LangChain 中的 Prompt 模板有什么作用?如何使用?
简单 | #13036 | LangChain / Prompt 提示词
252. LangChain 支持哪些向量数据库?如何选择?
中等 | #13037 | LangChain / 向量数据库
253. LangChain 的 Agent 执行流程是怎样的?
困难 | #13038 | LangChain / Agent 原理
254. 如何优化 LangChain 应用的性能和成本?
困难 | #13039 | LangChain / 性能优化
255. LangChain 和 LlamaIndex 有什么区别?各自适合什么场景?
中等 | #13040 | LangChain / LlamaIndex / 框架对比
256. LangChain 中的 DocumentLoader 有哪些类型?如何选择?
简单 | #13041 | LangChain / DocumentLoader 文档加载
257. LangChain 中的 TextSplitter 文档切分策略有哪些?
中等 | #13042 | LangChain / 文档切分
258. 如何评估 LangChain RAG 应用的效果?
困难 | #13043 | LangChain / RAG 评估
259. LangChain 中如何处理多模态数据?
中等 | #13044 | LangChain / 多模态
260. 在生产环境中使用 LangChain 需要注意哪些问题?
困难 | #13045 | LangChain / 生产实践
261. LangChain 的 OutputParser 有什么作用?有哪些常见类型?
简单 | #13046 | LangChain / OutputParser 输出解析
262. LangChain 中如何实现对话历史的管理和持久化?
中等 | #13047 | LangChain / 对话历史管理
263. LangChain 中的 Callback 回调机制是什么?有什么用?
中等 | #13048 | LangChain / Callback 回调
264. 如何在 LangChain 中实现函数调用 Function Calling?
中等 | #13049 | LangChain / Function Calling
265. LangChain 中的 LCEL 表达式语言是什么?有什么优势?
中等 | #13050 | LangChain / LCEL
266. LangChain 中如何实现条件分支和动态路由?
中等 | #13051 | LangChain / 条件路由
267. LangChain 如何与其他 AI 框架或工具集成?
简单 | #13052 | LangChain / 框架集成
268. LangChain 中的 Retriever 检索器有哪些类型?各有什么特点?
中等 | #13053 | LangChain / Retriever 检索器
269. 如何处理 LangChain 应用中的错误和异常?
中等 | #13054 | LangChain / 异常处理
270. LangChain 中如何实现多轮对话的上下文管理?
简单 | #13055 | LangChain / 上下文管理
271. LangChain 有哪些常见的性能瓶颈?如何优化?
困难 | #13056 | LangChain / 性能瓶颈
272. 如何保证 LangChain 应用的输出质量和一致性?
困难 | #13057 | LangChain / 质量保证
273. LangChain 的未来发展趋势如何?有哪些值得关注的方向?
中等 | #13058 | LangChain / 技术趋势
274. 最近 OpenClaw 这么火,你知道它的原理吗?
简单 | #13216 | AI / OpenClaw / 大模型应用开发 / Agent 开发 / AI 应用开发
275. (OpenClaw前置知识)什么是 AI Agent?它和直接调用大模型 API 做一次问答有什么本质区别?
简单 | #13217 | AI / OpenClaw / 大模型应用开发 / AI 应用开发 / Agent 开发
276. (OpenClaw前置知识)请解释 Tool Calling(工具调用)的完整链路:工具是怎么定义的、LLM 怎么调用它、结果怎么回传
简单 | #13221 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
277. (OpenClaw前置知识)System Prompt 在 Agent 系统中承载了哪些职责?如果 System Prompt 越来越长,你会怎么处理?
简单 | #13222 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
278. (OpenClaw前置知识)什么是 Agent 的 Context Window?为什么它是 Agent 工程中最核心的约束之一?
简单 | #13223 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
279. (OpenClaw前置知识)解释「短期记忆」和「长期记忆」在 Agent 系统中的区别,分别适合怎么存储和检索?
中等 | #13224 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
280. OpenClaw 是什么?它要解决什么问题?它的核心能力有哪些?
简单 | #13225 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
281. OpenClaw 的核心组件有哪些?请描述它们之间的关系
中等 | #13226 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
282. 在 OpenClaw 中,一条用户消息从进入系统到收到回复,完整链路是怎样的?
困难 | #13227 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
283. OpenClaw 的 Agent Runner 是如何工作的?一次 Agent 运行经历了哪些阶段?
困难 | #13228 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
284. LLM 的 Context Window 有上限,长对话时如何保证 Agent 仍然能正常工作?OpenClaw 是怎么做的?
中等 | #13229 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
285. Agent 调用工具可能返回超大结果(比如代码搜索返回 50KB),这会带来什么问题?你会怎么处理?OpenClaw 是怎么做的?
中等 | #13230 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
286. 当对话历史实在太长、裁剪也不够用时,还有什么办法?什么是 Compaction?OpenClaw 的 Compaction 策略是怎样的?
中等 | #13231 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
287. OpenClaw 把 Context 管理抽象成了可插拔的 Context Engine,为什么要做这层抽象?这个设计能支持哪些不同的策略?
中等 | #13232 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
288. 如果一个 Agent 系统要同时接入 Telegram、飞书、钉钉等渠道,你会怎么设计抽象层?OpenClaw 的 Channel Plugin 接口是怎么设计的?
简单 | #13237 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
289. 什么是 AI Agent 中的 Skills?它有什么用?
简单 | #13251 | AI / 大模型 / Agent / Skills
290. MCP 和 Skills 有什么区别?分别适用于什么场景?
简单 | #13252 | AI / 大模型 / Agent / Skills
291. 如何设计和管理 AI Agent 的 Skills 体系?在实际项目中有哪些挑战?
中等 | #13253 | AI / 大模型 / Agent / Skills
292. 同一个系统里可能有多个 Agent,不同渠道用户群组的消息需要路由到不同的 Agent。你会怎么设计这个路由?OpenClaw 的路由匹配优先级是怎样的?
中等 | #13256 | AI / OpenClaw / 大模型应用开发 / Agent开发 / AI应用开发
293. 同一个用户在 Telegram 私聊和 Discord 群组里和 Agent 对话,应该共享会话还是隔离?OpenClaw 是怎么设计会话隔离粒度的?
中等 | #13257 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
294. 同一个工具(比如「执行命令」)在不同场景下应该有不同的权限。你会怎么设计工具的权限控制?OpenClaw 的工具策略管道是怎么分层的?
中等 | #13258 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
295. 不同的 LLM Provider 对 Tool Schema 的支持不完全一致,你会怎么处理这种差异?OpenClaw 是怎么做 Schema 适配的?
中等 | #13259 | AI / OpenClaw / 大模型应用开发 / AI应用开发
296. Agent 系统中 Hook中间件模式有什么用?能举几个典型场景吗?OpenClaw 的 Hook 系统是怎么设计的?
中等 | #13260 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
297. 什么场景下需要多 Agent 协作而不是单个 Agent 解决?OpenClaw 是怎么支持子 Agent(Subagent)的?
中等 | #13261 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
298. 父 Agent spawn 子 Agent 时,有哪些边界问题需要考虑?OpenClaw 做了哪些限制和保护?
中等 | #13262 | AI / 大模型应用开发 / AI应用开发 / Agent开发
299. 多 Agent 之间如何通信和协调?OpenClaw 的 Gateway 在其中扮演什么角色?
中等 | #13263 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
300. OpenClaw 采用插件架构,第三方可以注册新渠道、工具、Hook。设计一个插件系统需要考虑哪些关键问题?OpenClaw 的插件 API 长什么样?
中等 | #13264 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
301. OpenClaw 的 Gateway 对 Agent 请求做了幂等性处理。为什么 Agent 系统特别需要幂等性?工具已经产生副作用时怎么办?
中等 | #13265 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
302. 如果让你基于 OpenClaw 的设计理念从零搭建一个 Agent 框架,你会先做哪三个模块?为什么?
中等 | #13266 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发
303. 什么是 LoRA?它的原理是什么?为什么能减少训练参数?
简单 | #13499
304. 微调大模型需要什么样的硬件?7B 和 70B 模型分别需要多少显存?
简单 | #13501
305. LoRA 的数学原理是什么?为什么低秩分解能近似全量微调的效果?
简单 | #13502
306. 2026 年主流的微调工具有哪些?Unsloth、Axolotl、TRL 各有什么特点?
简单 | #13503
307. 什么是 SFT 指令微调?微调数据需要什么格式?
简单 | #13505
308. RLHF 的完整训练流程是怎样的?从 SFT 到 Reward Model 到 PPO 每个阶段做了什么?
简单 | #13506
309. LoRA 的超参数应该怎么设置?有什么经验法则?
简单 | #13507
310. 对比 LoRA、QLoRA、DoRA 和全量微调,在不同场景下应该如何选择?
简单 | #13508
311. 什么是 DPO?它相比 RLHF 和 PPO 有什么优势?
简单 | #13509
312. 在多模态微调中,如何确保文本和图像数据的对齐质量?有哪些技术挑战?
简单 | #13510
313. 微调时出现过拟合怎么办?有哪些正则化方法可以使用?
简单 | #13511
314. 为什么需要微调?直接用 Prompt Engineering 或 RAG 不行吗?
简单 | #13512
315. 如何评估微调的效果?需要关注哪些指标?
简单 | #13513
316. Adapter Tuning 和 Prefix Tuning 是什么?它们和 LoRA 有什么区别?
简单 | #13514
317. ORPO 是什么?它如何将指令微调和偏好对齐合二为一?
简单 | #13515
318. 微调过程中如何防止灾难性遗忘?有哪些实用的缓解策略?
简单 | #13516
319. LoRA 和 QLoRA 有什么区别?各自适合什么场景?
简单 | #13517
320. 什么是全量微调?它有哪些优缺点?
简单 | #13518
321. 如何构建高质量的 SFT 微调数据集?数据质量和数量哪个更重要?
简单 | #13519
322. 什么是 AI 幻觉(Hallucination)?大模型为什么会产生幻觉?有哪些缓解方法?
简单 | #13648
323. 什么是 Agentic Engineering?它和 Vibe Coding 有什么区别?
简单 | #13649
324. 什么是 ACP 协议?它有哪两个不同的含义?
简单 | #13650
325. 什么是深度思考(Deep Thinking)和自适应思考(Adaptive Thinking)?它们在 AI 编程中有什么应用?
简单 | #13651
326. 什么是大模型的涌现能力(Emergent Abilities)?它对 AI 应用开发有什么启示?
简单 | #13652
327. 大模型的 Token 是什么?输入 Token 和输出 Token 在计费上有什么区别?
简单 | #13653
328. 什么是 Background Agent(后台 Agent)?它改变了 AI 编程的什么工作方式?
简单 | #13654
329. 什么是 Token 缓存机制?它如何帮助降低 AI 应用的成本?
简单 | #13655
330. 什么是模型蒸馏(Knowledge Distillation)?它和模型量化有什么区别?
简单 | #13656
331. 什么是 AI 编程中的自动修复循环(Auto-fix Loop)?它的工作流程和退出策略怎么设计?
简单 | #13666
332. 大模型的训练和推理分别是什么?它们在计算资源需求上有什么区别?
简单 | #13668
333. 什么是大模型的参数量?参数量和模型能力之间是什么关系?
简单 | #13671
