AI 大模型 333 题备份清单

沉默王二约 10346 字大约 34 分钟

这份文档只保存 AI 大模型题目备份清单，方便后续做知识点覆盖、补齐和扩写对照；不放题解答案。

题目清单

1. 什么是词嵌入（Word Embedding）？有哪些常见的词嵌入方法？

中等 | #5097 | 自然语言处理（NLP） / 词嵌入 / Word2Vec

2. 是否使用 Word2Vec 训练过数据？在这个过程中，如何获取语料？如何选择超参数？语料、词表和维度大小如何确定？怎样把握训练时长？

困难 | #5098 | 自然语言处理（NLP） / 词嵌入 / Word2Vec

3. Word2Vec 有哪些加速方法？

困难 | #5099 | 自然语言处理（NLP） / 词嵌入 / Word2Vec

4. Word2Vec 如何获取词向量？如何评估该训练得到的词向量的好坏？

中等 | #5100 | 自然语言处理（NLP） / 词嵌入 / Word2Vec / 词向量

5. 解释 hierarchical softmax 的流程，以及它有什么优点？

困难 | #5101 | 自然语言处理（NLP） / 词嵌入 / Word2Vec / hierarchical softmax

6. 说一说负采样技术在 Word2Vec 中的运用。

中等 | #5102 | 自然语言处理（NLP） / 词嵌入 / Word2Vec / 负采样

7. CBOW 和 Skip-gram 分别更适合哪些应用场景？

中等 | #5103 | 自然语言处理（NLP） / CBOW / Skip-gram

8. 说说 GloVE 技术，怎样进行训练？有哪些应用场景？相比 Word2Vec 有哪些优缺点？

困难 | #5104 | 自然语言处理（NLP） / Word2Vec / GloVE

9. 说说 FastText 技术，是否比 Word2Vec 更优越？哪些情况下更适合使用 FastText

困难 | #5105 | 自然语言处理（NLP） / Word2Vec / FastText

10. 聊一聊 ELMo 技术，它有哪些优缺点？可以做到一词多义吗？为什么？

困难 | #5106 | 自然语言处理（NLP） / ELMo

11. 说说 LSTM 的基本原理。

简单 | #5107 | 自然语言处理（NLP） / LSTM

12. 与循环神经网络（RNN）相比，LSTM 是如何解决梯度消失问题的？

中等 | #5108 | 自然语言处理（NLP） / LSTM / RNN / 梯度消失

13. 解释一个 LSTM 单元（LSTM cell）的基本组成，以及它们各自的作用。

中等 | #5109 | 自然语言处理（NLP） / LSTM

14. LSTM 中，隐藏状态（hidden state）和单元状态（cell state）有什么区别？

中等 | #5110 | 自然语言处理（NLP） / LSTM

15. LSTM 和 GRU 有什么区别？

中等 | #5111 | 自然语言处理（NLP） / LSTM / GRU

16. 请解释 LSTM 和 GRU 网络在处理序列数据中的应用。

中等 | #5112 | 自然语言处理（NLP） / LSTM / GRU

17. 什么是注意力机制？它是如何改善 NLP 模型性能的？

中等 | #5113 | 自然语言处理（NLP） / 注意力机制

18. 请描述 BERT 模型的架构和应用场景。

中等 | #5114 | 自然语言处理（NLP） / BERT

19. BERT 是如何处理自然语言文本中不常见词或者罕见词的？

中等 | #5115 | 自然语言处理（NLP） / BERT

20. Word2Vec 到 BERT 有怎样的改进？

中等 | #5116 | 自然语言处理（NLP） / BERT / Word2Vec

21. BERT 怎样进行 mask 相比 CBOW 有什么区别？

中等 | #5117 | 自然语言处理（NLP） / BERT / CBOW

22. 你有什么办法可以比较好地解决 BERT 输入长度的限制？

困难 | #5118 | 自然语言处理（NLP） / BERT

23. 说说你是怎样有效地优化和微调 BERT，以应对你做过的一些特定的 NLP 任务的？

困难 | #5119 | 自然语言处理（NLP） / BERT

24. 如何比较文本的相似度？

简单 | #5120 | 自然语言处理（NLP） / 文本分类

25. 支持向量机可以用于文本分类任务吗？若可以，请说明。

简单 | #5121 | 自然语言处理（NLP） / 文本分类 / 支持向量机

26. 在文本分类任务中，如何处理高维和稀疏数据？

中等 | #5122 | 自然语言处理（NLP） / 文本分类

27. 在文本分类任务中，如何处理样本（类别）不平衡的问题？

中等 | #5123 | 自然语言处理（NLP） / 文本分类

28. 现有文本分类算法在处理多语种文本数据时可能遭遇哪些挑战？

中等 | #5124 | 自然语言处理（NLP） / 文本分类

29. 简述 Word Embedding 可以怎样运用于文本分类任务？

中等 | #5125 | 自然语言处理（NLP） / 文本分类 / Word Embedding

30. 简述 LLaMA（Large Language Model Meta AI）的基本原理。

中等 | #5126 | 自然语言处理（NLP） / 大语言模型

31. LLaMA 模型中，输入句子的长度理论上是否可以无限长？

困难 | #5127 | 自然语言处理（NLP） / 大语言模型

32. 了解 LLaMA 中的旋转位置编码吗？

中等 | #5128 | 自然语言处理（NLP） / 大语言模型 / 旋转位置编码

33. LLaMA 有哪些实际应用？

简单 | #5129 | 自然语言处理（NLP） / 大语言模型

34. 聊一聊 Transformer 的架构和基本原理。

中等 | #5178 | Transformer

35. 使用 Transformer 解决了 RNN 面临的一些什么问题？

简单 | #5179 | Transformer / RNN

36. Transformer 的哪个部分最占用显存？

中等 | #5180 | Transformer

37. Transformer 的位置编码是怎样的？

简单 | #5181 | Transformer / 位置编码

38. Transformer 在计算 attention 的时候使用的是点乘还是加法？请说明理由。

中等 | #5182 | Transformer

39. self attention 中的 K 和 Q 是用来做什么的？

简单 | #5183 | Transformer / 自注意力机制

40. K 和 Q 可以使用同一个值通过对自身进行点乘得到吗？

中等 | #5184 | Transformer

41. 如果让 K 和 Q 变成同一个矩阵，你觉得对模型性能会带来怎样的影响？

困难 | #5185 | Transformer

42. 为什么 Transformer 采用多头注意力机制？

中等 | #5186 | Transformer / 自注意力机制 / 多头注意力机制

43. 在不考虑计算量的情况下，head 能否无限增多？

中等 | #5187 | Transformer / 多头注意力机制

44. 在进行多头注意力的时候需要对每个 head 进行降维吗？

中等 | #5188 | Transformer / 多头注意力机制

45. 讲一下你对 Transformer 的 Encoder 模块的理解。

中等 | #5189 | Transformer / Encoder

46. Transformer 中，Decoder 阶段的多头自注意力和 Encoder 阶段的多头自注意力是相同的吗？

中等 | #5190 | Transformer / Encoder / Decoder / 多头自注意力机制

47. 了解 Transformer 模型训练中的梯度裁剪（Gradient Clipping）吗？

中等 | #5191 | Transformer / 梯度裁剪

48. Transformer 为什么采用 Layer Normalization 而不是 Batch Normalization

中等 | #5192 | Transformer / normalization

49. Transformer 中的注意力遮蔽（Attention Masking）的工作原理是什么？

中等 | #5193 | Transformer / 注意力遮蔽

50. 什么是自回归属性（autoregressive property）？

中等 | #5194 | Transformer / 自回归属性

51. Transformer 中如何实现序列到序列的映射？

中等 | #5195 | Transformer / 编解码器

52. Transformer 中的"残差连接"可以缓解梯度消失问题吗？

中等 | #5196 | Transformer / 残差连接 / 梯度消失

53. Transformer 中，如何处理大型数据集？

中等 | #5197 | Transformer

54. Transformer 模型训练完成后，如何评估其性能和效果？

中等 | #5198 | Transformer

55. Transformer 模型的性能瓶颈在哪？

中等 | #5199 | Transformer

56. 你觉得可以怎样缓解这个性能瓶颈？

困难 | #5200 | Transformer

57. Transformer 和 LLM 有哪些区别

简单 | #5201 | Transformer / LLM

58. 了解 ViT（Vision Transformer）吗？

中等 | #5202 | Vision Transformer

59. 了解 ViLT（Vision-and-Language Transformer）吗？

困难 | #5203 | ViLT

60. ViLT 模型是如何将 Transformer 应用于图像识别任务的

中等 | #5204 | ViLT / 图像识别

61. chatGLM 和 GPT 在结构上有什么区别？

中等 | #5205 | Transformer / 语言模型

62. 请解释大模型微调(Fine-tuning)的原理，并说明在什么业务场景下需要微调而不是直接使用基础模型？

简单 | #11326 | 大模型

63. 什么是向量数据库？在基于大模型的应用开发中，向量数据库主要解决什么问题？

中等 | #11327 | 大模型

64. 解释LangChain框架中的Chain和Agent概念，并举例说明各自的应用场景

中等 | #11328 | 大模型

65. 什么是大模型的涌现能力？列举三种典型表现并解释其可能成因

中等 | #11329 | 大模型

66. 要让AI生成一个带表单验证的Vue3组件，请写出包含以下要素的Prompt

中等 | #11340 | 大模型

67. 假设需要让大模型生成一个React表单组件代码，请设计一个包含上下文约束的Prompt（需包含数据验证、错误提示等要求）

中等 | #11341 | 大模型

68. 请描述使用LangChain构建一个文档问答系统的关键技术组件及实现步骤

中等 | #11342 | 大模型

69. 假设要开发一个智能工单分类系统，请拆解AI可参与的环节并说明技术选型思路

中等 | #11343 | 大模型

70. 当需要处理超长大模型上下文窗口限制时，有哪些可行的工程解决方案？

中等 | #11344 | 大模型

71. 现场实操：给定一个包含数据Schema的API文档，请使用AI工具在15分钟内生成符合RESTful规范的CRUD接口代码，并解释关键实现逻辑

中等 | #11345 | 大模型

72. 请举例说明假设在电商系统中，哪些功能适合直接使用大模型完成，哪些需要结合工程化手段？

困难 | #11346 | 大模型

73. 假设请你设计一个医疗问诊系统，如何平衡AI幻觉带来的风险与效率提升？需要哪些技术手段？

困难 | #11347 | 大模型

74. 设计智能客服系统时，如何通过知识库构建解决长尾问题？请描述具体实现步骤

困难 | #11349 | 大模型

75. 当大模型API响应延迟超过1秒时，前端可以采取哪些优化策略保证用户体验？

中等 | #11351 | 大模型

76. 使用LangChain时，如何实现多路召回结果的动态权重分配？

中等 | #11352 | 大模型

77. 当大模型上下文窗口扩展到100万token时，哪些现有业务场景可能发生质变？

中等 | #11354 | 大模型

78. 当发现RAG系统召回结果与用户query意图不匹配时，有哪些可能的改进方向？

中等 | #11355 | 大模型

79. 使用LangChain实现RAG系统时，如何处理PDF文档中的表格数据召回问题？

中等 | #11356 | 大模型

80. 什么是 RAG？RAG 的主要流程是什么？

简单 | #11451 | AI / 大模型 / RAG

81. 什么是 RAG 中的 Rerank？具体需要怎么做？

中等 | #11456 | AI / 大模型 / RAG

82. 什么混合检索？在基于大模型的应用开发中，混合检索主要解决什么问题？

中等 | #11464 | AI / 大模型 / RAG

83. RAG 的完整流程是怎么样的？

简单 | #11469 | AI / 大模型 / RAG

84. 在 RAG 应用中为了优化检索精度，其中的数据清洗和预处理怎么做？

中等 | #11471 | AI / 大模型 / RAG

85. 什么查询扩展？为什么在 RAG 应用中需要查询扩展？

中等 | #11480 | AI / 大模型 / RAG

86. 什么自查询？为什么在 RAG 中需要自查询？

简单 | #11481 | AI / 大模型 / RAG

87. 什么提示压缩？为什么在 RAG 中需要提示压缩？

简单 | #11486 | AI / 大模型 / RAG

88. 如何进行 RAG 调优后的效果评估？请给出真实应用场景中采用的效果评估标准与方法

中等 | #11529 | AI / 大模型 / RAG

89. 什么是 RAG 中的分块？为什么需要分块？

简单 | #11532 | AI / 大模型 / RAG

90. 在 RAG 中，常见的分块策略有哪些？分别有什么区别？

简单 | #11534 | AI / 大模型 / RAG

91. 在 RAG 中的 Embedding 嵌入是什么？

简单 | #11535 | AI / 大模型 / RAG

92. 在 RAG 中，你知道有哪些 Embedding Model 嵌入模型？

简单 | #11549 | AI / 大模型 / RAG

93. 在 RAG 中，你如何选择 Embedding Model 嵌入模型，需要考虑哪些因素？

中等 | #11550 | AI / 大模型 / RAG

94. 在 RAG 中，索引流程中的文档解析你们怎么做的？

中等 | #11551 | AI / 大模型 / RAG

95. 你都了解哪些向量数据库？如何选型？

中等 | #11554 | AI / 大模型

96. 向量数据库原理是什么？请简述下它的原理

中等 | #11567 | AI / 大模型 / RAG / 向量数据库

97. 向量数据库中的 HNSW、LSH、PQ 分别是什么意思？

中等 | #11568 | AI / 大模型 / RAG / 向量数据库

98. 向量数据库中的 ANN 是什么？为什么需要用它？

中等 | #11570 | AI / 大模型 / RAG / 向量数据库

99. 向量数据库的工作流程有哪些？请简述下

中等 | #11571 | AI / 大模型 / RAG / 向量数据库

100. 什么是 MCP 协议，它在 AI 大模型系统中的作用是什么？

简单 | #11573 | 大模型 / AI / MCP / 协议原理 / 系统设计 / 场景题

101. MCP 架构包含哪些核心组件？

简单 | #11574 | 大模型 / AI / MCP / 系统架构

102. MCP 协议支持哪两种模式？

简单 | #11575 | 大模型 / AI / MCP / 协议设计

103. MCP 与 Function Calling 的区别是什么？

简单 | #11576 | 大模型 / AI / MCP / Function Calling

104. MCP 的工作流程是什么？

简单 | #11577 | 大模型 / AI / MCP / 协议原理

105. 在 Spring AI 框架中如何集成 MCP？

简单 | #11578 | 大模型 / AI / MCP / Spring / Spring AI / Java

106. MCP 协议安全性设计包含哪些层面？

简单 | #11579 | 大模型 / AI / MCP / 安全性

107. 如何将已有的应用转换成 MCP 服务？

简单 | #11580 | 大模型 / AI / MCP / 开发实践

108. 什么是大模型微调？与预训练的核心区别是什么？

简单 | #11581 | 大模型 / AI / 微调 / 预训练

109. 常见的微调任务有哪些？

简单 | #11582 | 大模型 / AI / 微调

110. 常见的微调方法有哪些？

简单 | #11583 | 大模型 / AI / 微调

111. PEFT 是什么？为什么需要 PEFT？

中等 | #11584 | 大模型 / AI / 微调 / PEFT

112. 参数高效微调（PEFT）的核心思路是什么？列举 3 种典型方法

中等 | #11585 | 大模型 / AI / 微调 / PEFT

113. PEFT 和全量微调的区别？

中等 | #11586 | 大模型 / AI / 微调 / PEFT

114. 在进行 Fine-Tuning 时，如何选择适合的预训练模型？

中等 | #11587 | 大模型 / AI / 微调 / 预训练模型

115. 微调中常用的优化器有哪些？

中等 | #11588 | 大模型 / AI / 微调 / 优化器

116. 如何判断微调效果是否达到预期？

中等 | #11589 | 大模型 / AI / 微调 / 评估指标

117. 介绍几种常见的微调策略的优缺点

中等 | #11590 | 大模型 / AI / 微调 / 训练策略

118. 什么是低秩适配（LoRA）技术？如何结合 LoRA 技术进行微调？

困难 | #11591 | 大模型 / AI / 微调 / LoRA / PEFT

119. 微调的过拟合风险如何通过正则化缓解？

困难 | #11592 | 大模型 / AI / 微调

120. 请详细讨论微调时如何防止灾难性遗忘问题？

困难 | #11593 | 大模型 / AI / 微调

121. 在多模态微调（如图文生成）中，如何确保文本和图像数据的对齐质量？

困难 | #11594 | 大模型 / AI / 微调 / 多模

122. 向量数据库中，常见的向量搜索方法：余弦相似度、欧几里得距离和曼哈顿距离分别是什么？有什么区别？

中等 | #11595 | AI / 大模型 / RAG / 向量数据库

123. 在 RAG 应用的过程中，关于提示工程的设计有什么心得和技巧吗？

中等 | #11605 | AI / 大模型 / RAG / 提示工程

124. 什么是 Advanced RAG？

中等 | #11607 | AI / 大模型 / RAG

125. 什么是 Modular RAG？

中等 | #11608 | AI / 大模型 / RAG

126. 什么是护栏技术？

简单 | #11626 | AI / 大模型

127. 什么是 GPTCache？

简单 | #11627 | AI / 大模型

128. 什么是 GPT Structured Outputs？

简单 | #11628 | AI / 大模型

129. 什么是 LangChain？

简单 | #11629 | AI / 大模型 / LangChain

130. 什么是 LangGraph ？

简单 | #11630 | AI / 大模型 / LangChain / LangGraph

131. LangGraph 编排的原理是什么？

简单 | #11633 | AI / 大模型 / LangChain / LangGraph

132. LangChain 和 LangGraph 有什么区别？

简单 | #11634 | AI / 大模型 / LangChain / LangGraph

133. 什么是 Manus？说说你对它的了解

简单 | #11635 | AI / 大模型 / Manus

134. Computer Use 是什么？说说它的原理

中等 | #11636 | AI / 大模型

135. ReAct 是什么？说说它的原理

简单 | #11637 | AI / 大模型

136. 在大模型应用中，通常如何实现长短期记忆机制？

中等 | #11639 | AI / 大模型

137. Copilot 模式和 Agent 模式的区别是什么？

中等 | #11640 | AI / 大模型

138. 参数高效微调（PEFT）如何减少计算成本？

困难 | #11641 | 大模型 / AI / 微调

139. 冻结层在微调中的作用是什么？

困难 | #11642 | 大模型 / AI / 微调

140. 为什么需要混合精度训练？

困难 | #11643 | 大模型 / AI / 微调

141. 模型输出重复和幻觉如何微调解决？

困难 | #11644 | 大模型 / AI / 微调

142. SFT 指令微调数据如何构建？

困难 | #11645 | 大模型 / AI / 微调

143. 指令微调的好处？

困难 | #11646 | 大模型 / AI / 微调

144. 什么是大模型 Agent？它与传统的 AI 系统有什么不同？

简单 | #11647 | 大模型 / AI / Agent

145. LLM Agent 的基本架构有哪些组成部分？

简单 | #11648 | 大模型 / AI / Agent

146. LLM Agent 常见功能有哪些？

简单 | #11649 | 大模型 / AI / Agent

147. Agent智能体的工作过程是怎样的？

中等 | #11650 | 大模型 / AI / Agent

148. 如何让 LLM Agent 具备长期记忆能力？

困难 | #11651 | 大模型 / AI / Agent

149. LLM Agent 如何进行动态 API 调用？

中等 | #11652 | 大模型 / AI / Agent

150. LLM Agent 在多模态任务中如何执行推理？

困难 | #11653 | 大模型 / AI / Agent

151. 市面上有哪些主流的 LLM Agent 框架？各自的特点是什么？

简单 | #11654 | 大模型 / AI / Agent

152. LangChain 的核心组件有哪些？

中等 | #11656 | 大模型 / AI / Agent / LangChain

153. LangChain核心架构是什么样的

中等 | #11657 | 大模型 / AI / Agent / LangChain

154. 什么是 LangChain Agent

简单 | #11658 | 大模型 / AI / Agent / LangChain

155. 什么是 LangChain model

简单 | #11659 | 大模型 / AI / Agent / LangChain

156. LlamaIndex 如何与 LangChain 结合？

困难 | #11660 | 大模型 / AI / Agent / LangChain / LlamaIndex

157. AutoGPT 如何实现自主决策？

困难 | #11661 | 大模型 / AI / Agent / LangChain / AutoGPT

158. 什么是 A2A 协议，它的核心架构及主要组件有哪些？

中等 | #11662 | 大模型 / AI / A2A / 系统架构

159. A2A 协议有哪五大设计原则？

中等 | #11663 | 大模型 / AI / A2A / 系统架构

160. A2A 协议的工作原理是怎样的？

简单 | #11664 | 大模型 / AI / A2A / 技术栈

161. A2A 协议的工作流程是怎样的？

简单 | #11665 | 大模型 / AI / A2A

162. 大模型的结构化输出指的是什么？

简单 | #11666 | AI / 大模型

163. A2A 协议与 MCP 协议的关系是怎样的？

中等 | #11667 | 大模型 / AI / A2A / MCP

164. 什么是 Google ADK？

简单 | #11715 | AI / 大模型

165. 什么是 Spring AI 框架？它有哪些核心特性？

简单 | #11757 | 后端

166. 你在 AI 超级智能体项目中如何利用 Spring AI 开发应用？用到了哪些特性？

简单 | #11758 | 后端

167. 如何实现程序和 AI 大模型的集成？有哪些方式？

简单 | #11759 | 后端

168. 如何实现 AI 多轮对话功能？如何解决对话记忆持久化问题？

中等 | #11761 | 后端

169. 什么是结构化输出？Spring AI 是怎么实现结构化输出的？

中等 | #11763 | 后端

170. 什么是 Re-Reading？如何基于 Spring AI 实现 Re-Reading Advisor？

中等 | #11764 | 后端

171. RAG 的文档处理流程是怎样的？

中等 | #11766 | 后端

172. 什么是查询重写？它有什么作用？如何基于 Spring AI 实现查询重写？

中等 | #11773 | 后端

173. 什么是上下文查询增强？它有什么作用？如何基于 Spring AI 实现上下文查询增强来处理无关问题？

中等 | #11775 | 后端

174. 什么是 Spring AI 提出的模块化 RAG 架构？预检索、检索和后检索阶段各自负责什么？

中等 | #11776 | 后端

175. 什么是工具调用 Tool Calling？如何利用 Spring AI 实现工具调用？

中等 | #11777 | 后端

176. 什么是 ReAct？如何基于 ReAct 模式构建具备自主规划能力的 AI 智能体？

困难 | #11787 | 后端

177. 什么是 OpenManus？它的实现原理是什么？

困难 | #11788 | 后端

178. 什么是 CoT 思维链？如何实现 CoT 思维链？

困难 | #11790 | 后端

179. 如何保证 AI 应用的性能和稳定性？

中等 | #11795 | 后端

180. 有哪些设计和优化 Prompt 的技巧？请举例说明

中等 | #11802 | 通用

181. 如何优化 RAG 的检索效果？

困难 | #11803 | 通用

182. 什么是 CoT 思维链和 ReAct 模式？它们如何提高 AI 推理能力？

困难 | #11804 | 通用

183. 本地部署大模型和调用云端大模型各有什么优缺点？

困难 | #11805 | 通用

184. 如何进行 AI 应用的测试和效果评估？

困难 | #11806 | 通用

185. 提示词优化考虑哪些维度？你们提示词模板有哪些字段？

中等 | #11856 | AI / 大模型

186. 你有多个知识库，做 RAG 的时候，怎么保证查询效率和准确性兼容，并尽可能减少幻觉？

中等 | #11857 | AI / 大模型 / RAG

187. Agent 死循环问题有遇到过吗？如何解决？

中等 | #11859 | 后端 / AI / 大模型 / 场景题

188. 如果一个GPU集群的LLM处理能力为1000tokenss，那1000个用户同时并发访问，响应给每个用户的性能只有1 tokens吗？怎么分析性能瓶颈

中等 | #11871 | 后端 / 场景题 / 大模型

189. 什么是 RAG 检索增强生成？它解决了大模型的哪些问题？

简单 | #12643 | RAG / RAG 基础

190. RAG 的完整工作流程是怎样的？核心步骤有哪些？

简单 | #12644 | RAG / RAG 流程

191. RAG 中的 Embedding 向量化是什么？如何工作的？

简单 | #12645 | RAG / Embedding

192. RAG 为什么需要向量数据库？它和传统数据库有什么区别？

简单 | #12646 | RAG / 向量数据库

193. RAG 和模型微调 Fine-tuning 有什么区别？如何选择？

简单 | #12647 | RAG / Fine-tuning

194. RAG 中如何计算文本相似度？常见算法有哪些？

简单 | #12648 | RAG / 相似度计算

195. RAG 系统中为什么要进行文档切割？有哪些切割策略？

简单 | #12649 | RAG / 文档切割

196. RAG 检索中的 Top-K 是什么意思？K 值如何确定？

简单 | #12650 | RAG / Top-K

197. 如何为 RAG 系统选择合适的 Embedding 模型？

中等 | #12651 | RAG / Embedding 模型选择

198. RAG 系统如何处理 PDF、Word、Markdown 等不同格式文档？

中等 | #12652 | RAG / 文档处理

199. RAG 中文档切割的 chunk_size 和 overlap 应该如何设置？

中等 | #12653 | RAG / 文档切割参数

200. 如何构建和使用向量索引？HNSW 和 IVF 有什么区别？

中等 | #12654 | RAG / 向量索引

201. 什么是 RAG 混合检索？如何实现向量检索和关键词检索结合？

中等 | #12655 | RAG / 混合检索

202. RAG 检索时相似度阈值如何设置？设置不当有什么影响？

中等 | #12656 | RAG / 相似度阈值

203. RAG 系统如何利用元数据过滤提升检索精度？

中等 | #12657 | RAG / 元数据过滤

204. RAG 中如何设计 Prompt 来有效利用检索到的文档？

中等 | #12658 | RAG / Prompt 设计

205. 如何处理 RAG 检索不到相关文档的情况？

中等 | #12659 | RAG / 检索失败处理

206. RAG 系统如何标注信息来源和提供引用？

中等 | #12660 | RAG / 引用标注

207. RAG 中如何实现向量数据库的增量更新？

中等 | #12661 | RAG / 增量更新

208. 如何为 RAG 项目选择向量数据库？Milvus、Pinecone、Chroma 怎么选？

中等 | #12662 | RAG / 向量数据库选型

209. RAG 中的查询重写 Query Rewriting 是什么？如何优化检索效果？

困难 | #12663 | RAG / 查询重写

210. RAG 为什么需要重排序 Reranking？如何实现？

困难 | #12664 | RAG / 重排序

211. 如何评估 RAG 系统的效果？检索和生成分别看哪些指标？

困难 | #12665 | RAG / 效果评估

212. 如何减少 RAG 系统的幻觉问题？有哪些实用方法？

困难 | #12666 | RAG / 幻觉问题

213. RAG 系统在生产环境中如何优化性能和降低成本？

困难 | #12667 | RAG / 性能优化

214. 什么是 Prompt Engineering 提示词工程？它的核心价值是什么？

简单 | #12999 | Prompt / 提示词工程基础

215. Prompt 提示词的基本结构包括哪些部分？

简单 | #13000 | Prompt / 提示词结构

216. Token 是什么？如何计算和控制 Token 数量？

简单 | #13001 | Prompt / Token

217. 什么是上下文窗口 Context Window？它有什么限制？

简单 | #13002 | Prompt / 上下文窗口

218. 如何让 AI 输出指定格式的内容，比如 JSON、表格、Markdown？

简单 | #13003 | Prompt / 格式控制

219. 什么是角色扮演 Role Playing？如何在提示词中使用？

简单 | #13004 | Prompt / 角色扮演

220. 提示词中的分隔符有什么作用？如何使用？

简单 | #13005 | Prompt / 分隔符

221. 如何在提示词中设置约束条件和输出要求？

简单 | #13006 | Prompt / 约束条件

222. 什么是系统提示词 System Prompt？它和用户提示词有什么区别？

简单 | #13007 | Prompt / System Prompt

223. 什么是 Few-shot Learning？Zero-shot、One-shot、Few-shot 有什么区别？

中等 | #13008 | Prompt / Few-shot Learning

224. 如何选择和设计 Few-shot 示例以提升效果？

中等 | #13009 | Prompt / Few-shot 示例设计

225. 什么是 CoT 思维链？它的工作原理是什么？

中等 | #13010 | Prompt / CoT 思维链

226. 零样本 CoT 和少样本 CoT 有什么区别？各自适合什么场景？

中等 | #13011 | Prompt / CoT 类型

227. 如何让 AI 一步步思考来提升推理能力？

中等 | #13012 | Prompt / 推理引导

228. 什么是自洽性？如何应用？

中等 | #13013 | Prompt / 自洽性

229. 如何设计提示词来减少 AI 的幻觉问题？

中等 | #13014 | Prompt / 幻觉问题

230. temperature 和 top_p 参数有什么作用？如何选择合适的值？

中等 | #13015 | Prompt / 模型参数

231. 什么是提示词模板？如何设计可复用的提示词模板？

中等 | #13016 | Prompt / 提示词模板

232. 如何使用提示词实现任务分解？

中等 | #13017 | Prompt / 任务分解

233. 什么是负面提示词？在什么场景下使用？

中等 | #13018 | Prompt / 负面提示词

234. 如何优化过长的提示词？提示词压缩有哪些技巧？

中等 | #13019 | Prompt / 提示词压缩

235. 什么是提示词链接？如何实现？

中等 | #13020 | Prompt / 提示词链接

236. 如何为不同领域设计专用提示词？比如编程、创作、数据分析

中等 | #13021 | Prompt / 领域专用提示词

237. 如何让 AI 进行自我反思和迭代优化？

中等 | #13022 | Prompt / 自我反思

238. 如何系统地评估和优化提示词的效果？

困难 | #13023 | Prompt / 效果评估

239. 提示词注入攻击是什么？如何防范？

困难 | #13024 | Prompt / 安全防护

240. 在实际项目中如何进行提示词的 AB 测试和迭代？

困难 | #13025 | Prompt / A/B 测试

241. 如何处理提示词优化中的常见问题？比如输出不准确、不完整、格式错误

困难 | #13026 | Prompt / 问题诊断

242. 什么是思维树 Tree of Thoughts？它相比 CoT 有什么优势？

困难 | #13027 | Prompt / 思维树

243. 如何结合 RAG 和 Fine-tuning 来提升提示词效果？

困难 | #13028 | Prompt / RAG / Fine-tuning

244. LangChain 是什么？它主要用来解决什么问题？

简单 | #13029 | LangChain / LangChain 基础

245. LangChain 中的 Chain 是什么？有哪些常见类型？

简单 | #13030 | LangChain / Chain 链式调用

246. 什么是 LangChain 中的 Agent？它和 Chain 有什么区别？

中等 | #13031 | LangChain / Agent 智能体

247. LangChain 的 Memory 组件有什么作用？常见的 Memory 类型有哪些？

中等 | #13032 | LangChain / Memory 记忆机制

248. 在 LangChain 中如何实现流式输出？

中等 | #13033 | LangChain / 流式输出

249. 如何在 LangChain 中自定义 Tool 工具？

中等 | #13034 | LangChain / Tool 工具

250. 什么是 RAG？在 LangChain 中如何实现 RAG 应用？

中等 | #13035 | LangChain / RAG 检索增强

251. LangChain 中的 Prompt 模板有什么作用？如何使用？

简单 | #13036 | LangChain / Prompt 提示词

252. LangChain 支持哪些向量数据库？如何选择？

中等 | #13037 | LangChain / 向量数据库

253. LangChain 的 Agent 执行流程是怎样的？

困难 | #13038 | LangChain / Agent 原理

254. 如何优化 LangChain 应用的性能和成本？

困难 | #13039 | LangChain / 性能优化

255. LangChain 和 LlamaIndex 有什么区别？各自适合什么场景？

中等 | #13040 | LangChain / LlamaIndex / 框架对比

256. LangChain 中的 DocumentLoader 有哪些类型？如何选择？

简单 | #13041 | LangChain / DocumentLoader 文档加载

257. LangChain 中的 TextSplitter 文档切分策略有哪些？

中等 | #13042 | LangChain / 文档切分

258. 如何评估 LangChain RAG 应用的效果？

困难 | #13043 | LangChain / RAG 评估

259. LangChain 中如何处理多模态数据？

中等 | #13044 | LangChain / 多模态

260. 在生产环境中使用 LangChain 需要注意哪些问题？

困难 | #13045 | LangChain / 生产实践

261. LangChain 的 OutputParser 有什么作用？有哪些常见类型？

简单 | #13046 | LangChain / OutputParser 输出解析

262. LangChain 中如何实现对话历史的管理和持久化？

中等 | #13047 | LangChain / 对话历史管理

263. LangChain 中的 Callback 回调机制是什么？有什么用？

中等 | #13048 | LangChain / Callback 回调

264. 如何在 LangChain 中实现函数调用 Function Calling？

中等 | #13049 | LangChain / Function Calling

265. LangChain 中的 LCEL 表达式语言是什么？有什么优势？

中等 | #13050 | LangChain / LCEL

266. LangChain 中如何实现条件分支和动态路由？

中等 | #13051 | LangChain / 条件路由

267. LangChain 如何与其他 AI 框架或工具集成？

简单 | #13052 | LangChain / 框架集成

268. LangChain 中的 Retriever 检索器有哪些类型？各有什么特点？

中等 | #13053 | LangChain / Retriever 检索器

269. 如何处理 LangChain 应用中的错误和异常？

中等 | #13054 | LangChain / 异常处理

270. LangChain 中如何实现多轮对话的上下文管理？

简单 | #13055 | LangChain / 上下文管理

271. LangChain 有哪些常见的性能瓶颈？如何优化？

困难 | #13056 | LangChain / 性能瓶颈

272. 如何保证 LangChain 应用的输出质量和一致性？

困难 | #13057 | LangChain / 质量保证

273. LangChain 的未来发展趋势如何？有哪些值得关注的方向？

中等 | #13058 | LangChain / 技术趋势

274. 最近 OpenClaw 这么火，你知道它的原理吗？

简单 | #13216 | AI / OpenClaw / 大模型应用开发 / Agent 开发 / AI 应用开发

275. （OpenClaw前置知识）什么是 AI Agent？它和直接调用大模型 API 做一次问答有什么本质区别？

简单 | #13217 | AI / OpenClaw / 大模型应用开发 / AI 应用开发 / Agent 开发

276. （OpenClaw前置知识）请解释 Tool Calling（工具调用）的完整链路：工具是怎么定义的、LLM 怎么调用它、结果怎么回传

简单 | #13221 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

277. （OpenClaw前置知识）System Prompt 在 Agent 系统中承载了哪些职责？如果 System Prompt 越来越长，你会怎么处理？

简单 | #13222 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

278. （OpenClaw前置知识）什么是 Agent 的 Context Window？为什么它是 Agent 工程中最核心的约束之一？

简单 | #13223 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

279. （OpenClaw前置知识）解释「短期记忆」和「长期记忆」在 Agent 系统中的区别，分别适合怎么存储和检索？

中等 | #13224 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

280. OpenClaw 是什么？它要解决什么问题？它的核心能力有哪些？

简单 | #13225 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

281. OpenClaw 的核心组件有哪些？请描述它们之间的关系

中等 | #13226 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

282. 在 OpenClaw 中，一条用户消息从进入系统到收到回复，完整链路是怎样的？

困难 | #13227 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

283. OpenClaw 的 Agent Runner 是如何工作的？一次 Agent 运行经历了哪些阶段？

困难 | #13228 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

284. LLM 的 Context Window 有上限，长对话时如何保证 Agent 仍然能正常工作？OpenClaw 是怎么做的？

中等 | #13229 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

285. Agent 调用工具可能返回超大结果（比如代码搜索返回 50KB），这会带来什么问题？你会怎么处理？OpenClaw 是怎么做的？

中等 | #13230 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

286. 当对话历史实在太长、裁剪也不够用时，还有什么办法？什么是 Compaction？OpenClaw 的 Compaction 策略是怎样的？

中等 | #13231 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

287. OpenClaw 把 Context 管理抽象成了可插拔的 Context Engine，为什么要做这层抽象？这个设计能支持哪些不同的策略？

中等 | #13232 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

288. 如果一个 Agent 系统要同时接入 Telegram、飞书、钉钉等渠道，你会怎么设计抽象层？OpenClaw 的 Channel Plugin 接口是怎么设计的？

简单 | #13237 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

289. 什么是 AI Agent 中的 Skills？它有什么用？

简单 | #13251 | AI / 大模型 / Agent / Skills

290. MCP 和 Skills 有什么区别？分别适用于什么场景？

简单 | #13252 | AI / 大模型 / Agent / Skills

291. 如何设计和管理 AI Agent 的 Skills 体系？在实际项目中有哪些挑战？

中等 | #13253 | AI / 大模型 / Agent / Skills

292. 同一个系统里可能有多个 Agent，不同渠道用户群组的消息需要路由到不同的 Agent。你会怎么设计这个路由？OpenClaw 的路由匹配优先级是怎样的？

中等 | #13256 | AI / OpenClaw / 大模型应用开发 / Agent开发 / AI应用开发

293. 同一个用户在 Telegram 私聊和 Discord 群组里和 Agent 对话，应该共享会话还是隔离？OpenClaw 是怎么设计会话隔离粒度的？

中等 | #13257 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

294. 同一个工具（比如「执行命令」）在不同场景下应该有不同的权限。你会怎么设计工具的权限控制？OpenClaw 的工具策略管道是怎么分层的？

中等 | #13258 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

295. 不同的 LLM Provider 对 Tool Schema 的支持不完全一致，你会怎么处理这种差异？OpenClaw 是怎么做 Schema 适配的？

中等 | #13259 | AI / OpenClaw / 大模型应用开发 / AI应用开发

296. Agent 系统中 Hook中间件模式有什么用？能举几个典型场景吗？OpenClaw 的 Hook 系统是怎么设计的？

中等 | #13260 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

297. 什么场景下需要多 Agent 协作而不是单个 Agent 解决？OpenClaw 是怎么支持子 Agent（Subagent）的？

中等 | #13261 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

298. 父 Agent spawn 子 Agent 时，有哪些边界问题需要考虑？OpenClaw 做了哪些限制和保护？

中等 | #13262 | AI / 大模型应用开发 / AI应用开发 / Agent开发

299. 多 Agent 之间如何通信和协调？OpenClaw 的 Gateway 在其中扮演什么角色？

中等 | #13263 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

300. OpenClaw 采用插件架构，第三方可以注册新渠道、工具、Hook。设计一个插件系统需要考虑哪些关键问题？OpenClaw 的插件 API 长什么样？

中等 | #13264 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

301. OpenClaw 的 Gateway 对 Agent 请求做了幂等性处理。为什么 Agent 系统特别需要幂等性？工具已经产生副作用时怎么办？

中等 | #13265 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

302. 如果让你基于 OpenClaw 的设计理念从零搭建一个 Agent 框架，你会先做哪三个模块？为什么？

中等 | #13266 | AI / OpenClaw / 大模型应用开发 / AI应用开发 / Agent开发

303. 什么是 LoRA？它的原理是什么？为什么能减少训练参数？

简单 | #13499

304. 微调大模型需要什么样的硬件？7B 和 70B 模型分别需要多少显存？

简单 | #13501

305. LoRA 的数学原理是什么？为什么低秩分解能近似全量微调的效果？

简单 | #13502

306. 2026 年主流的微调工具有哪些？Unsloth、Axolotl、TRL 各有什么特点？

简单 | #13503

307. 什么是 SFT 指令微调？微调数据需要什么格式？

简单 | #13505

308. RLHF 的完整训练流程是怎样的？从 SFT 到 Reward Model 到 PPO 每个阶段做了什么？

简单 | #13506

309. LoRA 的超参数应该怎么设置？有什么经验法则？

简单 | #13507

310. 对比 LoRA、QLoRA、DoRA 和全量微调，在不同场景下应该如何选择？

简单 | #13508

311. 什么是 DPO？它相比 RLHF 和 PPO 有什么优势？

简单 | #13509

312. 在多模态微调中，如何确保文本和图像数据的对齐质量？有哪些技术挑战？

简单 | #13510

313. 微调时出现过拟合怎么办？有哪些正则化方法可以使用？

简单 | #13511

314. 为什么需要微调？直接用 Prompt Engineering 或 RAG 不行吗？

简单 | #13512

315. 如何评估微调的效果？需要关注哪些指标？

简单 | #13513

316. Adapter Tuning 和 Prefix Tuning 是什么？它们和 LoRA 有什么区别？

简单 | #13514

317. ORPO 是什么？它如何将指令微调和偏好对齐合二为一？

简单 | #13515

318. 微调过程中如何防止灾难性遗忘？有哪些实用的缓解策略？

简单 | #13516

319. LoRA 和 QLoRA 有什么区别？各自适合什么场景？

简单 | #13517

320. 什么是全量微调？它有哪些优缺点？

简单 | #13518

321. 如何构建高质量的 SFT 微调数据集？数据质量和数量哪个更重要？

简单 | #13519

322. 什么是 AI 幻觉（Hallucination）？大模型为什么会产生幻觉？有哪些缓解方法？

简单 | #13648

323. 什么是 Agentic Engineering？它和 Vibe Coding 有什么区别？

简单 | #13649

324. 什么是 ACP 协议？它有哪两个不同的含义？

简单 | #13650

325. 什么是深度思考（Deep Thinking）和自适应思考（Adaptive Thinking）？它们在 AI 编程中有什么应用？

简单 | #13651

326. 什么是大模型的涌现能力（Emergent Abilities）？它对 AI 应用开发有什么启示？

简单 | #13652

327. 大模型的 Token 是什么？输入 Token 和输出 Token 在计费上有什么区别？

简单 | #13653

328. 什么是 Background Agent（后台 Agent）？它改变了 AI 编程的什么工作方式？

简单 | #13654

329. 什么是 Token 缓存机制？它如何帮助降低 AI 应用的成本？

简单 | #13655

330. 什么是模型蒸馏（Knowledge Distillation）？它和模型量化有什么区别？

简单 | #13656

331. 什么是 AI 编程中的自动修复循环（Auto-fix Loop）？它的工作流程和退出策略怎么设计？

简单 | #13666

332. 大模型的训练和推理分别是什么？它们在计算资源需求上有什么区别？

简单 | #13668

333. 什么是大模型的参数量？参数量和模型能力之间是什么关系？

简单 | #13671