AI 常见概念详解

大模型

大模型（Large Language Model, LLM）是指参数规模巨大、训练数据海量的人工智能模型，主要用于处理自然语言任务。这些模型通过学习海量文本数据，能够理解和生成人类语言，执行各种复杂的语言处理任务。

常见大模型对比

模型名称	开发者	特点	优点	缺点
GPT-4	OpenAI	参数规模庞大，多模态能力强	性能优异，支持多语言，理解能力强	价格昂贵，访问受限
Claude 3	Anthropic	长上下文理解，安全性高	上下文窗口大，安全性好	功能相对受限
DeepSeek	深度求索	代码理解能力强，中文支持好	代码生成质量高，中文表现优秀	通用性相对较弱
Llama 3	Meta	开源，可本地部署	开源免费，可定制性强	性能略逊于闭源模型
Gemini	Google	多模态能力全面	多模态集成度高，知识覆盖广	访问门槛较高

Agent（智能体）

Agent（智能体）是指能够自主执行任务、做出决策并与环境交互的人工智能系统。它不仅能够理解和生成语言，还能根据任务目标规划步骤、调用工具、执行操作并调整策略。

常见Agent类型

类型	特点	应用场景	优缺点
工具使用型Agent	能够调用外部工具	信息检索、数据分析	功能强大，但需要工具集成
对话型Agent	专注于自然语言交互	客户服务、个人助手	交互友好，但任务执行能力有限
自主决策型Agent	能够独立规划和执行任务	自动化工作流、研究辅助	自主性强，但可能存在决策偏差
多模态Agent	处理多种类型数据	内容创作、多媒体处理	适用范围广，但复杂度高

MCP（模型上下文协议）

MCP（Model Context Protocol）是一种模型上下文协议，用于在不同的AI系统和工具之间传递和管理上下文信息。它确保了模型能够获得正确的上下文，从而提高生成结果的准确性和相关性。

MCP的主要功能

上下文管理：跟踪和维护对话历史
工具调用协调：管理工具的调用和结果整合
状态持久化：保存和恢复对话状态
多模型协作：支持不同模型之间的信息传递

Skills

Skills（技能）是AI系统中可重用的功能模块，允许模型执行特定的任务或操作。它们扩展了模型的能力，使其能够处理更复杂的任务。

常见Skills类型

技能类型	功能	应用场景
代码生成	编写和优化代码	软件开发、编程辅助
信息检索	搜索和整理信息	研究、知识获取
数据分析	处理和分析数据	商业智能、科学研究
内容创作	生成各种类型的内容	文案写作、创意生成
翻译	多语言转换	跨语言沟通、内容本地化

AI工具

AI工具是集成了人工智能能力的软件应用，用于辅助或自动化各种任务。这些工具利用大模型的能力，为用户提供更高效、智能的解决方案。

常见AI工具对比

工具名称	类型	特点	优点	缺点
Cursor	代码编辑器	集成AI辅助编程	代码智能补全，实时建议	依赖网络连接，功能有限
Trae	IDE插件	全功能AI开发助手	深度集成开发流程，多语言支持	学习曲线较陡
OpenClaw	自动化工具	网页抓取和自动化	强大的自动化能力，可定制性高	配置复杂，需要编程知识
OpenCode	开源开发平台	协作式AI编程	开源免费，社区支持	功能相对基础
Codex	代码模型	专业代码生成	代码质量高，支持多种语言	已停止独立服务，整合到其他产品
ClaudeCode	代码助手	基于Claude模型	代码理解能力强，安全性好	访问受限，价格较高

TOKEN(词元) / Prompt（提示词）/ Vibe Coding（氛围编程）

🔹 Token（词元 / 令牌）

定义：AI 能"看懂"的最小文字单位

不是汉字，也不是单词，是 AI 切分文本后的小碎片
中文里，1 个 Token ≈ 1～1.5 个汉字

核心作用：

✅ 决定你能输入多少字（上下文长度）
✅ 决定计费（按 Token 收费）
✅ 决定 AI 记忆力长短

💡 一句话总结：Token = AI 的"字数"，越多越能说、越贵。

🔹 Prompt（提示词）

定义：你发给 AI 的指令

作用：告诉 AI 要画什么、写什么、生成什么风格、什么画质、什么情绪

标准结构：主体 + 风格 + 画质 + 细节 + 负面词

质量对比：

✅ 好 Prompt = 好结果
❌ 坏 Prompt = 模糊、乱、不对味

💡 一句话总结：Prompt = 你对 AI 说的话，说得越清楚，AI 越听话。

🔹 Vibe Coding（氛围编程）

定义：AI 视频领域的新玩法（由 Runway 等平台提出）

核心特点：

不写复杂指令，直接用"感觉、氛围、情绪"来控制视频
用自然语言描述画面节奏、色调、运动、质感

示例：

🎬 "温暖黄昏，慢镜头，电影感，轻微晃动"
🎬 "赛博朋克霓虹，快速剪辑，高能节奏"

本质：用文字描述"氛围"，AI 自动生成对应的画面动态

💡 一句话总结：Vibe Coding = 用"感觉"做视频，不用逐帧调参数。

🔗 三者关系（极简版）

总结

AI领域的这些概念和工具正在不断发展和演进，为我们的工作和生活带来了巨大的便利。从大模型的强大能力到Agent的自主决策，从MCP的上下文管理到Skills的功能扩展，再到各种AI工具的实际应用，这些技术正在共同推动人工智能的边界。

选择合适的AI工具和技术取决于具体的使用场景和需求。随着技术的不断进步，我们可以期待看到更多创新的AI应用和解决方案。

AI 常见概念详解 ​

大模型 ​

常见大模型对比 ​

Agent（智能体） ​

常见Agent类型 ​

MCP（模型上下文协议） ​

MCP的主要功能 ​

Skills ​

常见Skills类型 ​

AI工具 ​

常见AI工具对比 ​

TOKEN(词元) / Prompt（提示词）/ Vibe Coding（氛围编程） ​

🔹 Token（词元 / 令牌） ​

🔹 Prompt（提示词） ​

🔹 Vibe Coding（氛围编程） ​

🔗 三者关系（极简版） ​

总结 ​