Skip to content

AI 常见概念详解

大模型

大模型(Large Language Model, LLM)是指参数规模巨大、训练数据海量的人工智能模型,主要用于处理自然语言任务。这些模型通过学习海量文本数据,能够理解和生成人类语言,执行各种复杂的语言处理任务。

常见大模型对比

模型名称开发者特点优点缺点
GPT-4OpenAI参数规模庞大,多模态能力强性能优异,支持多语言,理解能力强价格昂贵,访问受限
Claude 3Anthropic长上下文理解,安全性高上下文窗口大,安全性好功能相对受限
DeepSeek深度求索代码理解能力强,中文支持好代码生成质量高,中文表现优秀通用性相对较弱
Llama 3Meta开源,可本地部署开源免费,可定制性强性能略逊于闭源模型
GeminiGoogle多模态能力全面多模态集成度高,知识覆盖广访问门槛较高

Agent(智能体)

Agent(智能体)是指能够自主执行任务、做出决策并与环境交互的人工智能系统。它不仅能够理解和生成语言,还能根据任务目标规划步骤、调用工具、执行操作并调整策略。

常见Agent类型

类型特点应用场景优缺点
工具使用型Agent能够调用外部工具信息检索、数据分析功能强大,但需要工具集成
对话型Agent专注于自然语言交互客户服务、个人助手交互友好,但任务执行能力有限
自主决策型Agent能够独立规划和执行任务自动化工作流、研究辅助自主性强,但可能存在决策偏差
多模态Agent处理多种类型数据内容创作、多媒体处理适用范围广,但复杂度高

MCP(模型上下文协议)

MCP(Model Context Protocol)是一种模型上下文协议,用于在不同的AI系统和工具之间传递和管理上下文信息。它确保了模型能够获得正确的上下文,从而提高生成结果的准确性和相关性。

MCP的主要功能

  • 上下文管理:跟踪和维护对话历史
  • 工具调用协调:管理工具的调用和结果整合
  • 状态持久化:保存和恢复对话状态
  • 多模型协作:支持不同模型之间的信息传递

Skills

Skills(技能)是AI系统中可重用的功能模块,允许模型执行特定的任务或操作。它们扩展了模型的能力,使其能够处理更复杂的任务。

常见Skills类型

技能类型功能应用场景
代码生成编写和优化代码软件开发、编程辅助
信息检索搜索和整理信息研究、知识获取
数据分析处理和分析数据商业智能、科学研究
内容创作生成各种类型的内容文案写作、创意生成
翻译多语言转换跨语言沟通、内容本地化

AI工具

AI工具是集成了人工智能能力的软件应用,用于辅助或自动化各种任务。这些工具利用大模型的能力,为用户提供更高效、智能的解决方案。

常见AI工具对比

工具名称类型特点优点缺点
Cursor代码编辑器集成AI辅助编程代码智能补全,实时建议依赖网络连接,功能有限
TraeIDE插件全功能AI开发助手深度集成开发流程,多语言支持学习曲线较陡
OpenClaw自动化工具网页抓取和自动化强大的自动化能力,可定制性高配置复杂,需要编程知识
OpenCode开源开发平台协作式AI编程开源免费,社区支持功能相对基础
Codex代码模型专业代码生成代码质量高,支持多种语言已停止独立服务,整合到其他产品
ClaudeCode代码助手基于Claude模型代码理解能力强,安全性好访问受限,价格较高

TOKEN(词元) / Prompt(提示词)/ Vibe Coding(氛围编程)


🔹 Token(词元 / 令牌)

定义:AI 能"看懂"的最小文字单位

  • 不是汉字,也不是单词,是 AI 切分文本后的小碎片
  • 中文里,1 个 Token ≈ 1~1.5 个汉字

核心作用

  • ✅ 决定你能输入多少字(上下文长度)
  • ✅ 决定计费(按 Token 收费)
  • ✅ 决定 AI 记忆力长短

💡 一句话总结:Token = AI 的"字数",越多越能说、越贵。


🔹 Prompt(提示词)

定义:你发给 AI 的指令

作用:告诉 AI 要画什么、写什么、生成什么风格、什么画质、什么情绪

标准结构主体 + 风格 + 画质 + 细节 + 负面词

质量对比

  • 好 Prompt = 好结果
  • 坏 Prompt = 模糊、乱、不对味

💡 一句话总结:Prompt = 你对 AI 说的话,说得越清楚,AI 越听话。


🔹 Vibe Coding(氛围编程)

定义:AI 视频领域的新玩法(由 Runway 等平台提出)

核心特点

  • 不写复杂指令,直接用"感觉、氛围、情绪"来控制视频
  • 用自然语言描述画面节奏、色调、运动、质感

示例

  • 🎬 "温暖黄昏,慢镜头,电影感,轻微晃动"
  • 🎬 "赛博朋克霓虹,快速剪辑,高能节奏"

本质:用文字描述"氛围",AI 自动生成对应的画面动态

💡 一句话总结:Vibe Coding = 用"感觉"做视频,不用逐帧调参数。


🔗 三者关系(极简版)

| 概念 | 说明 |
| Token | 你能说多少字 |
| Prompt | 你具体说什么 |
| Vibe Coding | 用感觉式的 Prompt 控制视频氛围 |

总结

AI领域的这些概念和工具正在不断发展和演进,为我们的工作和生活带来了巨大的便利。从大模型的强大能力到Agent的自主决策,从MCP的上下文管理到Skills的功能扩展,再到各种AI工具的实际应用,这些技术正在共同推动人工智能的边界。

选择合适的AI工具和技术取决于具体的使用场景和需求。随着技术的不断进步,我们可以期待看到更多创新的AI应用和解决方案。

基于 VitePress 的本地知识库