Hinton 团队 ImageNet 比赛 top-5 错误率 15.3%,比第二名领先 10 个百分点。GPU 训练神经网络成为主流路径。
Ian Goodfellow 提出生成对抗网络,让机器能 "创造" 而不只 "识别"。是后续所有图像 / 视频生成 AI 的理论基础。
微软亚研院何恺明团队,152 层深度网络在 ImageNet 上把错误率降到 3.57%。残差连接让超深网络训练成为可能,是 Transformer 之前最重要的架构突破之一。
DeepMind AlphaGo 4:1 击败围棋世界冠军李世石。是 AI 第一次进入全球大众视野的里程碑事件。
→ 看 Google DeepMind(基础模型)Google I/O 公开 TPU v1,证明专用 AI 芯片比 GPU 更高效。开启 "非 Nvidia AI 加速器" 路线。
→ 看 Google TPU(算力基建)Google《Attention Is All You Need》提出 Transformer 架构,奠定后续所有大语言模型基础。
→ 看 Google DeepMind(基础模型)DeepMind 发布 AlphaGo Zero,无人类数据 21 天自学超越前代。证明强化学习能从零达到超人水平,启发后续 LLM 推理模型路径。
Google BERT 在 11 个 NLP 任务刷新 SOTA,掀起 PLM 浪潮。
GPT-2 (15 亿参数) 发布。OpenAI 罕见以 "防止滥用" 为由延迟开源,引发开源社区争议。是 "AI 安全 vs 开放" 路线之争的起点。
→ 看 OpenAI(基础模型)微软首轮投资 10 亿美元 + Azure 独家算力授权,绑定 OpenAI 未来。是 AI 时代第一笔决定性战略投资。
→ 看 OpenAI(基础模型)DeepMind AlphaFold 2 在 CASP14 接近实验室精度解决 50 年蛋白质折叠难题。是 AI for Science 标志性成果,2024 年 Hassabis + Jumper 因此获诺贝尔化学奖。
→ 看 Google DeepMind(基础模型)OpenAI 发布 DALL-E 1,从文字生成图像首次震撼大众。开启 AI 创作时代。
Google I/O 展示 LaMDA 对话系统,让对话 AI 第一次接近 ChatGPT 水平。但 Google 一直没有产品化,直到 ChatGPT 出来后才有 Bard 反应。
GitHub + OpenAI 联合发布 Copilot,是首个真正商业化的 AI 编程工具。
→ 看 GitHub Copilot(应用层)前 OpenAI 团队(Dario + Daniela Amodei + 7 名核心研究员)创立 Anthropic 一年后完成 1.24 亿美元融资。Constitutional AI 路线启动。
→ 看 Anthropic(基础模型)OpenAI 发布 DALL-E 2,质量质变。引爆 "AI 艺术" 主流认知,是 ChatGPT 之前最受关注的 AI 产品。
Google 发布 PaLM (540B 参数),刷新当时多个 NLP benchmark 第一。同期清华 BAAI 发布 GLM-130B(中国第一个万亿级开源 LLM)。
Stability AI 开源 Stable Diffusion,让任何人能在自家 GPU 上跑文生图。彻底颠覆图像生成产业 + 启动开源 AI 创作生态。
11 月 30 日 OpenAI 发布 ChatGPT,5 天用户破百万,2 个月月活破亿,开启全球 AI 浪潮。
→ 看 ChatGPT(应用层)Meta 发布 LLaMA 1(仅授权研究),但权重一周内全网泄漏。意外催生开源 LLM 生态——后续 Alpaca / Vicuna / Guanaco 等微调版本爆发。
→ 看 Meta Llama(基础模型)Anthropic Claude 2 发布,100K context 让长文档处理首次实用。是 Claude 走出 "GPT 替代品" 标签的起点。
→ 看 Anthropic(基础模型)Mistral AI 开源 Mistral 7B,性能超 Llama 2 13B。证明 "小模型 + 高质量训练" 可行。欧洲 AI 主权代表。
→ 看 Mistral AI(基础模型)Sam Altman 被董事会突然罢免,5 天内员工 95% 联名要求他回归。最终 Altman 复职 + 董事会重组。是 AI 时代最戏剧性的公司治理事件。
→ 看 OpenAI(基础模型)Google 发布 Gemini 1.0 (Ultra/Pro/Nano) 反击 GPT-4。同月 Mistral 开源 Mixtral 8x7B (MoE),启发 DeepSeek-V3 等后续 MoE 模型。
Google 发布 Gemini 1.5 Pro,1M tokens 上下文进入实用。Sora 1 demo 同月引爆视频生成赛道。
→ 看 Google DeepMind(基础模型)Meta 发布 Llama 3 (8B / 70B),开源模型质量首次接近闭源 GPT-4 Turbo。Mark Zuckerberg 押注 AI 战略明牌化。
→ 看 Meta Llama(基础模型)DeepSeek 发布 V2 (236B MoE),开源 SOTA + 极低训练成本。是中国 LLM 第一次让全球开源社区真正认真对待。
→ 看 DeepSeek(基础模型)阿里 Qwen 2 系列开源(含 72B),HuggingFace 下载量进入全球 top 5。同月快手发布 Kling 视频生成,被认为是中国对标 Sora 最强候选。
→ 看 阿里通义千问(基础模型)Meta 发布 Llama 3.1 405B,是当时最大开源 LLM。首次让开源在大模型 benchmark 上完全追平闭源 GPT-4o。
→ 看 Meta Llama(基础模型)Google 付 27 亿美元给 Character.AI 投资人,原创始人 Noam Shazeer + Daniel De Freitas 回 Google DeepMind。开启 "反向收购" 新范式(后续 Inflection / Adept 跟进)。
→ 看 Character.AI(应用层)OpenAI 发布 o1 preview,引入 "思考链 + 强化学习" 推理范式。是 LLM 从 "快答" 转向 "慢思考" 的标志,启发 DeepSeek-R1 / Claude Thinking。
→ 看 OpenAI(基础模型)微软跟 Constellation 签 20 年 PPA 重启三里岛 1 号核电机组(2028 上线),专门给 Azure AI 数据中心供电。开启 "AI + 核电" 大潮。
→ 看 Constellation Energy(全景节点)Claude 能自主操作电脑界面,截屏 + 点击 + 输入。Agent 时代真正起步。
→ 看 Anthropic(基础模型)Anthropic 提出 Model Context Protocol,定义 LLM 调外部工具的开放标准。被 OpenAI / Google 跟进。
→ 看 MCP 协议(框架协议)OpenAI Sora 正式开放给 ChatGPT Plus / Pro 用户。但实际质量被质疑跟 demo 差距大,让 "Sora 神话" 部分破灭。
→ 看 Sora 2(应用层)OpenAI + Oracle + 软银 + MGX 在白宫宣布 Stargate 项目:4 年 5000 亿美元建 AI 算力基础设施。是 AI 历史最大单一基建项目。
→ 看 软银 / Stargate(全景节点)OpenAI 发布 Operator,让 ChatGPT 自主操作浏览器完成任务。是大众级 AI Agent 第一个商业产品。
→ 看 ChatGPT(应用层)OpenAI / Oracle / 软银宣布 Stargate 项目,4 年投 5000 亿美元建 AI 算力基础设施。
→ 看 OpenAI(基础模型)AI 专用云 CoreWeave 在纳斯达克 IPO,市值峰期 800 亿。是 AI infra 类公司最大上市 case,验证 AI 算力公司能独立上市。
→ 看 CoreWeave(全景节点)Anthropic 推 Claude Code 终端编程 agent,绕过 IDE 直接触达开发者。Anthropic 收入快速攀升。
→ 看 Claude Code(应用层)Google Gemini 2.5 Pro GA,编程能力跃升至 SWE-bench 第一。同期国产阶跃星辰 Step-2 发布万亿参数 MoE。
→ 看 Google DeepMind(基础模型)OpenAI GPT-5 + GPT-5 Pro 发布,统一推理 + 对话 + agent 能力。Pro 版定价 $200/月,是 ChatGPT 商业化的第二条高价路径。
→ 看 OpenAI(基础模型)Claude 4.5 系列发布,1M context 进入 GA,Opus 4.7 在编程榜首位。
→ 看 Anthropic(基础模型)OpenAI Sora 2 发布,物理一致性 + 多镜头连贯让 "AI 视频" 真正可用于专业内容创作。是 Sora 1 demo 后真正的商用迭代。
→ 看 Sora 2(应用层)OpenAI / Anthropic 据传估值分别站上 $5000 亿 / $1500 亿级别,AI 公司占美股市值 40%+。
Anthropic Claude 4.7 Opus 发布,编程能力进一步突破,1M 上下文进入 GA。Claude Code 用户体验同步升级。
→ 看 Anthropic(基础模型)时间轴持续补充中。建议:浏览完时间轴后回到 AI 全景图,按层 / 行业 / 受众视角再看一遍,感受差异。