大模型行业入门指南

40

本文将介绍大模型入门的基础, 包括一些基本资源, 知识, 博客, 投资视角等等

笔者的能力/认知/有限, 且主要聚集ChatBot领域, 本文仅作为一个记录, 希望能对您有所帮助

基本认识

基础知识

LLM大模型导论 强烈建议

人工智能基础课

框架

Langchain

FastGPT

Dify 强烈建议

Prompt

提示工程指南 强烈推荐

Claude Prompt 指南 强烈推荐

结构化提示词 强烈推荐

Code-Prompt 强烈推荐, 厚脸皮的自荐一波

JailBreak

LLM提示词攻击

LLM越狱指南

微调

Openai

DPO

ORPO

行业应用

基座模型

国外

国内

因为我对百度的强烈厌恶, 不再提及.

国内的六小龙做的还可以, 但是我认为零一万物/阶跃星辰对于开发者更加友好, 主观上向您推荐.

  • DeepSeek (强烈推荐, 我认为DeepSeek早晚会成为这个世界上最出色的大模型厂商, 对于开发者无比友好, 更新速度快, 性价比高, 我认为你应该立刻去支持DeepSeek! )
  • 阿里-千问系列 (强烈推荐, 阿里是垃圾公司, 但是千问不管是开源模型还是闭源模型都很厉害,)
  • 字节-豆包 (还行吧)
  • AI六小龙(括号内为主管评分): 零一万物(4/5)、MiniMax(2/5)、百川智能(2/5)、智谱AI(2/5)、阶跃星辰(4/5)、月之暗面(2/5)

算力提供商

算力提供商和基座模型厂商不一样的地方主要是, 算力提供商主要售卖算力, 在模型层一般使用开源模型.

硅基流动 (强烈推荐, 强烈推荐, 强烈推荐)

Openrouter (强烈推荐)

lepton.ai

Model Hub/Co

Hugging Face

魔搭

趋势

Toolify

投资认识

红杉

红杉

红杉有两篇文章我认为所有人都需要读一读

2022 生成式AI

2024 生成式AI

a16z

知名的AI投资机构

a16z + AI

a16z: Top 100 AI Apps

社区资源

酒馆社区

BASI LLM红方攻击, 越狱等等

类脑 任何一个ChatBot的从业者都应该加入这个社区

Linux.do 自由克制的探讨

DJJ Blog 你应该立刻关注这个博客