什么是 LLM 大语言模型？

大语言模型（Large Language Model，简称LLM）是一种先进的人工智能系统。
它通过学习海量的文本数据，能够理解和生成人类语言。
你可以把它想象成一个超级强大的"文字处理大脑"。

主要特点

优势

局限

模型名称	开发公司	地区	开源情况	主要特点
GPT3.5/ GPT-4/4o	OpenAI	美国	闭源	目前最强大的商业模型之一，多模态能力出色，通过ChatGPT提供服务
Claude3.5	Anthropic	美国	闭源	包含Opus、Sonnet和Haiku三个版本，擅长学术和专业分析
Gemini	Google	美国	部分开源	原生多模态设计，包括Ultra、Pro和Nano三个版本
LLaMA	Meta	美国	开源	影响力广泛的开源模型系列，为众多衍生模型提供基础
Mistral	Mistral AI	法国	开源	以高性能和低部署成本著称的新兴模型
DeepSeek	深度求索	中国	部分开源	开源版本性能优秀，特别在代码生成领域表现突出
文心一言	百度	中国	闭源	中文理解优秀，集成度高，支持多模态交互
通义千问	阿里巴巴	中国	部分开源	提供开源和闭源双版本，中文语境理解出色
豆包	字节跳动	中国	闭源	基于多个大模型混合，内容创作能力强
讯飞星火	科大讯飞	中国	闭源	语音交互优势明显，专业领域知识丰富
智谱ChatGLM	智谱AI&清华大学	中国	开源	开源模型中的佼佼者，训练成本相对较低
书生·浦语	商汤科技	中国	部分开源	强调产业应用，提供开源和商业双版本
MiniMax	MiniMax	中国	闭源	注重安全性和可控性，对话风格自然
360智脑	360公司	中国	闭源	强调安全性，针对企业级应用场景优化

内容来源于： https://xiangyangqiaomu.feishu.cn/wiki/IWI4wa1AaiD7Rfk92rAczxZdn9d ，担心原文档有一天无法打开，所以备份转载，建议关注原文档。