🤗 HuggingFace 热门模型分类展示

基于下载量和社区热度的模型分类整理

6 模型类别

30+ 热门模型

10B+ 总下载量

🤖 大语言模型 (LLM) 8 个模型

meta-llama/Llama-2-7b-hf LLM

Meta发布的Llama 2系列基础模型，7B参数版本，支持中英文等多种语言，在多项基准测试中表现优异。

⬇️ 10M+ 下载 ❤️ 15K+ 点赞

transformers llama text-generation

查看详情 →

mistralai/Mistral-7B-v0.1 LLM

Mistral AI发布的7B参数模型，采用分组查询注意力(GQA)和滑动窗口注意力(SWA)，性能超越Llama 2 13B。

⬇️ 8M+ 下载 ❤️ 10K+ 点赞

transformers mistral text-generation

查看详情 →

Qwen/Qwen-7B LLM

阿里云通义千问团队开发的7B参数大语言模型，支持中英文对话，在中文任务上表现突出。

⬇️ 5M+ 下载 ❤️ 8K+ 点赞

transformers qwen text-generation

查看详情 →

THUDM/chatglm3-6b LLM

智谱AI开发的ChatGLM系列第三代模型，6B参数，支持中英双语对话，具有强大的代码生成能力。

⬇️ 3M+ 下载 ❤️ 5K+ 点赞

transformers chatglm text-generation

查看详情 →

google/gemma-7b LLM

Google发布的Gemma系列开源模型，7B参数，基于Gemini技术，在多项基准测试中表现优异。

⬇️ 4M+ 下载 ❤️ 6K+ 点赞

transformers gemma text-generation

查看详情 →

microsoft/phi-2 LLM

微软发布的Phi-2模型，2.7B参数，小模型但性能强大，在多项基准测试中超越更大规模的模型。

⬇️ 6M+ 下载 ❤️ 7K+ 点赞

transformers phi text-generation

查看详情 →

TinyLlama/TinyLlama-1.1B-Chat LLM

TinyLlama项目发布的1.1B参数聊天模型，基于Llama架构，适合资源受限环境部署。

⬇️ 2M+ 下载 ❤️ 3K+ 点赞

transformers tinyllama text-generation

查看详情 →

01-ai/Yi-6B LLM

零一万物开发的Yi系列模型，6B参数，支持中英文，在多项中文基准测试中表现优异。

⬇️ 3M+ 下载 ❤️ 4K+ 点赞

transformers yi text-generation

查看详情 →

📝 文本嵌入模型 (Text Embedding) 5 个模型

sentence-transformers/all-MiniLM-L6-v2 Embedding

最流行的文本嵌入模型之一，384维向量，平衡性能与速度，适用于语义搜索和文本相似度计算。

⬇️ 50M+ 下载 ❤️ 20K+ 点赞

sentence-transformers feature-extraction

查看详情 →

BAAI/bge-large-zh-v1.5 Embedding

智源研究院发布的中文文本嵌入模型，1024维向量，在中文检索和语义匹配任务中表现优异。

⬇️ 10M+ 下载 ❤️ 8K+ 点赞

sentence-transformers feature-extraction chinese

查看详情 →

intfloat/multilingual-e5-large Embedding

微软发布的多语言文本嵌入模型，支持100+语言，1024维向量，适用于跨语言检索任务。

⬇️ 8M+ 下载 ❤️ 6K+ 点赞

sentence-transformers feature-extraction multilingual

查看详情 →

thenlper/gte-large Embedding

阿里巴巴达摩院发布的通用文本嵌入模型，1024维向量，在多项检索基准测试中表现优异。

⬇️ 5M+ 下载 ❤️ 4K+ 点赞

sentence-transformers feature-extraction

查看详情 →

jinaai/jina-embeddings-v2-base-en Embedding

Jina AI发布的文本嵌入模型，支持8K上下文长度，768维向量，适用于长文本检索。

⬇️ 3M+ 下载 ❤️ 3K+ 点赞

sentence-transformers feature-extraction long-context

查看详情 →

🎨 图像生成模型 (Image Generation) 5 个模型

stabilityai/stable-diffusion-xl-base-1.0 Image

Stability AI发布的SDXL模型，支持1024x1024高分辨率图像生成，图像质量和细节表现优异。

⬇️ 20M+ 下载 ❤️ 25K+ 点赞

diffusers text-to-image sdxl

查看详情 →

runwayml/stable-diffusion-v1-5 Image

经典的Stable Diffusion 1.5模型，512x512分辨率，社区生态最丰富，LoRA和ControlNet支持最完善。

⬇️ 30M+ 下载 ❤️ 30K+ 点赞

diffusers text-to-image sd-v1.5

查看详情 →

CompVis/stable-diffusion-v1-4 Image

Stable Diffusion早期版本，奠定了文生图领域的基础，社区贡献了大量微调模型。

⬇️ 15M+ 下载 ❤️ 18K+ 点赞

diffusers text-to-image

查看详情 →

prompthero/openjourney Image

基于Midjourney风格微调的Stable Diffusion模型，生成具有Midjourney艺术风格的图像。

⬇️ 5M+ 下载 ❤️ 6K+ 点赞

diffusers text-to-image midjourney-style

查看详情 →

dataautogpt3/Proteus-v0.4 Image

基于SDXL微调的高质量图像生成模型，在艺术风格和细节表现上有独特优势。

⬇️ 2M+ 下载 ❤️ 3K+ 点赞

diffusers text-to-image sdxl

查看详情 →

🎤 语音模型 (Audio/Speech) 4 个模型

openai/whisper-large-v3 Speech

OpenAI发布的Whisper语音识别模型，支持99种语言，识别准确率业界领先，支持长音频转录。

⬇️ 15M+ 下载 ❤️ 12K+ 点赞

transformers automatic-speech-recognition

查看详情 →

facebook/wav2vec2-large-960h Speech

Meta发布的Wav2Vec2语音识别模型，基于960小时LibriSpeech数据训练，在英语识别上表现优异。

⬇️ 8M+ 下载 ❤️ 7K+ 点赞

transformers automatic-speech-recognition

查看详情 →

microsoft/speecht5_tts TTS

微软发布的SpeechT5文本转语音模型，支持多种音色，生成自然流畅的语音。

⬇️ 3M+ 下载 ❤️ 4K+ 点赞

transformers text-to-speech

查看详情 →

suno/bark Audio

Suno AI发布的Bark模型，支持文本转语音、音乐生成、音效生成等多种音频任务。

⬇️ 5M+ 下载 ❤️ 6K+ 点赞

transformers text-to-speech text-to-audio

查看详情 →

👁️ 计算机视觉模型 (Computer Vision) 4 个模型

google/vit-base-patch16-224 Vision

Google发布的Vision Transformer基础模型，224x224输入，开创了Transformer在视觉领域的应用。

⬇️ 20M+ 下载 ❤️ 15K+ 点赞

transformers image-classification vit

查看详情 →

facebook/detr-resnet-50 Vision

Meta发布的DETR目标检测模型，基于ResNet-50骨干网络，端到端目标检测，无需NMS后处理。

⬇️ 10M+ 下载 ❤️ 8K+ 点赞

transformers object-detection detr

查看详情 →

microsoft/resnet-50 Vision

微软发布的ResNet-50图像分类模型，经典的深度残差网络，广泛应用于各种视觉任务。

⬇️ 12M+ 下载 ❤️ 9K+ 点赞

transformers image-classification resnet

查看详情 →

openai/clip-vit-base-patch32 Vision

OpenAI发布的CLIP模型，结合视觉和语言理解，支持零样本图像分类和图文检索。

⬇️ 18M+ 下载 ❤️ 14K+ 点赞

transformers zero-shot-image-classification clip

查看详情 →

🔮 多模态模型 (Multimodal) 4 个模型

llava-hf/llava-1.5-7b-hf Multimodal

LLaVA视觉语言模型，结合LLaMA和CLIP，支持图像理解和对话，是开源多模态模型的代表作。

⬇️ 5M+ 下载 ❤️ 6K+ 点赞

transformers image-text-to-text llava

查看详情 →

Salesforce/blip2-opt-2.7b Multimodal

Salesforce发布的BLIP-2模型，结合视觉编码器和OPT语言模型，支持图像描述和视觉问答。

⬇️ 4M+ 下载 ❤️ 5K+ 点赞

transformers image-to-text blip2

查看详情 →

microsoft/git-base-coco Multimodal

微软发布的GIT模型，基于COCO数据集训练，支持图像描述生成和视觉理解任务。

⬇️ 3M+ 下载 ❤️ 3K+ 点赞

transformers image-to-text git

查看详情 →

Qwen/Qwen-VL-Chat Multimodal

阿里云通义千问视觉语言模型，支持图像理解、视觉问答、OCR等多种多模态任务。

⬇️ 2M+ 下载 ❤️ 4K+ 点赞

transformers image-text-to-text qwen-vl

查看详情 →