🤗 HuggingFace 热门模型分类展示

基于下载量和社区热度的模型分类整理

6 模型类别
30+ 热门模型
10B+ 总下载量
🤖 大语言模型 (LLM) 8 个模型
meta-llama/Llama-2-7b-hf LLM
Meta发布的Llama 2系列基础模型,7B参数版本,支持中英文等多种语言,在多项基准测试中表现优异。
⬇️ 10M+ 下载 ❤️ 15K+ 点赞
transformers llama text-generation
查看详情 →
mistralai/Mistral-7B-v0.1 LLM
Mistral AI发布的7B参数模型,采用分组查询注意力(GQA)和滑动窗口注意力(SWA),性能超越Llama 2 13B。
⬇️ 8M+ 下载 ❤️ 10K+ 点赞
transformers mistral text-generation
查看详情 →
Qwen/Qwen-7B LLM
阿里云通义千问团队开发的7B参数大语言模型,支持中英文对话,在中文任务上表现突出。
⬇️ 5M+ 下载 ❤️ 8K+ 点赞
transformers qwen text-generation
查看详情 →
THUDM/chatglm3-6b LLM
智谱AI开发的ChatGLM系列第三代模型,6B参数,支持中英双语对话,具有强大的代码生成能力。
⬇️ 3M+ 下载 ❤️ 5K+ 点赞
transformers chatglm text-generation
查看详情 →
google/gemma-7b LLM
Google发布的Gemma系列开源模型,7B参数,基于Gemini技术,在多项基准测试中表现优异。
⬇️ 4M+ 下载 ❤️ 6K+ 点赞
transformers gemma text-generation
查看详情 →
microsoft/phi-2 LLM
微软发布的Phi-2模型,2.7B参数,小模型但性能强大,在多项基准测试中超越更大规模的模型。
⬇️ 6M+ 下载 ❤️ 7K+ 点赞
transformers phi text-generation
查看详情 →
TinyLlama/TinyLlama-1.1B-Chat LLM
TinyLlama项目发布的1.1B参数聊天模型,基于Llama架构,适合资源受限环境部署。
⬇️ 2M+ 下载 ❤️ 3K+ 点赞
transformers tinyllama text-generation
查看详情 →
01-ai/Yi-6B LLM
零一万物开发的Yi系列模型,6B参数,支持中英文,在多项中文基准测试中表现优异。
⬇️ 3M+ 下载 ❤️ 4K+ 点赞
transformers yi text-generation
查看详情 →
📝 文本嵌入模型 (Text Embedding) 5 个模型
sentence-transformers/all-MiniLM-L6-v2 Embedding
最流行的文本嵌入模型之一,384维向量,平衡性能与速度,适用于语义搜索和文本相似度计算。
⬇️ 50M+ 下载 ❤️ 20K+ 点赞
sentence-transformers feature-extraction
查看详情 →
BAAI/bge-large-zh-v1.5 Embedding
智源研究院发布的中文文本嵌入模型,1024维向量,在中文检索和语义匹配任务中表现优异。
⬇️ 10M+ 下载 ❤️ 8K+ 点赞
sentence-transformers feature-extraction chinese
查看详情 →
intfloat/multilingual-e5-large Embedding
微软发布的多语言文本嵌入模型,支持100+语言,1024维向量,适用于跨语言检索任务。
⬇️ 8M+ 下载 ❤️ 6K+ 点赞
sentence-transformers feature-extraction multilingual
查看详情 →
thenlper/gte-large Embedding
阿里巴巴达摩院发布的通用文本嵌入模型,1024维向量,在多项检索基准测试中表现优异。
⬇️ 5M+ 下载 ❤️ 4K+ 点赞
sentence-transformers feature-extraction
查看详情 →
jinaai/jina-embeddings-v2-base-en Embedding
Jina AI发布的文本嵌入模型,支持8K上下文长度,768维向量,适用于长文本检索。
⬇️ 3M+ 下载 ❤️ 3K+ 点赞
sentence-transformers feature-extraction long-context
查看详情 →
🎨 图像生成模型 (Image Generation) 5 个模型
stabilityai/stable-diffusion-xl-base-1.0 Image
Stability AI发布的SDXL模型,支持1024x1024高分辨率图像生成,图像质量和细节表现优异。
⬇️ 20M+ 下载 ❤️ 25K+ 点赞
diffusers text-to-image sdxl
查看详情 →
runwayml/stable-diffusion-v1-5 Image
经典的Stable Diffusion 1.5模型,512x512分辨率,社区生态最丰富,LoRA和ControlNet支持最完善。
⬇️ 30M+ 下载 ❤️ 30K+ 点赞
diffusers text-to-image sd-v1.5
查看详情 →
CompVis/stable-diffusion-v1-4 Image
Stable Diffusion早期版本,奠定了文生图领域的基础,社区贡献了大量微调模型。
⬇️ 15M+ 下载 ❤️ 18K+ 点赞
diffusers text-to-image
查看详情 →
prompthero/openjourney Image
基于Midjourney风格微调的Stable Diffusion模型,生成具有Midjourney艺术风格的图像。
⬇️ 5M+ 下载 ❤️ 6K+ 点赞
diffusers text-to-image midjourney-style
查看详情 →
dataautogpt3/Proteus-v0.4 Image
基于SDXL微调的高质量图像生成模型,在艺术风格和细节表现上有独特优势。
⬇️ 2M+ 下载 ❤️ 3K+ 点赞
diffusers text-to-image sdxl
查看详情 →
🎤 语音模型 (Audio/Speech) 4 个模型
openai/whisper-large-v3 Speech
OpenAI发布的Whisper语音识别模型,支持99种语言,识别准确率业界领先,支持长音频转录。
⬇️ 15M+ 下载 ❤️ 12K+ 点赞
transformers automatic-speech-recognition
查看详情 →
facebook/wav2vec2-large-960h Speech
Meta发布的Wav2Vec2语音识别模型,基于960小时LibriSpeech数据训练,在英语识别上表现优异。
⬇️ 8M+ 下载 ❤️ 7K+ 点赞
transformers automatic-speech-recognition
查看详情 →
microsoft/speecht5_tts TTS
微软发布的SpeechT5文本转语音模型,支持多种音色,生成自然流畅的语音。
⬇️ 3M+ 下载 ❤️ 4K+ 点赞
transformers text-to-speech
查看详情 →
suno/bark Audio
Suno AI发布的Bark模型,支持文本转语音、音乐生成、音效生成等多种音频任务。
⬇️ 5M+ 下载 ❤️ 6K+ 点赞
transformers text-to-speech text-to-audio
查看详情 →
👁️ 计算机视觉模型 (Computer Vision) 4 个模型
google/vit-base-patch16-224 Vision
Google发布的Vision Transformer基础模型,224x224输入,开创了Transformer在视觉领域的应用。
⬇️ 20M+ 下载 ❤️ 15K+ 点赞
transformers image-classification vit
查看详情 →
facebook/detr-resnet-50 Vision
Meta发布的DETR目标检测模型,基于ResNet-50骨干网络,端到端目标检测,无需NMS后处理。
⬇️ 10M+ 下载 ❤️ 8K+ 点赞
transformers object-detection detr
查看详情 →
microsoft/resnet-50 Vision
微软发布的ResNet-50图像分类模型,经典的深度残差网络,广泛应用于各种视觉任务。
⬇️ 12M+ 下载 ❤️ 9K+ 点赞
transformers image-classification resnet
查看详情 →
openai/clip-vit-base-patch32 Vision
OpenAI发布的CLIP模型,结合视觉和语言理解,支持零样本图像分类和图文检索。
⬇️ 18M+ 下载 ❤️ 14K+ 点赞
transformers zero-shot-image-classification clip
查看详情 →
🔮 多模态模型 (Multimodal) 4 个模型
llava-hf/llava-1.5-7b-hf Multimodal
LLaVA视觉语言模型,结合LLaMA和CLIP,支持图像理解和对话,是开源多模态模型的代表作。
⬇️ 5M+ 下载 ❤️ 6K+ 点赞
transformers image-text-to-text llava
查看详情 →
Salesforce/blip2-opt-2.7b Multimodal
Salesforce发布的BLIP-2模型,结合视觉编码器和OPT语言模型,支持图像描述和视觉问答。
⬇️ 4M+ 下载 ❤️ 5K+ 点赞
transformers image-to-text blip2
查看详情 →
microsoft/git-base-coco Multimodal
微软发布的GIT模型,基于COCO数据集训练,支持图像描述生成和视觉理解任务。
⬇️ 3M+ 下载 ❤️ 3K+ 点赞
transformers image-to-text git
查看详情 →
Qwen/Qwen-VL-Chat Multimodal
阿里云通义千问视觉语言模型,支持图像理解、视觉问答、OCR等多种多模态任务。
⬇️ 2M+ 下载 ❤️ 4K+ 点赞
transformers image-text-to-text qwen-vl
查看详情 →