Deepseek

DeepSeek 是一系列以 Transformer 架構為基礎的大型語言模型，類似 OpenAI 的 GPT 模型，但特別針對中文自然語言處理（NLP）能力加強，支援對話生成、知識問答、程式輔助、文章寫作、邏輯推理等任務。

目前發布的模型包含：

功能	說明
🧠 中英雙語能力強	訓練資料涵蓋中英文資料，特別優化中文對話與理解。
📚 支援多任務學習	包含問答、翻譯、摘要、創作、數學推理、程式撰寫等。
💻 DeepSeek-Coder	專為程式開發設計，支援 Python、C++、JavaScript 等主流語言的生成與補全。
⚙️ 高效開源部署	可在本地 GPU、雲端或企業私有化部署，提供 Hugging Face 介面。
🚀 推理效能優化（MoE）	DeepSeek-MoE 使用混合專家架構，大幅提升計算效率與推理速度。