DeepSeek-V2:深度求索发布的第二代开源MoE模型

DeepSeek-V2:深度求索发布的第二代开源MoE模型

DeepSeek-V2是由杭州深度求索公司发布的第二代开源MoE模型,DeepSeek-V2 在中文综合能力与 GPT-4-Turbo,文心 4.0 等闭源模型在评测中处于同一梯队,英文综合能力英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B,特别擅长数学、编程和逻辑推理任务。它在多个大型模型排行榜上名列前茅,支持长达128K的上下文长度,并提供开放源代码。
01,2810
通义千问 – 阿里巴巴旗下AI语言大模型

通义千问 – 阿里巴巴旗下AI语言大模型

通义千问是由阿里云推出的一种超大规模语言模型,它可以理解和回答各种领域的问题,包括常见、复杂甚至是少见的问题。它不仅是一个效率助手,也是一个点子生成机,可以帮助用户完成各种任务,如写邮件、写文章、写脚本、写情书、写诗等。此外,它还能提供娱乐功能,比如讲笑话、唱歌等。
01,0770