报告：2024年中国将出现比肩GPT-4的大模型

(资料图)

7月7日，2023年世界人工智能大会上，启明创投联合未尽研究发布了创投行业首份生成式AI报告。基于生成式AI的创新应用、大模型技术前沿、监管、安全、政策、人才等研究，报告对未来一至三年的大语言模型、多模态模型和商业竞争态势，作出了十点前瞻。

其中，大语言模型方面：

2024 年中国将出现比肩GPT-4的多语言通用大模型；超长上下文(Long Context) 将引领下一次LLM技术突破；在出现更有前景的大语言模型之前，为实现垂直领域更好的效果，以下三种方式将共存：在不改变数据分布的情况下，利用更多通用数据进行通用大模型预训练，不特别引入行业数据；利用行业专属数据微调( Fine-Tuning)通用大模型；利用行业数据占比更高的数据集进行垂直模型预训练；

多模态模型方面：

当前CLIP + Diffusion的文生图模型是过渡态，未来2年内将出现一体化的模型结构；下一代Text-to-Image模型将具备更强的可控性，它将结合底层模型能力和前端控制方式，对模型的设计将注重与控制方式的结合；2025之前，视频和3D 等模态将迎来里程碑式的模型，大幅提高生成效果；以PALM-E为代表的具身智能(Embodied AI)展现出在机器人的感知、理解和决策等方向上的巨大潜力，但当前训练和可靠性存在较大挑战；短期内Transformer正成为多个模态的主流网络结构，但压缩整个数字世界的通用方法尚未出现，Transformer并不是人工智能技术的终点；

商业机会方面：

3年内，颠覆式的AI应用的核心驱动力来自于底层模型的创新，两者无法解耦，模型的作用将大于产品设计的作用；当前生成式AI 市场处于技术主导的早期阶段，存在千亿美元市值的平台性企业的机会。

关键词：