广布局、重应用：生成式大语言模型的新进展-新闻爱好者

广布局、重应用：生成式大语言模型的新进展

作者：郭全中朱燕

来源：　发布时间：2023-09-11　点击量：2331次

收藏
微信版

【摘要】ChatGPT的上线掀起了大语言模型的热潮，除了谷歌、微软、OpenAI、百度、阿里巴巴等科技巨头，创业公司和其他互联网企业也纷纷布局大模型。目前，生成式大语言模型在搜索引擎、办公软件和诸多垂直领域有了初步应用，加快了产业智能化发展的步伐，未来，大语言模型将探索更多垂类应用场景，产业结构将进一步分化。但大模型在落地应用过程中也面临着技术和社会层面的问题，需要各国在生成式人工智能的管理方面进行规范与治理。

2022年11月30日，基于生成式预训练模型GPT-3.5微调而来的新一代对话式自然语言识别模型ChatGPT上线，这是人工智能研究实验室Open AI历经四年迭代推出的生成式大语言模型。一般而言，大模型是指具有海量参数和复杂架构，用于深度学习任务的大容量模型，它采用的“预训练大模型■下游任务微调”模式极大地提高了模型的通用能力，呈现出“大模型”和“小模型”协进、通用性与专用性并进的发展趋势。2023年1月末，上线仅两个月，ChatGPT的月活用户便突破1亿，成为全球用户增长速度最快的消费级应用程序。面对用户的对话、翻译、分类、修改回答等指令，ChatGPT均呈现出极强的对用户意图的理解能力，其语言理解能力、逻辑推理能力与生成内容能力的大幅提升是在自然语言处理领域的重要突破，是生成式AI（AIGC）极为关键的发展节点。ChatGPT的成功标志着人工智能从以专用小模型训练为主的“手工作坊时代”迈入到以通用大模型预训练为主的“工业化时代”，成为人工智能发展的分水岭。[1] 一、广布局：多类主体大力布局大语言模型无论是在训练研发的上游市场，还是落地应用的下游市场，以美国、中国为代表的国家均展开了广泛布局，除了互联网公司和AI公司，科研机构、各垂直行业巨头企业也纷纷加入大语言模型赛道。目前，大语言模型赛道主要分为两类：一类是聚焦

立即购买，享受随时随地阅读的乐趣￥ 3.00

上一篇：基于数字技术的网络内容生产方式变下一篇：从区块链版权到数字复刻：元宇宙中