J'Blog

人工智能碎片化信息

人工智能碎片化信息

大模型的概念

大模型通常指的是参数量极大的神经网络模型,这类模型通过大量的数据进行训练,从而能够在多种任务上表现出色。大模型的一个典型例子就是Transformer架构,以及基于该架构构建的模型,如BERT、GPT系列等。

大模型的应用

训练大模型本身成本比较高,所以利用大模型技术进行微调就能基本符合大部分需求。

RAG(Retrieval-Augmented Generation)

是一种结合了检索(Retrieval)和生成(Generation)的方法,用于构建更强大和准确的自然语言处理模型。传统的生成模型依赖于模型内部的记忆来生成文本,而RAG通过引入外部文档或知识库的检索机制,使得模型在生成过程中能够访问到更广泛和更新的信息。

被训练后的大模型本身很聪明且有推理能力,但是缺乏知识。除了通用的一些知识以外,通过提供一些问答,可以通过调用OpenAI接口爬取信息以外,自己搜集一些特定的问答,比如医疗相关的数据,进行检索排序最终得到相关回答,结合大模型就能开发一套问答系统了。