NVIDIA 推出大型语言模型云服务，以推动人工智能与数字生物学领域的发展

gamers • 2023年9月23日 16:13 • 游戏攻略

NVIDIA （辉达）今天宣布推出两项全新大型语言模型（Large Language Model; LLM 云端人工智能（AI）服务，分别为英伟达 NeMo LLM 服务与英伟达NeMO LLM服务，让开发人员能够轻松地调整 LLM，并部署用于内容生成、文字摘要、聊天机器人、代码开发，以及预测蛋白质结构和生物分子属性等定制化的 AI 应用程序。

NeMo LLM 服务让开发人员能够在 NVIDIA 管理的基础设施上，使用被称为快速学习（Prompt Learning）的训练方法，迅速自定义调整一些预先训练好的基础模型。 NVIDIA BioNeMo 服务是一个云端应用程序接口（API），它将 LLM 的使用范围扩大到语言之外的科学应用范畴中，以协助制药和生技公司更快开发新药物。

NVIDIA 创办人暨执行长黄仁勋表示：「LLM 具有改变各行各业的潜力。调整基础模型的能力将让数百万名开发人员能够获得 LLM 强大的力量，无需从头开始建立庞大模型，就能开发语言服务并推动科学发现。」

开发人员使用NeMo LLM服务，便能使用自己的训练数据自行调整基础模型，模型大小从30亿个参数到Megatron530B（这是世界上最大的LLM之一）。跟过去从头开始训练一个模型所需的数周或数个月相比，使用 NeMo LLM 服务只需几分钟到几小时即可完成。

开发人员使用快速学习来自行调整模型，而快速学习采用一种名为 p-tuning 的技术。开发人员只需使用几百个范例，就能快速地自行调整基础模型，而过去则要使用数十亿个数据点来进行调整。在客制化的过程中会产生特定任务的提示权杖（token），然后将权杖结合基础模型，为特定使用范例提供更高的准确性与更相关的回应内容。

开发人员可以使用同一个模型对多个使用范例进行定制调整，并产生出多个不同的提示权杖。 Playground 功能提供了一个无需编写程序的选项，可以轻松地对模型进行实验及互动操作，进一步提高将 LLM 用于特定行业使用范例的有效性和可取得性。

准备好部署后，调整好的模型便能在云端执行个体、企业内部系统或通过 API 运行。

BioNeMo LLM 服务包含两个用于化学和生物学应用的全新 BioNeMo 语言模型，可用于支持处理蛋白质、DNA 和化学数据，帮助研究人员发现生物序列中的模式并取得宝贵洞察。

BioNeMo 让研究人员能够通过内含数十亿个参数的模型来扩大其研究工作范围。这些更大的模型可以储存更多关于蛋白质结构、基因间进化关系的信息，甚至可以生成用于治疗的新型生物分子。

除了调整基础模型外，LLM 服务还能让研究人员通过云端 API 来使用现成和定制化的模型。

如此一来开发人员便能接触到众多预先完成训练的 LLM，包括 Megatron 530B，还能接触到通过 NVIDIA NeMo Megatron 框架所建立的 T5 和 GPT-3 模型（该框架现已进入公开测试阶段），以支持广泛的应用程序和多语言服务需求。

汽车、计算机运算、教育、医疗、电信等行业的领导业者正使用NeMo Megatron，为客户提供中文、英文、韩文、瑞典文及其他语言的服务。

NeMo LLM、BioNeMo 服务及云端 API 预计将于下个月开放抢先试用。开发人员现在可以申请加入，以了解更多细节。

NeMo Megatron 框架测试版可通过 NVIDIA NGC 取得，其经过优化调整可在 NVIDIA DGX Foundry 和 NVIDIA DGX SuperPOD，以及 Amazon Web Services （AWS）、Microsoft Azure 与 Oracle Cloud Infrastructure 的加速云端执行个体上运行。

开发人员可以在 NVIDIA LaunchPad 实验室中，免费体验 NeMo Megatron 框架。